Pratiques de l’IA de Notion en matière de sécurité

Pratiques de l’IA de Notion en matière de sécurité
Dans cet article

Chez Notion, nous tenons à informer nos clients de façon transparente sur nos produits d’IA. Voici un aperçu de leurs fonctionnalités et de leurs caractéristiques de confidentialité. 🔒


À l’heure actuelle, ce module inclut les composants suivants* :

  • Rédacteur : générez ou modifiez un texte sur une page avec les instructions de votre choix, ou en vous appuyant sur des instructions prédéfinies.

  • Remplissage automatique : générez du texte dans plusieurs pages d’une base de données en même temps, avec les instructions de votre choix ou en vous appuyant sur des instructions prédéfinies.

  • Notion Q&A : trouvez instantanément les réponses à vos questions en tirant parti des informations contenues dans votre espace de travail Notion.

Les fonctionnalités d’IA de Notion s’intègrent naturellement à votre espace de travail, mais elles reposent en réalité sur plusieurs sous-traitants spécialisés dans l’IA. Consulter la liste des sous-traitants auxquels nous faisons appel actuellement →

*L’IA de Notion s’étoffera en nouvelles fonctionnalités avec le temps.

Qui sont les fournisseurs des grands modèles de langage (LLM) utilisés par Notion ?

Notion exploite actuellement de grands modèles de langage (LLM) fournis par Anthropic, OpenAI et Cohere, ce dernier étant hébergé directement par Notion. Cohere ne stocke pas de données client. Nous évaluons en permanence nos fournisseurs et leurs modèles pour offrir la meilleure expérience possible aux utilisateurs de l’IA de Notion. Dès lors que nous faisons appel à un tiers pour stocker des données client, son nom est répertorié dans la page consacrée à nos sous-traitants.

Comment puis-je recevoir une notification lors de l’ajout d’un nouveau sous-traitant ?

Pour être informé·e de l’intégration d’un nouveau sous-traitant, écrivez-nous à l’adresse team@makenotion.com en précisant l’objet « Subscribe to New Subprocessors » (S’abonner aux notifications de nouveaux sous-traitants). Notion vous enverra alors un message à l’intégration de chaque nouveau sous-traitant avant d’autoriser celui-ci à traiter des données client. Pour en savoir plus, consultez notre Addendum relatif au traitement des données (ATD).

Comment fonctionnent le rédacteur et le remplissage automatique ?

Comment fonctionnent le rédacteur et le remplissage automatique ?

Lorsque vous interagissez avec l’assistant de rédaction ou configurez une propriété de remplissage automatique, plusieurs actions s’exécutent en arrière-plan :

  1. Notion reçoit vos instructions ;

  2. Les données de ces instructions sont envoyées à un fournisseur de LLM, qui génère des informations et les renvoie à Notion ;

  3. Notion traite ces informations pour qu’elles adoptent le bon format et le bon langage, puis vous les présente.

Comment vos données sont-elles protégées ?

  • Lorsque nous envoyons des données à nos fournisseurs de LLM, nous les chiffrons pendant leur transport avec le protocole TLS 1.2 ou version supérieure. Les données client ne sont en aucun cas utilisées pour entraîner le modèle.

  • Tous nos fournisseurs de LLM conservent les données pendant un maximum de 30 jours avant de les supprimer.

  • Les fournisseurs de LLM reçoivent uniquement les données auxquelles l’utilisateur a accès sur la page sur laquelle il utilise le rédacteur ou le remplissage automatique pour générer des informations. Autrement dit, ces informations contiendront uniquement des données auxquelles l’utilisateur avait déjà accès.

Comment fonctionne Notion Q&A ?

Notion Q&A fonctionne en deux temps :

  1. Création de plongements lexicaux ;

  2. Production de réponses.

Que sont les plongements lexicaux ?

Les plongements lexicaux sont des représentations numériques de textes ou documents. Ils intègrent la signification et le contexte du texte au sein d’un espace multidimensionnel dans lequel les sujets similaires sont associés à des représentations numériques du même type. Avec les plongements lexicaux, les algorithmes de recherche vectorielle sont en mesure de comparer et d’identifier des similarités de manière efficace entre différentes parties d’un texte ou de documents. Dans le cas de Notion Q&A, les plongements lexicaux sont générés à partir du contenu de l’espace de travail, afin que le système puisse fournir des réponses précises et pertinentes aux questions de l’utilisateur.

Voici un exemple de plongement lexical généré par OpenAI :

[
-0.02541878,
-0.0104167685,
-0.0015037002,
...,
-0.004155378,
-0.00043069973,
-0.01679479
]

Comment les plongements lexicaux sont-ils créés ?

  1. Pour créer les plongements lexicaux, Notion envoie le contenu de l’espace de travail à OpenAI.

  2. OpenAI envoie ensuite les plongements lexicaux à Notion, qui les stocke dans une base de données de vecteurs hébergée par Pinecone. Cette base de données permet ensuite de fournir des réponses aux questions.

Comment les plongements lexicaux sont-ils créés ?

Comment les plongements lexicaux permettent-ils de générer des réponses ?

  1. Notion reçoit une question d’un utilisateur ;

  2. La question est transmise à un fournisseur de LLM, qui la reformule pour obtenir une réponse optimale ;

  3. Cette question reformulée est alors envoyée à Pinecone, qui fournit une liste des pages concernées par la question ;

  4. Notion envoie la question et les pages identifiées par Pinecone à un LLM hébergé par Notion, où les pages sont affinées et classées par pertinence ;

  5. La question, la liste affinée des pages et leur classement sont ensuite traités par nos fournisseurs de LLM ;

  6. Notion traite les informations renvoyées pour qu’elles adoptent le bon format et le bon langage et les présente ensuite à l’utilisateur.

Comment les plongements lexicaux permettent-ils de générer des réponses ?

Comment sont protégés les plongements lexicaux ?

Les plongements lexicaux ont beau être de simples représentations numériques des données client, Notion leur fait bénéficier du même niveau de sécurité et de confidentialité que les données client elles-mêmes. Nos engagements envers la protection des données client sont présentés dans notre contrat-cadre de service (MSA). Par ailleurs, les plongements lexicaux sont régis par les clauses de nos accords de traitement de données (ATD).

Nous stockons les plongements lexicaux auprès de Pinecone. Notre équipe de sécurité a approuvé ce service, qui bénéficie par ailleurs d’une certification SOC2 Type II obtenue après audit externe. En savoir plus sur la sécurité de Pinecone →

L’IA de Notion respecte-t-elle les autorisations existantes ?

Oui. L’IA de Notion respecte les autorisations existantes. Les utilisateurs ne seront pas en mesure de générer du contenu ou de recevoir des réponses de Notion Q&A qui prendraient en compte des ressources auxquelles ils n’ont pas accès.

Comment les données client sont-elles protégées lors de leur envoi aux sous-traitants d’IA ?

L’IA de Notion est conçue pour protéger vos données client et éviter toute divulgation d’informations aux autres utilisateurs du service.

Avant de s’associer à un sous-traitant ou à un fournisseur, Notion évalue ses pratiques de confidentialité et de sécurité, et signe un contrat définissant ses obligations légales en la matière. Tous les sous-traitants font l’objet d’un contrôle et d’un audit au moins une fois par an pour garantir le respect continu de leurs obligations. Ces vérifications incluent l’analyse de documents comme des rapports d’attestation, des tests d’intrusion et d’autres éléments en fonction de l’importance stratégique du sous-traitant et d’autres facteurs de risque. Dans le cadre de l’intégration et des audits réguliers de ses sous-traitants, Notion leur fait également parvenir des questionnaires obligatoires. Enfin, les événements de sécurité publics majeurs sont évalués pour protéger la surface d’attaque de la supply chain.

Quand nous envoyons vos données à des tiers, elles sont chiffrées en transit à l’aide du protocole TLS 1.2 ou d’une version supérieure.

Pour en savoir plus sur le traitement de vos données par Notion, consultez notre addendum relatif au traitement des données (ATD).

Nos données seront-elles utilisées pour entraîner des modèles ?

Non. Les contrats conclus avec nos sous-traitants d’IA interdisent l’utilisation des données client pour entraîner des modèles.

Votre utilisation de l’IA de Notion ne confère à Notion aucun droit sur vos données client ni licence pour entraîner nos modèles d’apprentissage automatique.

Comment les données client sont-elles isolées ?

Chaque compte client est stocké de manière individuelle dans notre environnement de production. Nous ne mélangeons ni ne traitons ensemble les données de clients différents lors de l’utilisation des fonctionnalités d’IA. Cela signifie que nous n’exposons pas vos données aux autres clients de Notion.

Quelles sont les obligations de nos fournisseurs d’IA en matière de conservation de données ?

Les sous-traitants de l’IA de Notion disposent de politiques de conservation des données permettant à Notion de respecter ses obligations en matière de traitement des données.

Lorsque vous utilisez le rédacteur IA ou Notion Q&A, OpenAI et Anthropic conservent les données client pendant 30 jours ou moins avant leur suppression. Notion Q&A s’appuie également sur des intégrations d’OpenAI ; OpenAI ne conserve aucune donnée client par le biais de son service d’intégration.

Les plongements lexicaux stockés sur le service Pinecone sont supprimés dans les 60 jours suivant la suppression de la page ou de l’espace de travail associé.

Si un utilisateur supprime une page ou un espace de travail Notion, nous pouvons en restaurer le contenu pendant les 30 jours qui suivent. Passé ce délai, les données supprimées ne sont plus récupérables, y compris les données générées par l’IA et les plongements lexicaux. Pour en savoir plus sur la suppression et la restauration de vos données, reportez-vous à cette page de notre site d’aide →

Quelles sont les normes de conformité respectées par l’IA de Notion ?

L’IA de Notion entre dans le champ du rapport SOC 2 type 2 et de la certification ISO 27001, ce qui témoigne de notre engagement à respecter diverses normes.

Nous travaillons activement à sa mise en conformité avec les obligations de la loi HIPAA, en passant par les API sans conservation de données des fournisseurs de LLM afin de pouvoir traiter des données de santé (PHI).

Est-il possible de configurer une intégration de prévention de la perte de données (DLP) pour générer une alerte lorsque des données sont utilisées par l’IA de Notion ?

Oui. Nos clients peuvent déclencher des alertes de prévention de la perte de données lorsque du contenu sensible de leur espace de travail Notion est utilisé, à l’aide de partenaires d’intégration tiers accessibles avec notre forfait Entreprise. Ces alertes incluront les instructions d’IA et le contenu généré par l’IA. En savoir plus sur l’intégration DLP →

Est-il possible d’empêcher l’envoi de données aux sous-traitants de l’IA de Notion ?

Oui. Si vous êtes le propriétaire d’un espace de travail au forfait Entreprise, vous pouvez empêcher l’envoi de données aux sous-traitants d’IA en désactivant l’option IA de Notion dans la section Paramètres et membres. Cette option est accessible uniquement depuis un ordinateur.

Lors de la désactivation de cette fonctionnalité, toutes les données de votre espace de travail sont conservées, y compris le contenu généré précédemment par l’IA de Notion. La totalité des participants à votre espace de travail, qu’il s’agisse de propriétaires, d’administrateurs ou de membres, verra son accès aux fonctionnalités de l’IA de Notion désactivé dans cet espace de travail.

Existe-t-il des interdits en lien avec l’IA de Notion ?

Oui. Les conditions d’utilisation du programme d’IA de Notion régissent votre utilisation de l’IA de Notion. En outre, la politique relative au contenu et à l’utilisation de Notion s’applique à tout contenu disponible sur Notion, y compris le contenu généré par l’IA. La violation de ces politiques pourrait entraîner la suppression de votre contenu ou la suspension de l’accès à votre espace de travail.

Qui détient les droits sur le contenu généré par l’IA de Notion ?

Notion ne revendique aucun droit sur les données en entrée ou les données générées. Cette question est abordée dans les conditions d’utilisation du programme d’IA de Notion dans la section « Données en entrée et données en sortie » :

Vous pouvez fournir des données à traiter par l’IA de Notion (« Données en entrée ») et recevoir des résultats générés et renvoyés par l’IA de Notion sur la base de ces données en entrée (« Données en sortie »). Lorsque vous utilisez l’IA de Notion, les données en entrée et données en sortie sont considérées comme des données client.

Vous pouvez également vous reporter à nos pratiques de protection des données.


Donner votre avis

Cette ressource vous a-t-elle été utile ?