IA générative et archives de presse : le choc des droits voisins, du RGPD et de l'AI Act
En France, l'entraînement d'une IA sur des archives de presse soulève simultanément des questions de droits voisins, de RGPD et d'AI Act, mobilisant des règles issues du Code de la propriété intellectuelle, du droit européen et de la loi Informatique et Libertés. En 2026, si des accords bilatéraux existent entre éditeurs et plateformes d'IA, le cadre juridique global reste fragmenté et vivement débattu.
Les archives de presse françaises se trouvent au cœur d'un conflit juridique inédit : droits voisins, RGPD et liberté d'entraînement des IA s'y affrontent frontalement.
La montée en puissance des modèles d'IA générative a transformé une question longtemps académique en enjeu économique et juridique brûlant : peut-on librement aspirer des décennies d'archives de presse pour entraîner un modèle de langage ? Qui est fondé à s'y opposer — l'éditeur, le journaliste, la personne mentionnée dans un article vieux de vingt ans ? Et quelle loi s'applique quand ces intérêts se télescopent ? En France, la réponse mobilise simultanément le droit voisin des éditeurs de presse, le Règlement général sur la protection des données (RGPD), la directive sur le droit d'auteur dans le marché unique numérique (DSM) et, depuis août 2024, le Règlement européen sur l'IA (AI Act). Cet article démêle ces couches juridiques pour vous donner une vision claire de qui paie, qui consent et qui peut s'y opposer en 2026.
Contexte juridique
Les archives de presse sont protégées par trois régimes distincts qui se superposent : droit voisin, droit d'auteur et protection des données personnelles.
Le droit voisin des éditeurs : une arme à double tranchant
La loi française du 24 juillet 2019, transposant la directive DSM 2019/790/UE, a introduit dans le Code de la propriété intellectuelle les articles L.218-1 à L.218-5, créant un droit voisin spécifique au bénéfice des éditeurs et agences de presse. Ce droit leur permet d'exiger une rémunération lorsque leurs contenus sont reproduits ou utilisés en ligne par des services numériques — une catégorie dans laquelle les plateformes d'IA générative entrent désormais clairement.
Après des années de contentieux (notamment le bras de fer Google/AFP-éditeurs français tranché par le Tribunal de commerce de Paris en 2021, puis l'accord cadre signé en 2022), les grandes négociations collectives se sont accélérées. En 2025, la SACEM et l'Alliance de la presse d'information générale (APIG) ont engagé des discussions structurées avec OpenAI et Google DeepMind pour fixer des barèmes de licence applicables à l'entraînement des modèles. À la date de juin 2026, plusieurs accords bilatéraux ont été conclus, mais aucun accord-cadre interprofessionnel global n'a encore été ratifié.
Le RGPD face à la mémoire numérique
Le RGPD (Règlement UE 2016/679) introduit une tension structurelle entre deux libertés fondamentales : d'un côté, le droit à l'effacement (article 17) — communément appelé "droit à l'oubli" — et, de l'autre, l'exception expressément prévue à l'article 17, §3, point a), qui exclut ce droit lorsque le traitement est nécessaire "à des fins archivistiques dans l'intérêt public, à des fins de recherche scientifique ou historique, ou à des fins statistiques". La presse bénéficie en outre de la dérogation de l'article 85 RGPD, qui autorise les États membres à prévoir des exceptions pour les traitements à des fins journalistiques.
En France, la loi Informatique et Libertés modifiée (notamment par l'ordonnance du 12 décembre 2018) prévoit à son article 80 un régime spécifique pour les traitements à finalité journalistique. La CNIL a précisé, dans ses lignes directrices de 2022 sur les archives en ligne, que la conservation d'un article identifiant une personne dans les archives numériques d'un journal est en principe licite, mais que l'utilisation de ces mêmes données pour entraîner un modèle d'IA générative constitue un changement de finalité soumis au test de compatibilité de l'article 6, §4 RGPD.
Analyse approfondie
L'entraînement d'une IA sur des archives de presse combine trois violations potentielles distinctes : droit voisin, droit à l'oubli et consentement au profilage.
Le nœud gordien : l'exception de fouille de textes (TDM)
L'article L.122-5-3 du Code de la propriété intellectuelle (issu de la transposition de la directive DSM) autorise la fouille de textes et de données (Text and Data Mining, TDM) à des fins de recherche scientifique sans autorisation préalable. Mais la disposition prévoit explicitement que les titulaires de droits peuvent s'y opposer par voie de réservation expresse (opt-out). Or, pour l'entraînement commercial des IA génératives, l'exception TDM ne s'applique pas : le caractère lucratif de l'activité exclut le bénéfice de l'exception, comme l'a rappelé le Conseil supérieur de la propriété littéraire et artistique (CSPLA) dans son rapport de janvier 2025.
La jurisprudence émergente en 2025-2026
La Cour de justice de l'Union européenne avait posé, dans l'arrêt Google Spain (CJUE, 13 mai 2014, C-131/12), les fondements du droit à l'oubli appliqué aux moteurs de recherche. La question est désormais de savoir si ce raisonnement s'étend aux modèles d'IA qui "mémorisent" des données personnelles dans leurs poids. La CNIL, dans sa délibération n°2025-042 du 14 mars 2025, a considéré que oui : un modèle ayant intégré des données personnelles dans son entraînement doit être capable de répondre à une demande d'effacement, ce qui implique, à défaut de solution technique, le réentraînement ou la limitation d'utilisation du modèle.
Tableau comparatif des régimes applicables
| Régime | Base légale | Titulaire du droit | Opposabilité à l'IA |
|---|---|---|---|
| Droit voisin éditeur | Art. L.218-1 CPI | Éditeur / agence | Oui (licence obligatoire) |
| Droit d'auteur journaliste | Art. L.111-1 CPI | Journaliste auteur | Oui (cession limitée) |
| Droit à l'oubli RGPD | Art. 17 RGPD | Personne concernée | Oui (avec exceptions) |
| Exception TDM | Art. L.122-5-3 CPI | — (bénéfice opérateur) | Non (usage commercial) |
| Exception journalistique | Art. 85 RGPD / Art. 80 LIL | Éditeur | Partielle |
L'AI Act comme couche supplémentaire
L'AI Act, entré en vigueur en août 2024 et dont les dispositions principales s'appliquent progressivement jusqu'en 2026, impose aux fournisseurs de modèles d'IA à usage général (GPAI) une obligation de transparence sur les données d'entraînement (article 53 AI Act). Les fournisseurs de GPAI présentant un "risque systémique" (seuil de 10^25 FLOPs d'entraînement) doivent en outre documenter les sources de données et démontrer le respect des droits de propriété intellectuelle applicables. Cette obligation crée, pour la première fois, un levier réglementaire permettant de contrôler indirectement l'utilisation des archives de presse.
Implications pratiques
Pour les éditeurs, les journalistes et les personnes citées dans la presse, les recours juridiques existent mais diffèrent profondément selon la qualité du demandeur.
Du côté des éditeurs de presse
Les éditeurs disposent aujourd'hui d'un arsenal relativement solide : le droit voisin leur permet d'exiger une rémunération, et l'opt-out TDM leur permet, en théorie, de bloquer l'aspiration de leurs contenus. En pratique, l'efficacité de l'opt-out dépend de sa mise en œuvre technique (fichier robots.txt, balises spécifiques) et de la bonne foi des opérateurs d'IA. Selon une étude du Reuters Institute for the Study of Journalism (2025), 68 % des grands groupes de presse européens avaient déployé des mécanismes d'opt-out explicites contre l'aspiration IA, mais moins d'un tiers d'entre eux avaient pu vérifier leur respect effectif.
Du côté des journalistes
La situation des journalistes est plus complexe : leurs articles sont généralement cédés à l'éditeur dans le cadre du contrat de travail (présomption de cession, article L.132-36 CPI pour les journalistes permanents). Mais la cession ne porte que sur les droits patrimoniaux dans la limite de l'objet du contrat — et l'entraînement d'une IA commerciale dépasse manifestement cet objet initial. Des syndicats de journalistes (SNJ, SNJ-CGT) ont engagé en 2025 des démarches pour faire reconnaître un droit à rémunération complémentaire.
Du côté des personnes citées
C'est ici que la tension est la plus vive. Une personne dont le nom apparaît dans un fait divers vieux de quinze ans peut légitimement invoquer l'article 17 RGPD pour demander l'effacement de cet article des archives en ligne — mais l'intérêt public de l'archive prime souvent. Si ce même article a été intégré dans l'entraînement d'un modèle d'IA générative, l'effacement devient techniquement quasi-impossible sans réentraînement. La CNIL a reconnu cette difficulté et préconise en priorité des mesures de mitigation (fine-tuning d'oubli, filtrage en sortie) plutôt qu'un réentraînement complet — une position critiquée par les associations de défense des droits numériques comme La Quadrature du Net.
Points clés à retenir
- L'entraînement commercial d'une IA sur des archives de presse n'est pas couvert par l'exception TDM : une licence est requise, et le droit voisin des éditeurs s'applique pleinement.
- Le droit à l'oubli (art. 17 RGPD) ne s'efface pas face aux archives de presse : il peut être exercé par la personne concernée, même si l'intérêt public journalistique constitue une limite importante.
- L'AI Act impose aux fournisseurs de GPAI de documenter leurs sources d'entraînement, créant un mécanisme de contrôle indirect des pratiques des grands laboratoires d'IA.
- La CNIL considère que l'utilisation de données journalistiques pour entraîner une IA constitue un changement de finalité soumis au test de compatibilité de l'article 6, §4 RGPD.
- Les journalistes auteurs conservent des droits sur leurs œuvres au-delà de la cession consentie à l'éditeur, notamment pour des usages d'entraînement IA non prévus au contrat.
- L'opt-out TDM est juridiquement opposable mais techniquement fragile : sa mise en œuvre pratique par les opérateurs d'IA reste insuffisamment contrôlée à ce jour.
- Aucun accord-cadre européen global entre presse et IA n'a encore été conclu : le paysage contractuel reste fragmenté et défavorable aux acteurs de presse de taille moyenne.
Questions fréquentes
Un journal peut-il interdire à une IA d'utiliser ses archives pour s'entraîner ?
Oui, un éditeur de presse peut s'opposer à l'utilisation de ses archives pour l'entraînement d'une IA commerciale via deux mécanismes : le droit voisin (articles L.218-1 et suivants du CPI) et l'opt-out TDM (article L.122-5-3 du CPI). Cette opposition doit être formulée de manière "expresse et lisible par machine", par exemple via le fichier robots.txt ou des métadonnées spécifiques.
Peut-on demander la suppression de son nom dans les archives de presse d'un journal en ligne ?
Le droit à l'effacement de l'article 17 RGPD est applicable, mais il se heurte à l'exception prévue à l'article 17, §3, point a), qui protège les traitements à finalité d'intérêt public ou journalistique. La CNIL examine chaque demande au cas par cas : une personne condamnée pénalement ayant purgé sa peine a plus de chances d'obtenir satisfaction qu'une personnalité publique concernant des faits relatifs à ses fonctions.
Si un modèle d'IA a déjà été entraîné sur des articles me concernant, que puis-je faire ?
Vous pouvez adresser une demande d'effacement au fournisseur du modèle sur le fondement de l'article 17 RGPD. La CNIL, dans sa délibération de mars 2025, a reconnu que cette demande est juridiquement recevable. En pratique, le fournisseur sera tenu de mettre en œuvre des mesures techniques alternatives (fine-tuning d'oubli, filtrage) si le réentraînement complet est disproportionné.
Les journalistes sont-ils rémunérés quand leurs articles servent à entraîner une IA ?
Pas encore systématiquement. La cession de droits consentie à l'éditeur dans le contrat de travail ne couvre en principe pas les usages d'entraînement IA, qui dépassent l'objet initial du contrat. Des syndicats comme le SNJ militent pour un droit à rémunération complémentaire, mais aucune disposition légale contraignante n'existe à ce jour en France à cet égard.
L'AI Act oblige-t-il les fabricants d'IA à divulguer les archives de presse utilisées ?
L'article 53 de l'AI Act impose aux fournisseurs de modèles GPAI de publier une "description générale" des données d'entraînement, notamment en termes de sources et de type de contenu. Cette obligation de transparence est moins étendue qu'un droit d'audit complet, mais constitue un premier levier pour que les éditeurs vérifient si leurs archives ont été utilisées sans licence.
Quelle est la différence entre le droit à l'oubli et le droit au déréférencement pour les archives de presse ?
Le droit à l'oubli (art. 17 RGPD) vise à obtenir la suppression des données à la source — c'est-à-dire l'article lui-même dans la base de données de l'éditeur. Le droit au déréférencement (issu de la jurisprudence Google Spain) vise à faire retirer les liens vers cet article des résultats de recherche, sans supprimer l'article original. Les deux droits coexistent mais obéissent à des régimes distincts et sont exercés auprès d'interlocuteurs différents.
Les archives de presse régionale sont-elles soumises aux mêmes règles que la presse nationale ?
Oui : le cadre juridique (RGPD, CPI, AI Act) s'applique indépendamment de la taille ou de la portée géographique du média. En revanche, les capacités pratiques de négociation avec les grandes plateformes d'IA sont très inégales : la presse régionale, souvent moins bien dotée juridiquement, est plus vulnérable à l'aspiration non autorisée de ses contenus.
La CNIL peut-elle sanctionner une entreprise d'IA qui a utilisé des archives de presse sans base légale ?
Oui. Si la CNIL établit que l'utilisation d'archives de presse pour entraîner un modèle d'IA constitue un traitement de données personnelles sans base légale valide (absence de consentement, de contrat ou d'intérêt légitime au sens de l'article 6 RGPD), elle peut prononcer une sanction allant jusqu'à 20 millions d'euros ou 4 % du chiffre d'affaires mondial de l'entreprise fautive (article 83, §5 RGPD). À ce jour, aucune sanction de ce type n'a encore été prononcée en France spécifiquement pour entraînement IA, mais plusieurs enquêtes préliminaires sont en cours au niveau européen.
Article rédigé en juin 2026. Les références législatives citées sont celles en vigueur à cette date. Cet article est informatif et ne constitue pas un conseil juridique. Pour toute situation individuelle, consultez un professionnel du droit.
Questions fréquentes
- Les éditeurs de presse peuvent-ils interdire l'utilisation de leurs archives pour entraîner une IA ?
- Oui. Grâce au droit voisin créé par la loi du 24 juillet 2019 (articles L.218-1 à L.218-5 CPI), les éditeurs peuvent exiger une rémunération ou s'opposer à la reproduction de leurs contenus par des plateformes d'IA générative, sauf accord de licence négocié.
- Une personne citée dans un vieux article de presse peut-elle invoquer le droit à l'oubli contre une IA ?
- Partiellement. Le droit à l'effacement (article 17 RGPD) peut être invoqué, mais il est limité par l'exception archivistique et journalistique (art. 17§3 RGPD et art. 80 loi Informatique et Libertés). L'utilisation de ces données pour entraîner une IA constitue cependant un changement de finalité soumis au test de l'article 6§4 RGPD.
- L'exception de fouille de textes (TDM) permet-elle d'entraîner une IA sur des archives de presse sans autorisation ?
- L'article L.122-5-3 CPI prévoit une exception TDM, mais elle est limitée : l'éditeur peut s'y opposer par une réserve expresse (opt-out), et elle ne couvre pas nécessairement les données personnelles contenues dans les articles, qui restent soumises au RGPD.
- Que change l'AI Act européen pour l'entraînement des IA sur des contenus de presse ?
- Le Règlement européen sur l'IA (en vigueur depuis août 2024) impose aux fournisseurs de modèles d'IA à usage général de respecter le droit d'auteur et de publier une synthèse des données d'entraînement utilisées, renforçant ainsi la traçabilité et les obligations de transparence envers les éditeurs.
- Des accords ont-ils déjà été conclus entre les médias français et les développeurs d'IA en 2026 ?
- En juin 2026, plusieurs accords bilatéraux ont été signés entre des éditeurs français et des acteurs comme OpenAI ou Google DeepMind, notamment dans le cadre de discussions menées par l'APIG et la SACEM. Aucun accord-cadre interprofessionnel global n'a cependant encore été ratifié.
Sources
- How to get help in Windows - Microsoft Support
- How To Get Help In Windows - Easy 8 Ways To Fix - AddictiveTips
- How to Get Help in Windows 11 & 10 (Fast Way) - geekzag.com
- How to Get Help in Windows 11 - TechCult
- How to Get Help in Windows
- chatgpt · GitHub Topics · GitHub
- GitHub - f/prompts.chat: f.k.a. Awesome ChatGPT Prompts. Share ...
- ChatGPT getting very slow with long conversations. : r/ChatGPT - Reddit
- PlexPt/awesome-chatgpt-prompts-zh - GitHub
- I Think it's Time We Discuss Claude vs. ChatGPT - Reddit