C’était une question de temps avant que le phénomène ne prenne de l’ampleur. Depuis des mois, bon nombre d’auteurs et d’autrices — dont George R.R. Martin, à qui l’on doit Game of Thrones — ont déjà fait entendre leur voix contre l’arrivée massive de l’IA dans le monde de l’édition, dénonçant notamment la manière dont leurs ouvrages étaient utilisés sans leur consentement pour entraîner des modèles de langage toujours plus performants. L’intelligence artificielle générative vient de passer un nouveau cap, et passe désormais par la grande porte.
Une maison d’édition vend ses livres à l’IA
Le 15 novembre dernier, l’auteur et scénariste américain Daniel Kibblesmith partage sur Bluesky un étrange mail provenant de son éditeur HarperCollins. On y découvre alors que la maison d’édition souhaite obtenir son autorisation “pour intégrer (son) livre à un partenariat établi avec une grande entreprise technologique, visant à utiliser une sélection étendue d’ouvrages de non-fiction pour l’entraînement d’une intelligence artificielle générative“. Une décision qui fait grincer des dents, surtout lorsqu’on connait les relations conflictuelles entre auteurs et intelligence artificielle.
2500$ pour vendre son travail
Dans son mail, l’éditeur précise les détails de cet accord : chaque auteur est libre de refuser ou d’accepter la vente de son travail à des fins d’entraînement de l’IA. Le cas échéant, HarperCollins précise que c’est une somme fixe et non négociable qui sera versée aux ayant-droits, à raison de 2500$ par ouvrage. Dans le cas de Daniel Kibblesmith et de son livre pour enfant Santa’s Husband, la somme est donc à partager en deux, avec 1250$ pour l’auteur et 1250$ pour l’illustrateur. “Ces conditions ont déjà été négociées et acceptées par plusieurs centaines d’auteurs, donc une négociation individuelle n’est pas possible“, prévient toutefois l’éditeur, qui réclame “une acceptation ou un refus global“.
Abominable.
— Daniel Kibblesmith (@kibblesmith.com) 15 novembre 2024 à 20:36
Mieux que rien ?
Derrière la proposition formulée par HarperCollins, le cynisme de l’éditeur interpelle. Face à une situation tendue entre les différents acteurs de l’édition, il estime “Cette technologie existe et est déjà utilisée“. Comprenez, l’IA générative utilise déjà les contenus des livres publiés pour entraîner ses modèles de langage. Mieux vaut être rémunéré et consentant, plutôt que de voir son travail exploité gratuitement.
Reste que les promesses d’HarperCollins sont légères, face au déferlement annoncé de l’IA. Si les auteurs et les autrices ont effectivement le droit de refuser de voir leurs ouvrages vendus à une grande entreprise technologique — dont on ignore d’ailleurs le nom, l’accord ne couvre que trois ans d’exploitation des textes. Difficile de croire que passé ce délai, ces derniers ne resteront pas dans la mémoire des LLM.
De son côté, l’éditeur met en avant une tentative d’innovation, visant à proposer de nouvelles “perspectives intéressantes, tout en préservant la valeur fondamentale des œuvres et des revenus partagés“. Ce n’est d’ailleurs pas la première fois qu’HarperCollins cède aux sirènes de l’IA : en avril dernier, l’entreprise annonçait déjà un partenariat avec ElevenLabs, spécialisée dans les technologies d’IA audio, pour produire des livres audio en langues étrangères.
À l’inverse, d’autres maisons d’éditions font le choix de refuser en bloc les perspectives offertes par l’IA, en préférant protéger les auteurs d’une situation encore balbutiante, forcément susceptible de leur échapper. C’est le cas de Penguin Random House, qui a modifié les clauses de ses contrats en octobre dernier pour interdire explicitement que ses livres soient utilisés afin de développer des modèles de langage d’IA.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.