The Fort Worth Press - Pour grandir, l'IA générative se tourne vers les livres

USD -
AED 3.672497
AFN 65.999471
ALL 81.749912
AMD 377.657389
ANG 1.79008
AOA 916.489445
ARS 1447.774602
AUD 1.433949
AWG 1.80125
AZN 1.703098
BAM 1.656847
BBD 2.015105
BDT 122.260014
BGN 1.67937
BHD 0.377032
BIF 2953.091775
BMD 1
BND 1.272884
BOB 6.913553
BRL 5.239204
BSD 1.000479
BTN 90.561067
BWP 13.175651
BYN 2.857082
BYR 19600
BZD 2.012224
CAD 1.36841
CDF 2224.999659
CHF 0.778355
CLF 0.021805
CLP 860.999957
CNY 6.94215
CNH 6.94197
COP 3642
CRC 496.003592
CUC 1
CUP 26.5
CVE 93.41048
CZK 20.68075
DJF 178.163135
DKK 6.33486
DOP 63.049437
DZD 129.986956
EGP 46.961897
ERN 15
ETB 154.976835
EUR 0.84826
FJD 2.20805
FKP 0.729917
GBP 0.734446
GEL 2.689902
GGP 0.729917
GHS 10.985781
GIP 0.729917
GMD 73.500789
GNF 8780.996111
GTQ 7.67429
GYD 209.32114
HKD 7.80883
HNL 26.428662
HRK 6.385501
HTG 131.143652
HUF 321.991502
IDR 16828.55
ILS 3.10525
IMP 0.729917
INR 90.394901
IQD 1310.5
IRR 42125.000158
ISK 122.830055
JEP 0.729917
JMD 156.862745
JOD 0.708956
JPY 156.932007
KES 129.000202
KGS 87.450061
KHR 4029.999686
KMF 416.999794
KPW 899.945137
KRW 1467.869894
KWD 0.30742
KYD 0.83376
KZT 497.113352
LAK 21520.880015
LBP 86149.999963
LKR 309.665505
LRD 185.999907
LSL 16.060391
LTL 2.95274
LVL 0.60489
LYD 6.323093
MAD 9.174499
MDL 16.928505
MGA 4431.457248
MKD 52.289772
MMK 2099.936125
MNT 3569.846682
MOP 8.051354
MRU 39.72959
MUR 46.069927
MVR 15.459857
MWK 1737.999676
MXN 17.36485
MYR 3.947978
MZN 63.759773
NAD 16.060374
NGN 1371.399239
NIO 36.81834
NOK 9.708245
NPR 144.897432
NZD 1.670075
OMR 0.384506
PAB 1.000479
PEN 3.362498
PGK 4.286719
PHP 58.773502
PKR 279.84277
PLN 3.57756
PYG 6622.13506
QAR 3.64125
RON 4.321597
RSD 99.582996
RUB 76.249364
RWF 1459.958497
SAR 3.750129
SBD 8.064647
SCR 14.106828
SDG 601.502126
SEK 9.00598
SGD 1.27433
SHP 0.750259
SLE 24.549799
SLL 20969.499267
SOS 571.483593
SRD 37.894031
STD 20697.981008
STN 20.755852
SVC 8.7544
SYP 11059.574895
SZL 16.059778
THB 31.827019
TJS 9.349774
TMT 3.505
TND 2.845498
TOP 2.40776
TRY 43.532004
TTD 6.777163
TWD 31.677296
TZS 2584.99965
UAH 43.151654
UGX 3562.246121
UYU 38.562056
UZS 12264.970117
VES 377.98435
VND 25967.5
VUV 119.556789
WST 2.72617
XAF 555.589718
XAG 0.012686
XAU 0.000204
XCD 2.70255
XCG 1.803149
XDR 0.691101
XOF 555.690911
XPF 101.550041
YER 238.324995
ZAR 16.14345
ZMK 9001.198478
ZMW 19.585153
ZWL 321.999592
  • AEX

    -3.6800

    990.32

    -0.37%

  • BEL20

    45.6500

    5545.43

    +0.83%

  • PX1

    82.6100

    8262.16

    +1.01%

  • ISEQ

    144.4500

    13519.02

    +1.08%

  • OSEBX

    5.9800

    1765.77

    +0.34%

  • PSI20

    53.8500

    8881.79

    +0.61%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -18.9200

    4094.87

    -0.46%

  • N150

    24.1500

    3983.95

    +0.61%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: © AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

M.Cunningham--TFWP