The Fort Worth Press - Pour grandir, l'IA générative se tourne vers les livres

USD -
AED 3.673104
AFN 64.000368
ALL 80.950403
AMD 369.010403
ANG 1.789884
AOA 918.000367
ARS 1398.655759
AUD 1.37874
AWG 1.8025
AZN 1.70397
BAM 1.662466
BBD 2.013854
BDT 122.689218
BGN 1.668102
BHD 0.377404
BIF 2975
BMD 1
BND 1.267973
BOB 6.9098
BRL 4.915095
BSD 0.999873
BTN 94.420977
BWP 13.425192
BYN 2.825886
BYR 19600
BZD 2.010964
CAD 1.36705
CDF 2265.000362
CHF 0.776767
CLF 0.022646
CLP 891.290396
CNY 6.80075
CNH 6.796265
COP 3750.48
CRC 459.648974
CUC 1
CUP 26.5
CVE 94.050394
CZK 20.636704
DJF 177.720393
DKK 6.340404
DOP 59.350393
DZD 132.14904
EGP 52.744691
ERN 15
ETB 157.303874
EUR 0.84804
FJD 2.182504
FKP 0.734821
GBP 0.73346
GEL 2.67504
GGP 0.734821
GHS 11.29039
GIP 0.734821
GMD 73.503851
GNF 8780.000355
GTQ 7.634866
GYD 209.223551
HKD 7.83175
HNL 26.620388
HRK 6.393304
HTG 130.919848
HUF 300.190388
IDR 17377.45
ILS 2.901304
IMP 0.734821
INR 94.44155
IQD 1310
IRR 1311500.000352
ISK 122.010386
JEP 0.734821
JMD 157.601928
JOD 0.70904
JPY 156.66204
KES 129.180385
KGS 87.420504
KHR 4010.00035
KMF 418.00035
KPW 899.950939
KRW 1461.920383
KWD 0.30766
KYD 0.833358
KZT 462.122307
LAK 21955.000349
LBP 89550.000349
LKR 321.915771
LRD 183.503772
LSL 16.405102
LTL 2.95274
LVL 0.60489
LYD 6.322723
MAD 9.144703
MDL 17.099822
MGA 4165.000347
MKD 52.319561
MMK 2099.606786
MNT 3578.902576
MOP 8.06268
MRU 39.968719
MUR 46.820378
MVR 15.455039
MWK 1733.612706
MXN 17.177604
MYR 3.921039
MZN 63.903729
NAD 16.405102
NGN 1359.570377
NIO 36.715039
NOK 9.208804
NPR 151.087386
NZD 1.675884
OMR 0.384942
PAB 0.999962
PEN 3.434504
PGK 4.350375
PHP 60.515038
PKR 278.650374
PLN 3.59545
PYG 6107.687731
QAR 3.640374
RON 4.426304
RSD 99.473038
RUB 74.240007
RWF 1460.5
SAR 3.782036
SBD 8.019432
SCR 13.958442
SDG 600.503676
SEK 9.215704
SGD 1.267304
SHP 0.746601
SLE 24.650371
SLL 20969.496166
SOS 571.503662
SRD 37.399038
STD 20697.981008
STN 21.15
SVC 8.749309
SYP 110.543945
SZL 16.370369
THB 32.220369
TJS 9.329718
TMT 3.5
TND 2.866038
TOP 2.40776
TRY 45.349038
TTD 6.776593
TWD 31.316038
TZS 2598.394038
UAH 43.92104
UGX 3746.547108
UYU 39.879308
UZS 12135.000334
VES 499.23597
VND 26308
VUV 118.026144
WST 2.704092
XAF 557.575577
XAG 0.012439
XAU 0.000212
XCD 2.70255
XCG 1.802048
XDR 0.695511
XOF 557.503593
XPF 101.625037
YER 238.625037
ZAR 16.380704
ZMK 9001.203584
ZMW 19.037864
ZWL 321.999592
  • AEX

    -1.9400

    1017.5

    -0.19%

  • BEL20

    -6.5600

    5463.32

    -0.12%

  • PX1

    -89.4000

    8112.57

    -1.09%

  • ISEQ

    -222.6400

    12721.67

    -1.72%

  • OSEBX

    -8.9100

    1970.28

    -0.45%

  • PSI20

    -66.6800

    9067.26

    -0.73%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -6.0000

    3992.65

    -0.15%

  • N150

    -9.6600

    4189.18

    -0.23%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: © AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

M.Cunningham--TFWP