The Fort Worth Press - Pour grandir, l'IA générative se tourne vers les livres

USD -
AED 3.672502
AFN 63.000196
ALL 83.045552
AMD 377.608336
ANG 1.790083
AOA 916.999745
ARS 1383.1365
AUD 1.43213
AWG 1.8025
AZN 1.696767
BAM 1.692703
BBD 2.017085
BDT 122.889314
BGN 1.709309
BHD 0.375272
BIF 2964.437482
BMD 1
BND 1.280822
BOB 6.920277
BRL 5.3193
BSD 1.001532
BTN 93.628346
BWP 13.656801
BYN 3.038457
BYR 19600
BZD 2.014228
CAD 1.371515
CDF 2275.000405
CHF 0.78928
CLF 0.023138
CLP 913.630314
CNY 6.8864
CNH 6.91586
COP 3696.54
CRC 467.791212
CUC 1
CUP 26.5
CVE 95.432004
CZK 21.228963
DJF 178.340531
DKK 6.471195
DOP 59.449729
DZD 131.454091
EGP 51.964401
ERN 15
ETB 157.836062
EUR 0.86616
FJD 2.21445
FKP 0.749521
GBP 0.750815
GEL 2.715014
GGP 0.749521
GHS 10.917148
GIP 0.749521
GMD 73.506465
GNF 8778.549977
GTQ 7.671603
GYD 209.529662
HKD 7.83172
HNL 26.509205
HRK 6.524702
HTG 131.388314
HUF 340.851497
IDR 16991
ILS 3.109125
IMP 0.749521
INR 93.8122
IQD 1311.97909
IRR 1315624.999901
ISK 124.559881
JEP 0.749521
JMD 157.346743
JOD 0.708984
JPY 159.584028
KES 129.739685
KGS 87.447903
KHR 4001.973291
KMF 427.000235
KPW 900.003974
KRW 1509.115004
KWD 0.30657
KYD 0.834581
KZT 481.491739
LAK 21506.092917
LBP 89692.06536
LKR 312.41778
LRD 183.27376
LSL 16.894603
LTL 2.952739
LVL 0.60489
LYD 6.411466
MAD 9.358386
MDL 17.440975
MGA 4176.061001
MKD 53.348104
MMK 2099.452431
MNT 3566.950214
MOP 8.084003
MRU 40.089837
MUR 46.509602
MVR 15.460054
MWK 1736.722073
MXN 17.97235
MYR 3.939502
MZN 63.898088
NAD 16.894749
NGN 1356.239938
NIO 36.852081
NOK 9.58951
NPR 149.804404
NZD 1.72021
OMR 0.382195
PAB 1.001519
PEN 3.46252
PGK 4.323066
PHP 60.252942
PKR 279.628351
PLN 3.70525
PYG 6541.287659
QAR 3.662273
RON 4.408024
RSD 101.650468
RUB 84.452144
RWF 1457.231632
SAR 3.754897
SBD 8.05166
SCR 13.74181
SDG 600.999727
SEK 9.370501
SGD 1.2833
SHP 0.750259
SLE 24.574994
SLL 20969.510825
SOS 572.35094
SRD 37.487497
STD 20697.981008
STN 21.204227
SVC 8.762971
SYP 110.564047
SZL 16.900787
THB 33.050137
TJS 9.619362
TMT 3.51
TND 2.95786
TOP 2.40776
TRY 44.323503
TTD 6.794814
TWD 32.1128
TZS 2595.522995
UAH 43.875212
UGX 3785.603628
UYU 40.356396
UZS 12210.172836
VES 454.69063
VND 26322
VUV 119.226095
WST 2.727792
XAF 567.726608
XAG 0.015367
XAU 0.00023
XCD 2.70255
XCG 1.80494
XDR 0.706079
XOF 567.716781
XPF 103.216984
YER 238.598067
ZAR 17.126098
ZMK 9001.196659
ZMW 19.554625
ZWL 321.999592
  • AEX

    -16.0300

    961.62

    -1.64%

  • BEL20

    -88.0900

    4916.79

    -1.76%

  • PX1

    -142.1000

    7665.62

    -1.82%

  • ISEQ

    -203.0200

    11881.24

    -1.68%

  • OSEBX

    -31.9800

    1966.5

    -1.6%

  • PSI20

    -190.5700

    8756.26

    -2.13%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -27.8400

    3634.93

    -0.76%

  • N150

    -58.3500

    3755.58

    -1.53%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: © AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

M.Cunningham--TFWP