Pour grandir, l'IA générative se tourne vers les livres

The Fort Worth Press - Pour grandir, l'IA générative se tourne vers les livres

Fort Worth 34°C

USD -

AED 3.672504

AFN 63.000368

ALL 82.732897

AMD 367.370222

ANG 1.790403

AOA 917.000367

ARS 1478.086972

AUD 1.450326

AWG 1.80125

AZN 1.70397

BAM 1.716442

BBD 2.015885

BDT 123.112028

BGN 1.69088

BHD 0.377375

BIF 2972.662249

BMD 1

BND 1.295099

BOB 6.916495

BRL 5.177041

BSD 1.000921

BTN 93.946202

BWP 13.602176

BYN 2.902892

BYR 19600

BZD 2.012989

CAD 1.41895

CDF 2267.50392

CHF 0.80956

CLF 0.023471

CLP 922.497696

CNY 6.79815

CNH 6.804685

COP 3438.325508

CRC 454.429769

CUC 1

CUP 26.5

CVE 96.770372

CZK 21.30904

DJF 178.235113

DKK 6.565804

DOP 58.809075

DZD 133.424898

EGP 49.530036

ERN 15

ETB 161.36601

EUR 0.877704

FJD 2.266104

FKP 0.756395

GBP 0.757518

GEL 2.64504

GGP 0.756395

GHS 11.285269

GIP 0.756395

GMD 73.000355

GNF 8770.020624

GTQ 7.63614

GYD 209.469481

HKD 7.84255

HNL 26.780464

HRK 6.617804

HTG 130.8175

HUF 310.850388

IDR 17860.6

ILS 3.00205

IMP 0.756395

INR 94.360504

IQD 1311.158892

IRR 1375250.000352

ISK 126.490386

JEP 0.756395

JMD 157.637457

JOD 0.70904

JPY 161.75504

KES 129.518627

KGS 87.450384

KHR 4017.727851

KMF 434.00035

KPW 900.00035

KRW 1535.290383

KWD 0.30961

KYD 0.834087

KZT 485.637808

LAK 21969.371188

LBP 89630.523498

LKR 336.443021

LRD 182.31603

LSL 16.452675

LTL 2.95274

LVL 0.60489

LYD 6.42503

MAD 9.385493

MDL 17.746281

MGA 4233.621484

MKD 54.091886

MMK 2099.386013

MNT 3578.909161

MOP 8.085217

MRU 39.945588

MUR 47.250378

MVR 15.450378

MWK 1735.574181

MXN 17.504204

MYR 4.088039

MZN 63.903729

NAD 16.452675

NGN 1376.130377

NIO 36.83356

NOK 9.933039

NPR 150.313748

NZD 1.771166

OMR 0.384504

PAB 1.000921

PEN 3.41305

PGK 4.39247

PHP 61.312038

PKR 278.550353

PLN 3.76695

PYG 6109.087718

QAR 3.648427

RON 4.603104

RSD 103.014612

RUB 78.910966

RWF 1465.794901

SAR 3.758743

SBD 8.051953

SCR 14.057835

SDG 600.000339

SEK 9.73761

SGD 1.294204

SHP 0.746601

SLE 24.803667

SLL 20969.503664

SOS 572.030366

SRD 37.483038

STD 20697.981008

STN 21.501602

SVC 8.757734

SYP 110.532098

SZL 16.443021

THB 33.378038

TJS 9.263329

TMT 3.5

TND 2.966607

TOP 2.40776

TRY 46.553304

TTD 6.802405

TWD 31.859804

TZS 2632.322612

UAH 44.926675

UGX 3673.702225

UYU 40.177279

UZS 12022.46698

VES 620.752985

VND 26300

VUV 119.628449

WST 2.780038

XAF 575.678617

XAG 0.017058

XAU 0.000246

XCD 2.70255

XCG 1.803853

XDR 0.715959

XOF 575.678617

XPF 104.664531

YER 238.625037

ZAR 16.987795

ZMK 9001.203584

ZMW 18.029751

ZWL 321.999592

AEX

-6.9400

1060.73

-0.65%
BEL20

7.4500

5739.78

+0.13%
PX1

-46.3700

8384.87

-0.55%
ISEQ

-103.9100

13938.48

-0.74%
OSEBX

-15.5200

1900.57

-0.81%
PSI20

-21.0600

9136.18

-0.23%
ENTEC

-5.8300

1416.23

-0.41%
BIOTK

42.8700

4287.2

+1.01%
N150

-28.4100

4149.42

-0.68%

Pour grandir, l'IA générative se tourne vers les livres

CULTURE 22.11.2024

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

M.Cunningham--TFWP

The Fort Worth Press - Pour grandir, l'IA générative se tourne vers les livres

Pour grandir, l'IA générative se tourne vers les livres

En vedette

À son procès en appel, Stéphane Plaza dément "être violent"

Accablés de chaleur, des Italiens trouvent refuge dans les anciens "trulli" en pierre

CNews mise en demeure par l'Arcom: "Une décision politique", selon Saada

Allemagne : un monument en hommage aux Témoins de Jéhovah persécutés par les nazis