The Fort Worth Press - IA generativa recorre a livros para crescer

USD -
AED 3.672503
AFN 64.999933
ALL 81.600054
AMD 377.015652
ANG 1.79008
AOA 917.000138
ARS 1445.006097
AUD 1.42109
AWG 1.8025
AZN 1.692783
BAM 1.652954
BBD 2.006406
BDT 121.744569
BGN 1.67937
BHD 0.377041
BIF 2951.80061
BMD 1
BND 1.266301
BOB 6.883642
BRL 5.241901
BSD 0.996188
BTN 90.006001
BWP 13.760026
BYN 2.854269
BYR 19600
BZD 2.003533
CAD 1.363515
CDF 2199.999904
CHF 0.775602
CLF 0.02178
CLP 859.999739
CNY 6.938197
CNH 6.934855
COP 3629.58
CRC 494.755791
CUC 1
CUP 26.5
CVE 93.18904
CZK 20.592798
DJF 177.398771
DKK 6.31505
DOP 62.727665
DZD 129.829012
EGP 46.963602
ERN 15
ETB 154.525739
EUR 0.84552
FJD 2.196896
FKP 0.732491
GBP 0.728597
GEL 2.694986
GGP 0.732491
GHS 10.913255
GIP 0.732491
GMD 73.000148
GNF 8739.784147
GTQ 7.640884
GYD 208.410804
HKD 7.813605
HNL 26.319926
HRK 6.369601
HTG 130.669957
HUF 321.88799
IDR 16784
ILS 3.088995
IMP 0.732491
INR 90.283098
IQD 1305.009254
IRR 42125.000158
ISK 122.600846
JEP 0.732491
JMD 156.11768
JOD 0.708978
JPY 156.441021
KES 129.000315
KGS 87.449936
KHR 4019.573871
KMF 418.000012
KPW 899.987247
KRW 1454.629897
KWD 0.30734
KYD 0.830199
KZT 499.446421
LAK 21428.148849
LBP 89209.607762
LKR 308.347631
LRD 185.292552
LSL 15.956086
LTL 2.95274
LVL 0.60489
LYD 6.298121
MAD 9.137876
MDL 16.870209
MGA 4415.108054
MKD 52.097815
MMK 2100.119929
MNT 3568.429082
MOP 8.016683
MRU 39.768089
MUR 45.880351
MVR 15.449797
MWK 1727.419478
MXN 17.2304
MYR 3.930994
MZN 63.749641
NAD 15.956086
NGN 1381.359533
NIO 36.662976
NOK 9.632495
NPR 144.009939
NZD 1.654905
OMR 0.384507
PAB 0.996163
PEN 3.353659
PGK 4.26805
PHP 58.995007
PKR 278.611912
PLN 3.570445
PYG 6609.139544
QAR 3.622342
RON 4.307498
RSD 99.269956
RUB 77.049995
RWF 1453.926184
SAR 3.750074
SBD 8.058101
SCR 14.01331
SDG 601.523681
SEK 8.915195
SGD 1.27033
SHP 0.750259
SLE 24.475013
SLL 20969.499267
SOS 568.369098
SRD 38.114499
STD 20697.981008
STN 20.706383
SVC 8.716965
SYP 11059.574895
SZL 15.961664
THB 31.61499
TJS 9.309427
TMT 3.51
TND 2.88065
TOP 2.40776
TRY 43.502915
TTD 6.747746
TWD 31.554499
TZS 2586.540091
UAH 43.111874
UGX 3551.266015
UYU 38.369223
UZS 12195.585756
VES 371.640565
VND 25983.5
VUV 119.537583
WST 2.726316
XAF 554.38764
XAG 0.011167
XAU 0.000197
XCD 2.70255
XCG 1.79537
XDR 0.68948
XOF 554.38764
XPF 100.793178
YER 238.375005
ZAR 15.96625
ZMK 9001.200101
ZMW 19.550207
ZWL 321.999592
IA generativa recorre a livros para crescer
IA generativa recorre a livros para crescer / foto: © AFP

IA generativa recorre a livros para crescer

Para expandir o negócio dos direitos autorais, o mundo editorial começa a assinar contratos com empresas de tecnologia para permitir que os seus livros alimentem as necessidades crescentes da inteligência artificial generativa.

Tamanho do texto:

A grande editora americana HarperCollins acaba de propor a alguns dos seus autores um contrato com uma sociedade de inteligência artificial para que esta possa usar os seus livros para treinar o seu modelo de IA generativa.

Em um e-mail consultado pela AFP, a empresa tecnológica, cuja identidade é confidencial, propõe 2.500 dólares (14.530 reais) por cada livro selecionado para treinar o seu modelo de linguagem durante um período de três anos.

Para produzir todos os tipos de conteúdo, esta tecnologia precisa ser alimentada continuamente com uma grande quantidade de dados.

Contactada pela AFP, a editora confirmou a operação.

"A HarperCollins fechou um acordo com uma empresa de tecnologia de inteligência artificial para autorizar o uso limitado de determinados títulos (…) para treinar modelos de IA, a fim de melhorar sua qualidade e desempenho", escreveu.

A editora especificou que o acordo "limita claramente a produção de modelos que respeitem os direitos autorais".

A oferta gerou opiniões divergentes no setor e escritores como o americano Daniel Kibblesmith rejeitaram-na categoricamente.

"Provavelmente faria isso por um bilhão de dólares. Faria isso por uma quantia de dinheiro que não me obrigaria a trabalhar mais, porque esse é o objetivo final desta tecnologia", publicou na rede social Bluesky.

- Novos materiais -

A HarperCollins é um dos maiores atores do setor a dar esse passo, mas não o primeiro.

A editora americana de livros científicos Wiley deu acesso "ao conteúdo de livros acadêmicos e profissionais publicados para uso específico na formação desses modelos por 23 milhões de dólares (133 milhões de reais) a uma grande empresa de tecnologia", disse a companhia em março durante a apresentação de seus resultados financeiros.

Este tipo de colaboração evidencia os problemas ligados ao desenvolvimento da inteligência artificial generativa, treinada com enormes quantidades de dados recolhidos na Internet, o que pode resultar em possíveis violações de direitos autorais.

Para Giada Pistilli, chefe de ética da Hugging Face, plataforma franco-americana de IA de acesso livre, o anúncio é um avanço, porque o conteúdo dos livros passa a ser monetizado. Mas lamenta a margem de negociação limitada para os autores.

"O que veremos é um mecanismo de acordos bilaterais entre empresas de novas tecnologias e editoras ou proprietários de direitos autorais, quando na minha opinião seria necessário um diálogo mais amplo para incluir todas as partes envolvidas", afirma.

"Viemos de muito longe", comenta Julien Chouraqui, diretor jurídico do sindicato editorial francês SNE. "É um progresso: o fato de haver um acordo significa que houve um diálogo e uma vontade de alcançar um equilíbrio no uso de dados de origem que estão protegidos por direitos autorais e que vão gerar valor", afirma.

Os editores de imprensa também estão se organizando para enfrentar esse problema. No final de 2023, o jornal americano The New York Times processou a OpenAI, criadora do programa ChatGPT, e a Microsoft, sua principal investidora, por violação de direitos autorais.

Outros veículos de comunicação optaram por fechar acordos com esta empresa pioneira em IA.

As empresas de tecnologia podem não ter outra opção senão investir a fundo para melhorar os seus produtos, já que suas bases de dados e materiais para treinar os seus modelos estão esgotando.

A imprensa americana publicou recentemente que os novos modelos em desenvolvimento dão sinais de ter atingido o seu limite, especialmente no Google, Anthropic e OpenAI.

"Na Internet, você coleta material lícito e ilícito e muito conteúdo pirateado. Isso implica um problema jurídico. Sem esquecer o problema da qualidade dos dados", afirma Julien Chouraqui, do SNE.

"Para que o desenvolvimento de um mercado seja alcançado sobre uma base virtuosa, todos os atores devem estar envolvidos", destaca.

T.Mason--TFWP