The Fort Worth Press - Il paradosso dei chatbot, più crescono più sbagliano

USD -
AED 3.673007
AFN 63.503205
ALL 82.78735
AMD 368.501999
ANG 1.790403
AOA 917.000493
ARS 1470.999601
AUD 1.446383
AWG 1.80125
AZN 1.70203
BAM 1.718856
BBD 2.018008
BDT 123.091796
BGN 1.69088
BHD 0.377901
BIF 2992.837369
BMD 1
BND 1.297974
BOB 6.938524
BRL 5.203202
BSD 1.001973
BTN 94.864877
BWP 13.624819
BYN 2.814079
BYR 19600
BZD 2.015116
CAD 1.42081
CDF 2265.000143
CHF 0.810235
CLF 0.023173
CLP 912.029887
CNY 6.774797
CNH 6.79765
COP 3428.4
CRC 454.535468
CUC 1
CUP 26.5
CVE 96.906446
CZK 21.2905
DJF 177.720107
DKK 6.5684
DOP 58.644918
DZD 133.636966
EGP 49.7169
ERN 15
ETB 161.535521
EUR 0.87874
FJD 2.251301
FKP 0.754878
GBP 0.75825
GEL 2.644996
GGP 0.754878
GHS 11.246649
GIP 0.754878
GMD 72.999832
GNF 8779.291769
GTQ 7.644241
GYD 209.623413
HKD 7.84115
HNL 26.807458
HRK 6.620995
HTG 131.00145
HUF 312.568505
IDR 17927.1
ILS 2.99632
IMP 0.754878
INR 94.74005
IQD 1312.563167
IRR 1375000.000051
ISK 126.530301
JEP 0.754878
JMD 157.717811
JOD 0.709017
JPY 161.568981
KES 129.410174
KGS 87.450009
KHR 4021.248643
KMF 431.000018
KPW 900.00035
KRW 1534.009705
KWD 0.30898
KYD 0.834996
KZT 487.384102
LAK 22188.337654
LBP 89725.095575
LKR 335.228721
LRD 182.352683
LSL 16.522564
LTL 2.95274
LVL 0.60489
LYD 6.429642
MAD 9.377774
MDL 17.639408
MGA 4185.964758
MKD 54.164854
MMK 2099.387374
MNT 3579.000015
MOP 8.091488
MRU 39.79664
MUR 47.95968
MVR 15.459892
MWK 1737.391847
MXN 17.587719
MYR 4.140503
MZN 63.877447
NAD 16.522564
NGN 1369.919684
NIO 36.867777
NOK 9.796035
NPR 151.78296
NZD 1.764585
OMR 0.384504
PAB 1.001977
PEN 3.39166
PGK 4.394272
PHP 61.449502
PKR 278.668893
PLN 3.76585
PYG 6107.983882
QAR 3.652503
RON 4.610962
RSD 103.180107
RUB 74.499982
RWF 1469.343633
SAR 3.755291
SBD 8.065041
SCR 13.385005
SDG 600.521313
SEK 9.74456
SGD 1.297255
SHP 0.746601
SLE 24.750254
SLL 20969.503664
SOS 572.656446
SRD 37.482986
STD 20697.981008
STN 21.530796
SVC 8.767412
SYP 110.532098
SZL 16.517116
THB 33.269016
TJS 9.293141
TMT 3.51
TND 2.965857
TOP 2.40776
TRY 46.476955
TTD 6.803181
TWD 31.668977
TZS 2625.008027
UAH 44.976754
UGX 3667.442985
UYU 40.189832
UZS 12038.49365
VES 616.865275
VND 26325
VUV 118.758526
WST 2.756325
XAF 576.48558
XAG 0.016191
XAU 0.000242
XCD 2.70255
XCG 1.805774
XDR 0.716966
XOF 576.48558
XPF 104.811706
YER 238.650269
ZAR 16.555802
ZMK 9001.20146
ZMW 17.97425
ZWL 321.999592
Il paradosso dei chatbot, più crescono più sbagliano
Il paradosso dei chatbot, più crescono più sbagliano

Il paradosso dei chatbot, più crescono più sbagliano

Dà risposte errate piuttosto che ammettere l'ignoranza

Dimensione del testo:

Più crescono e fanno esperienza, maggiore è il rischio che rispondano in modo errato piuttosto che ammettere di non saper rispondere: è uno dei grandi problemi dei grandi modelli linguistici che alimentano i chatbot, come ChatGpt e Llama. A dirlo è lo studio pubblicato sulla rivista Nature da José Hernández-Orallo, dell'Istituto di ricerca per l'Intelligenza Artificiale di Valencia in Spagna, che sottolinea inoltre come questi errori sfuggano facilmente agli umani. Una delle importanti caratteristiche dei grandi modelli linguistici, o Llm, è la capacità di evolvere nel tempo integrando al loro interno nuove informazioni derivanti dalle interazioni con gli utenti o con gli sviluppatori, così da diventare teoricamente sempre più affidabili. Ma analizzando questo percorso in tre degli Llm più polari, in particolare ChatGpt di OpenAi, Llama di Meta e il modello aperto Bloom, i ricercatori spagnoli hanno osservato un cambiamento del loro comportamento. Secondo gli autori della ricerca i tre modelli inizialmente erano più propensi di oggi nell'ammettere di non poter rispondere a domande su questioni su cui non si sentivano certi di dare risposte accurate. Una prudenza che è andata gradualmente svanendo: "i modelli 'ingranditi' e modellati tendono a dare una risposta apparentemente sensata, ma sbagliata, molto più spesso rispetto al passato", affermano i ricercatori nell'articolo. I chatbot "stanno diventando più bravi a fingere di essere informati", ha commentato Hernández-Orallo. Un problema che si aggiunge inoltre all'incapacità da parte degli umani di riuscire a notare questi errori, spesso perché ci si fida automaticamente della macchina. Un problema che potrebbe essere parzialmente risolto impostando negli Llm una sorta di soglia di affidabilità più alta, al di sotto della quale l'IA non rilascia una risposta. Scelta possibile per i chatbot ideati per lavorare in settori specifici, ad esempio in campo medico, ma più difficile immaginare, sottolineano i ricercatori, possa essere introdotta da quelle aziende che sviluppano chatbot 'generalisti' che puntano proprio sulla capacità di risposta in settori molto ampi.

J.P.Cortez--TFWP