The Fort Worth Press - La diversidad del español, enloquecedora para la inteligencia artificial

USD -
AED 3.672499
AFN 63.000238
ALL 83.169003
AMD 376.6209
ANG 1.790083
AOA 917.000092
ARS 1368.052397
AUD 1.451716
AWG 1.8025
AZN 1.69793
BAM 1.695271
BBD 2.011918
BDT 122.564316
BGN 1.709309
BHD 0.376989
BIF 2967.20061
BMD 1
BND 1.283718
BOB 6.917863
BRL 5.237198
BSD 0.998895
BTN 94.130496
BWP 13.733504
BYN 2.999805
BYR 19600
BZD 2.009058
CAD 1.38535
CDF 2285.509878
CHF 0.794702
CLF 0.023516
CLP 928.540171
CNY 6.91145
CNH 6.91897
COP 3689.09
CRC 463.12669
CUC 1
CUP 26.5
CVE 95.576763
CZK 21.245955
DJF 177.883719
DKK 6.477905
DOP 60.224672
DZD 133.026736
EGP 52.70043
ERN 15
ETB 154.382647
EUR 0.866896
FJD 2.257398
FKP 0.747836
GBP 0.749905
GEL 2.695064
GGP 0.747836
GHS 10.920706
GIP 0.747836
GMD 73.501546
GNF 8757.194369
GTQ 7.641634
GYD 208.983427
HKD 7.82568
HNL 26.524801
HRK 6.531698
HTG 130.816171
HUF 336.210143
IDR 16931.95
ILS 3.124096
IMP 0.747836
INR 94.16635
IQD 1308.600776
IRR 1313300.000453
ISK 124.339829
JEP 0.747836
JMD 156.993954
JOD 0.708981
JPY 159.669885
KES 129.709928
KGS 87.449854
KHR 4000.242702
KMF 426.999823
KPW 900.057798
KRW 1509.249757
KWD 0.30721
KYD 0.83247
KZT 481.23605
LAK 21576.267146
LBP 89453.008863
LKR 314.161267
LRD 183.30119
LSL 17.089302
LTL 2.95274
LVL 0.60489
LYD 6.378746
MAD 9.32633
MDL 17.545669
MGA 4163.217544
MKD 53.427703
MMK 2099.983779
MNT 3583.827699
MOP 8.049494
MRU 39.846405
MUR 46.630413
MVR 15.459802
MWK 1732.116931
MXN 17.91723
MYR 3.999878
MZN 63.910338
NAD 17.089302
NGN 1384.759801
NIO 36.760627
NOK 9.697715
NPR 150.60914
NZD 1.735915
OMR 0.384501
PAB 0.998891
PEN 3.457024
PGK 4.316622
PHP 60.219872
PKR 278.822545
PLN 3.706645
PYG 6539.1033
QAR 3.642258
RON 4.417598
RSD 101.817979
RUB 81.375355
RWF 1458.729712
SAR 3.751912
SBD 8.041975
SCR 13.744945
SDG 601.00022
SEK 9.427865
SGD 1.28598
SHP 0.750259
SLE 24.549949
SLL 20969.510825
SOS 570.871346
SRD 37.562019
STD 20697.981008
STN 21.236391
SVC 8.740763
SYP 111.44287
SZL 17.084534
THB 32.979571
TJS 9.559625
TMT 3.51
TND 2.939203
TOP 2.40776
TRY 44.4593
TTD 6.780072
TWD 31.945008
TZS 2572.214879
UAH 43.832448
UGX 3715.935095
UYU 40.496498
UZS 12167.15207
VES 466.018145
VND 26351
VUV 119.023334
WST 2.74953
XAF 568.580406
XAG 0.014521
XAU 0.000227
XCD 2.70255
XCG 1.800334
XDR 0.707132
XOF 568.580406
XPF 103.373552
YER 238.650021
ZAR 17.09465
ZMK 9001.256834
ZMW 18.754849
ZWL 321.999592
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: © AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

A.Nunez--TFWP