The Fort Worth Press - La diversidad del español, enloquecedora para la inteligencia artificial

USD -
AED 3.673042
AFN 63.503991
ALL 82.403989
AMD 368.150403
ANG 1.790403
AOA 918.000367
ARS 1465.449815
AUD 1.42575
AWG 1.8025
AZN 1.70397
BAM 1.705709
BBD 2.013483
BDT 122.708482
BGN 1.69088
BHD 0.37702
BIF 2985
BMD 1
BND 1.290663
BOB 6.90816
BRL 5.152304
BSD 0.999721
BTN 94.239742
BWP 13.585663
BYN 2.777729
BYR 19600
BZD 2.010527
CAD 1.415225
CDF 2280.000362
CHF 0.807055
CLF 0.02293
CLP 902.460396
CNY 6.769604
CNH 6.783725
COP 3452.68
CRC 453.506829
CUC 1
CUP 26.5
CVE 96.403894
CZK 21.091104
DJF 177.720393
DKK 6.516504
DOP 58.403884
DZD 133.34504
EGP 49.986489
ERN 15
ETB 158.37504
EUR 0.871881
FJD 2.235504
FKP 0.756415
GBP 0.755512
GEL 2.650391
GGP 0.756415
GHS 11.22504
GIP 0.756415
GMD 73.503851
GNF 8775.000355
GTQ 7.625892
GYD 209.119888
HKD 7.83685
HNL 26.68504
HRK 6.568104
HTG 130.583803
HUF 306.820388
IDR 17826.3
ILS 2.95976
IMP 0.756415
INR 94.330504
IQD 1310
IRR 1375000.000352
ISK 125.530386
JEP 0.756415
JMD 157.959917
JOD 0.70904
JPY 161.30504
KES 129.403801
KGS 87.450384
KHR 4010.00035
KMF 429.503794
KPW 900.00035
KRW 1527.650383
KWD 0.30793
KYD 0.833035
KZT 487.855928
LAK 22055.000349
LBP 89550.000349
LKR 333.641485
LRD 182.150382
LSL 16.405039
LTL 2.95274
LVL 0.60489
LYD 6.375039
MAD 9.225039
MDL 17.654036
MGA 4200.000347
MKD 53.732839
MMK 2099.727916
MNT 3581.295381
MOP 8.070939
MRU 40.060379
MUR 47.850378
MVR 15.450378
MWK 1737.000345
MXN 17.326504
MYR 4.137904
MZN 63.910377
NAD 16.403727
NGN 1360.440377
NIO 36.610377
NOK 9.680204
NPR 150.787532
NZD 1.741735
OMR 0.384983
PAB 0.999725
PEN 3.384039
PGK 4.38775
PHP 60.716504
PKR 278.325038
PLN 3.71375
PYG 6138.96617
QAR 3.640504
RON 4.568104
RSD 102.170373
RUB 73.103247
RWF 1464
SAR 3.74824
SBD 8.061424
SCR 13.683262
SDG 600.503676
SEK 9.57882
SGD 1.292404
SHP 0.746601
SLE 24.750371
SLL 20969.503664
SOS 571.503662
SRD 37.402504
STD 20697.981008
STN 21.4
SVC 8.747449
SYP 110.532098
SZL 16.403649
THB 32.890369
TJS 9.272075
TMT 3.5
TND 2.91175
TOP 2.40776
TRY 46.438204
TTD 6.779085
TWD 31.715038
TZS 2630.985038
UAH 44.909735
UGX 3638.520172
UYU 39.96965
UZS 12005.000334
VES 606.63266
VND 26310
VUV 118.773512
WST 2.751708
XAF 572.078806
XAG 0.015419
XAU 0.00024
XCD 2.70255
XCG 1.801643
XDR 0.703697
XOF 565.000332
XPF 104.250363
YER 238.603589
ZAR 16.458037
ZMK 9001.203584
ZMW 17.919703
ZWL 321.999592
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: © AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

A.Nunez--TFWP