The Fort Worth Press - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

USD -
AED 3.672496
AFN 66.163223
ALL 82.178011
AMD 380.793362
ANG 1.790403
AOA 916.999963
ARS 1450.731498
AUD 1.513157
AWG 1.8025
AZN 1.699323
BAM 1.66612
BBD 2.009004
BDT 121.89647
BGN 1.668398
BHD 0.377025
BIF 2948.778015
BMD 1
BND 1.289026
BOB 6.892615
BRL 5.517898
BSD 0.997432
BTN 90.213099
BWP 13.173867
BYN 2.945358
BYR 19600
BZD 2.006108
CAD 1.378575
CDF 2265.000409
CHF 0.795003
CLF 0.023408
CLP 918.2798
CNY 7.04325
CNH 7.034398
COP 3865.5
CRC 496.969542
CUC 1
CUP 26.5
CVE 93.933289
CZK 20.824599
DJF 177.619334
DKK 6.374704
DOP 62.781377
DZD 129.775525
EGP 47.582801
ERN 15
ETB 155.065976
EUR 0.85316
FJD 2.28425
FKP 0.746872
GBP 0.747355
GEL 2.69501
GGP 0.746872
GHS 11.4911
GIP 0.746872
GMD 73.50261
GNF 8720.392873
GTQ 7.63972
GYD 208.695208
HKD 7.78155
HNL 26.279698
HRK 6.413504
HTG 130.648857
HUF 331.706965
IDR 16718.75
ILS 3.214715
IMP 0.746872
INR 90.26275
IQD 1306.658943
IRR 42109.999861
ISK 126.279652
JEP 0.746872
JMD 159.602697
JOD 0.708983
JPY 155.7825
KES 128.950061
KGS 87.449784
KHR 3995.195543
KMF 418.999777
KPW 899.993999
KRW 1476.105228
KWD 0.30709
KYD 0.831243
KZT 513.04833
LAK 21605.574533
LBP 89322.26491
LKR 308.916356
LRD 176.553522
LSL 16.705284
LTL 2.95274
LVL 0.60489
LYD 5.408398
MAD 9.140319
MDL 16.831784
MGA 4506.288786
MKD 52.51797
MMK 2100.057046
MNT 3547.602841
MOP 7.992265
MRU 39.658749
MUR 46.040507
MVR 15.450121
MWK 1729.597117
MXN 18.00418
MYR 4.086013
MZN 63.895167
NAD 16.705355
NGN 1454.640309
NIO 36.706235
NOK 10.209009
NPR 144.335596
NZD 1.733835
OMR 0.384499
PAB 0.997474
PEN 3.360253
PGK 4.241363
PHP 58.633504
PKR 279.486334
PLN 3.58771
PYG 6699.803648
QAR 3.636364
RON 4.343702
RSD 100.170284
RUB 80.066467
RWF 1452.319802
SAR 3.750688
SBD 8.130216
SCR 13.597311
SDG 601.500902
SEK 9.300155
SGD 1.29088
SHP 0.750259
SLE 24.100325
SLL 20969.503664
SOS 569.036089
SRD 38.678005
STD 20697.981008
STN 20.870336
SVC 8.728097
SYP 11058.365356
SZL 16.70138
THB 31.447502
TJS 9.206851
TMT 3.5
TND 2.911152
TOP 2.40776
TRY 42.734797
TTD 6.766306
TWD 31.540797
TZS 2478.95102
UAH 42.336966
UGX 3555.775153
UYU 38.863072
UZS 12075.031306
VES 276.231203
VND 26325
VUV 121.372904
WST 2.784715
XAF 558.777254
XAG 0.015099
XAU 0.000231
XCD 2.70255
XCG 1.797668
XDR 0.69494
XOF 558.777254
XPF 101.59601
YER 238.349681
ZAR 16.76745
ZMK 9001.20138
ZMW 22.866221
ZWL 321.999592
  • AEX

    3.9000

    933.46

    +0.42%

  • BEL20

    -3.5300

    5042.2

    -0.07%

  • PX1

    13.7500

    8099.64

    +0.17%

  • ISEQ

    10.3900

    12998.86

    +0.08%

  • OSEBX

    -1.6500

    1647.93

    -0.1%

  • PSI20

    12.9100

    8083.41

    +0.16%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    86.6400

    4173.57

    +2.12%

  • N150

    10.7000

    3699.76

    +0.29%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: © AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

A.Nunez--TFWP