The Fort Worth Press - L'intoxication des données, la menace invisible qui cible les chatbots IA

USD -
AED 3.672501
AFN 64.000152
ALL 82.64958
AMD 368.190044
ANG 1.790403
AOA 918.000282
ARS 1451.021502
AUD 1.425151
AWG 1.8025
AZN 1.694136
BAM 1.707161
BBD 2.0149
BDT 122.802041
BGN 1.69088
BHD 0.377099
BIF 2981.5
BMD 1
BND 1.291418
BOB 6.913076
BRL 5.159394
BSD 1.00038
BTN 94.317225
BWP 13.58542
BYN 2.769718
BYR 19600
BZD 2.012037
CAD 1.414105
CDF 2299.999963
CHF 0.805985
CLF 0.022887
CLP 900.770275
CNY 6.769297
CNH 6.788885
COP 3444.06
CRC 453.281776
CUC 1
CUP 26.5
CVE 96.44992
CZK 21.12795
DJF 177.7201
DKK 6.52257
DOP 58.450282
DZD 133.391791
EGP 49.928444
ERN 15
ETB 158.40191
EUR 0.87263
FJD 2.24625
FKP 0.755912
GBP 0.75595
GEL 2.655027
GGP 0.755912
GHS 11.193995
GIP 0.755912
GMD 72.49971
GNF 8774.999689
GTQ 7.624493
GYD 209.303848
HKD 7.838615
HNL 26.679749
HRK 6.572897
HTG 130.782794
HUF 307.949837
IDR 17797
ILS 2.957605
IMP 0.755912
INR 94.453105
IQD 1310
IRR 1375249.999944
ISK 125.840108
JEP 0.755912
JMD 158.02314
JOD 0.708987
JPY 161.307998
KES 129.394952
KGS 87.450264
KHR 4010.000168
KMF 430.999915
KPW 900.00035
KRW 1530.310066
KWD 0.30802
KYD 0.833672
KZT 488.416955
LAK 22065.000501
LBP 89549.999764
LKR 333.681027
LRD 182.000295
LSL 16.480024
LTL 2.95274
LVL 0.60489
LYD 6.374945
MAD 9.31875
MDL 17.512482
MGA 4199.999994
MKD 53.776432
MMK 2099.523204
MNT 3579.573337
MOP 8.076114
MRU 40.049996
MUR 47.869807
MVR 15.397632
MWK 1737.000105
MXN 17.3491
MYR 4.13201
MZN 63.909541
NAD 16.480079
NGN 1361.088769
NIO 36.630188
NOK 9.70165
NPR 150.908218
NZD 1.74215
OMR 0.384498
PAB 1.000388
PEN 3.383007
PGK 4.387997
PHP 60.762987
PKR 278.350383
PLN 3.71785
PYG 6092.611181
QAR 3.642499
RON 4.571397
RSD 102.42699
RUB 73.728229
RWF 1463.5
SAR 3.752194
SBD 8.058296
SCR 13.64719
SDG 600.495264
SEK 9.579375
SGD 1.29166
SHP 0.746601
SLE 24.749765
SLL 20969.503664
SOS 571.495264
SRD 37.369041
STD 20697.981008
STN 21.45
SVC 8.754097
SYP 110.532098
SZL 16.489788
THB 32.845504
TJS 9.283859
TMT 3.5
TND 2.942499
TOP 2.40776
TRY 46.412499
TTD 6.793553
TWD 31.630703
TZS 2625.494795
UAH 44.960241
UGX 3651.186439
UYU 40.204426
UZS 11549.999886
VES 606.63266
VND 26320
VUV 118.645306
WST 2.751804
XAF 572.560675
XAG 0.01536
XAU 0.00024
XCD 2.70255
XCG 1.802986
XDR 0.703697
XOF 569.500612
XPF 104.625035
YER 237.124983
ZAR 16.483802
ZMK 9001.198534
ZMW 17.894567
ZWL 321.999592
  • AEX

    -3.8900

    1077.5

    -0.36%

  • BEL20

    1.1300

    5650.28

    +0.02%

  • PX1

    -5.9300

    8462.15

    -0.07%

  • ISEQ

    -56.5300

    13730.39

    -0.41%

  • OSEBX

    17.9300

    1945.36

    +0.93%

  • PSI20

    -9.9400

    9030.17

    -0.11%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -88.3500

    4200.66

    -2.06%

  • N150

    1.2700

    4233.79

    +0.03%

L'intoxication des données, la menace invisible qui cible les chatbots IA
L'intoxication des données, la menace invisible qui cible les chatbots IA / Photo: © AFP/Archives

L'intoxication des données, la menace invisible qui cible les chatbots IA

Le recours aux agents conversationnels basés sur l'intelligence artificielle occupe une place croissante dans le rapport des utilisateurs à l'information. Mais aux biais et aux erreurs des "chatbots" s'ajoute la menace de manipulation des données sur lesquels ils sont entraînés.

Taille du texte:

. L'IA, cible de choix

ChatGPT, Mistral, Claude ou Gemini... Prisés des utilisateurs pour leur rapidité et leur facilité d'utilisation, les "chatbots" IA sont entraînés à formuler leurs réponses à partir de gigantesques bases de données regroupant des milliards de documents, inlassablement compilés et archivés par des "robots" qui parcourent internet en quête de données.

Il y apprennent comment, statistiquement, les mots s'enchaînent pour former des phrases et des idées, afin de pouvoir ensuite générer des réponses cohérentes qui ont le plus de chances de correspondre à la requête de l'usager.

Mais ce mode de collecte et d'entraînement expose les "chatbots" à de possibles manipulations par des acteurs malveillants, susceptibles d'introduire dans leurs données d'entraînement des éléments indésirables comme de la désinformation, de la propagande ou du code informatique malveillant.

. Empoisonnement, conditionnement

Chercheurs au Laboratoire d'investigation numérique de l'Atlantic council, un think tank d'étude des relations internationales, Valentin Châletet et Esteban Ponce de León distinguent deux concepts:

L'empoisonnement de données des grands modèles de langage (LLM) sur lesquels reposent les chatbots ("LLM poisoning") se produit en amont, lors de l'entraînement, via l'injection d'éléments non désirés. Ces manipulations sont pensées pour contourner les mécanismes de filtrage mis en place par les entreprises pour garantir des données fiables.

Le conditionnement ("LLM grooming") intervient plus tard, alors que le chatbot est déjà déployé: des acteurs malveillants diffusent massivement du contenu en ligne pour qu'il soit intégré par les modèles IA.

Ainsi, des tests menés par l'entreprise d'analyse de la fiabilité des contenus en ligne Newsguard ont montré que, dans diverses circonstances, les principaux chabots commerciaux pouvaient répondre en s'appuyant sur de fausses informations du réseau Pravda, une nébuleuse de sites web destinés à amplifier la propagande prorusse.

Ces manipulations peuvent être difficiles à repérer et endiguer, notamment parce que le fonctionnement de ces modèles est volontairement rendu opaque par leurs concepteurs: "On a affaire à un réseau de neurones qui fonctionne comme une boîte noire", explique Valentin Châtelet.

Expurger les données en question nécessiterait le plus souvent un réentraînement complet du modèle, estime le chercheur, et présenterait "un coût extrême" en temps et en ressources. La complexité de ces systèmes algorithmiques rend également très ardus leur audit ou leur régulation.

. "Désinformation à la demande"

Le phénomène est difficile à mesurer et son impact sur les utilisateurs complexe voire impossible à démontrer. Mais, difficilement traçables et relativement peu coûteuses, ces opérations ont de quoi séduire les acteurs qui souhaiteraient promouvoir leurs narratifs, qu'il s'agisse d'Etats, de lobbies ou d'entreprises.

"Ce type d'opération pourrait être mené par un groupe industriel qui veut enterrer les résultats d'une étude médicale scientifique qui ne va pas dans leur sens, par un homme politique qui veut pousser un récit qui va servir sa campagne...", énumère Chine Labbé, rédactrice en chef française de Newsguard.

Esteban Ponce de León observe pour sa part le développement d'un écosystème de "désinformation à la demande", au sein duquel des Etats ou des entités "délègueraient (...) l'opération à une autre entité, probablement privée, qui dispose déjà de l'expertise technologique nécessaire pour mener à bien" une campagne d'influence visant les LLM.

En septembre 2025, une entreprise dirigée par l'ancien directeur de campagne de Donald Trump a ainsi reçu plusieurs millions de dollars d'entreprises liées à l'Etat israélien pour diffuser des éléments de langage favorables via un réseau de sites web, avec pour objectif notamment d'influencer les réponses des chatbots, selon le think tank américain Quincy Institute for Responsible Statecraft.

Face au risque, les entreprises d'IA sont les premières concernées: il est ainsi crucial d'"apprendre aux chatbots à distinguer et à ne pas pondérer de la même manière les sources fiables et les sources de propagande étrangère ou de désinformation", argue Chine Labbé.

X.Silva--TFWP