The Fort Worth Press - Un pas de plus dans l'interprétation du génome grâce à l'IA

USD -
AED 3.672504
AFN 63.000368
ALL 82.776172
AMD 376.396497
ANG 1.790083
AOA 917.000367
ARS 1391.503978
AUD 1.422273
AWG 1.8025
AZN 1.70397
BAM 1.687271
BBD 2.010611
BDT 122.494932
BGN 1.709309
BHD 0.377087
BIF 2954.923867
BMD 1
BND 1.276711
BOB 6.898158
BRL 5.313404
BSD 0.998318
BTN 93.32787
BWP 13.612561
BYN 3.028771
BYR 19600
BZD 2.007764
CAD 1.37265
CDF 2275.000362
CHF 0.78844
CLF 0.023504
CLP 928.050396
CNY 6.886404
CNH 6.906095
COP 3669.412932
CRC 466.289954
CUC 1
CUP 26.5
CVE 95.125739
CZK 21.149204
DJF 177.768192
DKK 6.457504
DOP 59.25894
DZD 132.24804
EGP 51.758616
ERN 15
ETB 157.330889
EUR 0.862704
FJD 2.21445
FKP 0.749593
GBP 0.749681
GEL 2.71504
GGP 0.749593
GHS 10.882112
GIP 0.749593
GMD 73.503851
GNF 8750.377432
GTQ 7.646983
GYD 208.85994
HKD 7.83525
HNL 26.423673
HRK 6.511304
HTG 130.966657
HUF 339.680388
IDR 16956.2
ILS 3.109125
IMP 0.749593
INR 94.01055
IQD 1307.768624
IRR 1315625.000352
ISK 124.270386
JEP 0.749593
JMD 156.839063
JOD 0.70904
JPY 159.240385
KES 129.327524
KGS 87.447904
KHR 3989.129966
KMF 427.00035
KPW 900.029607
KRW 1505.310383
KWD 0.30657
KYD 0.831903
KZT 479.946513
LAK 21437.260061
LBP 89404.995039
LKR 311.417849
LRD 182.685589
LSL 16.84053
LTL 2.95274
LVL 0.60489
LYD 6.39089
MAD 9.328473
MDL 17.385153
MGA 4162.53289
MKD 53.176897
MMK 2098.81595
MNT 3568.179446
MOP 8.05806
MRU 39.961178
MUR 46.510378
MVR 15.460378
MWK 1731.096062
MXN 17.898204
MYR 3.939039
MZN 63.903729
NAD 16.84053
NGN 1356.250377
NIO 36.733814
NOK 9.569995
NPR 149.324936
NZD 1.712622
OMR 0.384504
PAB 0.998318
PEN 3.451408
PGK 4.309192
PHP 60.150375
PKR 278.721304
PLN 3.69475
PYG 6520.295044
QAR 3.65052
RON 4.401504
RSD 101.324246
RUB 82.822413
RWF 1452.529871
SAR 3.754657
SBD 8.05166
SCR 13.69771
SDG 601.000339
SEK 9.344038
SGD 1.282504
SHP 0.750259
SLE 24.575038
SLL 20969.510825
SOS 570.504249
SRD 37.487504
STD 20697.981008
STN 21.136177
SVC 8.734849
SYP 110.711277
SZL 16.845965
THB 32.908038
TJS 9.588492
TMT 3.51
TND 2.948367
TOP 2.40776
TRY 44.252504
TTD 6.773066
TWD 32.036704
TZS 2595.522581
UAH 43.73308
UGX 3773.454687
UYU 40.227753
UZS 12170.987361
VES 454.69063
VND 26312
VUV 118.849952
WST 2.727811
XAF 565.894837
XAG 0.01471
XAU 0.000222
XCD 2.70255
XCG 1.799163
XDR 0.703792
XOF 565.894837
XPF 102.885735
YER 238.603589
ZAR 17.12748
ZMK 9001.203584
ZMW 19.491869
ZWL 321.999592
  • AEX

    -16.0300

    961.62

    -1.64%

  • BEL20

    -88.0900

    4916.79

    -1.76%

  • PX1

    -142.1000

    7665.62

    -1.82%

  • ISEQ

    -203.0200

    11881.24

    -1.68%

  • OSEBX

    -31.9800

    1966.5

    -1.6%

  • PSI20

    -190.5700

    8756.26

    -2.13%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -27.8400

    3634.93

    -0.76%

  • N150

    -58.3500

    3755.58

    -1.53%

Un pas de plus dans l'interprétation du génome grâce à l'IA
Un pas de plus dans l'interprétation du génome grâce à l'IA / Photo: © AFP/Archives

Un pas de plus dans l'interprétation du génome grâce à l'IA

AlphaGenome, outil d'intelligence artificielle (IA) de Google rendu public mercredi, fait un pas de plus dans la compréhension du génome, en analysant comment des portions de l'ADN régulent l'activité des gènes dans la cellule.

Taille du texte:

Le déchiffrage de l'ensemble du génome humain en 2003, "nous a donné le livre de la vie, mais le lire reste un défi", a rappelé Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à l'occasion de la présentation d'AlphaGenome dans la revue Nature.

"Nous avons le texte" - la succession de 3 milliards de paires de nucléotides A, T, C et G qui composent l'ADN -, mais "comprendre la grammaire (...) et la manière dont cela gouverne la vie constitue la prochaine frontière majeure de la recherche", a-t-il souligné devant la presse.

Seules 2% des séquences d'ADN "codent" directement des protéines, indispensables au fonctionnement des organismes vivants.

Les 98% restants ont un rôle de "chef d'orchestre": elles coordonnent, protègent et régulent l'expression de l'information génétique dans chacune de nos cellules. Ces séquences, appelées "non codantes", contiennent de nombreux variants associés à des maladies.

Ce sont elles qu'étudie AlphaGenome, venant compléter les autres modèles développés par le laboratoire d'IA de Google: AlphaMissense (analyse des séquences codantes de l'ADN), AlphaProteo (conception de protéines) et AlphaFold (prédiction de la structure de protéines, prix Nobel de chimie en 2024).

Le modèle d'apprentissage profond (dans lequel un réseau de neurones apprend à reconnaître automatiquement des motifs complexes) a été entraîné avec des données provenant de grands consortiums publics, qui ont mesuré expérimentalement ces propriétés dans des centaines de types de cellules et de tissus chez l'homme et la souris.

Il est capable d'analyser une longue séquence d'ADN et de "prédire" l'influence de chaque paire de nucléotides sur différents processus biologiques dans la cellule: activer ou réprimer l'expression d'un gène, piloter l'assemblage de l'ARN (une "copie" de l'ADN qui transmet l'information génétique dans la cellule)...

- "Fondamental" mais "pas parfait" -

D'autres modèles existaient déjà. Mais ils devaient faire un compromis entre la longueur des séquences analysées et la finesse de la résolution.

Or, une longue séquence - jusqu'à un million de paires de nucléotides - est "nécessaire pour comprendre l'environnement régulateur complet d'un gène unique", explique Ziga Avsec, un des co-auteurs du projet.

Et la finesse de la résolution permet d'étudier l'effet de variants génétiques en comparant les prédictions de séquences mutées à celles de séquences non mutées.

Autre avancée, AlphaGenome modélise simultanément l'influence de la séquence sur onze processus biologiques, alors que les scientifiques devaient jusqu'à présent utiliser plusieurs modèles.

Cet outil "peut accélérer notre compréhension du génome en aidant à cartographier l'emplacement des éléments fonctionnels et à déterminer leurs rôles au niveau moléculaire", estime Natasha Latysheva, également co-autrice.

"Nous espérons que les chercheurs enrichiront avec davantage de données et de modalités" le modèle, déjà testé par 3.000 scientifiques de 160 pays et désormais disponible en open source pour la recherche non-commerciale, souligne M. Kohli.

"Identifier précisément les différences dans nos génomes qui nous rendent plus ou moins susceptibles de développer des milliers de maladies est une étape clé vers de meilleurs traitements", note Ben Lehner, responsable de la génomique générative et synthétique au Wellcome Sanger Institute de Cambridge.

Le chercheur, qui n'a pas participé au projet mais a testé le modèle, le juge "très performant", mais encore "loin d'être parfait".

"Les modèles d'IA ne sont bons que dans la mesure où les données utilisées pour les entraîner le sont", or la plupart des jeux de données existants "sont trop petits et insuffisamment standardisés", explique-t-il dans une réaction à l'organisme britannique Science Media Center (SMC).

AlphaGenome n'est pas une "solution miracle à toutes les questions biologiques", l'expression des gènes "étant influencée par des facteurs environnementaux complexes", mais il constitue un "outil fondamental", abonde Robert Goldstone, responsable de la génomique au Francis Crick Institute, cité dans le même texte.

Selon lui, ce nouvel outil permettra aux scientifiques "d'étudier et de simuler de manière programmatique les bases génétiques des maladies complexes".

F.Carrillo--TFWP