The Fort Worth Press - Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts

USD -
AED 3.672504
AFN 63.000368
ALL 81.850403
AMD 368.180403
ANG 1.79046
AOA 918.000367
ARS 1411.841886
AUD 1.388696
AWG 1.8
AZN 1.70397
BAM 1.679981
BBD 2.014233
BDT 122.76083
BGN 1.66992
BHD 0.377275
BIF 2976
BMD 1
BND 1.278067
BOB 6.910443
BRL 5.037104
BSD 1.000073
BTN 94.959542
BWP 13.418887
BYN 2.740298
BYR 19600
BZD 2.011459
CAD 1.38005
CDF 2272.000362
CHF 0.781119
CLF 0.022615
CLP 890.050396
CNY 6.76635
CNH 6.764365
COP 3693.14
CRC 452.064266
CUC 1
CUP 26.5
CVE 94.87504
CZK 20.824204
DJF 177.720393
DKK 6.41042
DOP 58.340393
DZD 132.780279
EGP 52.325831
ERN 15
ETB 158.000358
EUR 0.857704
FJD 2.221804
FKP 0.742087
GBP 0.743356
GEL 2.670391
GGP 0.742087
GHS 11.74039
GIP 0.742087
GMD 72.503851
GNF 8780.000355
GTQ 7.628513
GYD 209.220224
HKD 7.83695
HNL 26.570388
HRK 6.460604
HTG 130.96772
HUF 303.492504
IDR 17823.65
ILS 2.80215
IMP 0.742087
INR 95.010504
IQD 1310
IRR 1351050.000352
ISK 122.960386
JEP 0.742087
JMD 157.513861
JOD 0.70904
JPY 159.30904
KES 129.410385
KGS 87.450384
KHR 4010.00035
KMF 422.00035
KPW 899.855249
KRW 1507.420383
KWD 0.30944
KYD 0.833462
KZT 487.321548
LAK 21952.503779
LBP 89550.000349
LKR 330.034874
LRD 183.125039
LSL 16.240381
LTL 2.95274
LVL 0.60489
LYD 6.350381
MAD 9.18375
MDL 17.306602
MGA 4190.000347
MKD 52.848875
MMK 2100.044704
MNT 3580.365831
MOP 8.070537
MRU 40.000346
MUR 47.370378
MVR 15.403739
MWK 1737.000345
MXN 17.354804
MYR 3.970504
MZN 63.905039
NAD 16.240377
NGN 1371.703725
NIO 36.570377
NOK 9.253504
NPR 151.935268
NZD 1.671822
OMR 0.385278
PAB 1.000103
PEN 3.399504
PGK 4.355039
PHP 61.474038
PKR 278.550374
PLN 3.62895
PYG 6017.110756
QAR 3.641038
RON 4.504104
RSD 100.681038
RUB 71.146838
RWF 1462.5
SAR 3.772303
SBD 8.03246
SCR 13.536038
SDG 600.503676
SEK 9.255045
SGD 1.276804
SHP 0.746601
SLE 24.603667
SLL 20969.502105
SOS 571.503662
SRD 37.170504
STD 20697.981008
STN 21.4
SVC 8.751074
SYP 110.532098
SZL 16.240369
THB 32.575038
TJS 9.231047
TMT 3.5
TND 2.894038
TOP 2.40776
TRY 45.852504
TTD 6.793623
TWD 31.426804
TZS 2629.583038
UAH 44.293077
UGX 3769.922222
UYU 40.112866
UZS 12022.503617
VES 548.68505
VND 26312.5
VUV 118.055972
WST 2.715197
XAF 563.44981
XAG 0.013284
XAU 0.00022
XCD 2.70255
XCG 1.802416
XDR 0.699507
XOF 562.503593
XPF 102.603591
YER 238.603589
ZAR 16.29669
ZMK 9001.203584
ZMW 18.382896
ZWL 321.999592
  • AEX

    -2.2800

    1034.93

    -0.22%

  • BEL20

    -19.6100

    5583.39

    -0.35%

  • PX1

    -5.7300

    8183.34

    -0.07%

  • ISEQ

    94.4100

    13206.81

    +0.72%

  • OSEBX

    -15.5200

    2000.29

    -0.77%

  • PSI20

    -10.9000

    9076.53

    -0.12%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -13.1100

    4215.46

    -0.31%

  • N150

    -6.0100

    4284.26

    -0.14%

Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts
Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts / Photo: © AFP/Archives

Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts

L'émergence des agents d'intelligence artificielle (IA) a fait exploser la facture IA de bon nombre d'entreprises, qui se tournent vers des modèles moins coûteux pour ne pas rogner sur leur consommation.

Taille du texte:

Finie, l'ère de "l'intelligence subventionnée" - selon l'expression de Kevin Simback, de l'incubateur Delphi Labs - née avec ChatGPT et la déferlante de l'IA générative.

Pour favoriser l'adoption de cette nouvelle technologie, les grands acteurs du secteur, OpenAI en tête, ont proposé initialement des tarifs très attractifs, au point que leur activité était déficitaire.

"Mais le vent est en train de tourner", prévient Kevin Simback.

Chacun à leur tour, les poids lourds de l'IA ont récemment revu leurs prix pour les ajuster à l'utilisation réelle des capacités informatiques nécessaires pour faire tourner les modèles.

L'avènement des agents IA, des programmes capables d'effectuer des tâches et plus seulement de donner des réponses, a, en outre, fait bondir le recours aux infrastructures informatiques.

Pour une même mission, l'interface peut se démultiplier en plusieurs agents, chacun avec sa feuille de route, le tout assemblé et vérifié par d'autres agents.

A l'arrivée, le nombre de "tokens", unité de référence pour mesurer le résultat produit par l'IA, peut représenter des dizaines de fois celui correspondant à une simple question à ChatGPT.

Le tout s'inscrit dans une période de déséquilibre. Les centres de données et les fabricants de puces ne parviennent pas à suivre le rythme effréné de la demande d'intelligence artificielle, ce qui renchérit l'accès aux infrastructures.

"En particulier chez les développeurs, le coût d'utilisation de l'IA pour la programmation s'est accru de façon exponentielle", observe Mark Barton, de la société d'accompagnement numérique Omniux.

Par extension, pour tous les modèles de référence du marché, "les prix commencent à s'envoler", insiste-t-il.

Face à ce nouveau paradigme, certains questionnent le déploiement à tout crin de l'IA, tels l'enseigne de grande distribution Target, Starbucks ou Uber.

"Dans certains cas, le coût dépasse celui d'un employé au bout d'un mois ou deux parce qu'ils l'utilisent trop", décrit Jack Gold, président du cabinet J.Gold Associates.

- Pas d'IA "sans raison" -

Pourtant sacré, en début d'année, champion du "tokenmaxxing", mouvement qui glorifie la dépense maximale de "tokens" comme mètre étalon de productivité des employés, Meta a récemment mis le hola.

"Personne ne devrait recourir à des outils IA sans raison", a ainsi écrit le responsable technologique du groupe, Andrew Bosworth, dans un mémo interne relayé par le Wall Street Journal.

Mais si le discernement est désormais de mise, la plupart des sociétés cherchent surtout à accéder à une IA moins onéreuse, en recourant à des modèles moins performants que les fleurons du secteur.

Dans ce contexte, la popularité des modèles dits "open weights", téléchargeables gratuitement, est croissante, leur usage ne nécessitant que l'achat de puissance de calcul.

Les entreprises se tournent aussi vers des modèles de plus petite taille, les SLM (small language models) en lieu et place des LLM, qui servent de base à ChatGPT, Claude ou Gemini.

Ces SLM peuvent parfois tourner sur les serveurs locaux ou même directement sur l'ordinateur, une option plus économique car elle évite de payer un fournisseur de capacité à distance (cloud).

Il est aussi possible de scinder une demande unique (prompt) en étapes distinctes pour les confier, à chaque fois, à l'interface adaptée, explique Adrian Balfour, du cabinet de conseil numérique Enverso.

"Quand vous passez par un grand modèle monolithique, vous en aurez à peu près pour 15 dollars le million de +tokens+ alors qu'en prenant des mini-modèles, vous ferez descendre le tout à 5 cents", assure-t-il.

Beaucoup voient dans cette refonte la première étape de la banalisation des modèles, devenus interchangeables sans déperdition.

Dès lors, ce sont les plateformes de sélection et de coordination des modèles et des agents qui prennent de l'importance, selon John Belton, gérant au sein de la société d'investissement Gabelli Funds.

Sur ce créneau, des start-up se battent avec des mastodontes du "cloud" comme Amazon, qui propose déjà de jongler avec une multitude d'IA via sa plateforme Bedrock, mais aussi les géniteurs de l'intelligence artificielle eux-mêmes.

Anthropic dispose ainsi d'une gamme complète de modèles, dont Haiku, l'option la plus économique, à l'instar d'OpenAI et de Google.

John Belton ne voit d'ailleurs pas ces étoiles de l'IA perdre des parts de marché à mesure que les clients cherchent l'efficacité plutôt que la performance.

"Les utilisateurs les plus avancés seront toujours prêts à payer" pour ce qui se fait de mieux, prévoit-il. "Le gâteau ne fait que grossir."

G.Dominguez--TFWP