The Fort Worth Press - OpenAI donne la vision et la voix à ChatGPT

USD -
AED 3.672504
AFN 62.503991
ALL 82.182944
AMD 369.50071
ANG 1.79046
AOA 918.000367
ARS 1394.473315
AUD 1.398993
AWG 1.80125
AZN 1.70397
BAM 1.682192
BBD 2.018062
BDT 122.986281
BGN 1.66992
BHD 0.37793
BIF 2983.270976
BMD 1
BND 1.280867
BOB 6.923838
BRL 5.056804
BSD 1.001935
BTN 96.102868
BWP 14.172795
BYN 2.788285
BYR 19600
BZD 2.015138
CAD 1.37555
CDF 2247.50392
CHF 0.78696
CLF 0.022822
CLP 898.223885
CNY 6.809904
CNH 6.81438
COP 3789.962585
CRC 454.478992
CUC 1
CUP 26.5
CVE 94.839376
CZK 20.916604
DJF 178.419989
DKK 6.428304
DOP 59.863243
DZD 132.734701
EGP 52.834473
ERN 15
ETB 156.447426
EUR 0.860404
FJD 2.20415
FKP 0.74189
GBP 0.750272
GEL 2.680391
GGP 0.74189
GHS 11.457446
GIP 0.74189
GMD 72.503851
GNF 8785.963102
GTQ 7.643745
GYD 209.624565
HKD 7.83285
HNL 26.646884
HRK 6.481104
HTG 131.183073
HUF 311.210388
IDR 17602.95
ILS 2.91944
IMP 0.74189
INR 95.970504
IQD 1312.604825
IRR 1319000.000352
ISK 123.530386
JEP 0.74189
JMD 158.319357
JOD 0.70904
JPY 158.695504
KES 129.153228
KGS 87.450384
KHR 4020.126435
KMF 424.00035
KPW 900.001832
KRW 1497.880383
KWD 0.30864
KYD 0.834989
KZT 470.382316
LAK 21973.938847
LBP 89725.196749
LKR 329.144626
LRD 183.356986
LSL 16.597084
LTL 2.95274
LVL 0.60489
LYD 6.36219
MAD 9.236056
MDL 17.333677
MGA 4170.644648
MKD 53.021116
MMK 2099.639995
MNT 3579.473939
MOP 8.08128
MRU 40.218466
MUR 47.170378
MVR 15.410378
MWK 1737.410227
MXN 17.336604
MYR 3.949504
MZN 63.903729
NAD 16.597084
NGN 1370.490377
NIO 36.872662
NOK 9.304604
NPR 153.764245
NZD 1.70838
OMR 0.384019
PAB 1.001935
PEN 3.434998
PGK 4.365028
PHP 61.608038
PKR 279.069969
PLN 3.65375
PYG 6105.878811
QAR 3.652432
RON 4.436104
RSD 100.967617
RUB 72.76059
RWF 1465.70335
SAR 3.788656
SBD 8.016322
SCR 13.589038
SDG 600.503676
SEK 9.450804
SGD 1.280704
SHP 0.746601
SLE 24.603667
SLL 20969.502105
SOS 572.657292
SRD 37.453038
STD 20697.981008
STN 21.07255
SVC 8.767041
SYP 110.532449
SZL 16.600009
THB 32.605038
TJS 9.348299
TMT 3.51
TND 2.932525
TOP 2.40776
TRY 45.522504
TTD 6.800843
TWD 31.576504
TZS 2615.146433
UAH 44.241431
UGX 3762.095214
UYU 40.132456
UZS 11998.451813
VES 510.148815
VND 26355
VUV 117.920453
WST 2.705599
XAF 564.191287
XAG 0.013153
XAU 0.00022
XCD 2.70255
XCG 1.805789
XDR 0.701673
XOF 564.191287
XPF 102.576012
YER 238.603589
ZAR 16.68789
ZMK 9001.203584
ZMW 18.862082
ZWL 321.999592
  • AEX

    -11.1400

    1010.44

    -1.09%

  • BEL20

    -65.2800

    5467.27

    -1.18%

  • PX1

    -129.3100

    7952.55

    -1.6%

  • ISEQ

    -187.5200

    12397.73

    -1.49%

  • OSEBX

    31.9700

    2017.85

    +1.61%

  • PSI20

    -91.2400

    9033.06

    -1%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -42.5700

    4090.69

    -1.03%

  • N150

    -7.1900

    4219.51

    -0.17%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: © AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

M.T.Smith--TFWP