The Fort Worth Press - OpenAI donne la vision et la voix à ChatGPT

USD -
AED 3.672503
AFN 64.999933
ALL 81.600054
AMD 377.015652
ANG 1.79008
AOA 917.000138
ARS 1445.006097
AUD 1.42109
AWG 1.8025
AZN 1.692783
BAM 1.652954
BBD 2.006406
BDT 121.744569
BGN 1.67937
BHD 0.377041
BIF 2951.80061
BMD 1
BND 1.266301
BOB 6.883642
BRL 5.241901
BSD 0.996188
BTN 90.006001
BWP 13.760026
BYN 2.854269
BYR 19600
BZD 2.003533
CAD 1.363515
CDF 2199.999904
CHF 0.775602
CLF 0.02178
CLP 859.999739
CNY 6.938197
CNH 6.934855
COP 3629.58
CRC 494.755791
CUC 1
CUP 26.5
CVE 93.18904
CZK 20.592798
DJF 177.398771
DKK 6.31505
DOP 62.727665
DZD 129.829012
EGP 46.963602
ERN 15
ETB 154.525739
EUR 0.84552
FJD 2.196896
FKP 0.732491
GBP 0.728597
GEL 2.694986
GGP 0.732491
GHS 10.913255
GIP 0.732491
GMD 73.000148
GNF 8739.784147
GTQ 7.640884
GYD 208.410804
HKD 7.813605
HNL 26.319926
HRK 6.369601
HTG 130.669957
HUF 321.88799
IDR 16784
ILS 3.088995
IMP 0.732491
INR 90.283098
IQD 1305.009254
IRR 42125.000158
ISK 122.600846
JEP 0.732491
JMD 156.11768
JOD 0.708978
JPY 156.441021
KES 129.000315
KGS 87.449936
KHR 4019.573871
KMF 418.000012
KPW 899.987247
KRW 1454.629897
KWD 0.30734
KYD 0.830199
KZT 499.446421
LAK 21428.148849
LBP 89209.607762
LKR 308.347631
LRD 185.292552
LSL 15.956086
LTL 2.95274
LVL 0.60489
LYD 6.298121
MAD 9.137876
MDL 16.870209
MGA 4415.108054
MKD 52.097815
MMK 2100.119929
MNT 3568.429082
MOP 8.016683
MRU 39.768089
MUR 45.880351
MVR 15.449797
MWK 1727.419478
MXN 17.2304
MYR 3.930994
MZN 63.749641
NAD 15.956086
NGN 1381.359533
NIO 36.662976
NOK 9.632495
NPR 144.009939
NZD 1.654905
OMR 0.384507
PAB 0.996163
PEN 3.353659
PGK 4.26805
PHP 58.995007
PKR 278.611912
PLN 3.570445
PYG 6609.139544
QAR 3.622342
RON 4.307498
RSD 99.269956
RUB 77.049995
RWF 1453.926184
SAR 3.750074
SBD 8.058101
SCR 14.01331
SDG 601.523681
SEK 8.915195
SGD 1.27033
SHP 0.750259
SLE 24.475013
SLL 20969.499267
SOS 568.369098
SRD 38.114499
STD 20697.981008
STN 20.706383
SVC 8.716965
SYP 11059.574895
SZL 15.961664
THB 31.61499
TJS 9.309427
TMT 3.51
TND 2.88065
TOP 2.40776
TRY 43.502915
TTD 6.747746
TWD 31.554499
TZS 2586.540091
UAH 43.111874
UGX 3551.266015
UYU 38.369223
UZS 12195.585756
VES 371.640565
VND 25983.5
VUV 119.537583
WST 2.726316
XAF 554.38764
XAG 0.011167
XAU 0.000197
XCD 2.70255
XCG 1.79537
XDR 0.68948
XOF 554.38764
XPF 100.793178
YER 238.375005
ZAR 15.96625
ZMK 9001.200101
ZMW 19.550207
ZWL 321.999592
  • AEX

    2.5800

    996.55

    +0.26%

  • BEL20

    40.7000

    5540.04

    +0.74%

  • PX1

    59.7100

    8239.58

    +0.73%

  • ISEQ

    100.3100

    13475.1

    +0.75%

  • OSEBX

    0.3500

    1760.12

    +0.02%

  • PSI20

    50.3100

    8877.33

    +0.57%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    42.3400

    4113.69

    +1.04%

  • N150

    28.9100

    3988.51

    +0.73%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: © AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

M.T.Smith--TFWP