The Fort Worth Press - L'avenir incertain de la lecture humaine dans le livre audio

USD -
AED 3.672499
AFN 64.501308
ALL 81.091764
AMD 369.248031
ANG 1.789884
AOA 917.999814
ARS 1395.523747
AUD 1.382485
AWG 1.8
AZN 1.698555
BAM 1.662466
BBD 2.013854
BDT 122.689218
BGN 1.668102
BHD 0.377545
BIF 2976.339735
BMD 1
BND 1.267973
BOB 6.9098
BRL 4.914103
BSD 0.999873
BTN 94.420977
BWP 13.425192
BYN 2.825886
BYR 19600
BZD 2.010964
CAD 1.36575
CDF 2316.000248
CHF 0.778435
CLF 0.022607
CLP 889.770183
CNY 6.80505
CNH 6.80103
COP 3738.9
CRC 459.648974
CUC 1
CUP 26.5
CVE 93.718924
CZK 20.662698
DJF 178.070373
DKK 6.35355
DOP 59.467293
DZD 132.269335
EGP 52.717905
ERN 15
ETB 156.137601
EUR 0.85023
FJD 2.184898
FKP 0.734821
GBP 0.734715
GEL 2.679792
GGP 0.734821
GHS 11.264445
GIP 0.734821
GMD 72.999787
GNF 8773.107815
GTQ 7.634866
GYD 209.223551
HKD 7.82816
HNL 26.583478
HRK 6.404025
HTG 130.919848
HUF 302.820499
IDR 17368.9
ILS 2.90496
IMP 0.734821
INR 94.478103
IQD 1309.963492
IRR 1312900.000029
ISK 122.270146
JEP 0.734821
JMD 157.601928
JOD 0.708974
JPY 156.754504
KES 129.130063
KGS 87.420497
KHR 4012.087263
KMF 419.000313
KPW 899.950939
KRW 1466.68497
KWD 0.30763
KYD 0.833358
KZT 462.122307
LAK 21929.626969
LBP 89547.492658
LKR 321.915771
LRD 183.493491
LSL 16.405102
LTL 2.952741
LVL 0.60489
LYD 6.322723
MAD 9.144703
MDL 17.099822
MGA 4176.618078
MKD 52.401617
MMK 2099.606786
MNT 3578.902576
MOP 8.06268
MRU 39.968719
MUR 46.820195
MVR 15.454972
MWK 1733.612706
MXN 17.23635
MYR 3.920978
MZN 63.900189
NAD 16.405102
NGN 1359.689667
NIO 36.794016
NOK 9.20175
NPR 151.087386
NZD 1.67806
OMR 0.384529
PAB 0.999962
PEN 3.457057
PGK 4.415452
PHP 60.485968
PKR 278.66746
PLN 3.598017
PYG 6107.687731
QAR 3.654753
RON 4.440951
RSD 99.791978
RUB 74.148427
RWF 1465.941884
SAR 3.780624
SBD 8.032258
SCR 14.326153
SDG 600.498337
SEK 9.218875
SGD 1.267885
SHP 0.746601
SLE 24.600677
SLL 20969.496166
SOS 571.467429
SRD 37.43097
STD 20697.981008
STN 20.823594
SVC 8.749309
SYP 110.543945
SZL 16.394307
THB 32.224021
TJS 9.329718
TMT 3.51
TND 2.904513
TOP 2.40776
TRY 45.36475
TTD 6.776593
TWD 31.394497
TZS 2604.644023
UAH 43.92104
UGX 3746.547108
UYU 39.879308
UZS 12128.681314
VES 496.20906
VND 26308
VUV 118.026144
WST 2.704092
XAF 557.575577
XAG 0.012389
XAU 0.000212
XCD 2.70255
XCG 1.802048
XDR 0.695511
XOF 557.525817
XPF 101.364158
YER 238.601522
ZAR 16.42005
ZMK 9001.201083
ZMW 19.037864
ZWL 321.999592
  • AEX

    -1.4300

    1017.99

    -0.14%

  • BEL20

    -9.8500

    5459.73

    -0.18%

  • PX1

    -62.3400

    8139.81

    -0.76%

  • ISEQ

    -132.0200

    12811.26

    -1.02%

  • OSEBX

    -6.1400

    1973

    -0.31%

  • PSI20

    -59.3700

    9075.24

    -0.65%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -88.2800

    3998.61

    -2.16%

  • N150

    -5.0400

    4193.99

    -0.12%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: © AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

G.Dominguez--TFWP