The Fort Worth Press - L'avenir incertain de la lecture humaine dans le livre audio

USD -
AED 3.672499
AFN 64.999694
ALL 81.642835
AMD 377.219685
ANG 1.79008
AOA 916.999786
ARS 1444.993899
AUD 1.422789
AWG 1.8025
AZN 1.702618
BAM 1.653821
BBD 2.007458
BDT 121.808396
BGN 1.67937
BHD 0.377
BIF 2953.360646
BMD 1
BND 1.26696
BOB 6.887396
BRL 5.239202
BSD 0.996711
BTN 90.052427
BWP 13.76724
BYN 2.855766
BYR 19600
BZD 2.004583
CAD 1.363485
CDF 2199.999823
CHF 0.77501
CLF 0.02178
CLP 860.00012
CNY 6.938198
CNH 6.932785
COP 3652
CRC 495.031923
CUC 1
CUP 26.5
CVE 93.239472
CZK 20.567995
DJF 177.491777
DKK 6.31131
DOP 62.762674
DZD 129.809035
EGP 47.028301
ERN 15
ETB 154.611983
EUR 0.84503
FJD 2.19785
FKP 0.732491
GBP 0.728965
GEL 2.694962
GGP 0.732491
GHS 10.919207
GIP 0.732491
GMD 72.999979
GNF 8744.661959
GTQ 7.645019
GYD 208.524474
HKD 7.815215
HNL 26.334616
HRK 6.3668
HTG 130.737911
HUF 321.873967
IDR 16773
ILS 3.090495
IMP 0.732491
INR 90.462699
IQD 1305.693436
IRR 42125.000158
ISK 122.529935
JEP 0.732491
JMD 156.204812
JOD 0.708953
JPY 156.310501
KES 128.530273
KGS 87.449745
KHR 4021.613211
KMF 417.999941
KPW 899.987247
KRW 1450.801658
KWD 0.30737
KYD 0.830631
KZT 499.708267
LAK 21439.292404
LBP 89256.37795
LKR 308.507985
LRD 185.387344
LSL 15.964383
LTL 2.95274
LVL 0.60489
LYD 6.301423
MAD 9.14286
MDL 16.878982
MGA 4417.422775
MKD 52.086943
MMK 2100.119929
MNT 3568.429082
MOP 8.020954
MRU 39.790284
MUR 45.880297
MVR 15.449965
MWK 1728.325117
MXN 17.21895
MYR 3.92694
MZN 63.749624
NAD 15.964451
NGN 1388.149904
NIO 36.682353
NOK 9.626245
NPR 144.090313
NZD 1.655395
OMR 0.384498
PAB 0.996706
PEN 3.355418
PGK 4.270433
PHP 58.955987
PKR 278.75798
PLN 3.569715
PYG 6612.604537
QAR 3.624302
RON 4.3058
RSD 99.190187
RUB 76.999649
RWF 1454.737643
SAR 3.750137
SBD 8.058101
SCR 14.239717
SDG 601.499892
SEK 8.886903
SGD 1.27032
SHP 0.750259
SLE 24.47504
SLL 20969.499267
SOS 568.686313
SRD 38.114498
STD 20697.981008
STN 20.71794
SVC 8.721498
SYP 11059.574895
SZL 15.970032
THB 31.579829
TJS 9.314268
TMT 3.51
TND 2.882209
TOP 2.40776
TRY 43.511602
TTD 6.751283
TWD 31.5423
TZS 2581.539917
UAH 43.134476
UGX 3553.202914
UYU 38.389826
UZS 12201.979545
VES 371.640565
VND 25997.5
VUV 119.537583
WST 2.726316
XAF 554.697053
XAG 0.011442
XAU 0.000197
XCD 2.70255
XCG 1.796311
XDR 0.689842
XOF 554.678291
XPF 100.846021
YER 238.374989
ZAR 15.92825
ZMK 9001.198907
ZMW 19.560456
ZWL 321.999592
  • AEX

    0.6000

    994.63

    +0.06%

  • BEL20

    15.9500

    5515.19

    +0.29%

  • PX1

    23.7200

    8203.35

    +0.29%

  • ISEQ

    34.7700

    13408.41

    +0.26%

  • OSEBX

    -0.7000

    1758.99

    -0.04%

  • PSI20

    31.7800

    8859.64

    +0.36%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    42.3400

    4113.69

    +1.04%

  • N150

    18.2200

    3978.11

    +0.46%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: © AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

G.Dominguez--TFWP