The Fort Worth Press - L'avenir incertain de la lecture humaine dans le livre audio

USD -
AED 3.672497
AFN 63.999524
ALL 82.817919
AMD 366.961185
ANG 1.790403
AOA 917.497554
ARS 1477.267299
AUD 1.449191
AWG 1.8
AZN 1.696986
BAM 1.719513
BBD 2.008994
BDT 122.690487
BGN 1.69088
BHD 0.376994
BIF 2980
BMD 1
BND 1.294146
BOB 6.89258
BRL 5.195598
BSD 0.997508
BTN 94.112631
BWP 13.611387
BYN 2.838756
BYR 19600
BZD 2.006181
CAD 1.419985
CDF 2270.000283
CHF 0.810703
CLF 0.023384
CLP 920.330506
CNY 6.790502
CNH 6.80177
COP 3447.54
CRC 454.001969
CUC 1
CUP 26.5
CVE 96.940099
CZK 21.3531
DJF 177.630075
DKK 6.578008
DOP 58.781123
DZD 133.470173
EGP 49.515902
ERN 15
ETB 158.649893
EUR 0.880105
FJD 2.266098
FKP 0.75995
GBP 0.758084
GEL 2.639591
GGP 0.75995
GHS 11.218905
GIP 0.75995
GMD 72.500239
GNF 8740.757673
GTQ 7.610005
GYD 208.702762
HKD 7.84025
HNL 26.719736
HRK 6.630401
HTG 130.371712
HUF 311.630501
IDR 18028
ILS 2.982925
IMP 0.75995
INR 94.40065
IQD 1310
IRR 1375049.999969
ISK 126.720221
JEP 0.75995
JMD 157.214761
JOD 0.70901
JPY 161.818503
KES 129.529911
KGS 87.449853
KHR 4010.000098
KMF 434.000376
KPW 900.00035
KRW 1546.390241
KWD 0.30965
KYD 0.831256
KZT 483.438614
LAK 22065.000185
LBP 89328.533059
LKR 336.16866
LRD 181.540044
LSL 16.590003
LTL 2.95274
LVL 0.60489
LYD 6.405725
MAD 9.415504
MDL 17.705627
MGA 4252.569389
MKD 54.235871
MMK 2099.534862
MNT 3583.823146
MOP 8.055405
MRU 40.070268
MUR 48.190044
MVR 15.45039
MWK 1737.000108
MXN 17.507199
MYR 4.120437
MZN 63.894772
NAD 16.590323
NGN 1375.170414
NIO 36.609801
NOK 9.872751
NPR 150.579371
NZD 1.771805
OMR 0.384506
PAB 0.99749
PEN 3.422009
PGK 4.377508
PHP 61.366498
PKR 277.594113
PLN 3.77064
PYG 6095.373741
QAR 3.644976
RON 4.605495
RSD 103.32795
RUB 75.200986
RWF 1465.854892
SAR 3.75501
SBD 8.051953
SCR 13.24174
SDG 599.99957
SEK 9.742976
SGD 1.296825
SHP 0.746601
SLE 24.799045
SLL 20969.503664
SOS 570.059564
SRD 37.319711
STD 20697.981008
STN 21.540261
SVC 8.728411
SYP 110.532098
SZL 16.516625
THB 33.377502
TJS 9.221714
TMT 3.5
TND 2.937503
TOP 2.40776
TRY 46.601903
TTD 6.774893
TWD 31.861403
TZS 2618.936022
UAH 44.85287
UGX 3690.695456
UYU 40.019342
UZS 11982.22316
VES 620.752985
VND 26320
VUV 119.820737
WST 2.777776
XAF 576.690844
XAG 0.017376
XAU 0.000249
XCD 2.70255
XCG 1.797729
XDR 0.717231
XOF 576.698449
XPF 104.849947
YER 238.624978
ZAR 16.50045
ZMK 9001.200752
ZMW 18.004545
ZWL 321.999592
  • AEX

    2.3400

    1067.71

    +0.22%

  • BEL20

    60.1200

    5732.05

    +1.06%

  • PX1

    46.9500

    8431.61

    +0.56%

  • ISEQ

    105.9200

    14042.55

    +0.76%

  • OSEBX

    -10.6000

    1916.16

    -0.55%

  • PSI20

    102.3200

    9157.33

    +1.13%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    128.0200

    4244.51

    +3.11%

  • N150

    -5.4400

    4177.95

    -0.13%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: © AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

G.Dominguez--TFWP