phundrak.com/content/vocal-synthesis.org

70 lines
3.4 KiB
Org Mode
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

#+setupfile: ./headers
#+language: fr
#+begin_export html
---
title: Synthèse vocale
---
#+end_export
* Travaux en synthèse vocale
De 2011 à 2018, jai travaillé autant en tant quamateur puis en tant
que professionnel dans le domaine de la synthèse vocale chantée. Plus
précisément, je créais et utilisait des banques vocales pour le
logiciel UTAU puis Alter/Ego principalement.
** UTAU
Jai commencé à travailler avec UTAU durant la fin de 2011 avec une
banque vocale japonaise basée sur ma voix, anonyme et perdue depuis.
Bien que je ne la maintins pas longtemps, principalement dû à la
mauvaise qualité de sa configuration et de ses échantillons audio
source (je lenregistrai avec un micro de bureau de mauvaise qualité),
cela menseigna les bases de la création de banques vocales pour UTAU
et du travail avec des fichiers audio.
Le 14 octobre 2012, je publiai ma seconde banque vocale, /BSUP01 KEINE
Tashi JPN VCV/, une banque vocale également basée sur ma voix et dune
qualité bien supérieure du fait du matériel denregistrement
professionnel et de la méthode denregistrement très différente à
celle utilisé à lorigine. Bien que sa configuration nétait rien
dextraordinaire pour lépoque, il sagissait tout de même dun gain
de qualité net. Ma meilleure banque vocale fut /BSUP01 KEINE Tashi JPN
Extend Power/, une voix puissante créée dans des circonstances
similaires, mais avec à nouveau un meilleur savoir-faire.
Cette série de banques vocales basées sur ma voix inclut également
/BSUP01 KEINE Tashi TIB CVVC/ ainsi quune autre banque vocale basée sur
une autre voix, celle de /BSUP02 Drolma TIB/, les deux premières banques
vocales tibétaines optimisées pour la synthèse de chant au monde.
Je créai plus tard /ALYS 001 JPN/, /ALYS 001 FRA/ et /ALYS 002 FRA/ en tant
que prototypes dALYS sous UTAU. Ces banques vocales furent connues
plus tard sous le nom de /ALYS4UTAU/.
Tandis que chacune de ces banques vocales ne sont plus en
développement et leur support technique nest plus assuré, /BSUP01
KEINE Tashi/ et /ALYS/ sont toujours disponibles au téléchargement.
- BSUP01 KEINE Tashi :: [[file:./keine-tashi.org][BSUP01 KEINE Tashi]]
- ALYS :: [[https://labs.phundrak.com/ALYS/ALYS][Téléchargement dALYS4AE]] (en anglais)
** Alter/Ego
[[https://www.plogue.com/products/alter-ego.html][Alter/Ego]] est un moteur de synthèse vocale créé par [[https://www.plogue.com/][Plogue Inc.]]. ALYS
fut la première voix de synthèse commerciale créée pour ce moteur,
ainsi que la première voix de synthèse professionnelle francophone
créée pour le chant.
Du fait de larchitecture et du comportement dAlter/Ego, des
changements importants ont dû être apportés aux scripts
denregistrement dALYS (plus tard réutilisés pour LEORA). En incluant
la réalisation du script denregistrement, le développement initial
dALYS prit plus dun an. Le développement de la première mise à jour
majeure dALYS prit neuf mois supplémentaires.
/ALYS for Alter/Ego/ est désormais disponible gratuitement tant que
module pour Alter/Ego depuis le 15 décembre 2021. Cependant, les
informations et la méthode nécessaires pour compiler sa banque vocale
pour Alter/Ego ne peuvent pas être rendus publique. Plus
dinformations [[https://blog.phundrak.com/open-sourcing-alys/][ici]].
#+include: other-links