phundrak.com/vocal-synthesis.md

68 lines
3.3 KiB
Markdown
Raw Normal View History

---
title: Synthèse vocale
---
# Travaux en synthèse vocale
De 2011 à 2018, jai travaillé autant en tant quamateur puis en tant
que professionnel dans le domaine de la synthèse vocale chantée. Plus
précisément, je créais et utilisait des banques vocales pour le
logiciel UTAU puis Alter/Ego principalement.
## UTAU
Jai commencé à travailler avec UTAU durant la fin de 2011 avec une
banque vocale japonaise basée sur ma voix, anonyme et perdue depuis.
Bien que je ne la maintint pas longtemps, principalement dû à la
mauvaise qualité de sa configuration et de ses échantillons audio
source (je lenregistrai avec un micro de bureau de mauvaise qualité),
cela menseigna les bases de la création de banques vocales pour UTAU
et du travail avec des fichiers audio.
Le 14 Octobre 2012, je publiai ma seconde banque vocale, *BSUP01 KEINE
Tashi JPN VCV*, une banque vocale également basée sur ma voix et dune
qualité bien supérieure du fait du matériel denregistrement
professionel et de la méthode denregistrement très différente à celle
utilisé à lorigine. Bien que sa configuration nétait rien
dextraordinaire pour lépoque, il sagissait tout de même dun gain
de qualité net. Ma meilleure banque vocale fut *BSUP01 KEINE Tashi JPN
Extend Power*, une voix puissante créée dans des circonstances
similaires mais avec à nouveau un meilleur savoir-faire.
Cette série de banques vocales basées sur ma voix inclus également
*BSUP01 KEINE Tashi TIB CVVC* ainsi quune autre banque vocale basée
sur une autre voix, celle de *BSUP02 Drolma TIB*, les deux premières
banques vocales tibétaines optimisées pour la synthèse de chant au
monde.
Je créai plus tard *ALYS 001 JPN*, *ALYS 001 FRA* et *ALYS 002 FRA* en
tant que prototypes dALYS sous UTAU. Ces banques vocales furent
connues plus tard sous le nom de *ALYS4UTAU*.
Tandis que chacune de ces banques vocales ne sont plus en
développement et leur support technique nest plus assuré, *BSUP01
KEINE Tashi* et *ALYS* sont toujours disponibles au téléchargement.
- **BSUP01 KEINE Tashi**: [BSUP01 KEINE Tashi](/keine-tashi.md)
- **ALYS for UTAU**: [Open-Sourcing
ALYS](https://blog.phundrak.com/open-sourcing-alys/) (en anglais)
## Alter/Ego
[Alter/Ego](https://www.plogue.com/products/alter-ego.html) est un
moteur de synthèse vocale créé par [Plogue
Inc.](https://www.plogue.com/). ALYS fut la première voix de synthèse
commerciale créée pour ce moteur, ainsi que la première voix de
synthèse professionelle francophone créée pour le chant.
Du fait de larchitecture et du comportement dAlter/Ego, des
changements importants ont dû être apportés aux scripts
denregistrement dALYS (plus tard ré-utilisés pour LEORA). En
incluant la réalisation du script denregistrement, le développement
initial dALYS prit plus dun an. Le développement de la première mise
à jour majeure dALYS prit neuf mois supplémentaires.
*ALYS for Alter/Ego* est désormais disponible gratuitement tant que
module pour Alter/Ego depuis le 15 Décembre 2021. Cependant, les
informations et la méthode nécessaires pour compiler sa banque vocale
pour Alter/Ego ne peuvent pas être rendus publique. Plus
dinformations [ici](https://blog.phundrak.com/open-sourcing-alys/).