phundrak.com/content/vocal-synthesis.org
Lucien Cartier-Tilet cc0a479550
docs: switch from Markdown to orgmode
BREAKING CHANGE: Emacs required to export orgmode files to Markdown
2023-05-11 00:19:47 +02:00

3.4 KiB
Raw Blame History

Synthèse vocale

--- title: Synthèse vocale ---

Travaux en synthèse vocale

De 2011 à 2018, jai travaillé autant en tant quamateur puis en tant que professionnel dans le domaine de la synthèse vocale chantée. Plus précisément, je créais et utilisait des banques vocales pour le logiciel UTAU puis Alter/Ego principalement.

UTAU

Jai commencé à travailler avec UTAU durant la fin de 2011 avec une banque vocale japonaise basée sur ma voix, anonyme et perdue depuis. Bien que je ne la maintins pas longtemps, principalement dû à la mauvaise qualité de sa configuration et de ses échantillons audio source (je lenregistrai avec un micro de bureau de mauvaise qualité), cela menseigna les bases de la création de banques vocales pour UTAU et du travail avec des fichiers audio.

Le 14 octobre 2012, je publiai ma seconde banque vocale, BSUP01 KEINE Tashi JPN VCV, une banque vocale également basée sur ma voix et dune qualité bien supérieure du fait du matériel denregistrement professionnel et de la méthode denregistrement très différente à celle utilisé à lorigine. Bien que sa configuration nétait rien dextraordinaire pour lépoque, il sagissait tout de même dun gain de qualité net. Ma meilleure banque vocale fut BSUP01 KEINE Tashi JPN Extend Power, une voix puissante créée dans des circonstances similaires, mais avec à nouveau un meilleur savoir-faire.

Cette série de banques vocales basées sur ma voix inclut également BSUP01 KEINE Tashi TIB CVVC ainsi quune autre banque vocale basée sur une autre voix, celle de BSUP02 Drolma TIB, les deux premières banques vocales tibétaines optimisées pour la synthèse de chant au monde.

Je créai plus tard ALYS 001 JPN, ALYS 001 FRA et ALYS 002 FRA en tant que prototypes dALYS sous UTAU. Ces banques vocales furent connues plus tard sous le nom de ALYS4UTAU.

Tandis que chacune de ces banques vocales ne sont plus en développement et leur support technique nest plus assuré, BSUP01 KEINE Tashi et ALYS sont toujours disponibles au téléchargement.

BSUP01 KEINE Tashi
BSUP01 KEINE Tashi
ALYS for UTAU
Open-Sourcing ALYS (en anglais)

Alter/Ego

Alter/Ego est un moteur de synthèse vocale créé par Plogue Inc.. ALYS fut la première voix de synthèse commerciale créée pour ce moteur, ainsi que la première voix de synthèse professionnelle francophone créée pour le chant.

Du fait de larchitecture et du comportement dAlter/Ego, des changements importants ont dû être apportés aux scripts denregistrement dALYS (plus tard réutilisés pour LEORA). En incluant la réalisation du script denregistrement, le développement initial dALYS prit plus dun an. Le développement de la première mise à jour majeure dALYS prit neuf mois supplémentaires.

ALYS for Alter/Ego est désormais disponible gratuitement tant que module pour Alter/Ego depuis le 15 décembre 2021. Cependant, les informations et la méthode nécessaires pour compiler sa banque vocale pour Alter/Ego ne peuvent pas être rendus publique. Plus dinformations ici.