Modele d`une note de synthese
Le terme «synthèse vocale» a été utilisé pour diverses approches techniques. Dans cet article, certaines des approches utilisées pour générer des discours synthétiques dans un système de synthèse vocale sont examinées, et certaines des motivations de base pour choisir une méthode sur une autre sont discutées. Il est important de garder à l`esprit, cependant, que les modèles de synthèse vocale sont nécessaires non seulement pour la génération de la parole, mais pour nous aider à comprendre comment la parole est créée, ou même comment l`articulation peut expliquer la structure du langage. Les questions générales telles que la synthèse de différentes voix, accents et langues multiples sont discutées comme des défis particuliers auxquels la communauté de synthèse vocale est confrontée. Les outils de développement pour les systèmes de synthèse vocale ont suscité des efforts considérables. La publication du modèle sonore de l`anglais par Chomsky et Halle (1968) a poussé un nouveau type de système de synthèse basé sur des règles de réécriture. Leurs idées ont inspiré les chercheurs à créer des compilateurs de règles spéciales pour les développements de la synthèse vocale au début des années 1970. Le nouveau logiciel est encore en cours d`élaboration selon ce principe de base pour illustrer le problème, j`ai choisi quelques travaux récents de Slater et Hawkins (1992). Le travail a été motivé par la nécessité d`améliorer le système de règles dans un système de synthèse vocale pour l`anglais britannique. On a analysé les données relatives à la deuxième fréquence des formants au début d`une voyelle après un arrêt vélaire et au point médian de la voyelle, et, comme on pouvait s`y attendre, on pouvait noter une corrélation claire entre les fréquences à ces positions.
Les données peuvent être décrites par une, deux ou trois lignes de régression, selon le besoin d`exactitude. Cela pourrait ensuite être modélisé par un ensemble de règles. Comme alternative, tous les points de données peuvent être répertoriés. Malheureusement, les lignes de régression changent leurs coefficients en fonction d`un certain nombre de facteurs tels que la position et la contrainte. Pour augmenter la couverture, nous devons élargir la fenêtre d`analyse et inclure plus de dimensions ou augmenter le nombre d`unités. Finalement, nous atteindrons un point où les règles deviennent trop complexes ou Van, H. C., et E. te Lindert (1991), «Speechmaker, synthèse du texte à la parole basée sur une structure de données synchronisée multiniveau», proc. ICASSP-91. L`ambition actuelle dans la recherche de synthèse vocale est de modéliser la parole naturelle à un niveau global, ce qui permet de modifier les caractéristiques des haut-parleurs et le style de parole.
Une raison évidente est le succès limité dans l`amélioration de la qualité générale de la parole en améliorant seulement les modèles segmentaires. Les aspects spécifiques aux orateurs sont considérés comme jouant un rôle très important dans l`acceptabilité du discours synthétique. Cela est particulièrement vrai lorsque les systèmes sont utilisés pour signaler des connaissances sémantiques et pragmatiques. Le but ultime de la recherche de synthèse, à quelques exceptions près, est de produire la meilleure qualité de parole possible. La qualité et l`intelligibilité de la parole sont généralement très difficiles à mesurer. Aucun test unique ne permet de déterminer où se situent les problèmes. Le département de psychologie de l`Université de l`Indiana a lancé une nouvelle vague d`innovation dans l`évaluation des systèmes de synthèse auxquels un certain nombre de groupes ont apporté des contributions substantielles ultérieures.