Modelli prosodici emotivi per la sintesi dell'italiano

È noto come, nel campo della sintesi vocale Text To Speech (TTS), si utilizzano due approcci per l'implementazione di regole prosodiche efficaci: la tecnica rule-based oppure la tecnica data-driven. La prima risulta essere poco naturale e molto laboriosa, poiché le regole devono essere dedotte dalla sola informazione fornita dal testo in ingresso. La generazione data-driven della prosodia è un approccio alternativo che ha il vantaggio di essere più espressiva e di facilitare il compito soprattutto se si vogliono creare differenti set di stili prosodici. In questa comunicazione s'illustrerà la generazione data-driven della prosodia basata su alberi di decisione, utilizzando un database non emotivo. In particolare sarà illustrata un'estensione alla procedura degli alberi di classificazione nello spazio degli eventi intonativi quantizzati: VQ-PaIntE (Vector Quantization - Parametric Intonation Events). L'aspetto rilevante di questo lavoro è che si è utilizzato un approccio differenziale nella predizione della prosodia emotiva: il modulo prosodico emotivo implementato all'ISTC cerca di "imparare" le differenze tra la prosodia neutra (senza emozioni) e i dati prosodici corrispondenti alle emozioni. Un'attenzione particolare è stata posta nella scelta del dominio nel quale eseguire questa differenza. Nell'articolo sarà anche mostrato come l'applicazione della PCA (Principal Components Analysis) semplifica di molto gli alberi di decisione risultanti per modellare l'intonazione.

Tipo Pubblicazione: 
Contributo in volume
Author or Creator: 
Fabio Tesser
Piero Cosi
Carlo Drioli
Graziano Tisato
Publisher: 
EDK Editore, Torriana, ITA
Source: 
AISV 2004 - Atti del 1° Convegno Nazionale AISV - "Misura di parametri - aspetti tecnologici ed implicazioni nei modelli linguistici", edited by Piero Cosi, pp. 799–806. Torriana: EDK Editore, 2005
Date: 
2005
Resource Identifier: 
http://www.cnr.it/prodotto/i/139749
http://www.pd.istc.cnr.it/Papers/PieroCosi/tf-AISV2004.pdf
urn:isbn:88-88974-69-5
Language: 
Ita
Eng