Strumentazioni per la registrazione dei diversi tipi di segnale coinvolti nell'atto di comunicazione orale faccia-a-faccia:
1) segnale acustico:
cabina silente, registratori digitali ad alta fedeltà (DAT), microfoni e cuffie professionali, impianti analogici HiFi e digitali (PC con schede professionali di acquisizione digitale) per l'acquisizione, l'eleborazione e la riproduzione del segnale ecc.;
2) segnali articolatori:
movimenti della lingua: dispositivi elettropalatografici
(RION, KAY ELEMETRICS)
movimenti delle labbra e mandibola: sistemi
optoelettronici (ELITE);
3) segnali aerodinamici:
aerometri, pletismografi, pneumotacografi, ecc.;
4) segnali glottografici:
elettroglottografi, laringografi;
5) segnali video per la comunicazione multimodale nel parlato faccia-a-faccia:
telecamere analogiche e digitali, videoregistratori, sistemi di acquisizione digitale su PC;
6) per le ricerche percettive:
dispositivi per filtraggi e mascheramenti del segnale acustico.
B) Programmi per l'analisi acustica del parlato
MULTISPEECH
SCICON
SYGNALIZE
CSL-Kay Elemetric Co.
MATLAB
PRAAT
SFS
Snack (KTH)
Wavesurfer (KTH)
C) Programmi per la segmentazione ed etichettatura plurilivello del segnale acustico
Multitool
Transcriber
Anvil
TASX
ISTC-SPFD Automatic Aligner
D) Programmi per l'analisi dei movimenti labiali
Matlab
Mavis
ISTC-SPFD Interface
Track
Optimize
IFDCin
FacePlayer
Exml2FAP
EmotionDisk
E) Programmi per l'analisi dei movimenti facciali
Matlab
Mavis
ISTC-SPFD Interface
Track
Optimize
IFDCin
FacePlayer
Exml2FAP
EmotionDisk
F) Programmi per la segmentazione ed etichettatura plurilivello dei segnali che veicolano informazione nella comunicazione multimodale faccia-a-faccia
(segnale acustico del parlato e segnali visivi prodotti dai movimenti delle mani - gestualità coverbale - e della faccia - movimenti di testa, sopracciglia, occhi, bocca)
Partitura (Magno Caldognetto e Poggi) in ANVIL (M.Kipp)
Anvil
TASX
G) Programmi di sintesi automatica del parlato da testo (TTS)
FESTIVAL (CSTR The Centre for Speech Technology Research, University of Edinburgh Edinburgh)
FESTIVAL per l'italiano (ISTC-SPFD, P. Cosi, ITC-IRST, F. Tesser)
MBROLA per l'italiano (ISTC-SPFD, P. Cosi, ITC-IRST, F. Tesser)
PARLA per l'italiano (ISTC-SPFD, P. Cosi, ITC-IRST, F. Tesser)
MaryTTS per l'italiano (ISTC-SPFD, P. Cosi, ITC-IRST, F. Tesser)
MIVOQ TTS (Italiano, Inglese, Francese, Tedesco, ...) (MIVOQ)
H) Programmi di riconoscimento automatico del parlato (ASR)
CSLU-TOOLKIT (Italiano, Inglese)
SONIC (Italiano, Inglese)
SPHINX (Italiano, Inglese)
JULIUS (Italiano, Inglese)
BAVIECA (Italiano, Inglese)
KALDI (Italiano, Inglese)
I) Programmi di sintesi bimodale da testo
(Agenti Virtuali e Facce Parlanti)
LUCIA (P. Cosi)
GRETA (C. Pelachaud & P. Cosi)
BALDINI (D. Massaro & P. Cosi)
L) Programmi per l'esecuzione di test percettivi unimodali uditivi, unimodali visivi, bimodali uditivo-visivi
M) CORPORA VOCALI:
MIC 1 (read speech, Microphonic)
o Speech (Aree di Esistenza, Ferrero 1968) (ISTC-SMCL)
o 7 vocali isolate, segnale microfonico, 25 soggetti maschili, 25 soggetti femminili, 1 ripetizione , 16 bit PCM, 10 kHz
MIC 2 (read speech, Microphonic)
o Speech (Italian I-set) (ISTC-SMCL)
o [ /'bi/, /'tSi/, /'di/, /'dZi/, /'i/, /'pi/, /'ti/, /'vi/, /'Li/, /'si/ ], segnale microfonico, 7 soggetti maschili, 5 ripetizioni, segmentazione (ASCII), 16 bit PCM, 16 kHz
MIC 3 (read speech, Microphonic)
o Speech (Italian E-set) (ISTC-SMCL)
o [ /'Effe/, /'Elle/, /'Emme/, /'Enne/, /'Erre/, /'Esse/ ], segnale microfonico, 7 soggetti maschili, 5 ripetizioni, segmentazione (ASCII), etichettatura (ASCII), 16 bit PCM, 16 kHz
MIC-ART 1 [read audio/visual speech, Microphonic Articulatory (ELITE)]
o Speech (Italian VCV-set) (ISTC-SMCL)
o /'VCV/, C=/21 Italian consonants/, V=/a/, 5 soggetti maschili, 5 ripetizioni, segnale microfonico, 16 bit PCM, 16 kHz, 28 parametri ELITE, 16 bit PCM, 100 Hz (10 ms), segmentazione (ASCII), etichettatura (ASCII)
MIC-ART 2 [read audio/visual speech, Microphonic Articulatory (ELITE)]
o Speech (Italian /p&f-set) (ISTC-SMCL)
o /'VCV/, C=/21 Italian consonants/, V=/a/, 5 soggetti maschili, 5 ripetizioni, segnale microfonico, 16 bit PCM, 16 kHz, 28 parametri ELITE, 16 bit PCM, 100 Hz (10 ms), segmentazione (ASCII), etichettatura (ASCII)
MIC-ART 3 [read audio/visual speech, Microphoni Articulatory (ELITE)]
o Speech (Italian Plosive-set) (ISTC-SMCL)
o /'VCV/, C=/p,t,k,b,d,g/, V=/a,i,u/, 10 soggetti maschili, 5 ripetizioni, segnale microfonico, 16 bit PCM, 16 kHz, 28 parametri ELITE, 16 bit PCM, 100 Hz (10 ms), 40+40 coefficienti uditivi, codificati (unsigned-short), 16 bit PCM, 500 Hz (2 ms), segmentazione (ASCII), etichettatura (ASCII)
MIC-ART Emotion 1 [read audio/visual speech, Microphonic-Articulatory (ELITE)]
o Emotional Speech (isolated words) (ISTC-SMCL)
MIC-ART Emotion 2 [read audio/visual speech, Microphonic-Articulatory (ELITE)]
o Emotional Speech (isolated words and simple sentences) (ISTC-SMCL)
MBROLA ita3 (read speech, Microphonic)
o TTS male diphone DB (Mbrola) (ISTC-SMCL)
MBROLA ita4 (read speech, Microphonic)
o TTS female diphone DB (Mbrola) (ISTC-SMCL)
SARIS (spontaneous/read speech, Michrophonic)
o Spontaneous and read monologues
VISF (spontaneous speech, Microphonic)
o Spontaneous and read monologues
§ vocalizzazioni infantili sullo sviluppo fonetico, registrazioni babbling (anche videoregistrazioni), soggetti normali di età evolutiva (dai 6 mesi a 21 mesi), classificazione percettiva, e trascrizione fonetica stretta, analisi fonetica e acustica, statistiche elaborate con SYSTAT
AVIP (spontaneous speech, Microphonic)
o Archivio delle Varietà di Italiano Parlato
o (progetto MURST, Cofin 97)
API (spontaneous speech, Michrophonic)
o Archivio del Parlato Italiano
o (progetto MURST, Cofin 99)
SPK (continuous speech, Michrophonic)
o Isolated digits (ITC-IRST, ELRA)
APASCI (continuous/read speech, Michrophonic)
o Acoustic-Phonetic and Spontaneous Speech Corpus (ITC-IRST, ELRA)
SIVA the Muser (continuous/read speech, Michrophonic)
o Digits, Acoustic-Phonetic and Spontaneous Speech Corpus (FUB)
CSLU 30K numbers (continuous/read speech, Michrophonic)
o Isolated/continuous digits
o (OGI CSLU Portland Oregon)
TIMIT (continuous/read speech, Michrophonic)
o Acoustic-Phonetic and Spontaneous Speech Corpus (NIST SpeechDisc)
I vari cataloghi elettronici messi a disposizione potranno essere consultati direttamente per ricerche specializzate oppure per l'accesso diretto, vista la notevole dimensione digitale dei dati trattati per le ricerche nel campo fonico/articolatorio, l'archivio elettronico verrà organizzato come una serie di pagine esplicative dei vari corpora o delle varie informazioni a disposizione, che potranno essere successivamente richiesti all'SMCL sotto forma di CDrom o, nel caso di dimensioni ridotte, essere forniti direttamente in rete tramite collegamento telematico (FTP/ HTTP).