Acustica 08

La voce

Dopo esserci occupati degli strumenti, dedichiamo questo approfondimento alla voce, unico strumento in cui non si ricorre a qualcosa di esterno e di grande interesse perché riunisce sia l'aspetto musicale che quello della comunicazione linguistica.
Di solito non ci si pensa, ma il linguaggio ha una particolarità unica: è una forma di comunicazione completamente basata sul timbro. Infatti, sebbene di solito nel parlato ci sia anche una modulazione dell'altezza, essa può essere totalmente eliminata senza compromettere la comprensione.
Inoltre, come mostreremo, il nostro sistema percettivo è talmente specializzato nella decodifica del parlato che quest'ultimo può essere assogettato a manipolazioni che distruggerebbero il senso di qualsiasi altra forma di comunicazione, pur rimanendo intelleggibile.
Infine, l'apparato vocale è l'unico caso di cassa armonica di forma variabile che conosciamo.

Le corde vocali

Senza entrare in particolari fisiologici, le corde vocali sono due lamelle che vengono messe in vibrazione dal passaggio dell'aria. Non essendo particolarmente morbide, la loro vibrazione è di tipo impulsivo. Producono, cioè, una serie di 'toc' molto ravvicinati seguiti da un spazio vuoto.
Tale spazio viene poi riempito dalla risonanza del tratto vocale. In figura potete vedere le onde relative a una voce maschile (sopra) e femminile (sotto) che dicono la vocale aaaa.

Come si vede, le due onde sono simili, a parte l'ovvia differenza in frequenza della voce femminile, più alta.

In entrambi i casi, infatti, si vede l'impulso iniziale seguito dalla risonanza che, in pratica, è una piccola serie di echi generati dal tratto vocale che agisce come cassa armonica.
Ciò significa che, nei suoni tenuti, le corde vocali, da sole, non sono in grado di produrre timbri diversi, ma solo altezze diverse.
Il loro timbro è praticamente sempre identico per ciascun individuo e in generale corrisponde a quello di un'onda impulsiva il cui spettro tende alla lunga serie di armonici visibile nella figura qui sotto.

Questo, in linea di massima, è lo spettro che avrebbero le corde vocali private del tratto di risonanza.
Bisogna ricordare, poi, che non sempre le corde vocali entrano in azione. La maggior parte delle consonanti è prodotta mediante rumori generati dal passaggio dell'aria in un tratto vocale opportunamente configurato dalla posizione della mandibola, della lingua e delle labbra.
In questa sede ci occuperemo principalmente delle vocali, sia perché sono più interessanti didatticamente dal punto di vista timbrico, sia perché sono quelle su cui articola il canto classico.

I suoni vocalizzati

Intanto bisogna ricordare che le vocali sono ben più di 5. Nelle varie forme aperte, chiuse, mezze-aperte, mezze-chiuse, la lingua inglese ne conta da 10 a 14 che potete trovare qui.
L'italiano ha un doppio accento - grave e acuto - solo sulla [e] e sulla [o], ma, se si considerano anche i dialetti, si arriva facilmente alla decina.
La generazione delle vocali avviene nel modo seguente.
Il tratto vocale, che va dalle corde fino alle labbra, costituisce una vera e propria cassa armonica che filtra il suono prodotto dalle corde generando fino a 5 formanti, con le stesse modalità che abbiamo visto nel capitolo dedicato al timbro.
La particolarità della voce risiede nel fatto che, in questo caso, la forma della cassa armonica può essere cambiata per generare tutte le vocali. Ogni suono vocalizzato ha una propria caratteristica configurazione di formanti e quello che cambia da una vocale all'altra è solo questa configurazione.
Questa tabella riporta la posizione dei primi 3 formanti (F1, F2, F3) per alcune vocali della lingua inglese parlata nell'uomo, la donna e il bambino.

	Formant	heed	head	had	hod	haw'd	who'd
Men	F1	270	530	660	730	570	300
	F2	2290	1840	1720	1090	840	870
	F3	3010	2480	2410	2440	2410	2240
Women	F1	310	610	860	850	590	370
	F2	2790	2330	2050	1220	920	950
	F3	3310	2990	2850	2810	2710	2670
Children	F1	370	690	1010	1030	680	430
	F2	3200	2610	2320	1370	1060	1170
	F3	3730	3570	3320	3170	3180	3260

Qui, invece, trovate anche i grafici dei formanti di un parlatore canadese maschio.
Come vedete confrontando i grafici con questa tabella, fra vari parlatori della stessa lingua, possono esistere differenze nella posizione dei formanti che, però, almeno per i primi tre, sono minime. I primi tre formanti, infatti, sono quelli che assicurano la compensibilità della vocale, mentre i successivi hanno solo un effetto di colore.
In questa pagina, invece, potete trovare i formanti delle vocali cantate per vari tipi di voce, ognuno con relativa ampiezza e estensione di banda.

Ora passiamo ad alcuni esempi sonori relativi alla vocale /a/ cantata da voci maschili. In questo esempio sentite il suono prima dell'applicazione dei formanti e dopo. Notate che prima non assomiglia affatto a una /a/:

In questo secondo esempio sentite 4 coppie di suoni, tutte prima e dopo i formanti. Sentite come, nonostante il suono originale cambi, applicando i formanti si ottiene sempre una 'a', sia pure con un colore diverso

Il linguaggio parlato

Il nostro apparato percettivo è particolarmente specializzato nella comprensione del parlato. Centinaia di migliaia di anni di evoluzione hanno costruito un sistema in grado di estrarre il significato da una serie di segnali anche se sono stati sottoposti a deformazioni estreme.
Notate che buona parte di queste manipolazioni sono elettroniche, quindi i risultati sono molto lontani da qualsiasi sonorità naturale che potrebbe essere conosciuta dal nostro sistema percettivo. Si tratta di esperienze acustiche nuove che, nonostante questo, non mettono in crisi il sistema.

Gli esempi si basano sulla voce di Dylan Thomas che recita il primo verso di una sua poesia:

DYLAN THOMAS ORIGINALE

Tutte le frequenze delle componenti sono state spostate verso l'alto di 50 Hz. In tal modo il suono da armonico diventa inarmonico. Nonostante questo, il testo rimane comprensibile:

E' stato estratto l'inviluppo del segnale e le frequenze delle componenti sono state espanse verso l'alto in modo proporzionale all'ampiezza del suono. La voce ha assunto un andamento innaturale:

Filtraggio altamente selettivo su 100 Hz e armonici. In pratica sono state cancellate tutte le parziali lontane dagli armonici di 100 Hz. La voce diventa fissa sulla stessa altezza:

Spostamento totale delle componenti su una griglia di note predefinita, basata sul modo maggiore (sin) e sul minore armonico (dx):

Queste esperienze sono un'ulteriore prova della raffinatezza del sistema percettivo umano.