Dopo esserci occupati degli strumenti, dedichiamo questo approfondimento
alla voce, unico strumento in cui non si ricorre a qualcosa di esterno e di
grande interesse perché riunisce sia l'aspetto musicale che quello della
comunicazione linguistica.
Di solito non ci si pensa, ma il linguaggio ha una particolarità unica: è
una forma di comunicazione completamente basata sul timbro. Infatti, sebbene
di solito nel parlato ci sia anche una modulazione dell'altezza, essa può
essere totalmente eliminata senza compromettere la comprensione.
Inoltre, come mostreremo, il nostro sistema percettivo è talmente
specializzato nella decodifica del parlato che quest'ultimo può essere
assogettato a manipolazioni che distruggerebbero il senso di qualsiasi altra
forma di comunicazione, pur rimanendo intelleggibile.
Infine, l'apparato vocale è l'unico caso di cassa armonica di forma
variabile che conosciamo.
Le corde vocali
Senza entrare in particolari fisiologici, le corde vocali sono due lamelle
che vengono messe in vibrazione dal passaggio dell'aria. Non essendo
particolarmente morbide, la loro vibrazione è di tipo impulsivo. Producono,
cioè, una serie di 'toc' molto ravvicinati seguiti da un spazio vuoto.
Tale spazio viene poi riempito dalla risonanza del tratto vocale. In figura
potete vedere le onde relative a una voce maschile (sopra) e femminile
(sotto) che dicono la vocale aaaa.
Come si vede, le due onde sono simili, a parte l'ovvia differenza in
frequenza della voce femminile, più alta.
In entrambi i casi,
infatti, si vede l'impulso iniziale seguito dalla risonanza che, in pratica,
è una piccola serie di echi generati dal tratto vocale che agisce come cassa
armonica.
Ciò significa che, nei suoni tenuti, le corde vocali, da sole, non sono in
grado di produrre timbri diversi, ma solo altezze diverse.
Il loro timbro è praticamente sempre identico per ciascun individuo e in
generale corrisponde a quello di un'onda impulsiva il cui spettro tende alla
lunga serie di armonici visibile nella figura qui sotto.
Questo, in linea di massima, è lo spettro che avrebbero le corde vocali
private del tratto di risonanza.
Bisogna ricordare, poi, che non sempre le corde vocali entrano in azione. La
maggior parte delle consonanti è prodotta mediante rumori generati dal
passaggio dell'aria in un tratto vocale opportunamente configurato dalla
posizione della mandibola, della lingua e delle labbra.
In questa sede ci occuperemo principalmente delle vocali, sia perché sono
più interessanti didatticamente dal punto di vista timbrico, sia perché sono
quelle su cui articola il canto classico.
I suoni vocalizzati
Intanto bisogna ricordare che le vocali sono ben più di 5. Nelle varie forme
aperte, chiuse, mezze-aperte, mezze-chiuse, la lingua inglese ne conta da 10
a 14 che potete trovare qui.
L'italiano ha un doppio accento - grave e acuto - solo sulla [e] e sulla
[o], ma, se si considerano anche i dialetti, si arriva facilmente alla
decina.
La generazione delle vocali avviene nel modo seguente.
Il tratto vocale, che va dalle corde fino alle labbra, costituisce una vera
e propria cassa armonica che filtra il suono prodotto dalle corde generando
fino a 5 formanti, con le stesse modalità che abbiamo visto nel capitolo
dedicato al timbro.
La particolarità della voce risiede nel fatto che, in questo caso, la forma
della cassa armonica può essere cambiata per generare tutte le vocali. Ogni
suono vocalizzato ha una propria caratteristica configurazione di formanti e
quello che cambia da una vocale all'altra è solo questa configurazione.
Questa tabella riporta la posizione dei primi 3 formanti (F1, F2, F3) per
alcune vocali della lingua inglese parlata nell'uomo, la donna e il bambino.
Formant
heed
head
had
hod
haw'd
who'd
Men
F1
270
530
660
730
570
300
F2
2290
1840
1720
1090
840
870
F3
3010
2480
2410
2440
2410
2240
Women
F1
310
610
860
850
590
370
F2
2790
2330
2050
1220
920
950
F3
3310
2990
2850
2810
2710
2670
Children
F1
370
690
1010
1030
680
430
F2
3200
2610
2320
1370
1060
1170
F3
3730
3570
3320
3170
3180
3260
Qui, invece, trovate anche i grafici dei formanti
di un parlatore canadese maschio.
Come vedete confrontando i grafici con questa tabella, fra vari parlatori
della stessa lingua, possono esistere differenze nella posizione dei
formanti che, però, almeno per i primi tre, sono minime. I primi tre
formanti, infatti, sono quelli che assicurano la compensibilità della
vocale, mentre i successivi hanno solo un effetto di colore.
In questa pagina, invece, potete trovare i
formanti delle vocali cantate per vari tipi di voce, ognuno con relativa
ampiezza e estensione di banda.
Ora passiamo ad alcuni esempi sonori relativi alla vocale /a/ cantata da
voci maschili. In questo esempio sentite il suono prima dell'applicazione
dei formanti e dopo. Notate che prima non assomiglia affatto a una /a/:
In questo secondo esempio sentite 4 coppie di suoni, tutte prima e dopo i
formanti. Sentite come, nonostante il suono originale cambi, applicando i
formanti si ottiene sempre una 'a', sia pure con un colore diverso
Il linguaggio parlato
Il nostro apparato percettivo è particolarmente specializzato nella
comprensione del parlato. Centinaia di migliaia di anni di evoluzione hanno
costruito un sistema in grado di estrarre il significato da una serie di
segnali anche se sono stati sottoposti a deformazioni estreme.
Notate che buona parte di queste manipolazioni sono elettroniche, quindi i
risultati sono molto lontani da qualsiasi sonorità naturale che
potrebbe essere conosciuta dal nostro sistema percettivo. Si tratta di
esperienze acustiche nuove che, nonostante questo, non mettono in crisi il
sistema.
Gli esempi si basano sulla voce di Dylan Thomas che recita il primo verso di
una sua poesia:
DYLAN THOMAS ORIGINALE
Tutte le frequenze delle componenti sono state
spostate verso l'alto di 50 Hz. In tal modo il suono da armonico
diventa inarmonico. Nonostante questo, il testo rimane
comprensibile:
E' stato estratto l'inviluppo del segnale e le
frequenze delle componenti sono state espanse verso l'alto in modo
proporzionale all'ampiezza del suono. La voce ha assunto un
andamento innaturale:
Filtraggio altamente selettivo su 100 Hz e
armonici. In pratica sono state cancellate tutte le parziali
lontane dagli armonici di 100 Hz. La voce diventa fissa sulla
stessa altezza:
Spostamento totale delle componenti su una griglia
di note predefinita, basata sul modo maggiore (sin) e sul minore
armonico (dx):
Queste esperienze sono un'ulteriore prova della raffinatezza del sistema
percettivo umano.