il che significa che il timbro, pur essendo considerato una proprietà del
suono come l'altezza e la dinamica, non può essere espresso con un singolo
numero in una qualche unità di misura. Non possiamo dire che il timbro di un
suono è 25 qualcosa o 1100 qualcos'altro. Come vedremo, misurare il timbro
significa prendere in considerazione una certa quantità di parametri.
La teoria classica: gli armonici
Alla metà dell'800 Helmholtz dimostrò in modo scientifico l'esistenza degli
armonici, cosa che era già nota intuitivamente fin dai tempi di Rameau,
formalizzando quella che è nota come la teoria classica del timbro.
Secondo questa teoria, il timbro di un suono è determinato dai suoi
armonici. Ma cos'è un armonico?
Ogni onda può essere scomposta in una serie di onde semplici e prive di
armonici, dette sinusoidi (in figura), ognuna delle quali ha una certa
frequenza, una certa ampiezza e una certa fase (ma quest'ultima ci interessa
meno delle altre due).
Consideriamo questo suono prodotto elettronicamente e la sua forma d'onda:
Con un procedimento matematico messo a punto nel '700 da Fourier e chiamato,
appunto, trasformata di Fourier, possiamo scomporre quest'onda in una serie
di sinusoidi (fortunatamente, al giorno d'oggi i calcoli vengono eseguiti
dal computer con un algoritmo chiamato FFT (Fast Fourier Transform)).
Quello che vedete sotto è il risultato della scomposizione e la sua
rappresentazione.
Quello che stiamo guardando è lo spettro del suono in esame.
Sull'asse orizzontale troviamo le frequenze, su quello verticale le loro
ampiezze.
Nell'immagine, ogni componente è piazzata al suo posto sull'asse orizzontale
delle frequenze e la sua ampiezza è rappresentata da una linea verticale
proporzionale al valore di ampiezza. I valori numerici di frequenza e
ampiezza sono in alto a destra.
Vediamo che questo suono può essere visto come una sovrapposizione di 8
sinusoidi la cui frequenza in Hz è il primo dei due numeri, mentre il
secondo rappresenta l'ampiezza che qui non è in dB, ma in una scala in cui
il valore 1.0000 rappresenta convenzionalmente la massima ampiezza possibile
(non prendiamo in considerazione le sinusoidi con ampiezza 0.0000 o molto
vicina: sono solo valori parassitari dovuti ai calcoli. In effetti,
qualsiasi analisi deve essere interpretata e confrontata con l'ascolto).
Ma allora, se il suono che abbiamo sentito è formato da queste 8
sinusoidi, sovrapponendole dovremmo ottenere il suono di partenza?
Naturalmente. In questo esempio potete ascoltare le 8 sinusoidi prima in
scala ascendente, poi in forma di arpeggio e infine perfettamente
sovrapposte a formare il suono che abbiamo analizzato:
A questo punto punto possiamo affermare che
ogni suono può essere scomposto in una serie di sinusoidi con
relative frequenze e ampiezze
e a partire da queste ultime può essere anche ricomposto.
Ma queste sinusoidi sono gli armonici? La risposta è non sempre. In questo
caso specifico, sì. Se osserviamo la serie delle frequenze notiamo che
la più bassa, che in questo caso è la fondamentale, è 220 Hz, cioè un
LA
la frequenza delle altre sinusoidi è sempre un multiplo della
fondamentale (o quasi). 440=220*2; 660=220*3; 880=220*4; 1099 quasi = a
220*5 (sarebbe 1100); 1319 quasi = a 220*6 (sarebbe 1320).
Per questa ragione (frequenze multiple di quella della fondamentale) in
questo caso le sinusoidi sono armonici. In realtà, la cosa deve essere
generalizzata come segue
ogni sinusoide in cui un suono è scomposto viene chiamata
parziale (o componente)
se la frequenza di una parziale è multipla di quella della
fondamentale, essa è una armonica
Ne consegue che una parziale può essere o non essere una armonica, quindi
esistono anche dei suoni le cui parziali non sono armoniche. Sono quelli che
la teoria classica chiamava "rumori" o "suoni non musicali", ma che oggi
sono soltanto suoni. Ascoltate questo suono, vagamente simile a una campana,
di cui potete vedere la forma d'onda in figura:
Ascoltandolo, vi serete accorti che non suona
come una nota precisa, ma come una specie di accordo. Notate che la forma
d'onda qui sopra non è periodica. Ora vediamo l'analisi
Qui la situazione è più complessa. La
componente più bassa (200 Hz) potrebbe essere una fondamentale, ma nessuna
delle altre è un multiplo di 200 (non ci vanno nemmeno vicino). Infatti,
questo suono non ha componenti armoniche, ovvero ha parziali inarmoniche.
La cosa è evidente anche confrontando i due grafici: nel primo le parziali
hanno sempre la stessa distanza orizzontale, segno che fra loro c'è sempre
la stessa distanza in frequenza; nel secondo no.
Qui potete sentire le componenti di questo suono in forma di scala,
arpeggio e insieme. Notate come il grado di fusione delle parziali in un
unico suono non sia così forte come del caso degli armonici:
Ora confrontate i due suoni che abbiamo analizzato
Suono
Onda
Parziali
Percezione
Periodica
Armoniche
Nota precisa (LA)
Non periodica
Inarmoniche
No nota precisa
Con una certa cautela, possiamo arrivare alle seguenti conclusioni basate
sulla forma d'onda
se un'onda è chiaramente periodica, quasi certamente ha
parziali armoniche
se un'onda non è periodica, quasi certamente ha delle
parziali inarmoniche
Perché, in entrambi i casi, non possiamo dare una certezza? Perché in natura
esistono sempre dei casi particolari. Per esempio, molti strumenti che
suonano all'unisono non sono intonati perfettamente sullo stesso numero di
Hertz (non è umano). Si crea quindi quel complesso gioco di battimenti che è
tipico di questa situazione. L'onda potrebbe avere una periodicità molto
difficile da individuare, tuttavia, all'ascolto, sentiremo una nota precisa.
Una situazione analoga si ha quando il suono ha un forte componente di
rumore, come può essere in certi strumenti a fiato, oppure è formato da più
suoni leggermente stonati, come nel pianoforte.
Inoltre, non basta esaminare la forma d'onda in un punto, ma bisogna
guardarla per tutto il corso della nota. Ora vedremo dei casi reali, ma,
innanzitutto, ascoltiamo questa serie degli armonici (fino al 16mo) e
vediamo a quali note corrispondono (ATTENZIONE: il DO iniziale è troppo
basso per molti altoparlanti da computer e essendo una sinusoide priva di
armonici, rischiate di non sentirlo):
Ascoltate ora questo esempio in cui gli armonici arrivano uno dopo
l'altro sommandosi (fondendosi) insieme:
Analisi di suoni reali
Subito un caso complesso. SIb di pianoforte. Notate l'alto numero di
parziali armoniche, sia pure con qualche piccola deviazione (la fondamentale
è 232.8). Notate anche che la parziale che ha maggior ampiezza è la seconda,
all'8va sopra la fondamentale. Non è un caso particolare. Accade spesso e
dipende dalla cassa di risonanza o dalla risonanza del corpo dello strumento
(ne parliamo più avanti).
Guardate sempre il numero in basso a destra, sotto l'asse orizzontale come
riferimento per l'estensione dello spettro:
SIb - PIANOFORTE
SOL basso - VIOLONCELLO
SOL - TROMBA:
qui la terza parziale ha l'ampiezza maggiore
E ora qualche suono con parziali inarmoniche:
GONG
TAM-TAM
grande gong non intonato
PIATTO di batteria
Notate come, in questi ultimi due casi che si avvicinano molto al rumore
indifferenziato (soprattutto il piatto), non abbia più senso parlare di
parziali, ma solo di bande di rumore più o meno estese. Nel caso del piatto
c'è una banda intorno ai 6000 Hz e un'altra fra i 12000 e 20000 Hz.
Ora guardate un rumore quasi totalmente indifferenziato come quello prodotto
da una fontana:
Come vedete, non si vedono parziali, ma solo una banda continua la cui
ampiezza diminuisce verso gli acuti
I limiti della teoria classica
Secondo la teoria classica, il timbro di un suono è determinato unicamente
dalla forma d'onda e dalle sue parziali (armoniche o inarmoniche). Se fosse
vero, sarebbe molto facile ricreare in studio un suono reale. Basterebbe
riprodurre la forma d'onda con il suo contenuto armonico.
Abbiamo già visto due casi (i primi due esempi) in cui questo procedimento
ha funzionato, ma, in realtà non funziona quasi mai. Ecco una prova:
considerate questa nota di pianoforte, di cui vedete lo spettro:
Ora riproduciamo la forma d'onda inserendo le parziali armoniche trovate con
l'analisi, ognuna con la sua ampiezza, e diamo al suono un inviluppo simile
a quello del pianoforte. Ne esce questo:
Un suono un po' simile, ma decisamente non uguale. Quindi la teoria non
funziona. Cosa manca?
Il primo problema sta nel fatto che i suoni reali non sono fissi. Nella
realtà l'ampiezza delle parziali non rimane fissa, ma cambia. Nelle fasi di
attacco e rilascio cambia notevolmente, ma anche nella fase di tenuta, in
cui il suono sembra fisso, ci sono dei leggeri cambiamenti. Il pianoforte,
poi, è uno strumento a evoluzione libera, privo di una fase di tenuta,
quindi l'ampiezza delle parziali cambia sempre.
Il suono è
una cosa viva e si evolve nel tempo.
In tutte le analisi che abbiamo visto, invece, la componente temporale non
c'è mai. Si tratta di analisi istantanee che fotografano il suono in un
particolare istante (un po' come una vostra foto a 5 anni: siete voi, ma non
voi adesso).
Guardate, invece, questo tipo di analisi. Qui abbiamo le frequenze sull'asse
verticale e il tempo su quello orizzontale. Le parziali sono le linee
colorate e la loro ampiezza è rappresenta con il colore (colore scuro =
ampiezza elevata). Qui perdiamo un po' di definizione in ampiezza per vedere
l'evoluzione temporale. Questo tipo di grafico è chiamato sonogramma.
Si vede benissimo che le parziali non hanno tutte la stessa durata. Quelle
più acute finiscono prima. Si tratta di una caratteristica comune a tutti i
mezzi vibranti che riescono a sostenere più facilmente le vibrazioni basse e
lente rispetto a quelle acute e veloci.
Il segno in basso vicino a 0.0 con frequenza bassa e durata breve è il
rumore del martelletto.
Ora guardiamo un altro bel grafico in cui il suono è rappresentato come un
paesaggio montagnoso.
Qui abbiamo frequenza e tempo sui due assi, mentre le ampiezze si elevano in
verticale. Si tratta di uno spettrogramma in cui possiamo vedere l'inviluppo
di ogni singola parziale. Da qui vediamo, per es., che la durata delle tre
armoniche più alte è molto breve rispetto alle altre. La collina vicina
all'angolo degli assi è il rumore del martelletto. Ovviamente nulla di tutto
ciò sarebbe mai stato possibile senza la potenza di calcolo dei computer
attuali.
Questo programma può anche salvare i dati per risintetizzare tutte le
componenti e riprodurle.
In questo esempio, quindi, possiamo ascoltare le parziali della nota di
pianoforte senza il rumore dell'attacco (che non è riproducibile mediante
somma di parziali):
In quest'altro esempio abbiamo anche aggiunto il rumore del martelletto
(generato con altri sistemi) e il suono è praticamente identico
all'originale:
Disponendo di questo tipo di analisi, è utile anche osservare lo
spettrogramma della tromba in cui si vede come, anche nella fase di tenuta,
le parziali non hanno mai una ampiezza veramente fissa, a causa del fatto
che l'esecutore non è una macchina e la sua azione ha sempre delle piccole
variazioni.
In conclusione, possiamo affermare che la teoria classica deve essere estesa
e che nella creazione del timbro giocano un ruolo importante i seguenti
parametri:
le parziali presenti
la loro evoluzione nel tempo
il tipo di attacco
eventuali altre sonorità significative
(rumore di attacco, soffio, etc)
Evoluzione
temporale del suono: analisi nel tempo
Per
esemplificare l'importanza dell'evoluzione temporale, ora esamineremo i
suoni già visti sopra mediante sonogramma per osservare la variazione
dello spettro nel tempo. Il link ai suoni non è riportato essendo lo
stesso degli esempi di cui sopra. La
differenza è che finora abbiamo visto una sola "foto" per ogni suono presa
in un punto significativo. Ma i suoni evolvono nel tempo, quindi qui
utilizzeremo dei sonogrammi, cioè delle immagini che hanno
il tempo in ascissa (asse x)
la frequenza espressa in Hz in ordinata (asse y)
In
tal modo ogni componente diventa una linea orizzontale in cui l'ampiezza è
espressa con un colore. In genere, tanto più il colore è contrastato
rispetto allo sfondo, tanto più alta è l'ampiezza (es: sfondo bianco, max
amp nero o viceversa), mentre colori vicini allo sfondo sono indicatori di
bassa ampiezza. In
questi esempi lo sfondo è bianco, quindi la scala delle ampiezze, dal
basso verso l'alto è:
Guardando
i sonogrammi, inoltre, è necessario porre attenzione al valore massimo
dell'asse x, che indica la durata, ma soprattutto al valore massimo
dell'asse y che indica l'estensione della banda a cui arrivano le
componenti del suono.
Ogni
sonogramma racconta una storia che in qualche caso diventa un romanzo.
Bisogna saper leggere i sonogrammi come carta stampata.
Sib di pianoforte
Notate:
il rumore della percussione (martelletto) che si vede come banda rossa
nel primo decimo di secondo. È un rumore indifferenziato che si estende
ad alto volume fino a circa 7000 Hz, ma arriva anche più in alto.
la grande quantità di armonici nella prima parte del suono.
All'istante dell'attacco si arriva fino a circa 15000 Hz (qualcuno
isolato anche oltre)
la rapida scomparsa delle componenti alte: la maggior parte è già
sparita entro il primo secondo di suono. La loro durata decresce in
funzione dell'altezza seguendo una curva esponenziale decrescente.Questo comportamento è tipico dei suoni a
evoluzione libera(pizzicati, percussivi).
le componenti che vanno e vengono (linee interrotte), indice di
battimenti
il blob rosso finale sui bassi è lo smorzatore.
Sol basso di violoncello
Anche
qui molti armonici, ma la maggior parte è piuttosto debole. Solo quelli
in rosso hanno una ampiezza chiaramente sensibile, ma tutti gli altri,
sebbene singolarmente non siano così evidenti, nel loro insieme danno
corpo al suono. Le
macchie in alta frequenza sono interpretabili (a posteriori) come il
rumore dell'arco che è proprio uno sfregamento a frequenze alte. Notate
che, al momento dell'attacco, gli armonici arrivano quasi tutti insieme
(con un beve ritardo), poi rimangono in buona parte stabili per tutta la
durata del suono e scompaiono in breve tempo (a cominciare dalle
componenti alte) alla fine.Questo
comportamento è tipico dei suoni a evoluzione controllata(archi,
fiati). In questo caso il decadimento è lungo (quasi 1/2 secondo) e
dipende dal fatto che la corda riesce ancora a vibrare se l'arco viene
tolto di colpo.
In
entrambi questi esempi abbiamo visto molti armonici. Ciò dipende dal
fatto che, in entrambi i casi, abbiamo analizzato note basse generate da
corde grosse. In genere, i suoni bassi hanno una maggiore quantità di
armonici, per varie ragioni:
le strutture vibranti più massicce possono vibrare in modo più
complesso rispetto a quelle sottili
normalmente, le strutture vibranti che emettono suoni bassi vengono
trattate con maggiore violenza, sia perché sono più massicce, ma
soprattutto per compensare l'effetto Fletcher (vedi Dinamica: curve di
Fletcher) per cui occorre una ampiezza assoluta notevolmente maggiore
per produrre suoni percepiti allo stesso volume di quelli nella banda
500 - 2000 Hz
gli armonici di fondamentali alte escono molto prima dalla banda
udibile: una fondamentale a 100 Hz ha il 200mo armonico a 20000 Hz,
mentre se la fondamentale è a 2000 Hz, già il 10mo armonico è a 20000
Hz.
Sol di tromba
Due
grafici per la tromba: a sin. l'inviluppo, a des. il sonogramma. Notate
come l'attacco insfz,
tipico degli ottoni e ben visibile nell'inviluppo (occorre superare una
certa soglia perché scatti la vibrazione) si rifletta nel sonogramma con
componenti che all'inizio risultano più forti e meno precise (un po' più
sporche). Notate
anche come esista un leggero glissando al momento dell'attacco, più
visibile nelle frequenze alte. In realtà l'entità del glissando è
uguale, in percentuale, su tutte le componenti, ma, essendo l'asse Y
lineare e non logaritmica, si vede di più sugli alti (se è dell'1%, a
300 Hz è 3 e a 3000 Hz è 30). Infine,
il giallo diffuso, è il rumore del soffio.
Gong
Un
suono inarmonico, come si vede bene nell'ingrandimento a des. (la
distanza fra le componenti è variabile). Per
il resto, il quadro è quello tipico dei suoni a evoluzione libera:
percussione iniziale con parecchie componenti che scompaiono rapidamente
seguendo un pronunciato andamento esponenziale.
Tamtam
Molte
componenti che vanno a riempire dapprima lo spazio sui bassi e poi si
estendono verso l'alto (il tamtam è grande e impiega tempo, circa 1
sec., a entrare in vibrazione nella sua interezza). Ci avviciniamo al
rumore indistinto a banda limitata, ma esistono alcune componenti molto
pronunciate (soprattutto quella più bassa che agisce come
pseudo-fondamentale). Il
decadimento rispetta sempre la legge secondo cui gli alti se vanno
prima, ma in modo meno regolare, a causa delle grandi dimensioni e della
diversa densità e spessore del materiale che lo compone.
Piatto
Siamo
al rumore indistinto. La differenziazione fra le singole componenti si
perde in favore di 2 bande: la prima arriva fino a circa 11000 Hz con
centro intorno ai 6000/8000, la seconda fra 12000 e quasi 20000 Hz.
Alcune componenti della prima banda rimangono come rumore residuo (molto
debole) quando il piatto è stoppato.
Fontana
Infine,
la fontana: rumore statico, indifferenziato, con maggior peso sulle
frequenze basse. Notate la differenza qualitativa con l'esempio
precedente:qui
non c'è il minimo accenno a delle righeche
possano suggerire delle componenti.
La teoria formantica: lo strumento
In uno strumento musicale esistono sempre
un elemento vibrante (quello che genera la vibrazione; è chiamato
eccitatore)
un elemento risonante (che entra in vibrazione a causa della
presenza del primo; è detto risuonatore)
L'esempio tipico è corda e cassa armonica, ma l'idea su può estendere anche
a colonna d'aria e corpo dello strumento. Questi due elementi formano il
suono che sentiamo interagendo fra loro. Qual'è esattamente il loro ruolo?
Osservate questa analisi di un suono di chitarra effettuata nel punto
segnato in azzurro, cioè poco dopo l'attacco
Ora, noi sappiamo che una corda vibrante, da
sola, produce la fondamentale seguita da una serie di armonici con
ampiezza calante. Allora ci si può chiedere perché qui la seconda e la
terza parziale sono entrambe più forti della fondamentale? E perché anche
le parziali seguenti non hanno ampiezza regolarmente discendenti?
Tecnicamente, si dice che questo spettro mostra delle formanti.
formante = concentrazione di energia acustica in una
certa banda frequenziale
Ne consegue che le parziali che si trovano entro quella banda hanno una
ampiezza maggiore del normale. In figura vedete i formanti in questo spettro
di chitarra.
Qui, le formanti sono causate dalla cassa armonica, essenzialmente per due
ragioni.
La prima (e principale) è che il materiale di cui è composta ha delle
frequenze di risonanza, cioè vibra meglio in certe zone di frequenza
rispetto ad altre e il risultato è che le frequenze che si trovano in
queste zone vengono rinforzate, mentre quelle che si trovano al di fuori
vengono attenuate.
La seconda è che, nello spazio all'interno della cassa, le onde sonore
prodotte dalla corda continuano a rimbalzare e si sommano alle onde
principali con un piccolo ritardo sufficiente, però, a mettere certe
frequenze in fase e altre in controfase (ricordate la prima figura
sui battimenti), ancora con l'effetto di rinforzarne alcune e attenuarne
altre. Proprio per questa ragione non si costruiscono casse armoniche
rettangolari, che sarebbero molto più facili da fare. L'effetto di una forma
così regolare sarebbe quello di creare una serie di rimbalzi regolari e
quindi di amplificare troppo le frequenze il cui periodo è pari o multiplo
al tempo di rimbalzo.
In pratica, la cassa armonica amplifica certamente il suono, ma non agisce
nello stesso modo su tutte le frequenze. Alcune sono amplificate
maggiormente, altre vengono attenuate. In pratica
la cassa armonica è un filtro che con la sua azione crea le
formanti
che non devono essere viste come una cosa negativa perché caratterizzano
timbricamente il suono di tutto lo strumento.
Quello che accade, in sintesi, è schematizzato in figura. La corda fornisce
un segnale con armoniche di ampiezza calante. Questo segnale viene
rimodellato in base alle frequenze di risonanza della cassa armonica che
agisce da filtro. Il segnale risultante è il prodotto dell'interazione di
questi due elementi.
Questo fenomeno ha un importante effetto collaterale. La cassa armonica è
fissa. Non cambia da una nota all'altra e nello stesso modo, sono fisse le
sue frequenze di risonanza. Quindi anche le formanti che essa crea sono
sempre negli stessi punti, qualsiasi nota si faccia. Ora, osservate questi
due spettri di violoncello relativi a due note a distanza di 8va.
Se osservate lo spettro del DO in 8va, il secondo, noterete che nell'area
del primo formante cadono la prima e la seconda parziale (fondamentale e
primo armonico). In questa nota la fondamentale è la componente più forte.
Se ora guardate il DO più basso (il primo), noterete che, essendo una 8va
sotto e essendo il formante fisso, a cadere nella sua area qui sono la
seconda e la terza parziale. Di conseguenza, qui non è la fondamentale, ma
la terza parziale a essere la componente più forte. Il che significa che, in
un singolo strumento, il timbro cambia, sia pure gradualmente, da una nota
all'altra.
La cosa non si verifica solo negli strumenti con cassa armonica. Qui
potete vedere alcune analisi di note di tromba e constatare come cambia lo
spettro su varie note.
Non esistendo una cassa armonica, i formanti della tromba sono meno
complessi di quelli degli strumenti con cassa, ma esistono e sono dovuti
alla risonanza della campana e del corpo dello strumento.
Probabilmente è proprio questo cambiamento timbrico provocato dai formanti
ad aver generato la nozione di "registro". Si dice, infatti che lo strumento
entra in un altro registro quando il cambiamento timbrico diventa
avvertibile. Qui trovate i grafici delle formanti di
vari strumenti basati su analisi dell'Università di Stanford.
Il principale strumento che si basa sulle formanti resta comunque la voce.
La differenza fra le vocali, infatti, è legata unicamente alla posizione
delle formanti che viene modificata dalle diverse posizioni che può assumere
il tratto vocale (i dettagli vanno oltre il programma di Storia della
Musica, ma gli studenti curiosi possono trovarli in una delle lezioni
successive).
Sulle scoperte relative alle formanti si basa la teoria formantica del
timbro secondo la quale il nostro sistema percettivo riesce a riconoscere la
posizione delle formanti e proprio in base a queste ultime è in grado di
identificare lo strumento anche se in realtà lo spettro cambia di nota in
nota.
Parlando della banda critica, abbiamo visto come la chiocciola sia come un
analizzatore basato appunto sull'ampiezza di banda critica (circa 1/3 di
8va). L'intero campo udibile può essere diviso in 25 bande, per la maggior
parte a terzi di 8va, e quindi il sistema percettivo è in grado di misurare
l'energia acustica presente in ogni banda. In questo modo le formanti
possono essere identificate facilmente.
Si può quindi affermare che anche
la posizione delle formanti gioca un ruolo importante nel
riconoscimento del timbro