Acustica 06

Il Timbro

Un fenomeno multidimensionale

Il timbro è un fenomeno multidimensionale

il che significa che il timbro, pur essendo considerato una proprietà del suono come l'altezza e la dinamica, non può essere espresso con un singolo numero in una qualche unità di misura. Non possiamo dire che il timbro di un suono è 25 qualcosa o 1100 qualcos'altro. Come vedremo, misurare il timbro significa prendere in considerazione una certa quantità di parametri.

La teoria classica: gli armonici

Alla metà dell'800 Helmholtz dimostrò in modo scientifico l'esistenza degli armonici, cosa che era già nota intuitivamente fin dai tempi di Rameau, formalizzando quella che è nota come la teoria classica del timbro.
Secondo questa teoria, il timbro di un suono è determinato dai suoi armonici. Ma cos'è un armonico?
Ogni onda può essere scomposta in una serie di onde semplici e prive di armonici, dette sinusoidi (in figura), ognuna delle quali ha una certa frequenza, una certa ampiezza e una certa fase (ma quest'ultima ci interessa meno delle altre due).

Consideriamo questo suono prodotto elettronicamente e la sua forma d'onda:

Con un procedimento matematico messo a punto nel '700 da Fourier e chiamato, appunto, trasformata di Fourier, possiamo scomporre quest'onda in una serie di sinusoidi (fortunatamente, al giorno d'oggi i calcoli vengono eseguiti dal computer con un algoritmo chiamato FFT (Fast Fourier Transform)).
Quello che vedete sotto è il risultato della scomposizione e la sua rappresentazione.
Quello che stiamo guardando è lo spettro del suono in esame. Sull'asse orizzontale troviamo le frequenze, su quello verticale le loro ampiezze.
Nell'immagine, ogni componente è piazzata al suo posto sull'asse orizzontale delle frequenze e la sua ampiezza è rappresentata da una linea verticale proporzionale al valore di ampiezza. I valori numerici di frequenza e ampiezza sono in alto a destra.
Vediamo che questo suono può essere visto come una sovrapposizione di 8 sinusoidi la cui frequenza in Hz è il primo dei due numeri, mentre il secondo rappresenta l'ampiezza che qui non è in dB, ma in una scala in cui il valore 1.0000 rappresenta convenzionalmente la massima ampiezza possibile (non prendiamo in considerazione le sinusoidi con ampiezza 0.0000 o molto vicina: sono solo valori parassitari dovuti ai calcoli. In effetti, qualsiasi analisi deve essere interpretata e confrontata con l'ascolto).

Ma allora, se il suono che abbiamo sentito è formato da queste 8 sinusoidi, sovrapponendole dovremmo ottenere il suono di partenza? Naturalmente. In questo esempio potete ascoltare le 8 sinusoidi prima in scala ascendente, poi in forma di arpeggio e infine perfettamente sovrapposte a formare il suono che abbiamo analizzato:

A questo punto punto possiamo affermare che

ogni suono può essere scomposto in una serie di sinusoidi con relative frequenze e ampiezze

e a partire da queste ultime può essere anche ricomposto.
Ma queste sinusoidi sono gli armonici? La risposta è non sempre. In questo caso specifico, sì. Se osserviamo la serie delle frequenze notiamo che

la più bassa, che in questo caso è la fondamentale, è 220 Hz, cioè un LA
la frequenza delle altre sinusoidi è sempre un multiplo della fondamentale (o quasi). 440=220*2; 660=220*3; 880=220*4; 1099 quasi = a 220*5 (sarebbe 1100); 1319 quasi = a 220*6 (sarebbe 1320).

Per questa ragione (frequenze multiple di quella della fondamentale) in questo caso le sinusoidi sono armonici. In realtà, la cosa deve essere generalizzata come segue

ogni sinusoide in cui un suono è scomposto viene chiamata parziale (o componente)

se la frequenza di una parziale è multipla di quella della fondamentale, essa è una armonica

Ne consegue che una parziale può essere o non essere una armonica, quindi esistono anche dei suoni le cui parziali non sono armoniche. Sono quelli che la teoria classica chiamava "rumori" o "suoni non musicali", ma che oggi sono soltanto suoni. Ascoltate questo suono, vagamente simile a una campana, di cui potete vedere la forma d'onda in figura:

Ascoltandolo, vi serete accorti che non suona come una nota precisa, ma come una specie di accordo. Notate che la forma d'onda qui sopra non è periodica. Ora vediamo l'analisi

Qui la situazione è più complessa. La componente più bassa (200 Hz) potrebbe essere una fondamentale, ma nessuna delle altre è un multiplo di 200 (non ci vanno nemmeno vicino). Infatti, questo suono non ha componenti armoniche, ovvero ha parziali inarmoniche. La cosa è evidente anche confrontando i due grafici: nel primo le parziali hanno sempre la stessa distanza orizzontale, segno che fra loro c'è sempre la stessa distanza in frequenza; nel secondo no.

Qui potete sentire le componenti di questo suono in forma di scala, arpeggio e insieme. Notate come il grado di fusione delle parziali in un unico suono non sia così forte come del caso degli armonici:

Ora confrontate i due suoni che abbiamo analizzato

Suono	Onda	Parziali	Percezione
	Periodica	Armoniche	Nota precisa (LA)
	Non periodica	Inarmoniche	No nota precisa

Con una certa cautela, possiamo arrivare alle seguenti conclusioni basate sulla forma d'onda

se un'onda è chiaramente periodica, quasi certamente ha parziali armoniche

se un'onda non è periodica, quasi certamente ha delle parziali inarmoniche

Perché, in entrambi i casi, non possiamo dare una certezza? Perché in natura esistono sempre dei casi particolari. Per esempio, molti strumenti che suonano all'unisono non sono intonati perfettamente sullo stesso numero di Hertz (non è umano). Si crea quindi quel complesso gioco di battimenti che è tipico di questa situazione. L'onda potrebbe avere una periodicità molto difficile da individuare, tuttavia, all'ascolto, sentiremo una nota precisa.
Una situazione analoga si ha quando il suono ha un forte componente di rumore, come può essere in certi strumenti a fiato, oppure è formato da più suoni leggermente stonati, come nel pianoforte.
Inoltre, non basta esaminare la forma d'onda in un punto, ma bisogna guardarla per tutto il corso della nota. Ora vedremo dei casi reali, ma, innanzitutto, ascoltiamo questa serie degli armonici (fino al 16mo) e vediamo a quali note corrispondono (ATTENZIONE: il DO iniziale è troppo basso per molti altoparlanti da computer e essendo una sinusoide priva di armonici, rischiate di non sentirlo):

Ascoltate ora questo esempio in cui gli armonici arrivano uno dopo l'altro sommandosi (fondendosi) insieme:

Analisi di suoni reali

Subito un caso complesso. SIb di pianoforte. Notate l'alto numero di parziali armoniche, sia pure con qualche piccola deviazione (la fondamentale è 232.8). Notate anche che la parziale che ha maggior ampiezza è la seconda, all'8va sopra la fondamentale. Non è un caso particolare. Accade spesso e dipende dalla cassa di risonanza o dalla risonanza del corpo dello strumento (ne parliamo più avanti).
Guardate sempre il numero in basso a destra, sotto l'asse orizzontale come riferimento per l'estensione dello spettro:

SIb - PIANOFORTE
SOL basso - VIOLONCELLO
SOL - TROMBA: qui la terza parziale ha l'ampiezza maggiore
E ora qualche suono con parziali inarmoniche: GONG
TAM-TAM grande gong non intonato
PIATTO di batteria

Notate come, in questi ultimi due casi che si avvicinano molto al rumore indifferenziato (soprattutto il piatto), non abbia più senso parlare di parziali, ma solo di bande di rumore più o meno estese. Nel caso del piatto c'è una banda intorno ai 6000 Hz e un'altra fra i 12000 e 20000 Hz.
Ora guardate un rumore quasi totalmente indifferenziato come quello prodotto da una fontana:

Come vedete, non si vedono parziali, ma solo una banda continua la cui ampiezza diminuisce verso gli acuti

I limiti della teoria classica

Secondo la teoria classica, il timbro di un suono è determinato unicamente dalla forma d'onda e dalle sue parziali (armoniche o inarmoniche). Se fosse vero, sarebbe molto facile ricreare in studio un suono reale. Basterebbe riprodurre la forma d'onda con il suo contenuto armonico.
Abbiamo già visto due casi (i primi due esempi) in cui questo procedimento ha funzionato, ma, in realtà non funziona quasi mai. Ecco una prova: considerate questa nota di pianoforte, di cui vedete lo spettro:

Ora riproduciamo la forma d'onda inserendo le parziali armoniche trovate con l'analisi, ognuna con la sua ampiezza, e diamo al suono un inviluppo simile a quello del pianoforte. Ne esce questo:

Un suono un po' simile, ma decisamente non uguale. Quindi la teoria non funziona. Cosa manca?
Il primo problema sta nel fatto che i suoni reali non sono fissi. Nella realtà l'ampiezza delle parziali non rimane fissa, ma cambia. Nelle fasi di attacco e rilascio cambia notevolmente, ma anche nella fase di tenuta, in cui il suono sembra fisso, ci sono dei leggeri cambiamenti. Il pianoforte, poi, è uno strumento a evoluzione libera, privo di una fase di tenuta, quindi l'ampiezza delle parziali cambia sempre.

Il suono è una cosa viva e si evolve nel tempo.

In tutte le analisi che abbiamo visto, invece, la componente temporale non c'è mai. Si tratta di analisi istantanee che fotografano il suono in un particolare istante (un po' come una vostra foto a 5 anni: siete voi, ma non voi adesso).
Guardate, invece, questo tipo di analisi. Qui abbiamo le frequenze sull'asse verticale e il tempo su quello orizzontale. Le parziali sono le linee colorate e la loro ampiezza è rappresenta con il colore (colore scuro = ampiezza elevata). Qui perdiamo un po' di definizione in ampiezza per vedere l'evoluzione temporale. Questo tipo di grafico è chiamato sonogramma.

Si vede benissimo che le parziali non hanno tutte la stessa durata. Quelle più acute finiscono prima. Si tratta di una caratteristica comune a tutti i mezzi vibranti che riescono a sostenere più facilmente le vibrazioni basse e lente rispetto a quelle acute e veloci.
Il segno in basso vicino a 0.0 con frequenza bassa e durata breve è il rumore del martelletto.
Ora guardiamo un altro bel grafico in cui il suono è rappresentato come un paesaggio montagnoso.

Qui abbiamo frequenza e tempo sui due assi, mentre le ampiezze si elevano in verticale. Si tratta di uno spettrogramma in cui possiamo vedere l'inviluppo di ogni singola parziale. Da qui vediamo, per es., che la durata delle tre armoniche più alte è molto breve rispetto alle altre. La collina vicina all'angolo degli assi è il rumore del martelletto. Ovviamente nulla di tutto ciò sarebbe mai stato possibile senza la potenza di calcolo dei computer attuali.
Questo programma può anche salvare i dati per risintetizzare tutte le componenti e riprodurle.
In questo esempio, quindi, possiamo ascoltare le parziali della nota di pianoforte senza il rumore dell'attacco (che non è riproducibile mediante somma di parziali):

In quest'altro esempio abbiamo anche aggiunto il rumore del martelletto (generato con altri sistemi) e il suono è praticamente identico all'originale:

Disponendo di questo tipo di analisi, è utile anche osservare lo spettrogramma della tromba in cui si vede come, anche nella fase di tenuta, le parziali non hanno mai una ampiezza veramente fissa, a causa del fatto che l'esecutore non è una macchina e la sua azione ha sempre delle piccole variazioni.

In conclusione, possiamo affermare che la teoria classica deve essere estesa e che nella creazione del timbro giocano un ruolo importante i seguenti parametri:

le parziali presenti

la loro evoluzione nel tempo

il tipo di attacco

eventuali altre sonorità significative
(rumore di attacco, soffio, etc)

Evoluzione temporale del suono: analisi nel tempo

Per esemplificare l'importanza dell'evoluzione temporale, ora esamineremo i suoni già visti sopra mediante sonogramma per osservare la variazione dello spettro nel tempo. Il link ai suoni non è riportato essendo lo stesso degli esempi di cui sopra.
La differenza è che finora abbiamo visto una sola "foto" per ogni suono presa in un punto significativo. Ma i suoni evolvono nel tempo, quindi qui utilizzeremo dei sonogrammi, cioè delle immagini che hanno

il tempo in ascissa (asse x)
la frequenza espressa in Hz in ordinata (asse y)

In tal modo ogni componente diventa una linea orizzontale in cui l'ampiezza è espressa con un colore. In genere, tanto più il colore è contrastato rispetto allo sfondo, tanto più alta è l'ampiezza (es: sfondo bianco, max amp nero o viceversa), mentre colori vicini allo sfondo sono indicatori di bassa ampiezza.
In questi esempi lo sfondo è bianco, quindi la scala delle ampiezze, dal basso verso l'alto è:

giallo pallido - giallo - arancione - rosso - marrone - nerolow amp -------------------------------------------- high amp

Guardando i sonogrammi, inoltre, è necessario porre attenzione al valore massimo dell'asse x, che indica la durata, ma soprattutto al valore massimo dell'asse y che indica l'estensione della banda a cui arrivano le componenti del suono.

Ogni sonogramma racconta una storia che in qualche caso diventa un romanzo. Bisogna saper leggere i sonogrammi come carta stampata.

Sib di pianoforte

Notate:

il rumore della percussione (martelletto) che si vede come banda rossa nel primo decimo di secondo. È un rumore indifferenziato che si estende ad alto volume fino a circa 7000 Hz, ma arriva anche più in alto.
la grande quantità di armonici nella prima parte del suono. All'istante dell'attacco si arriva fino a circa 15000 Hz (qualcuno isolato anche oltre)
la rapida scomparsa delle componenti alte: la maggior parte è già sparita entro il primo secondo di suono. La loro durata decresce in funzione dell'altezza seguendo una curva esponenziale decrescente. Questo comportamento è tipico dei suoni a evoluzione libera (pizzicati, percussivi).
le componenti che vanno e vengono (linee interrotte), indice di battimenti
il blob rosso finale sui bassi è lo smorzatore.

Sol basso di violoncello

Anche qui molti armonici, ma la maggior parte è piuttosto debole. Solo quelli in rosso hanno una ampiezza chiaramente sensibile, ma tutti gli altri, sebbene singolarmente non siano così evidenti, nel loro insieme danno corpo al suono.
Le macchie in alta frequenza sono interpretabili (a posteriori) come il rumore dell'arco che è proprio uno sfregamento a frequenze alte.
Notate che, al momento dell'attacco, gli armonici arrivano quasi tutti insieme (con un beve ritardo), poi rimangono in buona parte stabili per tutta la durata del suono e scompaiono in breve tempo (a cominciare dalle componenti alte) alla fine. Questo comportamento è tipico dei suoni a evoluzione controllata (archi, fiati). In questo caso il decadimento è lungo (quasi 1/2 secondo) e dipende dal fatto che la corda riesce ancora a vibrare se l'arco viene tolto di colpo.

In entrambi questi esempi abbiamo visto molti armonici. Ciò dipende dal fatto che, in entrambi i casi, abbiamo analizzato note basse generate da corde grosse. In genere, i suoni bassi hanno una maggiore quantità di armonici, per varie ragioni:

le strutture vibranti più massicce possono vibrare in modo più complesso rispetto a quelle sottili
normalmente, le strutture vibranti che emettono suoni bassi vengono trattate con maggiore violenza, sia perché sono più massicce, ma soprattutto per compensare l'effetto Fletcher (vedi Dinamica: curve di Fletcher) per cui occorre una ampiezza assoluta notevolmente maggiore per produrre suoni percepiti allo stesso volume di quelli nella banda 500 - 2000 Hz
gli armonici di fondamentali alte escono molto prima dalla banda udibile: una fondamentale a 100 Hz ha il 200mo armonico a 20000 Hz, mentre se la fondamentale è a 2000 Hz, già il 10mo armonico è a 20000 Hz.

Sol di tromba

Due grafici per la tromba: a sin. l'inviluppo, a des. il sonogramma.
Notate come l'attacco in sfz, tipico degli ottoni e ben visibile nell'inviluppo (occorre superare una certa soglia perché scatti la vibrazione) si rifletta nel sonogramma con componenti che all'inizio risultano più forti e meno precise (un po' più sporche).
Notate anche come esista un leggero glissando al momento dell'attacco, più visibile nelle frequenze alte. In realtà l'entità del glissando è uguale, in percentuale, su tutte le componenti, ma, essendo l'asse Y lineare e non logaritmica, si vede di più sugli alti (se è dell'1%, a 300 Hz è 3 e a 3000 Hz è 30).
Infine, il giallo diffuso, è il rumore del soffio.

Gong

Un suono inarmonico, come si vede bene nell'ingrandimento a des. (la distanza fra le componenti è variabile).
Per il resto, il quadro è quello tipico dei suoni a evoluzione libera: percussione iniziale con parecchie componenti che scompaiono rapidamente seguendo un pronunciato andamento esponenziale.

Tamtam

Molte componenti che vanno a riempire dapprima lo spazio sui bassi e poi si estendono verso l'alto (il tamtam è grande e impiega tempo, circa 1 sec., a entrare in vibrazione nella sua interezza). Ci avviciniamo al rumore indistinto a banda limitata, ma esistono alcune componenti molto pronunciate (soprattutto quella più bassa che agisce come pseudo-fondamentale).
Il decadimento rispetta sempre la legge secondo cui gli alti se vanno prima, ma in modo meno regolare, a causa delle grandi dimensioni e della diversa densità e spessore del materiale che lo compone.

Piatto

Siamo al rumore indistinto. La differenziazione fra le singole componenti si perde in favore di 2 bande: la prima arriva fino a circa 11000 Hz con centro intorno ai 6000/8000, la seconda fra 12000 e quasi 20000 Hz. Alcune componenti della prima banda rimangono come rumore residuo (molto debole) quando il piatto è stoppato.

Fontana

Infine, la fontana: rumore statico, indifferenziato, con maggior peso sulle frequenze basse. Notate la differenza qualitativa con l'esempio precedente: qui non c'è il minimo accenno a delle righe che possano suggerire delle componenti.

La teoria formantica: lo strumento

In uno strumento musicale esistono sempre

un elemento vibrante (quello che genera la vibrazione; è chiamato eccitatore)
un elemento risonante (che entra in vibrazione a causa della presenza del primo; è detto risuonatore)

L'esempio tipico è corda e cassa armonica, ma l'idea su può estendere anche a colonna d'aria e corpo dello strumento. Questi due elementi formano il suono che sentiamo interagendo fra loro. Qual'è esattamente il loro ruolo?
Osservate questa analisi di un suono di chitarra effettuata nel punto segnato in azzurro, cioè poco dopo l'attacco

Ora, noi sappiamo che una corda vibrante, da sola, produce la fondamentale seguita da una serie di armonici con ampiezza calante. Allora ci si può chiedere perché qui la seconda e la terza parziale sono entrambe più forti della fondamentale? E perché anche le parziali seguenti non hanno ampiezza regolarmente discendenti?

Tecnicamente, si dice che questo spettro mostra delle formanti.

formante = concentrazione di energia acustica in una certa banda frequenziale

Ne consegue che le parziali che si trovano entro quella banda hanno una ampiezza maggiore del normale. In figura vedete i formanti in questo spettro di chitarra.

Qui, le formanti sono causate dalla cassa armonica, essenzialmente per due ragioni.
La prima (e principale) è che il materiale di cui è composta ha delle frequenze di risonanza, cioè vibra meglio in certe zone di frequenza rispetto ad altre e il risultato è che le frequenze che si trovano in queste zone vengono rinforzate, mentre quelle che si trovano al di fuori vengono attenuate.
La seconda è che, nello spazio all'interno della cassa, le onde sonore prodotte dalla corda continuano a rimbalzare e si sommano alle onde principali con un piccolo ritardo sufficiente, però, a mettere certe frequenze in fase e altre in controfase (ricordate la prima figura sui battimenti), ancora con l'effetto di rinforzarne alcune e attenuarne altre. Proprio per questa ragione non si costruiscono casse armoniche rettangolari, che sarebbero molto più facili da fare. L'effetto di una forma così regolare sarebbe quello di creare una serie di rimbalzi regolari e quindi di amplificare troppo le frequenze il cui periodo è pari o multiplo al tempo di rimbalzo.
In pratica, la cassa armonica amplifica certamente il suono, ma non agisce nello stesso modo su tutte le frequenze. Alcune sono amplificate maggiormente, altre vengono attenuate. In pratica

la cassa armonica è un filtro che con la sua azione crea le formanti

che non devono essere viste come una cosa negativa perché caratterizzano timbricamente il suono di tutto lo strumento.
Quello che accade, in sintesi, è schematizzato in figura. La corda fornisce un segnale con armoniche di ampiezza calante. Questo segnale viene rimodellato in base alle frequenze di risonanza della cassa armonica che agisce da filtro. Il segnale risultante è il prodotto dell'interazione di questi due elementi.

Questo fenomeno ha un importante effetto collaterale. La cassa armonica è fissa. Non cambia da una nota all'altra e nello stesso modo, sono fisse le sue frequenze di risonanza. Quindi anche le formanti che essa crea sono sempre negli stessi punti, qualsiasi nota si faccia. Ora, osservate questi due spettri di violoncello relativi a due note a distanza di 8va.

Se osservate lo spettro del DO in 8va, il secondo, noterete che nell'area del primo formante cadono la prima e la seconda parziale (fondamentale e primo armonico). In questa nota la fondamentale è la componente più forte.
Se ora guardate il DO più basso (il primo), noterete che, essendo una 8va sotto e essendo il formante fisso, a cadere nella sua area qui sono la seconda e la terza parziale. Di conseguenza, qui non è la fondamentale, ma la terza parziale a essere la componente più forte. Il che significa che, in un singolo strumento, il timbro cambia, sia pure gradualmente, da una nota all'altra.
La cosa non si verifica solo negli strumenti con cassa armonica. Qui potete vedere alcune analisi di note di tromba e constatare come cambia lo spettro su varie note.
Non esistendo una cassa armonica, i formanti della tromba sono meno complessi di quelli degli strumenti con cassa, ma esistono e sono dovuti alla risonanza della campana e del corpo dello strumento.
Probabilmente è proprio questo cambiamento timbrico provocato dai formanti ad aver generato la nozione di "registro". Si dice, infatti che lo strumento entra in un altro registro quando il cambiamento timbrico diventa avvertibile.
Qui trovate i grafici delle formanti di vari strumenti basati su analisi dell'Università di Stanford.
Il principale strumento che si basa sulle formanti resta comunque la voce. La differenza fra le vocali, infatti, è legata unicamente alla posizione delle formanti che viene modificata dalle diverse posizioni che può assumere il tratto vocale (i dettagli vanno oltre il programma di Storia della Musica, ma gli studenti curiosi possono trovarli in una delle lezioni successive).

Sulle scoperte relative alle formanti si basa la teoria formantica del timbro secondo la quale il nostro sistema percettivo riesce a riconoscere la posizione delle formanti e proprio in base a queste ultime è in grado di identificare lo strumento anche se in realtà lo spettro cambia di nota in nota.
Parlando della banda critica, abbiamo visto come la chiocciola sia come un analizzatore basato appunto sull'ampiezza di banda critica (circa 1/3 di 8va). L'intero campo udibile può essere diviso in 25 bande, per la maggior parte a terzi di 8va, e quindi il sistema percettivo è in grado di misurare l'energia acustica presente in ogni banda. In questo modo le formanti possono essere identificate facilmente.
Si può quindi affermare che anche