Questo articolo, soprattutto nella sua parte di intervista, vuole affrontare in modo il più possibile piano e divulgativo il tema trattato nella ricerca Proprietà delle distorsioni non lineari e loro misure negli amplificatori audio che trovate qui. La ricerca è scaricabile, ovviamente a pagamento, ed è stata pubblicata sul Journal of the Audio Engineering Society - JAES, meglio nota internazionalmente con il suo acronimo AES, vedi sito qui. L’AES non dovrebbe avere bisogno di presentazioni, trovate una sua descrizione qui. Sappiate comunque che è l'unica società professionale al mondo dedicata esclusivamente alla tecnologia audio. L’AES sviluppa, esamina e pubblica standard di ingegneria per l'industria audio e dei media correlati.

Frontespizio della ricerca dell'Ing. Parolo
Giuseppe Parolo è quindi e per l’appunto un ingegnere informatico. Lascio alle sue stesse parole, scritte all’inizio della ricerca di cui sopra, il compito di presentarsi: “Sono un ingegnere SW con l'hobby della riproduzione audio. Non ho esperienza approfondita per quanto riguarda l'elettronica, ma nel gruppo che frequento ho un paio di amici che costruiscono amplificatori (sia a stato solido che a valvole) per il mercato locale (vivo in Italia). Avendo strumenti di misura, competenze informatiche e una stanza trattata acusticamente per l'ascolto della musica, li aiuto a mettere a punto le loro creazioni. Ho anche avuto la fortuna di misurare e ascoltare decine di preamplificatori di molte marche, quindi, dopo alcuni anni di esperienza, mi sono avventurato nel difficile compito di correlare meglio le misurazioni ai test di ascolto, considerando anche gli effetti psicoacustici nell'equazione (sì, molto impegnativo!). Questo si basa sul grande lavoro svolto da persone come GedLee, Nelson Pass e Bob Katz”.
Nel suo corso di studi presso l’Università degli Studi di Roma La Sapienza, Parolo ha sostenuto esami su molte materie attinenti al campo dell’elettronica come Teoria dei Segnali, Teoria dei Sistemi, Controlli Automatici, nonché Acustica Applicata. La sua occupazione principale è nel campo delle telecomunicazioni.
La sua ricerca sfociata nel suddetto articolo ha una grande rilevanza per noi audiofili, in quanto, in estrema e approssimativa sintesi, cerca una correlazione fra misure e ascolti che è in un certo senso il cuore del nostro interesse audiofilo e, sicuramente, della nostra rivista.
Domanda: Giuseppe, nelle tue righe introduttive alla ricerca, sempre con frasi “scolpite nella pietra”, affermi che “La caratterizzazione classica delle distorsioni non lineari di dispositivi elettronici come gli amplificatori audio comporta il calcolo di alcuni indicatori, come la distorsione armonica totale, la distorsione armonica totale + rumore e la distorsione di intermodulazione, ottenuti misurando le componenti spettrali aggiuntive generate dal dispositivo rispetto ai segnali di ingresso convenzionali.” Cominciamo quindi in modo didattico e propedeutico dall’inizio: cos’è tecnicamente una “distorsione lineare”?
Giuseppe Parolo: Iniziamo col considerare un preamplificatore o un finale di potenza audio che utilizziamo abitualmente. Se immettiamo un segnale in input al dispositivo e lo confrontiamo con quello di output, ad un’analisi macroscopica sembreranno identici. In realtà, andando a guardare più nel dettaglio, si riveleranno sempre delle differenze fra i due segnali. Alcune saranno indipendenti dal segnale in input. Altre invece dipenderanno da queste. Nel gergo tecnico, le prime sono denominate “rumore”, mentre le seconde “distorsioni”. Queste ultime sono si possono classificare in due tipologie: “lineari” e “non lineari”. Questa nomenclatura deriva da come si rappresentano matematicamente i “sistemi” che presentano l’una o l’altra caratteristica e quindi dalle loro proprietà. Per afferrarne le differenze è necessario analizzare gli effetti sul segnale nel dominio della frequenza, cioè guardare alla decomposizione dello stesso in “toni”, vedi qui, ognuno individuato da una “frequenza”, un “modulo” – indicato anche con i termini di intensità o livello – e una “fase”. Il passaggio fra questi due domini è dato da un’operazione matematica denominata Trasformata di Fourier, vedi la fig. 1 seguente. Questa rappresentazione approssima il comportamento del nostro sensibilissimo apparato uditivo e quindi si presta bene anche a descrivere gli effetti di ogni tipo di alterazione.

Fig. 1 - Il segnale in tempo (grafico in alto, in rosso) è dato dalla somma di due toni H1 e H2 di frequenza di 100 Hz e 300 Hz (in blu e celeste). Questa decomposizone è evidenziata dall’analisi in frequenza, che mostra per ognuno dei due toni rispettivamente l’intensità, di 1 e 0.5 (grafico in basso a sinistra), e la fase, di -90° e 60° (grafico in basso a destra).
Con distorsione lineare si intende un’alterazione del segnale in cui viene modificata l’intensità o la fase delle componenti tonali contenute nel segnale in input, senza l’aggiunta di nuove. Negli amplificatori questo tipo di distorsione è causata dagli effetti capacitivi o induttivi dei componenti elettronici in cui transita il segnale che conservano una memoria dell’andamento del segnale nel tempo. Una rappresentazione efficace di questi effetti si ha misurando la Risposta in Frequenza, cioè la funzione che esprime l’alterazione dell’intensità – espressa in % o in decibel - dB – e della rotazione della fase – espressa in gradi – che subisce ogni componente tonale. La fig. 2 riporta un esempio della classica rappresentazione grafica di questa funzione per un preamplificatore.
Fig. 2 - Esempio di misura della Risposta in Frequenza. In alto la curva del modulo, con scala dei valori sulla sinistra; in basso quella della fase, con scala dei valori sulla destra.
L’andamento desiderabile è quello neutro, dove la curva dell’intensità è orizzontale nella banda audio, 20 Hz – 20 KHz, per decrescere lentamente al di fuori di questa banda. La curva della fase è legata all’andamento dell’intensità ed è desiderabile anche per questa un andamento orizzontale, quindi a 0°, in tutta la banda audio. L’andamento tipico è molto simile a quello di un filtro passa banda, ed è determinato da scelte progettuali: dunque, dal tipo del circuito e dalle caratteristiche dei componenti. Una proprietà dei sistemi che presentano solo distorsioni lineari è che le attenuazioni o gli sfasamenti da parte di un sistema possono essere recuperate, in teoria perfettamente, da quello successivo in cascata con un’azione contraria.
L’effetto sulla percezione dovuto alle deviazioni dalla neutralità è percepito principalmente come un cambiamento nel timbro del suono, denominato colorazione. Ad esempio, per quanto riguarda l’intensità:
- un’esaltazione nelle alte frequenze determina sensazioni di “brillantezza” e un aumento delle “sibilanti”; viceversa, un’attenuazione determina un suono “ovattato”, “noioso”;
- un’esaltazione nelle basse frequenze causa effetti di “rimbombo”, mentre un’attenuazione determina un suono “esile”, privo di corpo;
- un’esaltazione nelle frequenze medie risulterà in un suono “nasale” o “duro”.
Per le rotazioni di fase, se non sono opportunamente controllate nelle medie/alte frequenze si avranno ritardi fra le componenti tonali del suono che si possono tradurre nei casi più gravi in effetti all’ascolto di perdita di “coerenza”.
Dunque, ottenere una risposta in frequenza con l’andamento descritto è uno dei requisiti primari che dovrebbe osservare un progettista per non alterare l’equilibrio del messaggio musicale. In effetti, questo requisito oggi può essere soddisfatto abbastanza facilmente nei preamplificatori; per i finali è un po’ più problematico, dato il carico complesso degli altoparlanti a cui sono collegati. In generale, nel normale ascolto domestico la distorsione più elevata risulta proprio di questo tipo.
Domanda: Cos’è invece una distorsione non lineare?
Parolo: Le distorsioni non lineari sono più sfidanti da caratterizzare, sia fisicamente che percettivamente. Si presentano sotto forma di nuove componenti tonali, cioè nuovi suoni, aggiunti al segnale sorgente. Negli amplificatori questi effetti sono dovuti al fatto che i componenti elettronici non si comportano in modo perfettamente lineare: la grandezza in uscita, la tensione o la corrente, non ha una proporzione fissa con la grandezza d’ingresso per ogni valore nell’intervallo di lavoro.
Per un amplificatore audio questo comportamento può essere rappresentato attraverso la Funzione Caratteristica, che esprime il livello d’uscita del dispositivo in funzione di quello d’ingresso. Il grafico a sinistra nella fig. 3 riporta un esempio di funzione caratteristica con guadagno unitario, cioè 0 dB, che presenta un “soft clipping asimmetrico” dove il segnale è compresso in modo proporzionale al suo livello. A destra nella stessa figura è riportato l’effetto di questa funzione su un segnale contenente un tono puro, un’onda sinusoidale. È riportata la curva risultante in blu e la componente di distorsione complessiva in rosso risultante dalla differenza del tono distorto con quello indistorto.
Fig. 3 – Sinistra: esempio di funzione caratteristica, in blu, con guadagno unitario. La curva, relativa a una distorsione di -70 dB e -60 dB rispettivamente sulla seconda e terza armonica, è amplificata di 40 dB rispetto alla linearità, in arancione, per mostrarne meglio i dettagli. Destra: segnale di output corrispondente per un input sinusoidale nel dominio del tempo.
Nella pratica la misurazione di questa funzione per un dispositivo audio non è molto agevole, dati gli effetti della distorsione lineare che agisce simultaneamente sul segnale. Inoltre, correlare un dato andamento della curva con gli effetti sull’ascolto non è così immediato. La strategia seguita è quindi quella di misurare gli effetti causati dalla distorsione su segnali di test semplici e stazionari, cioè periodici, rilevando le componenti tonali aggiunte dal dispositivo.
Il caso più semplice consiste nell’introdurre nel dispositivo un segnale monotonale a 1 KHz, della forma di fig. 3, denominato “fondamentale”. In uscita si osserverà la creazione di nuovi toni a frequenze multiple della fondamentale: a 2 KHz cioè seconda armonica, a 3 kHz cioè terza armonica e così via, fino al massimo “ordine di distorsione” proprio del dispositivo. La fig. 4 mostra un esempio di analisi in frequenza del segnale di uscita di un preamplificatore. Sono evidenti i toni distorsivi a 2 KHz e a 3 KHz a livelli rispettivamente di HD2 = -78.3 dB e HD3 = -84.8 dB; gli altri toni inferiori a -130 dB sono dovuti al rumore.

Fig. 4 – Esempio di misurazione delle distorsioni armoniche per un tono a 1 KHz.
Questo tipo di distorsione non lineare è chiamata “armonica” poiché i toni creati si presentano a frequenze multiple dalla fondamentale. La maggioranza degli strumenti musicali genera segnali multitonali armonici, ma non tutte le armoniche sono “consonanti”, cioè gradevoli all’ascolto come direbbe un musicista: ad esempio, la settima armonica risulta molto fastidiosa.
Nel caso di segnali complessi si genera un altro fenomeno. Se consideriamo il caso immediatamente più complesso di un segnale con due toni, le non linearità genereranno, oltre alle componenti armoniche relative a ognuna delle due frequenze, altre componenti dovute a effetti di interazione fra i due toni fondamentali. Questi toni sono denominati “prodotti di intermodulazione” e si presentano a frequenze date dalle somme e differenze di multipli interi delle frequenze dei toni sorgenti. I nuovi toni risultano in generale non armonici, cioè non multipli delle fondamentali e quindi “dissonanti”. La fig. 5 riporta il caso di due toni fondamentali a 19 KHz e 20 KHz, con test CCIF.

Fig. 5 – Esempio di misurazione dei prodotti di intermodulazione per un segnale di due toni, con test CCIF.
Si notano qui i prodotti di intermodulazione creati alle frequenze di 1 KHz, dalla differenza delle frequenze a 20 KHz e 19 KHz, abbastanza problematica, intorno alle fondamentali (differenze 2*20 – 19, 2*19 – 20, …), intorno alle seconde armoniche a 38 KHz e 40 KHz (differenze 3*20 – 19, 3*19 – 20, …); altre di ordine superiore ultrasoniche non compaiono in figura.
Il numero dei prodotti generati aumenta velocemente al crescere dell’ordine di distorsione massimo del dispositivo. Inoltre, se si aumenta il numero delle fondamentali per ricondursi a segnali più realistici, si verranno a creare ancora più interazioni e quindi più prodotti di intermodulazione che formano una sorta di “tappeto di distorsione”, cioè una moltitudine di toni che potenzialmente può mascherare gli aspetti più fini del segnale. La fig. 6 riporta l’output per un segnale complesso composto da 31 toni dello stesso livello, equispaziati a 1/3 d’ottava da 20 Hz a 20 KHz, sempre per lo stesso preamplificatore. Si notano i prodotti creati fra le fondamentali, intorno a -95 dB di livello.

Fig. 6 – Esempio di misurazione dei prodotti di intermodulazione per un segnale multitonale: 31 toni a 1/3 d’ottava.
Gli effetti delle distorsioni non lineari si moltiplicano ulteriormente nella connessione di sistemi in cascata, causando effetti non facilmente prevedibili ed è difficile, se non impossibile, compensarli. Sebbene nel campo della produzione possano essere utilizzate per conferire caratteri particolari agli strumenti musicali, nel campo della riproduzione si tende a contenerle il più possibile per evitare di conferire al suono caratterizzazioni estranee alle intenzioni artistiche originali. Se troppo intense possono causare nella percezione del suono diversi effetti non sempre piacevoli, come “asprezza” o “rugosità”.
In generale, è difficile ridurre a livelli di inudibilità queste distorsioni, specialmente negli altoparlanti, dove valori intorno all’1% sono considerati molto buoni. La strada seguita da molti progettisti è quella di ridurre il più possibile gli ordini di distorsione elevati, concedendo una maggiore indulgenza a quelle di secondo e terzo ordine che risultano meno udibili date alcune peculiarità del nostro apparato uditivo.
Fine parte 1a di 4 - Alla seconda parte
Per ulteriori info:
contatta l'Ing. Parolo
al sito JAES
al sito AES