K-system, Dithering, True Peak e Oversampling

Il mondo della produzione musicale, pur essendo per molti versi regno per eccellenza di creatività e fantasia, presenta aspetti tecnici importanti e terminologie per definirli che possono lasciare il neofita spiazzato; vediamo di comprenderne meglio alcuni:
K-system metering
Credo negli anni 2010/2020, nessuno parlerebbe più di K-system essendo il concetto di fatto ad oggi abbastanza superato, se non fosse che Fabfilter ProL e altri limiter ci offrono la possibilità di misurare la loudness di una traccia in queste scale; ma cosa rappresentano e perché?

Il K-system porta l’iniziale del suo ideatore, Bob Katz, leggendario sound engineer statunitense, come un insieme di scale oggettive per valutare la gamma dinamica di un brano, Katz propose l’introduzione di 3 scale, K-20, K-14 e K-12, da applicarsi rispettivamente a materiale molto dinamico, quali ad esempio musica classica e colonne sonore, musica “pop” in senso lato e “materiale radiofonico”.
L’idea di Bob Katz era di offrire ai sound engineer modo di preservare la dinamica e la qualità del loro lavoro, offrendo una scala “oggettiva” che gli permettesse di mantenere consistenza tra vari lavori; un meter calibrato in una K-scale pone lo zero rispettivamente a -20, -14 o -12 dBFS, un brano che rispetti uno dei tre standard del caso, dovrebbe mantenere il suo volume RMS intorno a tale zero.

Il piano di Bob Katz, come credo sia evidente, è miseramente fallito, la loudness war continua ad imperversare e a escalare, a dispetto delle dichiarate buone intenzioni circa la normalizzazione di Spotify, Youtube e altre piattaforme, brani pop mainstream, ma anche rock, metal, hip hop e altre cose più o meno underground oggi hanno facilmente loudness medie al di sopra dei -10dBFS, mentre brani più elettronici, soprattutto se indirizzati al dancefloor, contro ogni logica e buona pratica, tendono ad essere anche più alti. Della loudness war si potrebbe parlare molto a lungo; le decisioni in merito alla loudness finale desiderata in un brano dipendono in buona misura dall’intenzione d’uso del brano, e in un mondo in cui il grosso degli ascoltatori ha dispositivi di ascolto modesti e una bassa soglia di attenzione, quando la maggior parte della musica viene pubblicata a volumi osceni, rilasciare un brano meno “piallato” può essere circa equivalente a un suicidio commerciale, purtroppo anche e soprattutto per quella musica, quali le varie declinazioni della EDM, che nascerebbe proprio per essere riprodotta ad alti volumi da impianti di pregio.
Oltre questo, il piano di Bob Katz, riferendosi unicamente ai dB, senza alcuna attenzione alla frequenza presentava un piccolo ma importante problema; il volume percepito, a parità di ampiezza, dipende anche criticamente dalla frequenza; per ovviare a questo problema, oggi la loudness viene comunemente misurata nella scala LUFS, ovvero Loudness Unit Full Scale, a volte anche detta LKFS, la K è anche qui riferita a Katz. La scala LUFS è “circa” equivalente a quella in dBFS, ma è invece pesata in frequenza, sarei molto felice di potervi scrivere qui la formula esatta per calcolarla, ma devo confessare che le mie ricerche in rete per scoprirla non hanno dato frutti.
Dithering
Argomento misterioso a molti, altro non è che un aggiungere del rumore casuale a un segnale per ridurre gli errori di quantizzazione dovuti a una riduzione nella profondità in bit, non ha nulla a che fare in senso stretto con l’audio, tanto che si usa anche in ambito video, ma dipende unicamente dal modo in cui il segnale, audio o video che sia viene rappresentato in digitale.

Per coloro che non hanno troppo chiaro cosa sia esattamente la profondità in bit di un segnale, la rete è piena di utile materiale didattico, volendo il mio webinar di dicembre 2021 trattava tra le varie cose anche questo.
Il dithering, rimuove le distorsioni indesiderate dovute agli errori di quantizzazione, sostituendoli con un rumore costante, tipicamente inudibile; esistono svariati possibili algoritmi con cui questo rumore può essere generato, ma penso per il grosso dei producer entrare nel merito degli stessi sia circa inutile; ciò che a mio avviso è importante ricordare è che il dithering è un’operazione che un segnale audio non dovrebbe subire più di una volta; in altre parole i cambi di bitrate non sono gratis… la buona notizia è che tipicamente per sbagliare bisogna quasi farlo apposta. In poche parole, se state facendo voi il “master” e producendo una traccia finita, tipicamente a 16bit, sarà cosa saggia applicare il dither; se state producendo un mix premaster, su cui qualcun altro dovrà lavorare, sarà invece saggio mantenere la stessa profondità in bit con cui avete lavorato fino a quel punto, e lasciare le decisioni di dithering a chi si occuperà del master.
True Peak
L’esistenza di un picco vero, presuppone forse l’esistenza di un picco falso? Si.
Questo “falso” dipende ancora una volta dal fatto che la codifica digitale dell’audio, per ovvie motivazioni ha una risoluzione finita. Come penso tutti sappiano, in un flusso di audio digitale, l’ampiezza del segnale viene campionata un numero di volte al secondo pari alla frequenza di campionamento (tipicamente 44.100 Hz in un CD o nel grosso dei file audio), e può verificarsi che l’interpolazione dei campioni che avviene nello stadio di conversione D/A generi dei picchi di volume più alto, laddove malauguratamente il nostro campionamento sia tale da generare un massimo “reale” in un punto intermedio tra due campioni, ovvero un cosiddetto picco intersample.

Oversampling
Il concetto si spiega da solo, ma si presta a lunghe e tediose riflessioni; consiste semplicemente nel far lavorare un plugin a una frequenza di campionamento più alta di quella normalmente usata dall’host, ma in senso più lato spesso si usa anche solo per un uso di frequenze di campionamento nettamente più alte di quelle imposte dal teorema di Nyquist; ma perchè farlo, o perchè no? Sull’argomento, per chi mastica l’inglese non posso che consigliare un bellissimo video sul canale Youtube di Fabfilter, in cui Dan Worral spiega queste cose in maniera esemplare, per chi non mastica l’inglese, vi rimando ancora al mio già citato webinar. L’oversampling, in pochissime parole, ci permette di ridurre l’aliasing che, a frequenze di campionamento più basse, determinati effetti, in particolare tutti quelli che agiscono sulla dinamica, come saturazione, compressione o limiting tendono a introdurre.

Tipicamente più si spingono determinati effetti, più in basso nello spettro gli artefatti digitali indotti dall’aliasing compaiono; se restano al di la dell’udibile, ovvero circa 20Khz per un bambino dalle orecchie vergini, molto meno per noi producer massacrati da clubbing e produzione a volumi osceni, di fatto nessun problema, quando scendono sotto tale soglia, sentiamo comparire della spiacevole distorsione non armonica.
Quanto oversampling è necessario usare?
Ecco, dipende; se non stiamo usando nessun tipo di distorsione, filtraggio o altri processing che possano generare aliasing, l’oversampling è sostanzialmente solo uno spreco di potenza di calcolo; ma nella realtà della produzione credo nessun brano possa essere concluso senza nemmeno l’ombra di un compressore, un saturatore o un limiter.
La buona notizia è che tutto quello che vi costa è un po di potenza di calcolo e forse un po di tempo; alzare la frequenza di campionamento del progetto, o introdurre oversampling nei plugin che lo permettono prima di fare un bounce, forse vi costringe a una pausa the/caffè un po più lunga prima di potervi ributtare nella DAW, ma è tutto quello che vi costa; sicuramente non fa danni, e nella peggiore delle ipotesi è inutile. A voi la scelta.
Mi auguro questo articolo sia risultato comprensibile e di vostro gradimento, se aveste delle perplessità, o aveste curiosità circa altre tematiche, non esitate a scriverlo nei commenti o sulle varie pagine social di Sounders.
A presto e buona musica.
Hai delle domande?