COME ESPORTARE L'AUDIO DESTINATO AD UN UTILIZZO VIDEO?
Il formato di esportazione
Partiamo dal formato col quale lo andremo ad esportare. Le indicazioni sono molto semplici, quando si deve consegnare l’audio a un montatore (ma anche ad un mix engineer che si occupa della post produzione) il formato richiesto è sempre il seguente:
Formato file: Wav
Sample rate: 48 kHz
Bit depth: 24 bit
I motivi sono diversi, non ultimo il fatto che oramai questo formato sia diventato uno standard.
Il formato Wav viene utilizzato perché si tratta di un formato non compresso che offre la massima qualità e la massima facilità di utilizzo.
Esistono formati compressi lossless come il FLAC, che offrono la stessa qualità con un peso inferiore, ma essendo compressi per essere utilizzati devono essere decodificati appesantendo di molto le task della CPU).
L’utilizzo di un sample rate di 48kHz (fondamentale se vogliamo che l’audio sia perfettamente a sync con le immagini, salvo algoritmi di ricampionamento interni al software che possono salvarci anche in caso di sample rate diversi) è dovuto al fatto che fino a non molti anni fa, si girava su pellicola, la quale aveva un frame rate di 24 fps (24 frame al secondo). La musica veniva poi stampata anch’essa sulla pellicola. Ecco che quindi un sample rate (che fondamentalmente è in campo audio quello che il frame rate è in ambito video) di 48kHz è stato scelto come il più comodo per non avere problemi di sincronizzazione, essendo multiplo di 24.
L’uso infine dei 24 bit è dovuto al fatto che l’audio nel cinema ha un range dinamico molto superiore a quello che ha in un contesto di musica da ascolto, e con i 24 bit di campionamento questo viene preservato al meglio.
Quali sono le specifiche sul volume di esportazione?
Il volume al quale esportate il vostro audio non è una questione da trascurare. Mentre nella musica c’è stata per anni la tendenza a masterizzare i brani col volume più alto immaginabile (a scapito della dinamica), la cosiddetta loudness war (anche se ultimamente Spotify e le varie piattaforme di streaming stanno contenendo il fenomeno applicando anche loro dei livelli standard di loudness) in ambito video esistono alcuni valori da tenere in considerazione, che variano a seconda del media al quale il video è destinato.
Il parametro più importante da conoscere è quello relativo alla loudness, i LUFS (loudness units relative to full scale). Questo valore indica il volume percepito dall’orecchio umano.
Mentre l’RMS (root mean square) rappresenta l’intensità di un segnale puramente da un punto di vista elettrico, che quindi non rappresenta fedelmente ciò che l’orecchio percepisce, per di più prendendo in considerazione una porzione di audio molto breve, la loudness viene calcolata tramite degli algoritmi che tengono conto non solo dell’ampiezza dell’onda, ma anche della potenza del segnale nelle varie fasce dello spettro sonoro (l’orecchio umano infatti non ha un ascolto lineare, vedi le curve di Fletcher e Munson).
La loudness si può misurare oltretutto nel breve periodo (short term), che include 3 secondi di audio, oppure in long term, ovvero il valore di loudness integrato che prende in esame l’intero file audio in esame.
Nel broadcast
Questi standard esistono e sono molto rigidi soprattutto a livello di broadcast, e il motivo è molto semplice: se stai guardando la televisione non vuoi dover fare su e giù col volume del telecomando ogni volta che cambi canale o peggio ancora, ogni volta che cambia spot pubblicitario. Quante volte (soprattutto in passato) quando arrivava la pubblicità in mezzo al film ci faceva saltare dalla sedia?
Secondo il documento della European Broadcasting Union, EBU R128, le specifiche per l’audio da mandare in onda sono le seguenti:
Loudness level: -23.0LUFS±1.0LU
Maximum true peak level: -1dBTP
Per quanto riguarda la misurazione del true peak è molto semplice, si tratta semplicemente del picco massimo raggiunto dal meter del nostro sequenze.
Per quanto riguarda la loudness invece esistono diversi software e plugin per misurarla, iZotope RX ha un loudness meter, così come iZotope Ozone, altrimenti il classico WLM della Waves.
Anche Logic Pro X ha il suo plugin integrato per la misurazione della Loudness, il Loudness Meter.
Alla lettera M viene indicato il valore momentary, ovvero quello istantaneo, molto simile al valore RMS come concetto.
Alla lettera S viene indicato il valore in short term, che prende in esame una porzione audio di 3s, e alla lettera I il valore integrated, ovvero quello complessivo, che è quello che ci interessa. Con LU Range abbiamo invece l’escursione dinamica.
Notare che, comparato alla musica masterizzata, il valore di -23LUFS può apparire molto basso. Il fatto è che trattandosi di un valore medio è il risultato sia dei momenti in cui l’audio è molto basso (anche se nell’algoritmo che calcola la loudness non vengono considerati i silenzi), come ad esempio un momento con solo un parlato, e dei momenti dove il volume cresce considerabilmente, pensiamo ad esempio ad una scena di azione con tanto di esplosioni. Anche il picco massimo non è assolutamente basso attestandosi sui -1dBTP, giusto per avere la certezza di non clippare da nessuna parte.
Web Streaming
Per quanto riguarda invece i video trasmessi in streaming il discorso è molto più libero, nel senso che non esiste uno standard vero e proprio per il web.
Tuttavia, anche se non vi è alcun obbligo di esportare l’audio con una determinata loudness noteremo come, bene o male, i video che troviamo in rete abbiano molto spesso un volume abbastanza omogeneo. Questo perché i colossi dello streaming applicano una normalizzazione, al rialzo o al ribasso, della loudness.
Sia Spotify che Youtube ad esempio normalizzano i contenuti caricati a -14LUFS.
Piccola curiosità: su YouTube cliccando sul video col tasto destro compare un menu a tendina con la voce “statistiche per nerd”. Selezionandola compare una finestrella con alcuni parametri associati al video, tra i quali il rapporto tra il volume originale del contenuto caricato e di quanto è stato ridotto per via della normalizzazione.
Morale della favola, sul Web potete fare come preferite senza stare a impazzire, tuttavia sappiate che un valore che si attesta attorno ai -14LUFS è quello che va per la maggiore, almeno su YouTube (che è un buon punto di riferimento).
Cinema
Anche il cinema ha i suoi standard, ma in questo caso non si basano sui LUFS. La questione è più complicata ma non è fiscale come per li broadcasting. Mentre infatti un video mandato ad una emittente televisiva con una loudness troppo alta o troppo bassa viene rispedito al mittente, e la rete rischia una multa se lo trasmette ad un volume esagerato, nel cinema ci sono dei criteri, ma il risultato finale non è soggetto ad un controllo così rigoroso, sebbene un volume esageratamente fuori dai margini previsti difficilmente passerebbe la fase di post produzione.
Per mixare l’audio di un prodotto si fa riferimento infatti alle specifiche Dolby 7. Cosa significa? L’impianto audio di ogni cinema è comandato, a livello di volume, da un sistema Dolby Surround con un potenziometro (la manopola del volume per intenderci) che in un range da 1 a 10, è fissata sul 7. Questo significa che nel mixare l’audio di un film si deve fare in modo che l’audio abbia un volume adeguato a quel livello (su cui chiaramente sono tarati anche gli speaker del cinema).
Per ottenere ciò è necessario non tanto misurare il livello di loudness, ma mixare in una regia con un impianto tarato di conseguenza. La taratura prevede sostanzialmente (senza entrare troppo nel tecnico) di mandare un pink noise ad ogni speaker e misurare con un fonometro in pesatura C una pressione sonora di 80 dB al punto di ascolto.
Conclusione
Questi sono i vari fattori da tenere in considerazione quando si esporta un audio destinato ad essere montato su delle immagini.
Chiaramente le situazioni più comuni sono quelle di uno streaming sul web (dove tra l’altro, senza regole precise, vale sempre anche la regola di fare una comparazione con delle reference simili al proprio prodotto).
Potrà capitare di fare qualche spot televisivo, ma per quanto riguarda il cinema ci lavorano figure professionali che difficilmente avrebbero qualcosa da imparare da questo articolo, ma è sempre bene conoscere, anche a grandi linee, quali sono le prassi lavorative in tutti i vari settori.
Filippo Ferrari