Quali sono e come funzionano i formati digitali per la riproduzione dei suoni audio ?

Come si registra e si riproduce un suono audio ?

Un suono è un segnale audio analogico. Viene generato da uno spostamento di aria (una variazione di pressione nella massa d’aria) che viene convertito dall’orecchio in un suono o rumore, a seconda di come è formata la sequenza dell’onda di pressione.

Per cui il suono è un evento ben studiato e caratterizzato dalla Fisica.

Quando vuoi sentire musica o vedere un film moderno devi convertire la musica registrata in suono (curiosità: i primi film registrati nei primi anni del ‘900 non avevano il suono, gli attori “gesticolavano” le scene o parlavano e venivano aggiunti i sottotitoli. Oggi si chiamano film muti. Se vuoi vedere qualche film muto cerca gli attori “Buster Keaton” o “Charlie Chaplin“).

Buster Keaton – Famoso attore Americano di film muti
Charlie Chaplin – famoso attore Inglese di film muti

Le fasi per convertire un suono in file audio digitale sono:

  • la cattura dell’intensità/pressione del suono tramite microfono
  • la conversione del suono da analogico a digitale, tramite numeri proporzionali alla intensità del suono
  • la memorizzazione dei dati in sequenze di numeri distanziati nel tempo

le fasi per convertire un file audio digitale sono:

  • lettura dei dati numerici memorizzati nel file secondo un formato definito (codec)
  • conversione dei numeri in segnale analogico proporzionale al formato, in bit
  • amplificazione del segnale analogico e conversione in onde sonore tramite altoparlante

I bit e la Frequenza di conversione

I bit sono la rappresentazione numerica, espressa in formato numerico con base 2^n, dell’intensità del suono catturato dal microfono e convertito dal circuito elettronico chiamato convertitore Analogico-Digitale.

immagine di un Compact Disk tenuto in una mano prima di essere inserito in un lettore di CD

Per esempio nei CD (Compact Disk, ormai un vecchio sistema per memorizzare i file audio) la musica viene memorizzata con massimo 16 bit, il che significa che l’intensità del suono digitalizzato è proporzionale ad un numero che può variare tra 0 e 65535 (2^16 = 65536). Questo si traduce in una “sensibilità” o gamma dinamica di 96 dB (deciBell). Puoi trovare un ben fatto articolo che spiega i dB su gregorioferraris.com/decibel.

Se non ascolti musica classica in modo “professionale” i 16 bit di dinamica sono sufficienti per avere una riproduzione “fedele” dei suoni originali. Basta sapere che ogni musica registrata digitalmente viene “compressa” in dinamica proprio per far meglio risaltare i suoni più “deboli”, i cosiddetti dettagli.

Questo è solo un mio modesto parere. Entrare nel campo degli audiofili è difficile e controverso, direi troppo tecnico e come sbufferebbe mia figlia “noioso”, per cui per me vale di più un “bel pezzo” che il mezzo con cui viene riprodotto (la magia di una bella canzone supera quasi qualsiasi limite tecnico).

La tabella che segue ti fa capire i limiti tecnici dati dalla estensione di sensibilità o dinamica.

tabella pressione sonora rapportata al tipo di suono (fonte elettroyou)

La frequenza di conversione, espressa in kHz (chiloHertz), è il numero di conversioni da analogico a digitale che vengono effettuate in 1 secondo. Dire 44 kHz significa aver effettuato una “campionatura” o conversione del segnale analogico, cioè il suono, 44’000 volte in un secondo. Questo numero non è a caso, ma deriva da due fattori principali:

  • l’estensione di frequenza a cui è sensibile l’orecchio umano
  • il teorema di Shannon applicato alle campionature/conversioni digitali

L’estensione di frequenza, cioè l’altezza/frequenza dei suoni riconoscibili dall’uomo varia tra qualche Hertz fino a 22’000 Hertz.

Il teorema del campionamento di Nyquist/Shannon afferma che per non creare distorsioni, e perdite di informazione, nella conversione da segnale analogico a segnale digitale la frequenza di conversione deve essere almeno il doppio della frequenza massima che stai convertendo. Cioè la velocità di campionamento deve essere una frequenza almeno doppia di quella massima da convertire. Questo si traduce in un numero di campionamenti al secondo, per l’orecchio umano, di almeno 44’000 campionamenti.

Grafici del segnale audio analogico, i livelli campionati, e la riproduzione del segnale digitale

Dal grafico dei campionamenti si intuisce che più campionamenti al secondo esegui e meglio è rappresentato il suono convertito (ha più dettagli nella gamma alta della frequenza audio musicale).

In particolar modo i transienti sonori (elettrici) vengono maggiormente convertiti e riprodotti.

I filtri di banda in ingresso ed in uscita

Il campo di frequenze a cui il nostro orecchio è sensibile variano da un minimo di qualche Hertz ad un massimo di 22 kHz. Il teorema del campionamento ci obbliga a limitare questa banda di frequenze con un filtro analogico (cioè applicato al segnale elettrico che proviene dal microfono) per non creare “errori” di campionamento e conversione analogico digitale. La qualità di questo filtro diventa un fattore importante nella catenza di riproduzione del suno.

Quando il suono deve essere ri-prodotto a partire dai numeri digitali, l’andamento a “gradini” del segnale campionato deve essere “ammorbidito” (cioè deve essere ricreato l’andamento analogico con variazioni lineari del segnale).

Per fare questo si deve usare un filtro analogico tra il convertitore digitale-analogico e l’altoparlante. La qualità di questo filtro determina la qualità del segnale audio ri-prodotto.

I Codec e formati file audio

La trasformazione di un segnale analogico, quale è il suono audio, in un file digitale necessita di memoria. Quanto più tempo dura il suono, o la canzone, tanta più memoria dovrà essere utilizzata per la sua memorizzazione.

Un file audio non compresso, dove tutti i campionamenti sono memorizzati così come sono stati acquisiti, chiamato anche RAW, con risoluzione dinamica di 16 bit, frequenza di campionamento di 44kHz e mono canale, occupa circa 88 kbyte di dati per ogni 1 secondo di suono salvato.

Una canzone di 3 minuti, con formato CD 16bit 44kHz, occupa circa 30 Megabyte.

Nei primi anni 2000 le capacità di memorizzare i dati erano più scarse e si è creata la necessità di “comprimere” i dati digitali, cioè risparmiare memoria a discapito della perdita di fedeltà del suono. Sono nati vari standard di compressione dei dati audio chiamati anche “Codec”.

Per calcolare la capacità di memoria per i file audio con qualsiasi compressione vai sul sito:

colincrawley.com/audio-file-size-calculator

Formati File Audio e Compressori Codec

la giungla dei formati audio 🙁

I formati audio servono per diminuire la memoria che serve per salvare i file, oppure per creare dei formati “proprietari” che ti impediscono di ascoltare o copiare musica gratuita.

Posso dividerli i tre principali categorie:

  • No lossy – Raw File Uncompressed – nessuna perdita di fedeltà audio
  • Compressed Lossless – meno memoria nessuna perdita di fedeltà audio
  • Very Compressed – Lossy – poca memoria meno fedeltà audio
Formati di compressione dei file audio, comparazione qualità e utilizzo di memoria

Comparazione uso di memoria e formati audio

Vediamo quanta memoria serve per memorizzare una canzone della durata di 3 minuti nei vari formati audio (frequenza di campionamento 44,1 kHz, bit di campionamento 16):

  • WAV uncompressed – 30,28 MegaByte
  • AIFF uncompressed – 30,28 MegaByte
  • MP3 compressed 320 kbps – 6,86 MegaByte
  • AAC compressed 320 kbps – 6,86 MegaByte
  • OGG compressed 500 kbps – 10,73 MegaByte
  • WMA compressed 576 kbps – 12,36 MegaByte

OGG Vorbis formato codec open source

Questo è il sito ufficiale della fondazione che sviluppa il Codec Open Source OGG Vorbis:

https://www.xiph.org/about/

Convertitori formati Audio Video Online

Una lista di siti internet dove poter convertire un file in qualsiasi formato audio desideri:

www.vidconverteronline.com – GRATUITO – molta scelta – veloce

Significato/descrizione formati/estensione dei file

In questo sito trovi il significato del formato/estensione dei file, con più di 10’000 estensioni tra cui scegliere.

https://fileinfo.com/

Vuoi aiutare questo Blog ?

Se vuoi aiutare questo Blog perchè ne apprezzi i contenuti sarebbe una bella cosa fare una donazione. Qualsiasi cifra è gradita e mi sprona a continuare e fare meglio.

Puoi anche scrivermi e suggerirmi argomenti o miglioramenti, anche questo sarà molto apprezzato.



Fonti di approfondimento & Credits

Autore dell'articolo: Lucio Sciamanna