9.1. FORMATE AUDIO UZUALE


      Pentru stocarea sunetului, s-au stabilit de-a lungul timpului numeroase tipuri de fişiere, care definesc formate audio dintre cele mai diverse.
      WAV este un format la care fişierele provin din prelucrarea unui sunet original în format MIC (PCM). După eşantionare şi digitizare, fişierului i se adaugă un antet (header), în care se specifică, printre altele, frecvenţa de eşantionare şi numărul de biţi pe care este memorată amplitudinea semnalului.
      VOC este un format introdus de Creative Labs pentru primele cartelele soundblaster. Iniţial, nu avea antet, parametrii trebuind setaţi manual.
      MID este o extensie care provine de la MIDI (Musical Instruments Digital Interface), fiind folosit pentru instrumentele muzicale electronice cu clape, cuplate cu un calculator. Este util pentru a permite prelucrarea sunetelor pe un alt instrument decât cel pe care au fost create. Pot fi redate cu ajutorul cipului FM sau wavetable, cu care este echipată cartela de sunet.
      MOD este un format de fişier care conţine atât sunete originale, asemănătoare cu cele de tip WAV, cât şi sunete predefinite, culese de la instrumente acustice, care, prin interpolare, pot genera întreaga gamă de sunete a instrumentelor respective. Este util în sinteza wavetable.
      MP3 (MPEG Audio Layer 3) este un format lossy (cu pierderi), care are avantajul unei calităţi ridicate la bitrate-uri scăzute, ceea ce i-a adus o popularitate foarte mare (vezi paragraful 10.2.3.1). O dată cu răspândirea Internetului şi, implicit, a reţelelor de tip peer-to-peer, fenomenul MP3 a luat amploare, devenind un mijloc eficient de transfer şi stocare a muzicii pe calculator.
      MPC (Musepack, denumit în trecut MPEG Plus) este considerat cel mai bun format de compresie audio lossy. Dezvoltat iniţial pe baza standardului MPEG Layer 2 (MP2), îmbunătăţirile aduse acestuia din urmă îi permit oferirea unei calităţi deosebite la bitrate-uri de peste 160 kbps. Dezavantajul principal este calitatea la bitrate-uri mici, comparabilă cu MP3. Lucrează nativ cu tehnica VBR, iar pentru definirea calităţii există un număr nelimitat de paşi, parametrul quality luând valori între 0 şi 10, cu o precizie oricât de mare.
      OGG este un format gratuit al firmei Vorbis, care are la bază un algoritm care – în loc să elimine complet frecvenţele înalte sau să le păstreze, dar să permită apariţia artefactelor – generează un fel de zgomot de fond, deloc supărător, care păcăleşte urechea umană, frecvenţele înalte fiind denaturate în aşa fel încât chiar şi la un bitrate de 50 kbps calitatea audio este acceptabilă, iar, în acelaşi timp, frecvenţele înaltele sunt redate decent. Dezavantajul principal: nu este capabil să ofere o calitate foarte bună la bitrate-uri mari.
      MP3Pro este o extensie a formatului MP3, compatibilă cu acesta. Calitatea suplimentară este obţinută exclusiv pe baza ratei de eşantionare de 22 kHz, rezultând un bitrate teoretic între 24 şi 144 kbps. Astfel, alături de informaţia propriu-zisă, este introdusă, cu ajutorul tehnologiei SBR (Spectral Band Replication), o secţiune responsabilă cu estimarea frecvenţelor înalte.
      VQF, bazat pe tehnica TwinVQ (Transform domain Weighted INterleave Vector Quantization), este un format dezvoltat de NTT Labs în urmă cu mulţi ani şi achiziţionat de Yamaha mai târziu, el dorindu-se a fi, în esenţă, o alternativă superioară lui MP3. Minusurile sunt, în ordine, calitatea bună doar la bitrate-uri mici, limitarea la 96 kbps (corespunzător unui MP3 la < 128 kbps), viteza de codare extrem de redusă şi promovarea slabă (proprietar: Ahead).
      AAC (Advanced Audio Coding) este considerat ca fiind succesorul formatului MP3, având şanse mari să se impună. Are avantajul posibilităţii codării unui număr mare de canale (15), precum şi a unei rate maxime de eşantionare de 96 kHz. De aceea, este folosit uneori la codarea sunetului discurilor DVD, însă avantajele sale nu îl fac recomandat pentru audiofili. Este de calitate în special la biterate-uri mici.
      AC3 (Audio Coding algorithm 3) este formatul audio dezvoltat de Dolby şi utilizat în cinematografie şi, mai nou, în codarea sunetului pentru filmele stocate pe DVD. Se diferenţiază de alte formate prin faptul că este conceput pentru a stoca şase canale (5.1, ultimul canal conţinând doar frecvenţe joase, sub 120 Hz). Algoritmul este de tip transformată, iar bitrate-urile utilizate sunt cuprinse între 32 şi 640 kbps. Codoarele de calitate sunt foarte scumpe, de aceea formatul nu este recomandat utilizatorilor obişnuiţi.
      WMA (Windows Media Audio) este formatul pe care Microsoft a încercat, fără succes, să-l impună pe piaţă în faţa lui MP3. Popularitatea sa relativ mare se datorează lui Windows Media Player. Fiind un codec de tip transformată, este mai eficient la bitrate-uri mici în comparaţie cu MP3, producând, în acelaşi timp, un sunet metalic, nu departe de cel obţinut de OGG. Bitrate-ul maxim în versiunea iniţială (7), de 192 kbps, nu permitea decât o calitate audio decentă, WMA fiind eficient doar la bitrate-uri sub 128 kbps. Versiunile 8 şi 9 au oferit îmbunătăţiri remarcabile, dar fără a depăşi concurenţa.
      RealAudio este un format vechi şi foarte răspândit în trecut, din cauza utilizării sale în domeniul streaming-ului (cel mai adesea, pentru posturi de radio on-line). Fiind format proprietar, utilizat în scopuri comerciale avantajele sale sunt minime. De-a lungul vremii, au fost dezvoltate diverse variante, printre care se remarcă modul de compresie lossless (fără pierderi), introdus recent.
      WavPack este un format promiţător, conceput în primul rând pentru compresia lossless. Algoritmul lossy oferă o calitate relativ bună, dar este limitat inferior la un bitrate minim de circa 260 kbps. Avantajele lui sunt legate de faptul că este absolut gratuit şi de facilităţile deosebite pe care le oferă. Cea mai importantă este modul de compresie hibrid, care generează două fişiere: primul conţinând secvenţa audio comprimată lossy, iar al doilea, de obicei mai mare, diferenţele faţă de original.
      OptimFROG este un format care oferă, pe lângă excelenta compresie lossless, şi una cu pierderi, numită DualStream. Bitrate-urile obţinute sunt mari, între 200 şi 500 kbps, iar calitatea – excelentă, superioară lui WavPack şi comparabilă cu cea a oricărui format modern. Totuşi, formatul nu oferă suficiente avantaje pentru a fi utilizat pe scară largă, calitatea sunetului fiind uşor depăşită de alte formate în cazul unui bitrate similar. De asemenea, OptimFROG permite folosirea modului hibrid.
      ATRAC3 (Adaptive TRansform Acoustic Coding 3) este un format proprietar Sony, introdus pentru MiniDisc-urile sale. Pe piaţa PC-urilor a apărut ca un codec ACM (Audio Compression Manager), având disponibile doar trei bitrate-uri: 66, 105 şi 132 kbps, calitatea fiind redusă, în principal, datorită zgomotului de fond puternic. Există însă versiuni mai calitative, precum ATRAC3plus, care creşte substanţial calitatea, oferind, la cei maximum 256 kbps, un sunet apropiat unui MP3 la acelaşi bitrate.
      AUPECg2 (Auckland University Perceptual Entropy Coder generation 2) este un format vechi şi care sună decent, comparabil cu MP3 la 128 kbps, dar a cărui calitate nu poate creşte, indiferent de creşterea bitrate-ului. De remarcat, existenţa unui plug-in pentru Winamp.
      LBPack (Low Bitrate Pack) este un codor atât de lent, încât nu poate avea nicio utilitate practică (o melodie este codată în 5-10 minute pe un sistem modern), dar care surprinde prin calitatea foarte bună la bitrate-uri scăzute, chiar şi la 15 kbps sunetul fiind clar, cu toate frecvenţele prezente, dar suferind de zgomot de fond. La bitrate maxim (146 kbps), însă, calitatea lasă de dorit.
      RaveSound sau QDMC (QDesign Music Codec) este urmaşul lui LBPack, devenind codecul audio oficial, prezent în Apple QuickTime 3. Versiunea personală oferă posibilitatea unui bitrate maxim de 48 kbps, iar varianta profesională urcă până la 128 kbps. Este unul dintre cele mai agresive formate existente, în sensul că oferă calitate bună la bitrate-uri foarte scăzute, dar, o dată cu mărirea bitrate-ului, creşterea calităţii se plafonează.
      PAC (Perceptual Audio Coding) face parte din software-ul AudioLib. Este asemănător din toate punctele de vedere lui MP3. Muzica astfel codată este integrată într-o bază de date, singura modalitate de a o asculta fiind folosirea acestui software. În versiunea a doua, denumită ePAC (Enhanced Perceptual Audio Coding), softul suferă îmbunătăţiri majore, în primul rând, de interfaţă.
      Astrid/Quartex AAC este un format care nu are nimic de-a face cu AAC, chiar dacă sună surprinzător de bine la un bitrate de doar 96 kbps. La realizarea acestui codor, au contribuit în cea mai mare măsură sursele preluate de la AudioLib. Executabilele au fost criptate, pentru mai multă siguranţă.
      APE este un format lossless, la care softul pentru codec poartă numele de Monkey’s Audio şi oferă, ca în cazul arhivatoarelor, mai multe nivele de compresie: Fast, Normal, High, Extra High şi Insane, al doilea şi al treilea fiind cele recomandate, iar ultimele două având ca dezavantaj principal procentul mare de procesor consumat la decodare şi, deci, imposibilitatea rulării piesei muzicale pe sisteme foarte lente.
      FLAC (Free Lossless Audio Codec) este tot un format fără pierderi, care oferă 9 nivele de compresie (de la 0 la 8, valoarea 5 fiind recomandată), atât timpul, cât şi rata de compresie diferind în funcţie de acest parametru. Formatul FLAC este susţinut de xipg.org, organizaţia non-profit care se află în spatele formatului Vorbis. Dezavantajul lui, la fel ca al oricărui format lossless, este că rata de compresie este mică şi produce fişiere de dimensiuni mari. Este ideal, însă, pentru înregistrările de muzică clasică. Alte formate de compresie lossless care merită amintite sunt WavPack, RK Audio, Shorten, TTA şi La. Acestea oferă, uneori, rate de compresie mai bune, dar nu prezintă suficiente avantaje pentru a detrona formatele APE sau FLAC. Alte tipuri de fişiere de sunet reprezintă formate proprietar sau sunt dedicate unor aplicaţii specifice: .rol, .snd, .sou, .au, .ul, .iff, .aif, .fssd etc.