Vizualizarea şi editarea fişierelor audio
1.
Obiectivul lucrării
Scopul acestei lucrări este
familiarizarea cu modurile de vizualizare şi de editare ale
fişierelor de tip audio, abordarea fiind aceea de a evidenţia cele
mai frecvente operaţii care se execută în prelucrarea sunetului digital.
2.
Introducere teoretică
2.1. Captarea sunetelor
Sunetul este un fenomen
fizic care stimulează simţul auzului. La oameni auzul are loc când
vibraţiile de frecvenţe între 20 şi 20.000 de hertzi ajung la
urechea internă. Hertzul, sau Hz, este unitatea de măsură a
frecvenţei, egal cu o perioadă pe secundă. Astfel de
vibraţii ajung la urechea internă când sunt transmise prin aer.
Microfonul este singurul
aparat electroacustic capabil să capteze oscilaţiile sonore naturale,
motiv pentru care acestea sunt denumite şi surse primare de semnal.
Microfoanele captează semnalele produse în spaţiul înconjurător,
transformând oscilaţiile acustice (mecanice) în oscilaţii electrice,
obţinându-se la bornele acestora semnale electrice de
audiofrecvenţă.
Undele sonore lovesc diafragma, făcând-o
să vibreze. Cu cât diafragma este mai subţire, cu atât va putea
reproduce mai bine frecvenţele înalte ale sunetelor. Vibraţia
mecanică a diafragmei este transformată în semnal electric de
către traductor. Carcasă oferă, pe lângă protecţie
pentru diafragmă şi traductor, posibilitatea de control a
caracteristicii de directivitate a microfonului.
2.2. Conversia analog-digitală a semnalelor
audio
Un convertor
analog-digital (CAD) eşantionează semnalul analogic la diferite
valori de timp. Fiecare eşantion va fi apoi transformat într-un
număr, pe baza valorii amplitudinii sale. Astfel, dacă se folosesc
mai multe puncte de eşantionare, semnalul analog de la ieşirea
convertorului digital-analog (CDA) va avea o calitate mai ridicată.
Dezavantajul este că, odată cu numărul de eşantioane,
creşte şi volumul de date, fiind nevoie de un spaţiu de stocare
mai mare.
Pentru
a fi siguri că nu se foloseşte o frecvenţă de
eşantionare prea mică, deteriorându-se astfel semnalul, sau una prea
mare, care va creşte considerabil spaţiul de stocare necesar, se
poate folosi teorema lui Nyquist, care spune că frecvenţa de
eşantionare trebuie sa fie dublul frecvenţei maxime din spectrul
semnalului analogic:
![]()
2.3. Compresia fişierelor audio
Fişierele
de tip wave (*.wav) stochează muzica în acelaşi format care se
regăseşte pe un CD. Astfel, calitatea sunetului este cea mai
bună, însă şi mărimea fişierelor este cea mai mare.
Din această cauză au fost create, prin intermediul compresiei audio,
alte formate care încearcă să micşoreze dimensiunea
fişierelor, fără să afecteze prea mult calitatea
înregistrării.
Compresia audio este o
formă a compresiei de date concepută special pentru a reduce
mărimea fişierelor audio stocate. Algoritmii generici de compresie de
date nu au un efect prea bun asupra datelor audio, reuşind să
reducă mărimea unui fişier audio cu maximum 13%. De aceea au
fost creaţi algoritmi speciali pentru compresie audio.
3.
Descrierea aplicaţiei
Meniul
aplicaţiei Audio Editor are două butoane, File şi Edit
(vezi figura 1). Submeniul File conţine butoanele Open, Save
şi Recent Files, iar Edit conţine butoanele Undo,
Redo, Select All, Cut, Copy şi Paste.

Fig. 1. Submeniurile File
şi Edit.
Pentru încărcarea unui fişier audio în
aplicaţie se apasă Open, după care se caută şi
se selectează fişierul dorit (vezi figura 2).

Fig. 2. Fereastra Open.
O altă metodă de
încărcare a fişierelor este opţiunea Recent Files. Pentru
a salva un fişier se foloseşte opţiunea Save.
După încărcarea unui fişier audio, acesta poate fi
vizualizat în fereastra principală (vezi figura 3).

Fig. 3. Fişier audio încărcat
în aplicaţie.
Se pot selecta porţiuni de semnal prin
apăsarea butonului stânga al mouse-ului şi tragerea suprafeţei
de selecţie până se acoperă porţiunea dorită (vezi
figura 4). Dacă selecţia efectuată nu este cea dorită, se
poate ajusta cu ajutorul operaţiei clic dreapta.

Fig. 4. Selecţie de date.
Datele selectate apar
încadrate de două bare de selecţie, de culoare roşie, pe un fundal
de culoare gri. Aceste date pot fi tăiate sau copiate folosind
opţiunile de Cut (vezi figura 5) sau Copy din submeniul Edit.
Datele salvate în clipboard se pot lipi cu opţiunea Paste,
înlocuind astfel selecţia curentă (vezi figura 6). Dacă nu
există date selectate, lipirea se va face în dreptul cursorului. Toate
aceste operaţiuni se pot modifica cu ajutorul butoanelor de Undo şi
Redo.

Fig. 5. Operaţia Cut
aplicată selecţiei precedente.

Fig. 6. Operaţia Paste.
În bara de unelte (vezi figura 7) se află
butoanele aferente redării unui fişier audio: Play, Pause,
Stop, butoane de Open şi Save, şi butoane de
zoom: Zoom In, Zoom In Selection, Entire Signal şi Zoom
Out.

Fig. 7. Bara de unelte.
Butonul Play
redă datele selectate. Dacă nu există date selectate, acesta
redă fişierul audio, de la locaţia curentă a cursorului,
până la final. În cazul în care se apasă butonul Play în
timpul redării audio, se opreşte redarea curentă şi se
începe o nouă redare, de la început.
Butonul Pause
întrerupe redarea, aceasta putând fi reluată din acelaşi loc prin
apăsarea aceluiaşi buton. Butonul Stop opreşte redarea,
aceasta nemaiputând fi reluată din locul în care a rămas. Butoanele Open
şi Save au aceeaşi funcţionalitate ca cele din submeniul File.
Pe lângă butoanele de
Zoom In şi Zoom Out, mai există încă două
butoane. Butonul Zoom In Selection (vezi figurile 8 şi 9)
aplică o operaţie de mărire asupra zonei selectate, astfel încât
doar aceasta apare pe ecran. Butonul Entire Signal foloseşte o
operaţie de micşorare, astfel încât să poată fi vizualizat întreg semnalul.

Fig. 8. Folosirea operaţiei Zoom
In Selection.

Fig. 9. Efectul Zoom In Selection pentru selecţia precedentă.
4.
Desfăşurarea lucrării
Partea I
1. Se porneşte aplicaţia Audio
Editor. Alternativa la rularea kitului de
instalare (AudioEditor_pkg.exe) este lansarea directă din Matlab (audioeditor.m). Se va
adăuga în Matlab calea (Add Path) către directorul care
conţine fişierul sursă şi fişierele adiacente (pentru
detalii despre compilatorul Matlab, vezi
fişierul readme.txt).
2. Se deschide un fişier audio de tip *.wav la alegere.
3. Se folosesc butoanele Play, Pause şi Stop.
4. Se foloseşte butonul Zoom In pentru a vizualiza semnalul în
detaliu.
5. Se foloseşte butonul Zoom Out pentru a reveni la vizualizarea
iniţială a semnalului.
6. Folosind operaţia de clic şi drag cu mouse-ul se
selectează o porţiune de semnal la alegere.
7. Folosind operaţia de clic dreapta se modifică selecţia
creată anterior.
8. Se foloseşte butoanele Zoom In Selection şi Entire
Signal, notându-se efectele acestora.
9. Se creează o nouă selecţie. Se notează modul în care a
fost făcută selecţia.
10. Folosind butonul Copy din submeniul Edit se copiază
selecţia curentă.
11. Se deplasează cursorul într-un punct la alegere. Acest lucru se
realizează prin efectuarea operaţiei clic în punctul dorit.
12. Se lipeşte secţiunea copiată în punctul ales anterior.
Pentru aceasta se foloseşte butonul Paste din submeniul Edit.
13. Se repetă acţiunile de la punctele 10¸12, folosind butonul Cut în loc de Copy.
14. Se repetă punctul 13 pentru lipirea cu Paste a porţiunii
tăiate prin înlocuirea unei alte porţiuni de semnal selectate la
alegere (în loc de a deplasa cursorul într-un punct la alegere, se creează
o nouă selecţie, care va fi înlocuită).
Partea a II-a
1. Se deschide un fişier audio de tip *.wav din directorul cu sample-uri
de bătăi de tobe.
2. Se folosesc cele 4 butoane de operaţii de tip zoom pentru a vizualiza
semnalul sau porţiuni ale acestuia în detaliu.
3. Se folosesc butoanele de redare pentru a asculta atât întregul fişier,
cât şi o parte de semnal selectată la alegere.
4. Se editează structura fişierului audio cu ajutorul
operaţiilor Cut, Copy şi Paste. Operaţiile Paste
se fac atât într-un punct la alegere, cât şi prin înlocuirea unei
părţi de semnal selectate (pentru efectuarea unei tăieturi cât
mai precise, se folosesc operaţiile de tip zoom)
5. Se notează paşii efectuaţi pe parcursul acestei
editări.
Partea a III-a
1. Se deschide un fişier audio de tip *.wav din directorul cu
înregistrări de chitară.
2. Folosind cunoştinţele acumulate în primele două
părţi ale lucrării de laborator, se editează structura
semnalului audio, astfel încât mesajul rezultat să difere de cel original.
3. Se salvează fişierul rezultat cu un nume de forma NumePrenume.wav.
4. Se notează paşii efectuaţi pe parcursul acestei
editări.
5.
Întrebări
1.
Care este banda de
frecvenţe a auzului uman?
2.
Care este modul de
funcţionare al unui microfon?
3.
Care este frecvenţa de
eşantionare minimă necesară pentru a converti un semnal audio
analogic în unul digital, fără ca urechea umană să
detecteze deteriorări ale calităţii?
4.
De ce a fost necesară
dezvoltarea compresiei dedicate semnalelor audio?
5.
Ce alte formate de
fişiere audio, în afară lângă *.wav, mai cunoaşteţi?
6.
După ce s-a efectuat
operaţia de Zoom In, cum se poate reveni la vizualizarea întregului
semnal, fără a folosi butonul Zoom Out?
7.
Care este diferenţa
dintre operaţia de Zoom In şi cea de Zoom In Selection?
8.
Care este principalul
avantaj al butonului Zoom In Selection?
9.
În ce condiţii este
recomandată folosirea butonului Entire Signal?
10.
Cum se poate modifica o
selecţie deja efectuată?
11.
Cum se poate asculta doar o
porţiune din semnalul audio?
12.
Prin ce metodă se pot
face tăieturi precise în semnalul audio?
13.
Care este diferenţa
(din punct de vedere al reluării redării audio) dintre butonul Stop
şi butonul Pause?
14.
Care sunt
particularităţile fişierelor audio obţinute din semnale
instrumentale de tobe şi de chitară? Dar faţă de cele
obţinute din semnale vocale?
15.
Ce alte programe de editare
audio aţi mai utilizat până în prezent?
16.
Propuneţi
completări şi optimizări pentru aplicaţie.