1. 看看聲音
聲音是聽的,怎麼能看?大家可以在物理課裡了解到,聲音是一種波,波是起伏的,具有周期性和一定的幅度。周期性表現為頻率,控制音調的高低。頻率越高,聲音就越尖,反之就越沉。比如說男生的聲音都比較低沉,就是因為男生的聲帶較寬,發出的聲音主要集中在低頻部分的緣
故。圖1和圖2就分别是1000Hz和100Hz的聲音波形圖,這兩段聲音的長度都是0.01秒。
圖1 圖2
幅度控制的就是聲音的音量了,幅度越大,聲音越響,反之就越弱。圖3中的波形也是1000Hz 0.01秒,但幅度與圖1不同。說說看,哪個聲音更大?
圖3
2. 電腦發聲
我們說話是靠聲帶的振動,電腦中產生聲音是通過聲卡產生特定的電信號,從而控制喇叭發出聲音。電腦的聲音由于產生機制的不同而分為兩種:合成音樂和數字聲音。
合成音樂指的是根据樂譜去演奏樂器的聲音而組合形成的音樂。目前的主流聲音卡都是使用波表(Wave table)合成法,也就說使用真正樂器的數字聲音來演奏樂譜。影响合成音樂的值量因素主要有:波表數據的真實性、可以同時演奏樂器的通道數(複音數)、是否支持合唱和混响等。在後面將要提到的MIDI就是合成音樂的標準。
數字聲音是指將人聽到的聲音(又稱為類比聲音)進行數字化轉換(量化)後得到的數據。這一轉換過程在使用計算機進行錄音時由聲卡自動完成,又稱為模/數轉換。但由於揚聲器只能接受類比信號,所以聲卡輸出前要還要把數字聲音轉換回類比聲音,也即數/模轉換。
3.聲音質量
影響數字聲音質量的主要原素有三個︰采樣頻率、數字量的位數(簡稱量化位數)以及聲道數。
采樣頻率決定的是聲音的保真度。具體說來就是一秒鐘的聲音分成多少個數據去表示。可以想像,這個頻率當然是越高越好。頻率以kHz(千赫茲)去衡量。44.1kHz表示將一秒鐘的聲音用44100個采樣樣本數據去表示。目前最常用的三種采樣頻率分別為︰電話效果(11 kHz)、FM電台效果(22 kHz)和CD效果(44.1 kHz),市場上的非專業聲卡的最高采樣率為48kHz,專業聲卡可高達96kHz或以上。一般人的耳朵能聽到的頻率範圍是從20Hz到20kHz。而將聲音數字化之所以需要44.1kHz是因為根據采樣原理,采樣頻率至少是播放頻率的兩倍才足以在播放時正確還原。再考慮到有些樂器發出的高於20kHz的聲音對人也有一定的作用,所以定在44.1kHz。
量化位數表示的是聲音的振幅,決定的是音樂的動態範圍,所謂動態範圍是波形的基線與波形上限間的單位。簡單地說,位數越多,音質越細膩。量化位數主要有8位和16位兩種。8位的聲音從最低到最高只有2^8=256個級別,16位聲音有2^16=65536個級別。專業級別使用24位甚至32位。
下面是兩幅關於聲音量化的說明圖︰
聲道數表明在同一時刻聲音是只產生一個波形(單聲道)還是產生兩個波形(身歷聲雙聲道)。顧名思義,身歷聲聽起來比單聲道具有空間感。
聲音數據量一般都被稱為海量數據。這是因為對音質要求越高,數據量就越大。大家平時聽的CD的質量是44.1kHz、16位的身歷聲音樂,一分鐘這種質量的聲音就需要10M位元組的存儲空間。因此,需要採用壓縮技術,才能方便地進行聲音的傳送。比如現下非常流行的MP3,就是一種壓縮技術。這就涉及到了聲音的處理。
4.數字聲音處理
數字聲音的處理主要分為三個方面︰壓縮、編輯和效果處理。
我們剛才談到的MP3技術就是對數字聲音的壓縮處理的一種。目前有很多種對聲音進行壓縮的方法,各有不同的應用範圍,比如程控交換電話中的是ADPCM(差分脈波編碼調製),手機中用的是GSM,而對於音樂,用的就是MP3了。
壓縮的目的就是降低數據量,以便於傳輸,這一過程稱為編碼。而在播放時,便需要有一個解碼的過程,將壓縮了的數據還原為可以直接播放的數字聲音。比如現下非常流行的WINAMP,就是從播放MP3這一個功能起家的。
聲音的編輯常常是進行分段、組合、首尾處理等,類似於我們對文本進行編輯。效果處理也常常放在編輯操作中同時進行。常用的處理有回聲處理、倒敘處理、音色效果處理等等。在這裡給大家介紹一個適合入門者使用的中文免費軟體︰WaveCN。大家可以到http://www.wavecn.com/去下載。
5.音質的判斷
在對數字聲音進行處理時,都希望得到效果好的聲音,可究竟怎么樣才算效果好呢?除了前面提到的那幾個基本原素之外,還有一些主觀上的音質判斷,比如清晰與混濁、圓潤與發毛、臨場感、立體感等等。
音質判斷一般都需要受過專業訓練的人才能掌握,不過也有普通人也可以明白的,比如立體感。立體感就是聽者能否根據聲音的變化去判斷音源的位置。對於遊戲玩家來說,遊戲中的聲音是否具有立體感是非常重要的。現下許多流行的遊戲都在這方面狠下工夫,力求給玩家營造置身其中的感覺。比如Need For Speed系列,很早就已經支援Dolby環繞身歷聲,增加駕駛的真實感;又如Delta Force這一類第一人稱射擊遊戲透過支援Direct Sound 3D技術來使得玩家可以透過敵人開槍的聲音來判斷敵人的方位、子彈的來路(否則就死得不明不白了)。
在這裡介紹了這么多,其實只是電腦聲音這門學科中的一小部分,在計算機領域裡聲音的應用是非常廣泛的,包括語音識別、語音合成等等,以後慢慢就會接觸到的了。
沒有留言:
張貼留言