【中國數字視聽網訊】1.引言
在視頻監控領域,提高監控圖像質量和編碼傳輸效率一直是我們最為重要的追求目標。提高視頻質量意味著提高最終用戶的觀看滿意度,提高編碼效率則意味著在同樣的碼率限制下可以傳輸更高質量的視頻。這涉及到監控系統中的多個環節,從上游的實際場景,到中間的傳輸網絡,再到下游的用戶終端,主要包括圖像的采集、壓縮處理、傳輸或存儲、解壓縮和顯示等部分,其中任何一個上游環節出了問題,對圖像質量的影響都不是下游環節能夠糾正或補救的。視頻信號的預處理處在系統最上游,是針對主處理而言的,如圖1所示。在視頻監控中,主處理一般是指視頻的壓縮編碼和傳輸,此前的處理一般稱之為預處理,常將它歸并在視頻采集部分。無疑,視頻采集中的預處理是一個重要環節,處理的好壞將直接影響采集圖像質量以及后續編碼傳輸處理的效率。

有一個現象可以有力地說明預處理在改進圖像質量方面的作用:對同樣場景、采用相同的碼率,不同廠家的網絡攝像機解碼輸出視頻的質量往往存在較大的差別。尤其是在比較惡劣的環境下,其差別更為顯著。產生這種差別的一個重要原因在于:在監控系統中,雖然大家都采用標準化的視頻壓縮方法,但最后解碼輸出圖像的質量高低很大程度上取決于有無預處理、預處理的好壞,有時還包括適當的后處理。
近來,隨著人們對預處理重要性認識的不斷提高,隨著集成芯片和信號處理器能力的不斷增強,業界對視頻信號的預處理越來越重視,市場上高質量的監控產品一定離不開高質量的視頻預處理方法。
2.預處理的作用
視頻預處理的第一個作用是提高編碼視頻的質量。在實際的視頻監控的應用中,不像娛樂視頻,往往有高質量的攝像機、良好的演播室拍攝環境和專業技術人員的時時人為干預,因此可以保證得到的高質量的采集視頻。而視頻監控系統由于成本、環境等因素影響,所獲取的原始視頻質量并不高,甚至很低。例如,由于環境、噪聲、光照、運動等影響,往往所采集的圖像常常出現模糊、扭曲、噪點、太亮或太暗、彩色不鮮明、……。對于這樣比較差的視頻,再進行壓縮、傳輸、解碼顯示,用戶所看到的監控視頻常常不能令人滿意的。如何在現有的條件下提高采集視頻質量的問題就實在地放在我們面前。對此,一個重要的應對措施就是在視頻采集環節進行預處理(preprocessing),以利于提高采集視頻質量,有利于后續的視頻處理,以利于用戶提取視頻中感興趣的信息。
視頻預處理的第二個作用是提高編碼效率和有利于碼率控制。我們知道,無論是有線還是無線視頻傳輸,都是基于IP的包傳輸方式,信號的傳輸速率不穩定,速率會隨用戶的擁擠程度、信道的物理介質而不斷變化。要在這樣速率變化的信道上穩定、高效地傳輸壓縮視頻圖像,除了依賴編碼器的碼率控制之外,還可以利用預處理的方法來輔助實現。在編碼前對圖像進行預處理,控制輸入到編碼器的視頻數據量,從而來間接控制編碼器輸出的碼率,其過程仍可參見圖1。
由圖1可見,不僅通過緩沖區的滿溢程度來控制量化步長,同時也加上了預處理對輸入的視頻數據進行控制。例如,當信道變窄時,我們可以根據信道帶寬信息對輸入視頻進行一定程度的平滑濾波,減少細節,甚至進行下采樣處理、跳幀處理,使編碼視頻的碼率能與信道帶寬相匹配。當然,由于信道狀況信息的獲得比較麻煩,可以經統計學習建立信道帶寬變化的近似模型,再依據這個模型來決定預處理的方法和程度。
最早的視頻預處理是在模擬域進行的,包括對模擬視頻信號的限帶濾波、噪聲抑制、自動增益控制、白平衡以及r校正等。隨著視頻采集技術的數字化進程,這些簡單的預處理方法大多已經集成到芯片中去了,F在,視頻預處理都是在數字域進行的,即在視頻數字化采集以后進行,充分發揮了數字信號處的方便、高效、靈活和一致的優越性。目前,在視頻監控中常見的預處理方法除了基本的圖像濾波、圖像去噪和多種圖像增強處理外,還出現了多種針對特殊應用環境的預處理方法,如背光或暗光處理、雨霧煙處理、感興趣區間的處理等。
3.常見的預處理方法
現在常見的效果明顯的視頻預處理主要包括下面的幾個方面。
3.1 限帶濾波和降采樣
根據奈奎斯特定理,只有對圖像進行高于兩倍信號最高頻率的采樣才能保證從采樣值完全恢復原圖像。但是如果該條件不滿足,即欠采樣時,高次諧波的頻譜就會疊加到基波,出現頻譜混疊效應。隨著圖像高清晰度的增加,由于采樣率的限制,絕大多數成像系統都存在不同的混疊現象。怎樣消除混疊效應成為了預處理中的一個令人關注的問題。
抑制或消除混疊效應常采用兩項措施,一是限帶濾波,二是下采樣。限帶濾波就是對高速采樣的數字視頻進行一次低通濾波,抑制奈奎斯特定理定義的通帶以外的高頻分量。因為這些帶外分量在后續的處理中會引起混疊效應,產生無意義的高頻分量,而編碼器還得對它們進行編碼,浪費不少寶貴的編碼比特。僅采用限帶濾波只能濾除信號中少量的高頻分量,如果信號帶寬遠高于奈奎斯特帶寬,那么在限帶濾波后還需進行一次下采樣,進一步減少碼字。
3.2 噪聲去除
噪聲對于任何實際的視頻采集來說均是不可避免的,如果在編碼前未將不必要的噪聲去除,不僅會影響解碼視頻質量,而且后面的編碼部分還將為噪聲編碼,降低了效率。視頻中常見的噪聲主要有加性噪聲、乘性噪聲和量化噪聲等。圖像中的噪聲往往和信號交織在一起,尤其是乘性噪聲,如果濾波不當,就會使圖像本身的細節,如邊界輪廓、線條等,變得模糊不清。如何既平滑掉噪聲又盡量保持圖像細節,是圖像去噪的難點所在。
圖像去噪方法很多,它們大體上可以分為兩類:空間域的去噪方法和變換域的去噪方法。這兩類方法的最主要區別是前者直接對觀察圖像數據進行處理,而后者則是先對圖像進行某種變換,然后再對變換后的系數進行處理。
變換域的去噪方法認為,在變換域圖像往往是稀疏表示的,即高頻分量很少,大部份噪聲處于高頻部分,通過在變換域設置閾值或者截斷高端頻譜來去除噪聲。這類方法的優點是在變換域進行處理比較簡單。它的不足之處在于對閾值的設置比較困難;在去除噪聲的同時不可避免地會平滑圖像本身的紋理細節;圖像在變換域丟失了部分結構特征,特別是邊界信息等。這些都會影響去噪圖像的質量! 】臻g域的去噪方法關注圖像數據本身,如近年來流行的基于塊的去噪方式,其基本思想是為去噪圖像的每一個塊尋找與它相似的塊,相似塊可以在同一幀內部尋找,或者其它幀中尋找,還可在其它圖像中尋找,最后通過加權平均等操作恢復圖像塊。空間域的方法利用了更多的圖像數據信息,保留圖像的結構,有利于保持圖像細節,但也容易出現過平滑現象。近年來針對圖像的混合高斯噪聲,出現了一種將變換域和空間域方法相結合的自適應噪聲去除方法。這種方法首先采用基于塊和濾波的噪聲參數估計,自適應的估計混合高斯噪聲參數,然后利用估計得到的噪聲參數進行圖像去噪,將多幅去噪圖像進行簡單的數據融合,最終獲得性能良好的去噪圖像,其過程如下圖2所示

3.3 圖像增強
圖像增強處理的任務是有目地突出圖像中的感興趣部分,或目標的特征,抑制圖像中某些不需要的特征,提高圖像的清晰度,改進圖像的觀賞質量。在圖像增強過程中,一般不考慮圖像降質的原因,增強后的圖像也不一定要逼近原圖像。圖像增強中常見的幾種具體處理方法為:
(1)直方圖均衡
在圖像處理中,圖像直方圖表示了圖像中像素灰度值的分布情況。為使圖像變得清晰,增大反差,凸顯圖像細節,通常希望圖像灰度的分布從暗到亮大致均勻。直方圖均衡就是把那些直方圖分布不均勻的圖像(如大部分像素灰度集中分布在某一段)經過一種函數變換,使之成一幅具有均勻灰度分布的新圖像,其灰度直方圖的動態范圍擴大。用于直方均衡化的變換函數不是統一的,它是輸入圖像直方圖的積分,即累積分布函數。
(2)灰度變換
灰度變換可使圖像動態范圍增大,對比度得到擴展,使圖像清晰、特征明顯,是圖像增強的重要手段之一。它主要利用圖像的點運算來修正像素灰度,由輸入像素點的灰度值確定相應輸出像素點的灰度值,可以看作是“從像素到像素”的變換操作,不改變圖像內的空間關系。像素灰度級的改變是根據輸入圖像f(x, y)灰度值和輸出圖像g(x, y)灰度值之間的轉換函數g(x,y)=T[f(x,y)]進行的。
灰度變換包含的方法很多,如逆反處理、閾值變換、灰度拉伸、灰度切分、灰度級修正、動態范圍調整等。
(3)白平衡
白色是人眼對比例相同且具有一定亮度的藍、綠、紅三種色光所形成的視覺反應。在正常的情況下,視頻采集系統對白光的輸出為白色,簡單地說這個系統處于白平衡狀態。如果系統對白光不能夠保持白色輸出,出現偏色,如發紅或發藍等,就說明采集系統對現場彩色的處理出現了偏差,即未達到白平衡。由于場景的彩色情況非常復雜,難以斷定白平衡情況,所以在實際應用中,常常用白光來判定系統的白平衡狀況。這是一種衡量系統的色彩比例是否恰當的一種方便、直觀的方法。如果達到了白平衡,那么輸出的色彩也是白色,沒有其它的偏色;如果有偏色,說明沒有達到白平衡,需要在預處理時加以調整,使之成像后仍然為白色。
(4)伽瑪校正
在視頻采集系統中,CCD、CMOS等光電轉換的器件的特性都是非線性的。場景的亮度L和是傳感器輸出的電壓E,之間的關系可用一個冪函數E(x, y)=kLr(x, y)來表示,其中k是比例常數,r是冪函數的指數,用它來衡量非線性器件的轉換特性,稱之為伽瑪特性。在視頻中由于伽瑪特性的存在,會導致圖像信號的亮度失真,影響圖像質量。因此要對這個失真進行補償,即伽瑪校正。簡單地說,就是對輸出電壓用一個負指數函數對其進行校正,使得校正后的光、電兩個量之間保持線性關系。
(5)圖像平滑
在空間域中進行平滑濾波技術主要用于消除圖像中的噪聲,主要有鄰域平均法、中值濾波法等等。這種局部平均的方法在削弱噪聲的同時,常常會帶來圖像細節信息的損失。
鄰域平均,也稱均值濾波,對于給定的圖像f(x,y)中的每個像素點(x,y),它所在鄰域S中所有M個像素灰度值平均值為其濾波輸出,即用一像素鄰域內所有像素的灰度平均值來代替該像素原來的灰度。
中值濾波,對于給定像素點(x,y)所在領域S中的n個像素值數值{f1, f2,…,fn},將它們按大小進行有序排列,位于中間位置的那個像素數值稱為這n個數值的中值。某像素點中值濾波后的輸出等于該像素點鄰域中所有像素灰度的中值。中值濾波是一種非線性濾波,運算簡單,實現方便,而且能較好的保護邊界。
(6)圖像銳化
采集圖像變得模糊的原因往往是圖像受到了平均或者積分運算,因此,如果對其進行微分運算,就可以使邊緣等細節信息變得清晰。這就是在空間域中的圖像銳化處理,其的基本方法是對圖像進行微分處理,并且將運算結果與原圖像疊加。從頻域中來看,銳化或微分運算意味著對高頻分量的提升。常見的連續變量的微分運算有一階的梯度運算、二階的拉普拉斯算子運算,它們分別對應離散變量的一階差分和二階差分運算。
(7)小波變換增強
對圖像進行小波變換,可得到圖像的不同頻率分量的小波變換系數,如果對適當的高頻系數進行增強處理后,再進行小波逆變換之后,就可以達到圖像的細節或邊緣增強的目的。當然,小波變換還可以用來去除圖像中的噪聲。由于噪聲大多屬于高頻信息,因此,當進行小波變換之后,噪聲信息大多集中在高頻子塊之中,對這一部分系數進行抑制,則可以達到一定的噪聲去除效果。

