var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://#/hm.js?bbed808a7e81aea9265f249f4cb59cdb"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })();
伴隨著城市化進程的不斷加快和城市經(jīng)濟的高速增長,以及人們安全意識的不斷提高,對視頻監(jiān)控的需求越來越強烈,其應用場景和使用環(huán)境也越來越豐富。不同的場景需求對視頻監(jiān)控技術提出了更高更復雜的要求,不僅僅要高清,更要智能。顯然已經(jīng)從過去的“看得見”、“看得清”到如今的“更好看”、“更易看”。
就像對手機拍照像素需求的與日俱增一樣,人們現(xiàn)今已經(jīng)很難再接受分辨率低、噪聲大、動態(tài)范圍低的視頻圖像了。這不僅要求安防企業(yè)在光學部件的選擇上不斷追求更高的品質,在視頻圖像處理技術上更是不能落后。目前主流的視頻圖像處理技術都在與時俱進,以滿足用戶不斷變化的需求,這里介紹一下當今比較熱門、比較前沿的圖像處理技術的發(fā)展情況。

這只是一個很籠統(tǒng)的稱呼,對低照表現(xiàn)的要求是指在缺少光照的環(huán)境條件下仍然能展現(xiàn)出清晰明亮、色彩豐富、較低噪聲的視頻圖像,pg星光級相機就是在這種需求下應運而生的。該技術不僅對傳感器、鏡頭的品質有很高的要求,還涵蓋了ISP(圖像信號處理)中的夜間圖像增強、2D 降噪、3D 降噪等技術, 同時如何權衡以上功能,以得到最優(yōu)質的畫面表現(xiàn),也是對ISP 調校技術的考驗。
寬動態(tài)技術可以分為數(shù)字寬動態(tài)和多幀寬動態(tài)兩種。數(shù)字寬動態(tài)是指,對單幀圖像利用色調映射技術使得畫面的暗區(qū)和亮區(qū)同時能夠看清,即增大圖像動態(tài)范圍。而多幀寬動態(tài)則是通過對同一場景獲取多幀曝光程度不同的圖像,然后利用圖像融合和運動估計技術,將多幀畫面合成一幅,以達到同樣的目的。由于多幀寬動態(tài)獲得的信息較單幀多,因此通常情況下可以獲得更大的動態(tài)范圍,和更自然的視覺感觀。
![]() 數(shù)字寬動態(tài)處理前(左)和處理后對比 | ![]() 多幀寬動態(tài)處理前(左)和處理后對比 |
品質再高清的相機,也可能由于人為拍攝的原因或者被拍攝物體本身的運動而導致:,分為失焦:馱碩:街智榭。模糊本身在數(shù)學上來說,是清晰圖像與擴散函數(shù)卷積的結果,因此去:褪且桓瞿婢砘墓,失焦模糊和運動:鬧饕畋鶚搶┥⒑問繳系牟鉅。
![]() 失焦模糊處理前(左)和處理后對比 | ![]() 運動:砬埃ㄗ螅┖痛硨蠖員 |
視頻圖像透霧增強技術,一般指將因霧氣、水氣和灰塵等導致畫面朦朧不清的因素去除,使畫面重新變得清晰通透,恢復原有的色調、飽和度,獲得了良好的圖像質量與視覺感受。pg的透霧技術,已不再局限于簡單的對比度增強而已,而是通過對霧霾濃度建模,獲得大氣分布情況,進而有針對性的去除,保持畫面自然,并且不會丟失任何有用信息。

另外值得一提的是,與利用圖像處理算法進行透霧增強技術各有所長的,還有pg的光學透霧技術。其原理主要是利用近紅外波段對大氣的穿透性要優(yōu)于可見光波段,因而能在濃霧霾情況下,獲得可見光圖像所獲取不到的信息。

提高圖像分辨率最直接的辦法就是提高采集設備的傳感器密度,然而高密度的圖像傳感器價格相對昂貴,在一般的應用中難以承受,同時傳感器陣列密度目前也已接近極限。解決這一問題的有效途徑是采用基于信號處理的軟件方法對圖像的空間分辨率進行提高,超分辨率重建技術可以分為單幀超分辨率重建和多幀超分辨率重建。單幀超分辨率通常是利用學習的方法對低分辨率圖像進行恢復;多幀超分辨率的核心思想是用時間帶寬(獲取同一場景的多幀圖像序列)換取空間分辨率,實現(xiàn)時間分辨率向空間分辨率的轉換。
近幾年來隨著監(jiān)控行業(yè)的發(fā)展以及平安城市等大型工程的建設, 成千上萬的視頻圖像給廣大工作人員帶來無力管理和監(jiān)看等問題。應用智能分析技術對視頻畫面中的海量數(shù)據(jù)進行高速分析, 過濾掉用戶不關心的信息, 僅僅為監(jiān)控者提供有用的關鍵信息, 從而解決了視頻量大工作人員無力監(jiān)管等問題, 因此受到越來越多的關注。
目前國內智能分析技術已經(jīng)不再局限于檢測和識別,還逐漸發(fā)展為跟蹤預測、行為分析等眾多應用。檢測是指通過前景提取等方法對畫面中物體的移動進行檢測,通過設定規(guī)則來區(qū)分不同的行為,例如拌線、周界等;識別是指利用模式識別技術對畫面中所需要監(jiān)控的物體進行針對性的建模,從而達到對視頻中的特定物體進行檢測、識別、分類等相關應用,例如智能檢測與識別、車型識別等;跟蹤是指對識別到的特定物體的運動軌跡進行跟蹤預測,在視頻圖像序列中表示感興趣的物體或者將不同時間序列中出現(xiàn)的物體濃縮進短短幾分鐘的畫面,例如視頻濃縮、摘要等;行為分析是指對運動物體的行為進行判斷,并在使用者設定的條件下進行自動告警與記錄,如離崗、徘徊、打架斗毆以及表情分析等。
智能處理的壓力通常集中在性能上,如何在有限的服務器資源上同時滿足更多路智能分析的需求,是除了算法效果以外開發(fā)者需要關注的另一個重要問題。目前越來越多的高速處理器得到普及,除了DSP 以外,GPU 和FPGA 的主流廠家如Intel、Nvidia、AMD、Altera 等紛紛推出基于OpenCL 平臺的通用計算開發(fā),pg也基于GPU 和FPGA 進行了一系列的智能分析算法的優(yōu)化加速。
GPU 與CPU 的差別在于更少的邏輯控制單元和更多的算術運算單元。由于GPU在邏輯判斷方面的弱勢,導致其通常不會用作主控芯片,而是與CPU 配合使用,處理大量數(shù)據(jù)計算問題。而針對數(shù)據(jù)交互的瓶頸問題, 各大廠家也各自開發(fā)出unifymemor y 等解決方案,減少數(shù)據(jù)拷貝。

控制密集型(Control Int ensive),例如searching、parsing 等等,適合于CPU 的任務并行處理。數(shù)據(jù)密集型(Data Intensive),例如圖像處理、數(shù)據(jù)挖掘等等,適合于GPU 的數(shù)據(jù)并行處理。
計算密集型(Compute Int ensive),例如迭代操作、金融建模等等, 適合于FPGA 的流水線并行處理。
GPU 的單指令多數(shù)據(jù)并行(SIMDParallelism)工作方式和FPGA 的流水線并行(Pipeline Parallelism) 工作方式對比如下圖10 所示。GPU 是硬件固定的(fixed hardware), 同一個處理單元在每個時鐘周期可以加載不同的指令,但是在每個時鐘周期都是處理的同一條指令,并且無論處理何種指令,都必然占用一整個流處理器的資源(包括指令發(fā)射器、寄存器等);而FPGA 相當于是指令固定的(fixed instructions),每個時鐘周期數(shù)據(jù)流水似的經(jīng)過不同的處理,這在運行過程中不會發(fā)生變化,而不同的操作會消耗不同的資源,這在關注Performance PerWatt 時可能會有更好的表現(xiàn)。
另外一個重要的差別是遇到分支時,盡管GPU 和FPGA 都不像CPU 那樣善于處理分支,它們會把分支都進行處理,但二者的做法也很不一樣。GPU 由于為單指令多數(shù)據(jù)操作,只能通過時間上的“堆疊”,一條分支一條分支的處理,這種情況下GPU 的效率明顯降低; 而FPGA 可以通過硬件的“堆疊”來同時處理多個分支,當然需要以犧牲資源為代價,如下圖11 所示。
![]() SIMD 并行與流水線并行對比 | ![]() SIMD 并行和流水線并行分支行為的對比 |
視頻圖像處理技術未來的發(fā)展趨勢,絕對不僅僅是局限在技術本身而已。如何與其他技術結合、融合,來創(chuàng)造出更靈活、更人性化的應用,適應物聯(lián)網(wǎng)浪潮的發(fā)展,才是未來值得關注的方向。