東芝演示Cell圖像識別處理過程

中國視聽網資訊更新時間：2010-1-20 11:22:13　編輯：溫情　[ 大中小 ]

　　東芝運用圖像識別技術，在CEATEC會場現場演示了利用圖像推測人體姿勢進行動作捕捉的“活動捕獲術 SHADOW”。此技術使用了“Integral Image”等幾種特殊技術。下面就來詳細報道一下具體的處理過程。

　　首先，處理過程如下。

　　（1）拍攝彩色圖像：拍攝240×320像素的彩色圖像。
　　（2）分離出人物影像：以背景圖像的色調（綠色）信息為依據，分離出背景以外的區域。此次演示假定，背景外的區域內只有一人。因此，除了背景之外所有的區域都是人物影像。這樣就可以得出背景部分的像素值為零，人物區域為1的2值圖像。
　　（3）對比姿勢數據：將這種2值圖像與姿勢數據庫進行比對，從姿勢數據庫中的4萬個姿勢的數據（28個關節角度數據）中篩選出最接近的圖像。
　　（4）畫出CG人物：以（3）中篩選出圖像的姿勢對應的關節角度數據為依據畫出CG。

　　此次使用的系統每秒可以進行10次判斷，所以Cell每l00ms進行一次處理。處理過程中最繁重的是檢索姿勢。雖說僅是進行人物區域的圖像的相關演算，但是將240×320像素的圖像與數據庫中4萬張圖像直接做比對的話，即使使用的是高速的Cell，也很難進行實時識別。

通過Integral Image提高比較速度

　　因此，東芝這次在人物影像的比對過程中做了兩方面的努力。首先，為了提高對比速度，采用了被稱作“Integral Image”的方法。Integral Image首先提前算出某一區域內的像素總和，這次比對過程中算出了各行像素和。利用Integral Image，可以使相關演算的量降至幾百分之一。另外，姿勢數據庫再將根據關節角度數據畫出的CG模型進行平面投影，生成人物影像的圖像。

　　其次，將姿勢數據庫中相似的姿勢排列成3層樹結構。樹的最上層按大體的姿勢分成幾類，首先對這一層進行比對、篩選。判斷結果出來后再進行下一層的對比。檢索處理中，樹結構的每一分枝都由Cell的七個SPE分別處理，是并行處理。