東芝運用圖像識別技術,在CEATEC會場現場演示了利用圖像推測人體姿勢進行動作捕捉的“活動捕獲術 SHADOW”。此技術使用了“Integral Image”等幾種特殊技術。下面就來詳細報道一下具體的處理過程。
首先,處理過程如下。
(1) 拍攝彩色圖像:拍攝240×320像素的彩色圖像。
(2) 分離出人物影像:以背景圖像的色調(綠色)信息為依據,分離出背景以外的區域。此次演示假定,背景外的區域內只有一人。因此,除了背景之外所有的區域都是人物影像。這樣就可以得出背景部分的像素值為零,人物區域為1的2值圖像。
(3) 對比姿勢數據:將這種2值圖像與姿勢數據庫進行比對,從姿勢數據庫中的4萬個姿勢的數據(28個關節角度數據)中篩選出最接近的圖像。
(4) 畫出CG人物:以(3)中篩選出圖像的姿勢對應的關節角度數據為依據畫出CG。
此次使用的系統每秒可以進行10次判斷,所以Cell每l00ms進行一次處理。處理過程中最繁重的是檢索姿勢。雖說僅是進行人物區域的圖像的相關演算,但是將240×320像素的圖像與數據庫中4萬張圖像直接做比對的話,即使使用的是高速的Cell,也很難進行實時識別。
通過Integral Image提高比較速度
因此,東芝這次在人物影像的比對過程中做了兩方面的努力。首先,為了提高對比速度,采用了被稱作“Integral Image”的方法。Integral Image首先提前算出某一區域內的像素總和,這次比對過程中算出了各行像素和。利用Integral Image,可以使相關演算的量降至幾百分之一。另外,姿勢數據庫再將根據關節角度數據畫出的CG模型進行平面投影,生成人物影像的圖像。
其次,將姿勢數據庫中相似的姿勢排列成3層樹結構。樹的最上層按大體的姿勢分成幾類,首先對這一層進行比對、篩選。判斷結果出來后再進行下一層的對比。檢索處理中,樹結構的每一分枝都由Cell的七個SPE分別處理,是并行處理。
更多相關: AV集成
©版權所有。未經許可,不得轉載。