光場攝影機應用於三維手勢分類
  • 領域:電機與電子工程
  • 研發教師:王敬文
  • 技術說明: 自西元1833年第一組立體影像的出現以來,大多都是採用兩眼視差法來拍攝立體影像,所謂兩眼視差法是由於人類的左右兩眼有大約6.5公分的距離差,因此在接收到 的影像有些微的差距,所以兩眼同時分別接收到的影像可以使觀看者有立體影像的效果,由此發展出以兩台或以上平行架設的攝影機模擬人兩眼視物的情況來拍攝立體影像的陣列式攝影機手法,然而這種拍攝方法不僅在架設拍攝環境時耗時費工,而且由於兩台攝影機之間的位置及光線差異,在重建影像的時候會受到影響而產生誤差,所以近年來發展的目標在於獨立的三維攝影機,以減少三維影像的取得困難。

    隨著3D顯示技術的成熟,對立體影像的研究也日新月異,由於三維影像不僅擁有傳統攝影所能夠獲得的平面影像,還進一步提供了深度資訊,就辨識而言能夠保有更多的特徵資訊。本研究使用光場攝影機拍攝三維手勢影像,毋須複雜的架構與前處理程序,以單一鏡頭即可直接取得輪廓及實心手勢影像,可免除額外產生的誤差。拍攝時先以曝光片對微型鏡頭陣列進行校正,確保良好的取像設置,調整適當的深度參數以分別擷取出輪廓及實心手勢影像。在進行手勢辨識時採取兩種系統架構:(1)使用主成分分析獲取所需的特徵向量,並以最近相鄰法進行識別;(2)利用二維自我主成分分析結合基因演算法對特徵向量進行挑選,以馬氏距離作為分類依據,分別對平面旋轉、深度旋轉、以及用於模擬真實情況下光線干擾的雜訊添加等變異情況,檢驗兩種系統架構的對各種情況的容忍度。實驗結果若能與預期相同,達到較高的辨識率,對於未來實際運用上有著更多的變化,也更能調整往使用的攝影方式來達到更高的效能。
  • 創新特色: 目前三維攝影機大致上可分為三類:(圖1(a))是ToF(Time of Flight)攝影機[1],是利用飛行時間法的原理,由攝影機所發射出的紅外線打中待測物體反射後傳回感應器所需的時間,來計算出待測物體與攝影機的距離,以灰階影像來表示深度資訊;(圖1(b))為Kinect攝影機[2],該攝影機是採用Light Coding技術,利用發射的紅外線照射在物體上產生散斑,對空間進行編碼標記,以感應器紀錄訊號後,由晶片計算出具有深度的影像。上述兩種三維攝影機在使用上皆有其侷限性,ToF攝影機由於所得僅為灰階影像及深度資訊,在實際應用上仍須與傳統RGB攝影機結合,以獲得對應像素的深度數值,因此需要額外設置校對目標物,以進行位置校正。而Kinect則會受限於晶片處理速度,只能處理VGA畫質的影像。第三類為本研究中所使用的光場攝影機(圖1(c))[3],此攝影機的成像原理,是在相機的主鏡頭與高畫素影像感測器中間加入一片特製微型鏡頭陣列,透過主鏡頭的折射,可以將景物的影像聚集到微型鏡頭陣列前,透過微型鏡頭將此聚集的影像再成像,並投射到高畫素影像感測器,其優點在於只需單一攝影機一次取像,即可得到立體影像和深度資訊圖,不需與其他攝影機並用,減少環境因素所導致的誤差。本研究以光場攝影機所拍攝影像進行手勢辨識,觀察包含深度資訊之影像於各種情況下的容忍度,嘗試以簡便而迅速的方法達成良好的辨識效果。

瀏覽人次:330