首先揩悄,VR得益于三維游戲的發(fā)展卖哎,而AR收益于影視領(lǐng)域的跟蹤技術(shù)(video tracking)的發(fā)展。從技術(shù)門檻的角度來說删性,VR亏娜、AR和移動端重合的技術(shù)有:顯示器、運動傳感器蹬挺、處理器维贺、儲存&記憶、無線連接……所以在硬件上巴帮,這些都不是技術(shù)難點溯泣。
VR、AR的難點都在感知和顯示榕茧,感知是一種mapping垃沦,VR mapping的是一個lighthouse的空間或者PS camera mapping的一個交叉;在顯示上用押,VR如何精準(zhǔn)地匹配用戶的頭部產(chǎn)生相應(yīng)的畫面肢簿,AR則在這基礎(chǔ)上算出光照、遮擋等情況并讓圖像通透不干擾現(xiàn)實中的視線蜻拨。
而VR硬件的難點在于光學(xué)的鏡片技術(shù)和位置追蹤技術(shù)池充,因為以前的移動端不涉及這些技術(shù)。
而AR的硬件難點在于顯示和感知缎讼,顯示最大的難點在于accommodation收夸,因為用戶看見虛擬物體固定在2-3米的位置,而現(xiàn)實物體卻可以前后聚焦血崭,如果這時虛擬物體放在現(xiàn)實物體上卧惜,則會引發(fā)輻輳→用戶聚焦錯亂厘灼;而在感知上,即使是有Kinect是十幾年積累的hololens序苏,它已經(jīng)做到世界第一了手幢,可它的spatial mapping仍需要花費很多時間去掃描去建模捷凄,至限在狹小的室內(nèi)走來走去忱详,而在室外就完全失效了。
當(dāng)然跺涤,也因為這些技術(shù)的門檻匈睁,導(dǎo)致硬件價格居高不下。
正因為此桶错,AR行業(yè)一片冷寂航唆,而VR行業(yè)非常火爆院刁,因為VR的技術(shù)門檻比AR低一個數(shù)量級糯钙,VR更容易成功。
而從軟件角度來說退腥,現(xiàn)階段視覺上的難點比較多:
VR的核心技術(shù)是tracking(追蹤)和CG(計算機圖形)任岸。三自由度的方向追蹤,六自由度的位置追蹤(見《追蹤設(shè)備的使用場景和覆蓋范圍有哪些局限狡刘?是否會影響VR可交互的空間的設(shè)計享潜?》)
而AR的核心技術(shù)主要是
計算機視覺(computer vision)
物體識別(object recognition)。
包括人臉識別
區(qū)域識別
如果說廣義的VR和AR還包括其他的交互方式嗅蔬,比如語音識別(speech recognition)
手勢識別(gesture recognition)
最近上Stanford的CV課學(xué)到的幾個知識點搬上來——
AR要把虛擬物體整合(integrate)到現(xiàn)實環(huán)境中來剑按,它需要攝像頭來建立現(xiàn)實空間的坐標(biāo)系。
三種圖像配準(zhǔn)(image registration):
1. interest points(興趣點)
2. fiducial markers(基準(zhǔn)標(biāo)記)
3. optical flow(光流)
幾種圖形處理( image processing):
1. corner detection(角點檢測)
2. blob detection(斑點檢測)
3. edge detection(邊緣檢測)
4. thresholding(閾值)
根據(jù)上面的圖像配準(zhǔn)(image registration)和圖形處理( image processing)建立現(xiàn)實世界的坐標(biāo)系統(tǒng)(real world coordinate system)澜术。