解讀 云視鏈背后的“讀眼”技術
來源:數字音視工程網 作者:黃通兵 編輯:航行150 2015-07-30 15:19:42 加入收藏 咨詢

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯系方式: | |
咨詢內容: | |
驗證碼: |
|
今天整個科技圈都被云視鏈霸了屏,又是一個青年才俊創業的勵志故事,22歲就擁有哈佛大學高材生、創業公司CEO、6億估值、福布斯創業榜單最年輕創業者等諸多光環,而透過這些光環我們該看一看云視鏈是否真的有看起來那么cool。
看看媒體是怎么說的吧:
拋開用戶在觀看視頻過程中是否愿意那么多的互動(廣告)不說,今天主要探討一下,一聽就覺得吊炸天的通過捕捉眼球信息來實現觀眾情緒和思維在視頻中的實時反饋互動。
作為眼球追蹤行業的從業者,我的分析可能讓很多剛剛有點興奮的讀者失望了,從報道中所提到的云視鏈的技術來看,通過普通家用攝像頭捕捉人眼注視點可是沒那么容易實現的!
1、技術現狀
目前在世界范圍內眼球追蹤技術的實現主要是通過眼電圖法、鞏膜接觸鏡法、眼圖錄像法、角膜反射法。
眼電圖法應用較早,它是通過放置于眼鏡附近的電極測量皮膚的電勢差,實現眼動測量。
眼電圖法在40年前就已經廣泛應用,至今仍有部分領域使用此法測量。
鞏膜接觸鏡法是將光學部件置于一個接觸鏡上,并將接觸鏡輕置于眼球上,這種方法在5°范圍內可以達到5“~10”的精度,因此也是被認為精度最高的眼球追蹤法。但是因為操作精度高,并且對于人眼有一定的傷害因此并未廣泛應用。
以上兩種方法普及性太差,對于普通用戶來說根本無法實現。
眼圖錄像法主要是通過辨認眼球的特征如瞳孔外形、異色邊緣(虹膜、虹膜邊界)、近距指向光源的角膜反射來實現眼動跟蹤。
根據云視頻的宣傳,其所提到的能夠讀懂人“眼神意識”的視頻技術,就是基于此項技術,也就是眼圖錄像法。
2、技術實現的硬傷在哪里?
然而虹膜識別+瞳孔運動識別雖然可以捕捉人眼的動作,但是卻無法檢測到人眼的注視點,這才是最大的硬傷!
首先,虹膜識別和瞳孔識別都是基于一個平面的,要測量注視點就必須保證頭部是固定的,讓眼睛同頭部和注視點的相對位置一致才可以。人眼作為人體最精細的器官之一,注視點轉移僅需要一個微小的動作,而人類僅僅因為呼吸而造成的頭部動作就足以讓測量誤差造成定位偏移。
然后我們再退一萬步講,即使的頭部是固定的,對于虹膜的識別也沒那么容易,歐洲人的人眼特征較為明顯,識別相對容易,但也不是一個家用普通攝像頭就可以判斷眼球特征的,而亞洲人瞳孔多為深褐色,人眼特征較弱,普通攝像頭幾乎無法捕捉。
因此從云視鏈的眼球追蹤技術的出發點來說,通過眼神就能推送出你想要的信息是無法實現的!
那么,云視鏈的視頻與觀眾眼神關注點的實時反饋也是根本無法實現的嗎?其實并非如此。
剛也已經提到,云視鏈以虹膜識別+瞳孔運動識別為出發點的,就是這個起點讓他們走錯了路。不知道有沒有細心的讀者注意到,其實眼球追蹤技術的實現還有一種方法我沒有說?那就是角膜反射法。接下來就介紹一下這種可以通過普通攝像頭即可捕捉人眼注視點的方法,搬好板凳,買好瓜子。
角膜反射法是目前眼球追蹤領域被廣泛認可并應用的方法,主要通過攝像頭捕捉人眼特征,通過算法建立人眼二維或者三維注視點估計模型,通過算法判斷人眼動作和注視點。
眼球的特殊構造會形成一到多個浦肯野像,基于這種方法的眼球追蹤一般定位第一浦肯野像,通過定標步驟,可以測量出在垂直平面現實定標點表面上人眼的注視點。
來張示意圖看看:
為了從頭部運動中區分眼球動作,需要眼球上的兩個參考點。這種瞳孔中心與角膜反射之間的位置差異之隨眼球轉動而變化,同輕微的頭部運動相對恒定,不管瞳孔在眼眶中如何轉動,浦肯野像同眼球相對固定。目前我在七鑫易維了解到的眼球追蹤算法,已經做到了頭部的正常動作不影響注視點的判斷,并且采用紅外弱光進行彌補了亞洲人人眼特征不明顯的問題,可以很精準地捕捉到人眼的注視點。可以說,這樣的技術已經不是問題。
根據大腦——眼睛一致性假設,人們所看的一般是其大腦中正在處理的內容,這是人類視覺系統的工作方式。基于這個假設,采用眼動跟蹤技術來研究人類心理已有近百年的歷史。在人機交互過程中,注視等同于注意力。
所以說云視鏈的“讀眼神”完全可以實現,但是路徑要正確。
以“眼神推薦系統”為例。
首先,根據角膜反射技術及相關算法,完全可以捕獲到用戶的注視點。接下來,可以對用戶的注視目標進行模式識別(例如,識別出他注視的形狀是一個紅色的女士手提包)。進而可以根據用戶的瀏覽記錄提取一些框架信息,比如,用戶看的都是紅色、細帶的手提包,并且注視點經常停留在包的發行時間上,可以推斷這個用戶目前就是想買一個紅色的細帶手提包,而且很關注它是不是新上市的潮流產品;可以通過分析瞳孔直徑的變化,推斷用戶的情緒。
在以上三點的基礎上,完全可以給用戶實現精準推送,匹配某寶、某東的物品給用戶。這和很多購物網站上的“猜你喜歡”之類的標簽某種意義上原理是一致的,不過過去只能通過分析用戶點擊、分析購物車等操作才能記錄喜好,現在只要一個眼神。從對用戶認知的把握與實現簡易程度兩個層面來講,可以說,眼動跟蹤技術產生的數據非常寶貴,且是其他輸入通道所無法替代的。
對于眼球追蹤技術方面產業鏈,國內目前有很多,而真正實現技術突破的并不多,這也導致國人對新技術狂歡。但是,反觀眼球追蹤方面的突破給特定人群帶來的希望也很勵志,比如“中國的霍金”王甲用眼睛寫出了兩本書,漸凍人“好想飛”也用眼睛打字開起了網店。這些都是技術帶來的美好。
視覺在人類獲取信息渠道所占比例超過80%,注視點信息就是視覺信息中最重要的,眼球追蹤技術會給很多行業帶來翻天覆地的變化,也會孕育出新的偉大公司,但絕不會是沒有核心技術的忽悠型公司。
(本文作者黃通兵,系七鑫易維CEO,眼控行業相關人士。本文僅代表作者個人觀點)
評論comment