登錄|注冊|收藏首頁|簡體|繁體
首頁評論時政台灣華人國際財經娛樂文史圖片社區視頻專題創投吉林南粵商城創新中原招商縣域環保創投成渝移民書畫IP電視華商滾動
海外網>>時政

百度人臉識別搜索是怎麼實現的?

2013年01月25日17:28    來源:創事記        字號:
摘要:對於搜索引擎而言,尋找圖片之間的內在聯系,與常見的關鍵詞搜索並沒有本質區別——都是通過關鍵特征的比對,按照一定的邏輯規則完成匹配。然而不同之處也是顯而易見的,以圖片為輸入發起的搜索,存在多種搜索含義的可能。

如果用戶給出一張圖片,百度識圖會判斷裡面是否出現人臉,如果有,百度識圖在相似圖片搜索之外,同時會全網尋找出現過的類似人像。

來源:新浪創世紀

如果用戶給出一張圖片,百度識圖會判斷裡面是否出現人臉,如果有,百度識圖在相似圖片搜索之外,同時會全網尋找出現過的類似人像。

如何通過一張圖片,找到另一張圖片?

對於搜索引擎而言,尋找圖片之間的內在聯系,與常見的關鍵詞搜索並沒有本質區別——都是通過關鍵特征的比對,按照一定的邏輯規則完成匹配。然而不同之處也是顯而易見的,以圖片為輸入發起的搜索,存在多種搜索含義的可能。

比方,一張圖片可能既包括風景又包括人,用戶想要尋找的是類似風景、類似布局結構的圖片還是類似的人?谷歌以圖搜圖功能,甚至可以根據一張圖片猜出拍攝地,但並不會嘗試對圖片中的人物精確匹配。多數搜索引擎都會如此。

而且大部分以圖片作為輸入的搜索引擎,例如tineye(2008年上線)、搜狗識圖(2011年上線)等,本質上是進行圖片近似拷貝檢測,即搜索看起來幾乎完全一樣的圖片。2010年推出的百度識圖(shitu.baidu.com)也是如此。

在經歷兩年多的沉寂之后,百度識圖開始向另一個方向探索。

上周的百度年會中,李彥宏特意提到百度識圖:“以圖搜圖的准確率從20%提升到80%”。不過與之前相比,百度識圖找到相似圖片的能力似乎並未顯著提升,那麼改變從何而來?李彥宏把這種明顯的提升歸因於剛上線的人臉識別搜索。

與之前的區別在於,如果用戶給出一張圖片,百度識圖會判斷裡面是否出現人臉,如果有,百度識圖在相似圖片搜索之外,同時會全網尋找出現過的類似人像。

新增加的技術簡而言之,首先是人臉檢測並提取出特征表達,隨后再據此進行數據庫對比,最后按照相似度排序返回結果。其實,人臉檢測並不是新技術,相關研究已有三十年歷史,然而直到去年底,百度才決定推動這一技術付諸實施。

這裡面自然有戰略層面的考慮。兩年前,李彥宏就對未來做出讀圖時代的判斷﹔去年的KDD大會上,李彥宏提出的九大待解技術挑戰中,基於內容的圖像搜索技術被列在第三﹔現實層面百度的圖片相關產品、雲相冊等均對這一技術有需求。

百度還希望借助這一途徑,挖掘圖片之間的聯系,進而激發二次瀏覽。然而要把想法變為現實,百度至少要解決兩個問題:一是算法,二是數據。

——算法方面。同樣是基於圖片進行搜索,人臉識別和以圖搜圖並不一樣。百度資深工程師陶吉告訴創事記,百度人臉識別首先並不關注完整的圖像結構,其次顏色也沒有任何意義。最主要的特征表達來自於臉部紋理,並進行一些再加工。

具體算法作為商業機密,難以對外界披露。不過資料顯示,目前人臉識別算法中LBP是比較流行的一種特征提取方式,即通過像素周邊8個臨近像素的灰度值和中心灰度值比較,得到一個八位編碼,然后再根據編碼的直方圖進行分類。

而影響算法效果的因素還可能包括預處理、特征選擇、特征點定位精度、分類器設計和后處理乃至各種方式的融合、閾值選擇等各個方面。

一張圖片中,人臉至少有40×40像素(約一個指甲蓋大小),才會被當作有效的識別對象。如果一張圖片中多個人像,目前百度的解決辦法是僅識別尺寸最大的那個,未來百度將提供焦點選擇功能,用戶可以通過選點確定搜索對象。

——數據方面。算法的改善如果算是充分條件,數據的處理則是必要條件。從機器搜索的角度看,光照、姿態、表情、角度等因素,均是影響巨大的因素,所謂“笑和不笑,都是不同”。所以用來訓練的數據量越大,變化的包容性就越好。

人臉識別搜索實際使用時,同一張人臉積累的數據越多,越能在匹配對比時提供更好的支持。為此百度需要把全網近百億規模的圖片抽取出來,然后把沒有人臉的數據去掉,再海量掃描一遍,建立起盡量高效的索引。

人臉識別引入搜索引擎,必然會加劇外界關於隱私泄漏的擔心。百度強調人臉搜索隻會在公開的信息范圍內進行,封閉的個人相冊並不會被觸及。

這還涉及准確率、召回率等概念。假設數據庫裡有一百張劉德華的圖片,用劉德華的頭像發起搜索,前50張結果中40張是真正的劉德華,那麼前50張的召回率就是40%,准確率是80%。同樣假如數據庫中隻有兩張路人甲的圖片,當用路人甲的頭像發起搜索,前50張可能隻有1張真正的路人甲,那麼前50張的召回率是50%,准確率是2%。

由於名人在網上的照片較多,能被用戶感知到的准確率要比普通人高很多,而召回率是用戶感知不到的。據透露,人臉識別搜索技術會在百度雲相冊內部進一步結合,幫助用戶在圖片之間建立聯系,而且未來不排除開放API的可能。

除了上述技術討論之外,從百度的研發體系看,人臉識別搜索也頗具代表性。

這個先后投入幾十個工程師、百度基礎技術部的多媒體部門負責核心算法的項目,去年11月下旬立項,12月底就已經上線運行。這個速度在百度並不常見,因此也有人半開玩笑的說這是百度近期“改作風”運動成效的代表。

值得注意的是百度新成立的基礎技術部。這個部門由百度首席科學家王海峰帶領,並且直接向李彥宏匯報。據說一些李彥宏會親自參與一些重點項目。自然語言處理、互聯網數據挖掘、多媒體、推薦和個性化等技術研發,均由百度基礎技術部負責。

還是在百度年會上,談及近期遇到的挑戰,李彥宏稱百度不會忽視渠道的價值,但技術才是未來產業的關鍵。“相信技術的力量,未來就在我們手裡”,李彥宏發出這樣的號召。顯然,百度的“變奏”已是必然要上演。

(孟鴻)

分享到:

(責編:王昕)

視頻 >

  • 女毒販讓嬰兒吸毒女毒販讓嬰兒吸毒
  • 女生學校裡遭群打女生學校裡遭群打