近日,北京健康寶更新,“他人健康碼代查詢”可通過人臉識別、姓名和身份證信息進行認證授權,家庭成員、安保人
員等可通過此功能為老人、兒童提供幫助。從疫情防控健康碼查驗、交通安檢等公共應用到金融支付、出入門禁等,人臉
識別應用已經深入到人們生活的方方面面。從技術角度來看,當前人臉識別發展狀況如何?不同應用場景下對人臉識別技
術要求有何不同?如何解決日益凸顯的個人信息保護問題?針對業界關注的這些問題,《人民郵電》報記者分別采訪了中國
信通院云計算與大數據研究所人工智能部副主任石霖和北京郵電大學“鴻雁人才”特聘教授鄧偉洪。
多元應用場景多維度評判人臉識別效果
20世紀60年代有研究人員開始研究人臉識別,進入初級應用階段是在90年代后期,從發展歷程來看,人臉識別重點的
研究領域、研究方法是什么?
鄧偉洪:人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術。它涵蓋采集包含人臉的圖像或視頻流,
檢測和跟蹤人臉,精確定位到面部特征點,并進行特征提取和比對識別的一系列相關技術。
近年來,除了身份識別,性別、年齡、種族、情緒等人臉屬性,甚至某些遺傳病、抑郁癥、性格傾向等隱含特征,也可
以被識別。20世紀70年代以來,該研究經歷了五官幾何特征、像素變換特征、局部濾波特征和深度卷積神經網絡四類主流技
術路線。目前,主流的深度卷積神經網絡推動了人臉識別的廣泛應用,在很多場景的識別準確率已經超過了人眼。
石霖:人臉識別技術經歷了傳統機器學習和深度學習的技術發展階段。傳統方法依賴于人工設計的特征與機器學習技術
的組合。自2014年引入深度學習方法后,人臉識別技術發展迅猛,識別效果開始超過傳統機器學習,并呈現出訓練數據規模
越來越大、識別精度越來越高的趨勢,目前在人臉識別領域,深度學習已經取代了傳統機器學習。當前,基于深度神經網絡
的人臉識別在權威數據集LFW(Labeled Faces in the Wild)上的識別準確率達到了99.5%以上,遠超出了人眼的97.52%,
也隨之帶來了人臉識別商業應用的爆發式增長。
評判人臉識別效果的主要標準是什么?
石霖:描述人臉識別性能的指標主要包括準確率、錯誤接受率、錯誤拒絕率。盡管近年來人臉識別技術的準確性已大大提
高,但隨著人臉識別應用的逐漸深入,僅從性能維度進行評價并不能滿足特定場景下的實際需求。
我們認為,要全面客觀的評價人臉識別的應用效果,需要看人臉識別系統本身是否具備能夠被用戶信任的技術能力。隨著
人臉識別的大規模應用,頻繁出現系統被黑灰產攻破、用戶個人信息被泄露、人臉技術濫用、對部分人群的識別結果存在偏見
等負面新聞,這些問題也逐漸成為用戶對人臉識別系統是否信任的關鍵。因此,為有效回應用戶關切,我們認為需要圍繞安全
可靠、透明性、數據保護、明確責任、公平性五個可信特征,結合其使用場景來評價人臉識別系統是否具備相應的可信能力。
鄧偉洪:傳統的標準主要是準確率。對于1∶N的識別應用,準確率就是從數據庫中精確搜索出目標人物的正確概率。針對
高鐵、機場等1∶1的驗證應用,準確率是指在很低的錯誤接受率下的本人驗證通過率。在準確率已經滿足使用需求的今天,人們
開始追求更加全面的識別效果,包括在口罩遮擋、側臉、年齡變化等極端條件下的穩定性、對抗樣本攻擊和活體攻擊的安全性,
以及在多人種人臉識別下的公平性等。
對相似性比較高的情況(比如跨年齡、跨姿態)怎樣保證識別的準確性?應用的主要算法、研究方法是什么?
鄧偉洪:目前主流的方法是深度卷積神經網絡,該網絡結構能夠提取像素、邊緣、五官、屬性等多層次的人臉特征,對年齡
、姿態甚至整容等外觀變化有很強的適應性。模型參數的學習主要依靠海量的人臉數據驅動完成,通過學習訓練數據中同一人的
多張年齡、姿態等變化的圖片,并增強同一人的這些圖片特征的一致性。經過數百萬甚至數億圖像的訓練后,網絡可以獲得對年
齡、姿態等穩定的識別準確率。
石霖:使用更大、更具有代表性的數據集,更好地遵守圖像質量標準以及其他措施。
日??记?、銀行辦理業務、健康寶等都需要“刷臉”,在不同應用場景下,對人臉識別的技術要求有何不同?
石霖:不同業務場景下對于人臉識別的技術要求存在很大的差異,主要體現在易用性和安全性兩個方面。在樓宇門禁、考勤
打卡等通常有人值守的低風險場景下,需要在提升通行效率的同時,實現人員身份的核驗,一般不會受到黑灰產的惡意攻擊,因
此易用性相對來說是更為重要的考量因素。
而在線上業務辦理、刷臉支付、大額轉賬等涉及用戶人身財產安全且通常為無人值守的高風險場景下,需要確保人臉識別不
因受到黑灰產攻擊而失效,因此需要最大限度地提升人臉識別本身的安全性。除此之外,在金融、政務等行業的部分場景中,人
臉識別只是用戶身份認證的一個因子,通常還包括姓名、身份證號、卡號以及手機驗證碼等其他因子,以確保人臉識別被攻破的
情況下,身份認證業務不被繞過。
鄧偉洪:除了所有應用都有的準確率要求,特定應用場景下還需要考慮兩個方面:易用性和安全性。例如,門禁考勤等應用
為了保證大人流下的通過效率,會適當調低人臉驗證的閾值,保證絕大多數人可以快速通過,避免反復拍照驗證。
從可用走向可信多元共治形成合力
在安全性方面,人臉識別準確性面臨哪些威脅?目前比較有效的解決思路是什么?
鄧偉洪:隨著人臉識別的廣泛應用,各類安全性威脅是伴生出現的。打印人臉照片、顯示屏播放人臉、三維打印面具甚至硅膠
面具等越來越逼真的活體攻擊手段,對人臉識別的安全性帶來極大挑戰。同時,常用的深度卷積神經網絡本身還存在內在的漏洞,
攻擊者可以通過優化方法生成對抗噪聲來控制人臉的識別結果,由于疊加在圖像上的對抗噪聲幅度很小,從外觀上人們還難以發現
異常。
正如俗話說的“未知攻,焉知防”,目前的防御方法都是針對不斷演進的攻擊手段設計的。例如,采集各類活體攻擊視頻,生
成對抗攻擊的樣本作為訓練樣本,專門學習區分正常和異常樣本的分類器來進行防御。但這些方法都不能從根本上解決問題,攻擊
和防御方法呈現迭代優化的態勢。
石霖:從技術上看,在一些特定的實驗條件下人臉識別確實已經達到了99%以上的準確率,但在實際應用場景中,表情、年齡
變化、遮擋、光照強度等因素,都會影響人臉識別的準確率。對于人臉識別準確率,可以考慮從三個方面進行提升:一是在確保訓
練數據的可靠、可追溯的前提下,拓展訓練數據集,做到全面、準確;二是優化人臉識別技術流程,確保前端采集到的人臉圖像滿
足后續識別的質量要求;三是結合實際應用中的反饋,做好算法模型的升級迭代。
從應用上看,人臉識別作為一種身份認證技術,同密碼、指紋等傳統身份認證技術一樣,都存在一定被攻破的概率,現階段尚
不存在百分之百安全的技術,黑灰產常用的呈現攻擊、注入攻擊,以及更為前沿的對抗樣本攻擊,均有可能造成人臉識別失效。
中國信通院云大所依托“可信人臉應用守護計劃”已開展了兩輪針對人臉識別系統安全性的評測,著重檢驗了人臉識別系統抵
御電子圖像攻擊、合成視頻攻擊等主流黑灰產攻擊手段的能力。在評測中我們發現,當前移動端人臉識別系統普遍采用了移動端和
服務端聯動的方式進行活體檢測,具體呈現形式包括“動作”“動作﹢唇語”等,能夠有效區分真人與各種呈現類攻擊。另外,部
分人臉識別系統能夠通過設備安全檢驗、鏈路安全校驗、動態調整相機參數等方式有效識別非攝像頭實時錄制的注入視頻,從而進
行攔截。
人臉識別技術發展成熟的標準是什么?未來的發展趨勢是什么?
石霖:人臉識別作為一項近年來快速發展的生物識別技術,盡管在金融、政務、安防、交通、教育、醫療等行業得到了廣泛應
用,但也暴露出在實際場景下的準確性降低以及安全和合規等一些需要解決的問題。長遠來看,人臉識別技術和應用發展的不斷成
熟,需要政府主管部門、科研機構、法律機構、技術提供方、技術使用方以及用戶方共建一個良性的生態環境,中國信通院云大所
發起的“護臉計劃”,就是聯合社會各界組建的一個開放平臺,也歡迎各方積極參與,共同提升全行業的安全合規能力,促進產業
的健康發展。
目前,在開展護臉工作的過程中,我們也看到人臉識別技術產業的發展呈現出了以下幾個趨勢。一是多種認證技術融合。人臉
識別雖然能帶來良好的用戶體驗,但并不是百分百安全的技術,以金融行業為例,越來越多的機構開始采用“動作活體﹢炫彩活體”
“人臉識別﹢聲紋識別”等身份認證方式,提升系統整體的安全性。二是從業廠商主動“合規”。隨著《數據安全法》《個人信息保
護法》等相關法律法規的出臺,越來越多的人臉識別從業者加入“護臉計劃”,尋求合規的產品設計、研發方案,這些從業人員多數
來自新零售、金融行業,在實際從業過程中直接接觸大量的人臉信息,主動“合規”的意愿也越來越強。三是探索人臉識別替代性技
術。我們也發現,一些人臉識別的從業者迫于合規的壓力,在部分場景放棄了使用人臉識別,轉向了研發和使用人體識別、掌紋識別
等新的識別技術,這些技術在一定程度上規避了法律上的合規風險,但其實際的應用效果和安全性都有待考驗,也都是“護臉計劃”
需要跟蹤和探索的新方向。
鄧偉洪:人臉識別技術發展成熟的標準應該是“可信”,“可信”的內涵十分豐富,至少包括高于人眼的識別準確率和穩定性、
對各類群體具有公平一致的識別效果、應對各類惡意攻擊的防御能力,以及對識別結果的可解釋性等。未來的技術發展趨勢是從目前
的“可用”走向“可信”,從唯“準確率”的跑分走向多元發展的識別技術。
小貼士
人臉識別技術發展關鍵點
初識人臉識別
人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術。它涵蓋采集包含人臉的圖像或視頻流,檢測和跟蹤人臉,
精確定位到面部特征點,并進行特征提取和比對識別的一系列相關技術。
技術發展階段
自2014年引入深度學習方法后,識別效果開始超過傳統機器學習,并呈現出訓練數據規模越來越大、識別精度越來越高的趨勢,
目前在人臉識別領域,深度學習已經取代了傳統機器學習。
如何保證高相似度情況下的識別準確性?
目前主流的方法是深度卷積神經網絡,該網絡結構能夠提取像素、邊緣、五官、屬性等多層次的人臉特征,對年齡、姿態甚至整
容等外觀變化有很強的適應性。
“未知攻,焉知防”
為應對各類安全性威脅,目前的防御方法都是針對不斷演進的攻擊手段設計的。例如,采集各類活體攻擊視頻,生成對抗攻擊的
樣本作為訓練樣本,專門學習區分正常和異常樣本的分類器來進行防御。
加入“護臉計劃”
人臉識別技術和應用發展的不斷成熟,需要政府主管部門、科研機構、法律機構、技術提供方、技術使用方以及用戶方共建一個
良性的生態環境。
隨著《數據安全法》《個人信息保護法》等相關法律法規的出臺,越來越多的人臉識別從業者加入推動產業健康發展的“護臉計
劃”,尋求合規的產品設計、研發方案。