新功能!蘋果正在申請(qǐng)專利 希望訓(xùn)練Siri解讀唇語
摘要:①蘋果公司的一項(xiàng)新專利申請(qǐng)正試圖讓Siri增加一項(xiàng)新功能,通過動(dòng)作檢測(cè)來讀取唇語; ②通過檢測(cè)嘴部和頭部的運(yùn)動(dòng),Siri將提高它解讀唇語的準(zhǔn)確性; ③此舉還將使Siri音頻傳感器的能耗減少。
財(cái)聯(lián)社8月4日訊(編輯 周子意)據(jù)專業(yè)媒體報(bào)道,未來的蘋果設(shè)備可能會(huì)使用動(dòng)作檢測(cè)來讀取唇語,這樣就可以在不需要麥克風(fēng)的情況下觸發(fā)Siri的指令。
蘋果想給Siri增添一個(gè)功能,例如檢測(cè)用戶嘴部和頭部的運(yùn)動(dòng),并可能會(huì)提高它的準(zhǔn)確性。蘋果公司的一項(xiàng)名為“使用運(yùn)動(dòng)感應(yīng)進(jìn)行關(guān)鍵字檢測(cè)”的新專利申請(qǐng),正試圖做到這一點(diǎn)。
該專利申請(qǐng)稱,“(數(shù)據(jù))將從運(yùn)動(dòng)傳感器接收”,例如,當(dāng)用戶發(fā)出語音輸入時(shí),記錄用戶的唇部和頭部運(yùn)動(dòng),并確定運(yùn)動(dòng)數(shù)據(jù)的一部分是否與一個(gè)或多個(gè)單詞的參考數(shù)據(jù)相匹配。
蘋果公司的這一想法也是出于對(duì)Siri現(xiàn)有缺陷的考量:如果音頻傳感器收到環(huán)境噪音或其他用戶的語音,語音控制系統(tǒng)可能會(huì)導(dǎo)致誤報(bào)。
動(dòng)作檢測(cè)
但這并不意味著蘋果計(jì)劃推出一些沒有麥克風(fēng)的設(shè)備,相反,蘋果公司提出,這種運(yùn)動(dòng)檢測(cè)可能意味著Siri能夠分時(shí)段地關(guān)閉麥克風(fēng)地音頻傳感器設(shè)備。該傳感器目前始終處于開啟狀態(tài),用于不斷收聽“Siri”或“Hi, Siri”等語音。
蘋果公司指出,“即使用戶沒有主動(dòng)使用語音控制,持續(xù)地音頻檢測(cè)和處理音頻數(shù)據(jù)也會(huì)消耗電力和處理能力。”
“當(dāng)用戶說話時(shí),用戶的嘴、臉、頭和脖子會(huì)移動(dòng)和振動(dòng)…加速度計(jì)和陀螺儀等運(yùn)動(dòng)傳感器可以檢測(cè)到這些運(yùn)動(dòng),而這些與麥克風(fēng)等音頻傳感器相比,它們消耗的能量相對(duì)較少。”
不過,這種唇部動(dòng)作檢測(cè)的方式事實(shí)上存在一定的缺陷。它對(duì)于一些常規(guī)命令能夠起作用,例如“播放音樂”或“查看天氣”等;但當(dāng)口頭命令不太常見時(shí),那么動(dòng)作檢測(cè)可能會(huì)因?yàn)槿狈⒖紨?shù)據(jù)而失效。
為了規(guī)避這一點(diǎn),蘋果公司設(shè)想,只要?jiǎng)幼鳈z測(cè)足夠快,當(dāng)發(fā)現(xiàn)用戶說“Siri”這個(gè)詞的時(shí)候,設(shè)備就能夠及時(shí)打開麥克風(fēng),捕捉到其他聲音。