在智能手機時代,圖像識別、人臉識別一直是人工智能和機器學(xué)習(xí)領(lǐng)域的熱點技術(shù),這些技術(shù)也給手機用戶帶來了非常實用的功能。據(jù)外媒最新消息,在日前的一個云計算技術(shù)大會上,谷歌對外展示了一個新技術(shù):可以識別視頻中的物體和內(nèi)容,這也是機器學(xué)習(xí)研究的重大新成果。
過去,諸多公司已經(jīng)能夠利用人工智能技術(shù),對于圖片文件中的人臉或物體進行識別,比如Facebook公司就推出了人臉識別,從而搜尋出含有自己面孔的好友照片,或是對手機拍攝的海量照片進行分類管理。據(jù)美國科技新聞網(wǎng)站TheVerge報道,日前谷歌舉行了云計算相關(guān)的一個大會,在大會上,谷歌負責(zé)人工智能和機器學(xué)習(xí)研究的負責(zé)人李飛飛女士,介紹了谷歌人工智能研究的新成果,以及可以供外部開發(fā)者利用的新接口等。
李飛飛在大會上展示了“視頻智能API”。通過這一技術(shù),谷歌能夠識別視頻當(dāng)中的各種動物、物體、風(fēng)景等內(nèi)容。比如在一個演示中,谷歌很快識別出視頻中出現(xiàn)了一條達克斯狗。
在另外一個視頻搜索演示中,用戶搜索“沙灘”,則谷歌列出了所有含有沙灘風(fēng)景的視頻內(nèi)容。
從功能上,這些識別技術(shù)和過去的圖像識別、人臉識別存在相似之處,不過谷歌已經(jīng)把識別提升到了視頻的新領(lǐng)域。
據(jù)報道,視頻識別依然是一個新技術(shù)。目前許多互聯(lián)網(wǎng)公司無法識別視頻內(nèi)容,要求用戶在上傳時提供諸多的標(biāo)簽,從而利用標(biāo)簽作為搜索依據(jù)。未來,和圖片文件的標(biāo)簽一樣,視頻的標(biāo)簽將成為一種落后技術(shù)。
過去,谷歌已經(jīng)把許多機器學(xué)習(xí)的技術(shù)及時變成了軟件開發(fā)接口,讓開發(fā)者應(yīng)用到自己的軟件產(chǎn)品中。據(jù)悉,谷歌也正在把上述的視頻內(nèi)容識別變成接口,對外開放。
視頻識別將具有重大的應(yīng)用場景,比如在安全、打擊恐怖主義等領(lǐng)域,政府或者警方可以對視頻畫面進行實時的監(jiān)控和分析,快速抓捕恐怖分子。
另外,寬帶的發(fā)展已經(jīng)讓互聯(lián)網(wǎng)進入了網(wǎng)絡(luò)視頻時代,短視頻、視頻直播等新應(yīng)用不斷出現(xiàn),但是與此同時,視頻搜索的長期落后,成為行業(yè)的一個短板。不少消費者已經(jīng)發(fā)現(xiàn),在一些搜索引擎的視頻搜索服務(wù)中,出現(xiàn)了準(zhǔn)確率太低的現(xiàn)象,主要原因是搜索企業(yè)對于視頻內(nèi)容完全無法識別,他們只能根據(jù)視頻周邊的文字內(nèi)容、視頻標(biāo)題等附加信息進行搜索,這導(dǎo)致差錯率大大提高,也影響了用戶發(fā)現(xiàn)更多精彩的視頻內(nèi)容。
值得一提的是,在人工智能、機器學(xué)習(xí)和圖像識別方面,谷歌和Facebook展開了一場軍備競賽。在去年的一次開發(fā)大會上,F(xiàn)acebook相關(guān)團隊負責(zé)人也曾經(jīng)表示,F(xiàn)acebook已經(jīng)具備了成熟的圖像識別技術(shù),目前正在進行視頻識別的研究,希望能夠盡早識別出視頻中的人臉,方便搜索好友之間發(fā)送的大量視頻。