據(jù)外媒報(bào)道,F(xiàn)acebook人工智能部門發(fā)布了關(guān)于其“Ego4D”項(xiàng)目的一些成果。這項(xiàng)研究與“9個(gè)國家的13所大學(xué)和實(shí)驗(yàn)室組成的聯(lián)盟”合作,共同收集了“2200個(gè)小時(shí)的戶外第一人稱視角視頻,其中有700多名參與者正在進(jìn)行他們的日常生活”。
在這項(xiàng)研究中,與Facebook AI合作的研究人員的目的是開發(fā)“從這個(gè)角度理解世界”*的人工智能,以便他們能夠“開啟一個(gè)沉浸式體驗(yàn)的新時(shí)代”。他們正在具體研究增強(qiáng)現(xiàn)實(shí)(AR)眼鏡和虛擬現(xiàn)實(shí)(VR)頭顯將如何“在日常生活中變得像智能手機(jī)一樣有用”。
*研究人員在這里指的是第一人稱視角。他們用第一人稱視角拍攝的視頻來工作,而不是通過視頻和照片來訓(xùn)練人工智能的正常視角:第三人稱視角。
研究人員為這個(gè)項(xiàng)目列出了五個(gè)"基準(zhǔn)挑戰(zhàn)",有效地展示了他們正在追蹤的內(nèi)容。要清楚的是:Facebook并沒有通過真實(shí)的現(xiàn)場設(shè)備來追蹤這個(gè)項(xiàng)目的數(shù)據(jù)--現(xiàn)在還沒有。這些都是通過Facebook AI為這個(gè)項(xiàng)目獲得的第一人稱視角視頻進(jìn)行追蹤。
-事件記憶:什么時(shí)候發(fā)生了什么?
-預(yù)測:我接下來可能會做什么?
-手和物體的操作:我在做什么?
-視聽日記:誰在什么時(shí)候說了什么?
-社會互動:誰在與誰互動?
根據(jù)Facebook AI的說法,他們對這一主題的研究與一個(gè)數(shù)據(jù)集合作,該數(shù)據(jù)集"就錄像的小時(shí)數(shù)而言"比其他任何數(shù)據(jù)集都要大20倍。正是通過Facebook AI的Ego4D項(xiàng)目公告,這一信息才得以公開。
有關(guān)這個(gè)項(xiàng)目的研究論文《Ego4D:Around the World in 3,000 Hours of Egocentric Video》已在arXiv發(fā)表。