作者:Joe Carmichael 機器之心編譯出品
編譯:吳攀 一年前的今天,Facebook 推出了「那年今天」功能。Inverse 與 Facebook 的計算機視覺研究負責人 Manohar Paluri 談論了人工智能、機器學習和計算機視覺是如何讓這一功能更有意義的——以及這些領域的研究和開發將如何在今后幾年中繼續提高 Facebook 的用戶體驗。
即使你自己沒使用過「那年今天」功能,你也在你的動態消息中見到過這些帖子;你已經見過一個好友重新分享了他或她過去的 Facebook 帖子。還記得那位魔術師在帽子里拉出一只兔子嗎?不敢相信已經過去了三年。同時還搭配著一張那魔術師和那只兔子以及那頂帽子的照片——就是類似這樣的。而今天,Facebook 分享了它自己的記憶。在一年前的今天,Facebook 推出了「那年今天」。(現在,「那年今天」自稱每日訪問量已經超過了 6000 萬,而且有 1.55億用戶訂閱了它的通知。)

「那年今天」的新外觀,Facebook 的社交記憶輔助。
但是,對于 Facebook 而言,這種記憶更多的是里程碑意義,而少了一些懷舊的多愁善感。Facebook不斷在推出新功能,而且這些功能也在不斷地被檢查和調整。有時候是人類做這些事,如 Paluri 及其團隊;其它時候則是人工智能——盡管大部分時候兩種都會用到。Facebook 就像是一個半機械人,而這個半機械人有一個存在的理由:讓你的 Facebook 體驗盡可能愉悅。
如果你愿意,Facebook 的計算機視覺、內容理解和人工智能小隊可以被看作是半機械人的主板。按照這個比喻,Paluri 就該算作是主板上的中央處理器。過去十年來,Paluri 一直在計算機視覺上工作,而且他可不是個小角色:他從 SRI 開始,轉到了 IBM 沃森實驗室,然后再從那里跳到了谷歌。現在他在 Menlo Park 的 Facebook 總部工作。他說,當他加入的時候,他在視覺識別上的實習項目躍升成為了 Facebook 的圖像和識別理解技術的「主干」。而且視覺識別引擎對 Facebook 而言也變得越來越中心化。
「如果你看看 Facebook 隨時間變化的使用情況——而這也是 Mark [Zuckerberg] 常常舉的例子——你可以看見分享的媒體越來越豐富,人們用其來連接。」Paluri 說,「你從文本開始,變成了照片;從照片又變成了視頻;然后現在從視頻我們正變成虛擬現實。隨著通信媒介變得越來越豐富,工具跟上也是非常重要的,以及那些能夠理解這些內容是什么的工具。除非我們有那樣的工具,(否則)我們就不能在動態消息排序上做到更好,我們就不能在搜索結果檢索中做到更好,我們就不能在為盲人描述照片內容上做到更好,我們就不能開發出更好的人口密度圖。」
Paluri 說,人工智能相對較新的中心,機器學習和計算機視覺是有一點「戰略下注」的感覺——但這是一個讓他興奮的賭注。之前他工作過的每一個地方在研究和工程之間都沒有如此緊密的反饋和響應回路。「通過集中關注,我們處理最先進的技術,我們推動技術前沿,然后產品團隊和公司的其它部門就可以使用它。」他說。現在,Paluri 管理著計算機視覺團隊,「這個團隊的高層次目標是讓機器能以人類的方式去看見,」Paluri 解釋說,「并且超越,實際上——超越人類所能做到的,比如在非常細節的識別上。我們在頂級會議上發表我們的發現,我們撰寫技術博客,而且我們對我們正在工作的內容非常開放。總體而言,我們的主要目標是將計算機視覺技術帶入到 Facebook 的其它產品組。」
而最早利用 Paluri 團隊的成果的產品剛好就是「那年今天」。

「那年今天」的老版設計
在簡潔天真的面紗背后,「那年今天」有一個復雜的能夠精確調控你的記憶體驗的人工智能和計算機視覺系統。Paluri——再次說明他與「那年今天」只有一點點交集——解釋了為什么重溫社交網絡記憶可以是一件好事。
「懷舊是一種非常正面的現象。所以,比如以一種即興的方式查看你的婚禮照片——當你不是專門瀏覽它時,但它就在你的動態消息中出現了——是一種非常讓人愉悅的體驗。尤其是當你在瀏覽的時候,一種積極的記憶就從過去涌現了出來。」
懷舊是一種非常正面的現象。
然而,毫無疑問,懷舊更多地是落在苦樂譜上的苦的一邊。「我所想到的第一件事」Paluri 說,是「你應該展示出所有的這些回憶嗎?憑直覺的答案是:否,因為它依賴于你現在的狀態,它依賴于特定的記憶;這里有很多很多內在的東西。這就是人工智能技術加入其中的地方。」 而且人工智能技術進入的方式有兩種:一,個性化;二,內容理解。
對于后者,內容理解:「這些回憶是你上傳的文字回憶、生活事件、照片或你上傳的視頻。所以,現在你有過剩的不同類型的內容,而了解這里面有什么對能夠學習并提供一套正確的回憶而言是非常重要的。」
此外——而且不僅僅對于「那年今天」——內容理解和這些人工智能系統有助于清除 Facebook 上每天海量信息中的無益內容。(想一想:如果 Facebook 的動態消息與 Instagram 類似,你也許就只會看所有帖子中的百分之二。相反,你看到的都是你可能會點贊的內容,或者你可能會花很多時間探究的內容。)而且它還能幫助過濾掉讓人反感的內容,例如色情,這比其它大多數網站都做得多。
即便那是一次損失,它也能給他們帶來積極的回憶。
而對于前者,Paluri 闡述說:「對你而言,也許看看積極的回憶是好的,而且你不喜歡任何負面的東西。但對其他人來說,也許他們想被提醒他們在那一天失去了他們的貓。盡管那是一種損失,它也能給他們帶來積極的回憶。」而且,從某種意義上講,每一個 Facebook 用戶都有一個高度個性化的幕后配置文件,它知道他或她將想要或不想要回憶什么。「當你和回憶互動時——隨著你的分享、你的點贊或你的忽略——都會有一個使用內容理解模塊的機器學習模型配合你的喜好,個性化定制未來將會提供給你的回憶。」
但不要擔心:Facebook 希望能確保你不會被粗魯地提醒分手或親人去世的回憶。「不管人工智能或機器學習技術有多好,我們仍然希望能將控制權交給用戶,因為這一天結束時,我們的目標是重現他們喜歡的回憶。」用戶得到一個控制開關:「如果他們知道,在這些日子期間一件負面的事情發生了——他們分手什么的——我們想將不呈現這些回憶的全部控制權交給他們。」
那么在「那年今天」的偏好設置中,你可以選擇不要向我展示某某人(因為他是一個可鄙的人)或近三年的回憶(這段時間很悲慘,絕不值得注意)。

基于機器學習系統的偏好設置可以確保你見到的都是溫暖和模糊的回憶,不會有更多。
展望未來,Paluri 解釋了為什么他非常高興能繼續從事開發這些系統,并提高 Facebook 的主板質量的工作。
你已經提到了 Facebook 的視覺和內容理解系統的其它應用。是否還有其它的使用這些系統的正在進行中的工作讓你感到興奮?
所有這些在視頻上的功能都是讓我感到興奮的事情,那是肯定的。那肯定是已經存在的;這是一件持續的事情,因為視頻是 Facebook 上的大頭。但我認為,在某種程度上,我們希望對此有越來越豐富的了解。就人類描述圖片的方式而言,目前的計算機視覺技術仍然離得很遠。它可能能告訴你這張圖片上有什么,像這些像素是屬于一只貓的等等——但它是有限的。它仍然不了解事物之間的關系,而且它仍然不能以人類的方式描述它。
有一些工作是為了描述圖像的——稱之為圖像說明(image captioning)。最近兩年有一堆成果出來。但如果你看看這些系統生成的說明,他們非常一般。它們不是描述性的。而我們會喜歡的以及會在未來到來的一件事是以一種更為豐富的方式描述它。這對圖像和視頻而言都一樣。如果你有一段兩分鐘視頻,你不會想只要一句句子描述;你想要的是一段帶有時態的描述段落,對吧?『這個發生,然后這個發生,再然后這個發生』,對吧?這就很好理解了。
所以總之,你是說,你在想辦法奪走我的工作。
(笑)不,絕對不是。我在讓你的工作變得更加有趣。
你覺得對于開展這樣的研究而言,Facebook 是個奇怪的地方還是完美的地方?
我認為這是個完美的地方,因為內容理解嵌入在 Facebook 的DNA 中。如果你看看 Facebook 的使用情況的暴增,相對許多其它競爭對手而言,動態消息是讓 Facebook 成為一個驚人的社交網絡的臺柱。動態消息仍然是主要的發放渠道。
但當你進入動態消息時,你并不帶有特定的意圖。你來這里是為了信息。所以,對我們而言很重要的就是向你展示正確的事物,向你展示有意義的事物。如果你進入其它服務,也許你就帶著一個意圖,在這種情況下,所有需要做的服務就是給出一個答案。在這里,這就像是我既給你問題也給你答案。所以,為了讓人們繼續回來,你需要做得真的很好。
這就是為什么說人工智能和內容理解是 Facebook 的核心,以及為什么它是做這些事最好的地方。考慮到這里如此之多的媒體數量——考慮 Facebook 上有多少關于圖像和視頻的內容,以及向越來越多的視頻和虛擬現實的轉變——這是做人工智能研究、計算機視覺和機器學習最好的地方。
這不是奇怪的地方:這就是最合適的地方。
?本文由機器之心編譯 |