|
作者: Cade Metz 機器之心編譯 參與:馬世豪、李亞洲
構(gòu)建人工智能系統(tǒng)太難了,于是 Faceook 開發(fā)了一個人工智能系統(tǒng)自己構(gòu)建人工智能。
深度神經(jīng)網(wǎng)絡(luò)正在重塑互聯(lián)網(wǎng)。這樣的人工智能系統(tǒng)因為有了通過分析海量數(shù)據(jù)學習每樣人類任務(wù)的能力,從而為網(wǎng)絡(luò)在線服務(wù)注入了以前無法實現(xiàn)的新力量。它們能在照片中識別人臉、識別智能手機的語音指令、還能進行機器翻譯。它們甚至在幫助谷歌選擇搜索結(jié)果。這些我們都知道,但往往較少提及的是互聯(lián)網(wǎng)巨頭們?nèi)绾稳ソㄔ爝@些相當了不起的人工智能引擎。
其中一個做法是,谷歌和 Facebook 這樣的公司花高價聘請那些頂級聰明的人。地球上只有幾百人有這樣的天賦和技能來真正推動人工智能事業(yè)的發(fā)展。在這些頂級大腦上的投入抵得上一個 NFL(美國橄欖球聯(lián)盟) 四分衛(wèi)的工資。這是人工智能不斷發(fā)展進步的一個瓶頸,而且這并不是唯一一個瓶頸。即使是頂尖的研究者們,在沒有大規(guī)模反復(fù)試驗的情況下,也無法建立這樣的人工智能服務(wù)。要構(gòu)建一個解決人工智能難題的深度神經(jīng)網(wǎng)絡(luò),研究人員在成功前一定會嘗試無數(shù)種方式,并一個一個的在幾十、幾百個機器上運行。
Google 旗下 DeepMind 公司的聯(lián)合創(chuàng)始人Demis Hassabis 說,「這更像是做教練而不是球員,你忽悠著把這些東西傳達出來,而不是直接告訴機器做什么。」
這就是為什么許多公司現(xiàn)在正試圖把反復(fù)試驗(trial and error)的過程自動化,或至少使其一部分自動化。如果你把核心關(guān)鍵自動化了,你可以更快速地將最新的機器學習推廣到普通工程師手中,頂級天才將會有更多的時間思考更好的想法、解決更困難的問題。反過來,這也會加速我們?nèi)粘J褂玫木W(wǎng)絡(luò)服務(wù)和 App 背后的人工智能的進程。
換句話說,要讓計算機變得更聰明、更快,電腦本身必須處理更繁重的工作。互聯(lián)網(wǎng)巨頭們正在制造能夠替代工程師測試無數(shù)機器學習算法的計算系統(tǒng),并且這種系統(tǒng)自身能夠不斷測試各種可能性。更好的是,這些公司正在開發(fā)可以幫助建立人工智能算法的人工智能算法。這并非開玩笑。在Facebook內(nèi)部,工程師們已經(jīng)設(shè)計一個他們稱之為「自動機器學習工程師」的人工智能系統(tǒng),一個幫助開發(fā)人工智能系統(tǒng)的系統(tǒng)。雖然離完美還有很大距離,但最終目標是用盡可能少的人力工作創(chuàng)造新的人工智能模型。
感受下 Flow
在 Facebook 2012 年 1040 億美元的 IPO 之后,F(xiàn)acebook 廣告團隊的 Hussein Mehanna 和其他工程師在改良公司的廣告定位上倍感壓力,因為它們需要更精確地把廣告和數(shù)以百萬計使用社交網(wǎng)絡(luò)的用戶匹配起來。這意味著構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)和其他機器學習算法需要更好地利用 Facebook 收集到的大量數(shù)據(jù)。這些數(shù)據(jù)來源于數(shù)以百萬計的用戶的特性和行為愛好。
據(jù) Mehanna 所說,F(xiàn)acebook 工程師們在想出新的人工智能點子上毫無壓力,但測試這些想法卻又是另一回事。于是他和他的團隊開發(fā)了一個叫做 Flow 的工具。Mehanna 說,「我們想建立一個機器學習裝配線,讓 Facebook 所有的工程師都可以使用。」設(shè)計 Flow 的目的是幫助工程師大規(guī)模的開發(fā)、測試和執(zhí)行機器學習算法。這是一個廣泛的技術(shù),涵蓋了完成自我學習任務(wù)的所需的所有服務(wù),也幾乎包括了任何形式的機器學習技術(shù)。
基本來說,工程師們可以很容易地測試公司龐大的計算機數(shù)據(jù)中心網(wǎng)絡(luò)層出不窮的想法。他們可以運行測試各種算法的可能性,這些算法所涉及的不只是深度學習,還有其他形式的人工智能,包括對數(shù)幾率回歸到 Boosted 決策樹,而測試的結(jié)果還可以提供更多的想法。Mehanna 說,「嘗試越多的點子、越多的數(shù)據(jù)就越好。」這也意味著工程師們可以很容易地對其他人寫的算法進行再利用,對這些算法進行微調(diào)然后應(yīng)用到其他任務(wù)。
很快,Mehanna和他的團隊在全公司推廣使用 Flow。在其他團隊里,它可以幫助生成各種算法:選擇 Facebook News Feed 的連接、識別發(fā)布到社交網(wǎng)絡(luò)照片里的面孔、為照片生成音頻描述從而讓盲人理解照片內(nèi)容。它甚至可以幫助公司確定世界的哪些部分還需要接通互聯(lián)網(wǎng)。
Mehanna 說,在 Flow 的幫助下,F(xiàn)acebook 每個月訓練和測試約 30 萬個機器學習模型。曾經(jīng) Facebook 每 60 天左右才把一個新的人工智能模型推送到其社交網(wǎng)絡(luò)上,而現(xiàn)在每周就可以推送幾個新的模型。
下一個前沿
這個想法要比 Facebook 本身重要的多。這是全球深度學習領(lǐng)域共同的實踐。去年,Twitter 收購了一個叫做 Whetlab的創(chuàng)業(yè)公司,專門從事這樣的工作。最近,微軟也透露出其研究人員如何使用一個系統(tǒng)測試海量的人工智能模型。微軟研究人員 Jian Sun 把它稱之為「人類輔助搜索。」
Mehanna 和 Facebook 想要加快這個進程。公司計劃最終把 Flow 開源,與世界分享 Flow。據(jù) Mehanna 所言,諸如LinkedIn、Uber 和 Twitter 都對使用 Flow 感興趣。Mehanna 和他的團隊還開發(fā)了一個工具叫 AutoML,可以減去工程師們更多的負擔。與 Flow 同時運行的 AutoML 可以在沒有任何人為干預(yù)的情況下,自動「清除」用來訓練神經(jīng)網(wǎng)絡(luò)的和其他的機器學習算法的數(shù)據(jù),并做好測試準備。Mehanna 設(shè)想的未來版本甚至可以收集自己的數(shù)據(jù)。但更有趣的是,AutoML 使用人工智能幫助開發(fā)人工智能。
正如 Mehana 所說,F(xiàn)acebook 每個月訓練和測試約30 萬個機器學習模型。AutoML 可以使用這些測試結(jié)果來開發(fā)另一個機器學習模型,這個模型可以優(yōu)化整個機器學習模型的開發(fā)流程。是的,這可能讓你感到困惑。Mehana 把它與《盜夢空間》相比,但它是行得通的。該系統(tǒng)可以自動選擇行得通的算法和參數(shù)。「這幾乎可以在開發(fā)前就能預(yù)測到結(jié)果,」Mehana 如是說。
在 Facebook 的廣告團隊里,工程師們甚至還開發(fā)了叫做 ASIMO 的「自動機器學習工程師」,這個工具已經(jīng)推廣到公司的其他部門。據(jù) Facebook 表示,在有些情況下,它可以自動增強和改進現(xiàn)有模型,工程師可以把改進后的模型立即應(yīng)用到網(wǎng)絡(luò)里。Mehanna 說,「它還不足以發(fā)明一種新的人工智能算法,但沿著這條路一直走下去誰又知道會怎樣。」
這確實是一個很有趣的想法,一個讓科幻作家為之癡迷幾十年的想法:一個會自我建造的智能機器。其實 ASIMO 并沒那么先進,但這確實是走向未來世界一大步。在未來,開發(fā)人工智能的人里面,不僅會有絕頂聰明的天才,還會有一些非人類的存在。
本文由機器之心編譯
|