穀歌組建新AI團隊開發“世界模型”:通往AGI的關鍵路徑
極客網ⷦ嵥瀥月8日最近穀歌組建一個新團隊,專門開發可以用來模擬物理世界的AI模型,也就是所謂的“世界模型”(World Models)。
蒂姆ⷥ𘃩 斯(Tim Brooks)原本是OpenAI的一名高管,也是視頻生成工具Sora的主要開發者之一。去年10月,他加入穀歌DeepMind,成為新領導之一。模擬物理世界的AI模型團隊是穀歌DeepMind的一部分。

布魯克斯說:“DeepMind有著宏大的計劃,它準備開發巨大的生成式模型,可以模擬物理世界。我受聘之後將會成為新團隊的一員,努力幫公司達成新使命。”
新團隊將會與穀歌Gemini、Veo、Genie團隊合作,努力解決關鍵性新問題。Veo是穀歌自己的視頻生成模型;Gemini相當於穀歌的旗艦AI模型,它可以分析圖片,生成文本,可以模擬遊戲、3D環境;最新的Genie版本於去年12月揭開麵紗,它已經可以生成巨大多變的可玩性3D世界。
“世界模型”是通往AGI的關鍵路徑
在新團隊招聘信息中能看到這樣的話:“我們相信在視頻、多模態方麵擴大AI訓練規模是通往AGI的關鍵路徑。”
AGI是頂尖AI企業共同追求的目標,它指的是AI可以像人一樣完成任何任務。
AI行業人士認為,世界模型就是AI的下一個大事件。“世界模型”這個術語實際上是從人類心智派生出來的,它是人類自然進化而來。

人類大腦會從感官中抽象一些表征,從而加深對周圍世界的理解,形成所謂的“模型”,大腦會根據這些模型進行預測,繼而影響人對世界的感知。
棒球手打球時,隻需要幾毫秒就能判斷如何擊球,耗費的時間比視頻信號傳到大腦還要短。人類之所以能擊中時速達到100公裏的棒球,主要是因為我們能憑直覺判斷球的運動方向。
一些科學家認為,人類之所以擁有超常智力,主要是能夠在潛意識推理,這些推理是以世界模型作為基礎的。
一旦技術取得突破,世界模型將會為多個領域賦能,比如視覺推理、模擬、嵌入式智能體規劃、實時娛樂交互。
按照描述,新團隊將會開發實時交互生成工具,它以穀歌之前開發的模型作為基礎,新團隊開發的模型會考慮如何與現有多模態模型整合,比如與Gemini整合。
不少AI公司都在布局“世界模型”
很多創業公司和科技巨頭正在努力開發世界模型,比如李飛飛創建的World Labs,以色列Decart、Odyssey。大家相信,一旦世界模型獲得成功,可以創建交互性媒體內容,比如遊戲、電影,還可以為搭建逼真的模擬環境。

對於這樣的新技術,創意界意見不統一。比如,動視暴雪積極進入AI工具,提高生產力,結果導致部分員工被裁。Animation Guild不久前發布的報告稱,在2026年之前,由於AI的應用,美國會有超過10萬個電影、電視、動畫職位被摧毀。
在“世界模型”開發領域,Odyssey算是新手,它宣稱要與創意專業人士一起開發,並無替代創意人士的計劃。穀歌的物理世界模擬AI會不會替代創意人士?還有待觀察。
在版權方麵,開發世界模型也存在障礙。有一些世界模型是根據視頻遊戲片段訓練的,訓練時並沒有拿到版權,可能會引發糾紛。
穀歌是YouTube的所有者,它已經獲得許可,準備用YouTube視頻訓練模型,隻是現在還不知道具體會用到哪些視頻。
當然,除了這些問題,世界模型還有很多技術難題沒有解決,即使是穀歌,離成功也有不小的距離。
和所有AI模型一樣,世界模型也存在“幻覺”。如果用歐洲城市數據訓練模型,城市的天氣一直晴朗,可能無法理解下雪的亞洲城市。沒有充分的數據,模型不可能深刻理解世界。
Runway的CEO Crist㳢al Valenzuela不久前說,由於數據和工程方麵的問題,想精準捕捉世界上的“居民”(比如動物和人)存在巨大挑戰。模型要為環境生成一致的地圖,要在環境中導航、交互。
雖然存在巨大挑戰,不過如果問題得到解決,世界模型可以讓AI與真實世界更好聯係在一起,到時不隻虛擬世界生成工具會取得突破,機器人、AI決策也會地大踏步前進。
蜜度索驥:以跨模態檢索技術助力“企宣”向上生長穀歌組建新AI團隊開發“世界模型”:通往AGI的關鍵路徑MIT想用AI設計電動汽車,大幅縮短設計時間並節省成本美媒:一些中國大模型已經追平甚至超越美國產品透過這場開發者圈的“年度盛典”,窺見華為開發者生態構建之道穀歌Willow量子芯片有進步 但離實用還很遙遠LLM很難變成AGI?科學家:創造AGI理論上可行PON在園區網絡的“先天不足”,無源以太全光來拯救!英特爾CEO黯然退場背後:芯片製造陷泥潭,AI起大早趕晚集開源5年樹立 openEuler以智能 致世界華為推出Mate 70手機引發高度關注 看外媒是如何評價的?
免責聲明:本網站內容主要來自原創、合作夥伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,並對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書麵權利通知或不實情況說明,並提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件後,將會依法盡快聯係相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。