多模態AI如何改變世界?
未來幾年AI領域將迎來巨變。算力競賽將進一步升溫,視頻生成模型和機器人技術將迎來爆發式增長,同時多模態 AI 將深刻改變我們的生活。視頻生成模型將在未來兩年內徹底改變電影製作方式。完全由 AI 生成的、足以獲獎的電影將很快出現。這對於影視行業來說無疑是顛覆性的變革,也為相關領域的投資者帶來了巨大的想像空間。機器人技術將在五年後迎來廣泛應用。零售、倉庫等工作環境將率先迎來“機器人革命”。這也意味著機器人產業鏈上的企業將迎來前所未有的發展機遇。關注AI人才的培養。數學、編程和寫作、藝術和創意能力將是未來人才的核心競爭力,相關教育領域的投資也將獲得豐厚回報。
GPT-5 將帶來重大突破
許多人認為自 GPT-4 發佈以來,大型語言模型的進展似乎停滯了,但實際上內部人士的看法完全不同。開發像 GPT 這樣的大型語言模型需要大量的算力,這依賴於新數據中心的建設,這是一個緩慢的多年的過程。
從 GPT-4 到 GPT-5 將需要 100 倍的算力提升,這需要時間。在 GPT-5 正式發佈之前,可能會先看到算力提升 10 倍的過渡版本。
目前 AI公司的重點在於“測試時計算”,即在模型生成答案的過程中投入更多算力,以獲得更長、更連貫的思考鏈。例如,OpenAI 將 GPT-4 擴展到 0,1 模型,就實現了 100 倍的算力增長。
“測試時計算”不需要建設新的數據中心,因此在演算法改進方面還有很大空間。未來幾年,“測試時計算”將是 AI 領域最令人興奮的進展之一。
多模態 AI 的突破:Sora 引領視頻生成革命
與其他模態(如圖像)不同,視頻是一個擴展的事件序列,需要一個完整的用戶介面來考慮故事如何隨著時間的推移而展開。此外,視頻模型的訓練和運行成本都非常高。
Sora 是第一個高質量的視頻生成模型,它通過故事板功能解決了視頻生成中的一些挑戰。故事板功能允許用戶在不同時間點放置檢查點,以指導視頻的生成。
未來視頻模型的品質會更好,生成時間更長,成本更低。就像 LLM 一樣,你將能夠看到非常美麗、逼真的視頻,而且它們幾乎不花任何成本。
預計兩年內,我們將看到完全由 AI 生成的、足以獲獎的電影。這些電影的吸引力將在於導演如何利用視頻模型來實現他們的創意願景,並在媒介中做一些他們無法拍攝的事情。
機器人技術的未來:五年後,我們將與機器人在日常生活中互動
機器人技術將在五年後看到廣泛的應用,儘管會有一些限制。 基礎模型的出現是機器人技術領域的一大突破,它使機器人能夠快速啟動並在重要方面進行泛化。
與模擬環境相比,在現實世界中訓練機器人具有優勢。模擬器擅長模擬剛體,但在現實世界中,許多物體都是柔軟的,例如布料或紙板,模擬器並不擅長處理這些。
對於任何想要真正通用的機器人來說,在現實世界中進行訓練是必不可少的。
預計五年後,我們會在日常生活中以一種今天感覺奇怪的方式與機器人互動。機器人將在零售、倉庫等工作環境中得到廣泛應用。
關於AGI
許多人擔心 AI 會導致大規模失業,但實際上 AI 能夠自動化的只是單個任務。 大多數工作都包含一些無法自動化的任務, 即使是編程也是如此。
AI 的進步將繼續,它將令人興奮,並且不會放緩,但它會發生變化。 我們正在從一個智能可能是社會關鍵稀缺因素的世界,過渡到一個智能無處不在且免費的世界。
當智能不再稀缺時,代理權將成為稀缺的生產要素。 代理權是指提出正確問題和追求正確專案的能力。 我們需要思考如何發展這種代理權,以便我們能夠與 AI 合作。
未來將是連續的,AI 的進步將逐步改變我們的生活。 我們應該關注那些需要無限耐心的領域, 例如仔細檢查支出或進行比較購物,這些領域 AI 可以做得更好。
如何培養孩子適應 AI 時代?
儘管 AI 正在迅速發展,但我們不應該改變孩子的教育方式。 仍然應該教他們數學、編程和寫作、藝術和創意等,因為這些技能可以幫助他們以結構化的方式思考問題。未來是不可預測的, 我們應該鼓勵孩子們嘗試那些挑戰他們能力極限的事情,並培養他們的適應能力。