多模态AI如何改变世界?
未来几年AI领域将迎来巨变。算力竞赛将进一步升温,视频生成模型和机器人技术将迎来爆发式增长,同时多模态 AI 将深刻改变我们的生活。视频生成模型将在未来两年内彻底改变电影制作方式。完全由 AI 生成的、足以获奖的电影将很快出现。这对于影视行业来说无疑是颠覆性的变革,也为相关领域的投资者带来了巨大的想象空间。机器人技术将在五年后迎来广泛应用。零售、仓库等工作环境将率先迎来“机器人革命”。这也意味着机器人产业链上的企业将迎来前所未有的发展机遇。关注AI人才的培养。数学、编程和写作、艺术和创意能力将是未来人才的核心竞争力,相关教育领域的投资也将获得丰厚回报。
GPT-5 将带来重大突破
许多人认为自 GPT-4 发布以来,大型语言模型的进展似乎停滞了,但实际上内部人士的看法完全不同。开发像 GPT 这样的大型语言模型需要大量的算力,这依赖于新数据中心的建设,这是一个缓慢的多年的过程。
从 GPT-4 到 GPT-5 将需要 100 倍的算力提升,这需要时间。在 GPT-5 正式发布之前,可能会先看到算力提升 10 倍的过渡版本。
目前 AI公司的重点在于“测试时计算”,即在模型生成答案的过程中投入更多算力,以获得更长、更连贯的思考链。例如,OpenAI 将 GPT-4 扩展到 0,1 模型,就实现了 100 倍的算力增长。
“测试时计算”不需要建设新的数据中心,因此在算法改进方面还有很大空间。未来几年,“测试时计算”将是 AI 领域最令人兴奋的进展之一。
多模态 AI 的突破:Sora 引领视频生成革命
与其他模态(如图像)不同,视频是一个扩展的事件序列,需要一个完整的用户界面来考虑故事如何随着时间的推移而展开。此外,视频模型的训练和运行成本都非常高。
Sora 是第一个高质量的视频生成模型,它通过故事板功能解决了视频生成中的一些挑战。故事板功能允许用户在不同时间点放置检查点,以指导视频的生成。
未来视频模型的质量会更好,生成时间更长,成本更低。就像 LLM 一样,你将能够看到非常美丽、逼真的视频,而且它们几乎不花任何成本。
预计两年内,我们将看到完全由 AI 生成的、足以获奖的电影。这些电影的吸引力将在于导演如何利用视频模型来实现他们的创意愿景,并在媒介中做一些他们无法拍摄的事情。
机器人技术的未来:五年后,我们将与机器人在日常生活中互动
机器人技术将在五年后看到广泛的应用,尽管会有一些限制。 基础模型的出现是机器人技术领域的一大突破,它使机器人能够快速启动并在重要方面进行泛化。
与模拟环境相比,在现实世界中训练机器人具有优势。模拟器擅长模拟刚体,但在现实世界中,许多物体都是柔软的,例如布料或纸板,模拟器并不擅长处理这些。
对于任何想要真正通用的机器人来说,在现实世界中进行训练是必不可少的。
预计五年后,我们会在日常生活中以一种今天感觉奇怪的方式与机器人互动。机器人将在零售、仓库等工作环境中得到广泛应用。
关于AGI
许多人担心 AI 会导致大规模失业,但实际上 AI 能够自动化的只是单个任务。 大多数工作都包含一些无法自动化的任务, 即使是编程也是如此。
AI 的进步将继续,它将令人兴奋,并且不会放缓,但它会发生变化。 我们正在从一个智能可能是社会关键稀缺因素的世界,过渡到一个智能无处不在且免费的世界。
当智能不再稀缺时,代理权将成为稀缺的生产要素。 代理权是指提出正确问题和追求正确项目的能力。 我们需要思考如何发展这种代理权,以便我们能够与 AI 合作。
未来将是连续的,AI 的进步将逐步改变我们的生活。 我们应该关注那些需要无限耐心的领域, 例如仔细检查支出或进行比较购物,这些领域 AI 可以做得更好。
如何培养孩子适应 AI 时代?
尽管 AI 正在迅速发展,但我们不应该改变孩子的教育方式。 仍然应该教他们数学、编程和写作、艺术和创意等,因为这些技能可以帮助他们以结构化的方式思考问题。未来是不可预测的, 我们应该鼓励孩子们尝试那些挑战他们能力极限的事情,并培养他们的适应能力。