OpenAI CEO在2023年11月的开发者大会上宣布,尽管GPT-5尚未确定,但他暗示了未来的AI创新。GPT-4 Turbo等新功能也在此次会议上发布,突显了OpenAI在生成AI领域的领先地位。此外有传闻称GPT-5(代号“Gobi”)将于2024年初发布,支持文本、图像和视频,并具有自我纠正和自我意识的能力。
在 2023 年 11 月 9 日的 OpenAI 开发者大会上,OpenAI 的 CEO Sam Altman 再次强调,GPT-5 还没有确切的计划。在 OpenAI 能够训练一个名为 GPT-5 的模型之前,仍然有很多问题需要解决。他表示,并没有保证一切顺利,OpenAI 仍然需要解决困难的科学问题,并需要更多的计算资源。
总体而言,Altman 预期潜在的 GPT-5 将能够解决更多任务。GPT-3 基本上只擅长写作文本,GPT-3.5 在五到八个类别上有用,而 GPT-4 能够可靠地应用于数十个类别。他估计 GPT-5 将在“大多数你想要构建的事情”上都能够胜任。
Altman 没有直接评论 OpenAI 硬件的传言,但他也没有排除开发这样的硬件的可能性。
在这次开发者大会上,OpenAI 宣布了一系列新功能,包括 GPT-4 Turbo、巨大的价格降幅以及面向开发者的新功能,定制的 ChatGPT 等等。OpenAI 强调了其在生成式人工智能领域的领导地位,并明确表示,谷歌和其他公司将不得不努力才能与 OpenAI 的 ChatGPT 和 API 服务相匹敌,这些服务已经在市场上占据了巨大份额,几乎没有竞争。
而 OpenAI 的 CEO Sam Altman 则在告别时暗示了下一轮的创新,他表示:“相对于我们正在为您们创造的东西,今天我们发布的东西将会显得相当古老。”
这一表态表明 Altman 对未来的 AI 创新充满信心。然而,他也承认,并非每一项创新都会成功。例如,ChatGPT 插件最初具有巨大的潜力,但至今尚未在 OpenAI 以外的工具中成为成功案例,与 DALL-E 3 等 OpenAI 自身的工具相比,自定义的 ChatGPT 则可以看作是它们的进化。
ChatGPT 浏览也有其弱点,包括起步阶段的困难,OpenAI 尚未能够从谷歌手中夺得市场份额。公平地说,他们尚未明确表示这是他们的目标,但他们正在构建的很多东西都对谷歌构成了威胁,因为它可能显著改变数字生态系统。
总之,Altman 向在场的开发者发出了对所有其他 AI 公司的挑战,尤其是对谷歌。
关于 GPT-5 的第一批传言也应运而生。Altman 的表态与近期 Twitter.com 上的 Brian Roemmele 的传言相吻合,他准确地泄漏了 ChatGPT 以及 OpenAI 开发者大会前发布的市场等信息。
根据 Roemmele 的说法,GPT-5 是先前泄漏的多模态 AI 模型,代号“Gobi”。据他称,它计划于 2024 年初发布,目前正在大规模数据集上进行训练。除了文本和图像,它还将支持视频。
“The Information”也对 Gobi 进行了报道,它据说从一开始就是多模态的,可能会成为 GPT-5。在 2023 年 3 月初,就在 GPT-4 亮相之前,微软德国首席技术官 Andreas Braun 也谈到了 OpenAI 的多模态 AI 模型可以生成视频。
Roemmele 继续声称,GPT-5 能够自我纠正,并且具有一定程度的自我意识。他引述了一些他非常了解的人所看到的演示作为消息来源。他声称,政府机构目前正在测试这一模型,这与拜登的新监管计划相吻合。
今年 9 月底,Roemmele 声称他能够访问谷歌的“Gemini”,他表示这相当于 GPT-4 但更为更新。如果关于 GPT-5 的传言属实,谷歌可能不得不竞争以 Gemini 对抗更先进的 GPT-5。
至今,OpenAI 尚未就 GPT-5 发表评论。在 2023 年 6 月,Altman 表示,GPT-5 离开始训练还有很长的路要走,仍需大量工作。微软创始人比尔·盖茨认为,GPT-5 不会在性能上显著超越 GPT-4。
OpenAI 在其开发者大会上发布了一系列创新,包括 GPT-4 Turbo 和定制的 ChatGPT,强调了其在生成式人工智能领域的领导地位。在会议结束时,OpenAI 的 CEO Sam Altman 宣布了正在开发中的更多创新,这些创新将使今天的成就显得“相当古老”。
有关 GPT-5 的传言也在蔓延,据称它是一款名为“Gobi”的多模态 AI 模型,将支持文本、图像和视频,预计将在 2024 年初发布。