热搜词: 2025 2026

OpenAI升级API推出更强模型, 加大开发者生态建设力度

周一举办的开发者日活动上,OpenAI公布了应用程序接口(API)的多项更新,包括推出最新语言模型GPT-5Pro、全新视频生成模型Sora2,以及一款体积更小、成本更低的语音模型。

此次API更新是OpenAI一系列公告的组成部分,这些公告均旨在吸引开发者加入其生态系统,其他举措还包括推出智能体构建工具,以及支持在ChatGPT内开发应用程序的功能。

OpenAI首席执行官山姆・奥特曼表示,GPT-5Pro的推出可能会吸引金融、法律和医疗健康领域的应用开发者——这些行业均需要“高准确性和深度推理能力”的技术支持。

奥特曼还指出,语音功能在未来将至关重要,因为它正迅速成为人们与人工智能交互的主要方式之一。为此,OpenAI正于API中推出“gpt-realtimemini”:这是一款体积更小、成本更低的语音模型,支持音频与语音的低延迟流式交互。该新型号比OpenAI此前的高级语音模型便宜70%,同时保证“语音质量和表现力不变”。

最后,参与OpenAI开发者生态的创作者如今可通过API预览版使用Sora2。上周,OpenAI已发布其最新音视频生成模型Sora2,同时推出了Sora应用——这款应用内满是人工智能生成的短视频。用户可通过Sora应用,根据提示生成以自己、朋友或任意事物为主题的视频,并通过TikTok式的算法推荐流分享。

奥特曼表示:“(开发者)如今可直接在自己的应用中,使用驱动Sora2生成惊艳视频效果的同款模型。”

Sora2在前代模型基础上进行了升级,能生成更逼真、物理逻辑更连贯的场景,实现声音与画面的同步,并提供更强的创意控制权——从精细的镜头调度到风格化视觉呈现均涵盖在内。

奥特曼表示:“例如,你可以先确定一个类似iPhone拍摄的视角,然后通过提示让Sora将其扩展为一个宏大开阔、具有电影质感的宽幅镜头。但我们目前正在研发的最令人兴奋的成果之一,是这款新模型能将声音与视觉完美匹配——不仅限于语音,还包括丰富的音景、环境音效,以及与画面内容紧密关联的同步特效。”

Sora2定位为一款概念开发工具,其应用场景广泛:既可以根据产品的整体风格,为广告打造视觉起点;也能帮助美泰(Mattel)的设计师将草图转化为玩具概念。奥特曼在开发者日活动中举了这个例子,这也间接揭示了OpenAI与这家芭比娃娃制造商达成的合作——双方将把生成式人工智能整合到玩具开发流程中。