OpenAI升级API推出更强模型, 加大开发者生态建设力度

周一举办的开发者日活动上，OpenAI公布了应用程序接口（API）的多项更新，包括推出最新语言模型GPT-5Pro、全新视频生成模型Sora2，以及一款体积更小、成本更低的语音模型。

此次API更新是OpenAI一系列公告的组成部分，这些公告均旨在吸引开发者加入其生态系统，其他举措还包括推出智能体构建工具，以及支持在ChatGPT内开发应用程序的功能。

OpenAI首席执行官山姆・奥特曼表示，GPT-5Pro的推出可能会吸引金融、法律和医疗健康领域的应用开发者——这些行业均需要“高准确性和深度推理能力”的技术支持。

奥特曼还指出，语音功能在未来将至关重要，因为它正迅速成为人们与人工智能交互的主要方式之一。为此，OpenAI正于API中推出“gpt-realtimemini”：这是一款体积更小、成本更低的语音模型，支持音频与语音的低延迟流式交互。该新型号比OpenAI此前的高级语音模型便宜70%，同时保证“语音质量和表现力不变”。

最后，参与OpenAI开发者生态的创作者如今可通过API预览版使用Sora2。上周，OpenAI已发布其最新音视频生成模型Sora2，同时推出了Sora应用——这款应用内满是人工智能生成的短视频。用户可通过Sora应用，根据提示生成以自己、朋友或任意事物为主题的视频，并通过TikTok式的算法推荐流分享。

奥特曼表示：“（开发者）如今可直接在自己的应用中，使用驱动Sora2生成惊艳视频效果的同款模型。”

Sora2在前代模型基础上进行了升级，能生成更逼真、物理逻辑更连贯的场景，实现声音与画面的同步，并提供更强的创意控制权——从精细的镜头调度到风格化视觉呈现均涵盖在内。

奥特曼表示：“例如，你可以先确定一个类似iPhone拍摄的视角，然后通过提示让Sora将其扩展为一个宏大开阔、具有电影质感的宽幅镜头。但我们目前正在研发的最令人兴奋的成果之一，是这款新模型能将声音与视觉完美匹配——不仅限于语音，还包括丰富的音景、环境音效，以及与画面内容紧密关联的同步特效。”

Sora2定位为一款概念开发工具，其应用场景广泛：既可以根据产品的整体风格，为广告打造视觉起点；也能帮助美泰（Mattel）的设计师将草图转化为玩具概念。奥特曼在开发者日活动中举了这个例子，这也间接揭示了OpenAI与这家芭比娃娃制造商达成的合作——双方将把生成式人工智能整合到玩具开发流程中。