GPT

财经新闻网12月12日电(编辑石正成)在被谷歌强行拉响“红色警报”后,OpenAI终于在周四推出了最新型号GPT-5.2系列。该图是OpenAI官方网站的截图。 OpenAI 将 GPT-5.2 描述为迄今为止针对“专业知识任务”性能最佳的模型系列,在创建电子表格、演示文稿、图像识别、编写代码和理解长上下文方面优于上一代产品。 GPT-5.2 具有三个不同的版本。 Instant,一种速度优化的模型,适用于搜索互联网、翻译和打字等常见查询。思维能力。擅长结构复杂的任务,例如编程、数学和长文档分析。顶级的 Pro 模型旨在为 d 问题提供最大的精度和可靠性。困难 OpenAI 特别强调,GPT-5.2 Thinking 是最适合现实世界专业使用的模型。在tGDPval 测试评估了 44 个职业的知识工作任务,其中 70.9% 的表现至少与行业顶尖专业人士相当,包括创建销售演示、会计电子表格、制造流程图和短视频。在评估44个职业的知识型工作任务的GDPval测试中,70.9%的比较结果达到或超过了领先的行业专家的水平。此外,在金融AI领域,GPT-5.2 Thinking的结果明显优于GPT-5.1。 OpenAI展示的例子表明,与GPT-5.1 Thinking相比,GPT-5.2 Thinking在创建人力资源规划模型、资本结构表和项目管理表的任务上有了明显的改进。除了 OpenAI 展示的用于创建 PPT 和 Excel 表格的示例之外,OpenAI 在编码、数学、科学、视觉、扩展推理和工具方面还支持 GPT-5.2。它还声称已经更新了使用的基准测试结果。钍该公司表示,这些改进将带来“更可靠的类似代理的工作流程、可用于生产的代码以及可以处理大规模上下文和现实世界数据的复杂系统”。从横向比较的角度来看,GPT-5.2 Thinking 在列出的几乎所有推理测试中都略微优于 Anthropic 的 Gemini 3 和 Claude Opus 4.5,从现实世界的软件工程任务 (SWE-Bench Pro) 和博士级科学知识 (GPQA Diamond) 到抽象推理和模式发现 (ARC-AGI Suite)。在 caif 列出的所有推理测试中,GPT-5.2 Thinking 的表现略胜于 Anthropic 的 Gemini 3 和 Claude Opus 4.5。 OpenAI 产品负责人 Max Schwarzer 也在周四报告了 GPT-5.2。思维响应相比上一代减少了 38% 的错误,使模型在日常决策、研究和写作中更加可靠。从周四开始,GPT-5.2 将向所有付费 ChatGPT 用户和 API 用户推出。嗯,随着时间的推移,它会变得清晰耳朵这个新模式多么适合“兼职工作”。 GPT-5.2只是OpenAI反击谷歌的“第一击”。首席执行官奥特曼周四宣布,公司将于下周向用户赠送“圣诞小礼物”。他周四还表示,Gemini 3 对公司多项指标的影响比最初担心的要小。他还表示,OpenAI预计将于明年1月退出目前的红色警报状态,“处于非常强势的地位。图为Altman的社交媒体帖子截图。OpenAI首席产品官Fidji Simo周四也宣布,该公司已开始在部分地区推出年龄估计系统。这项措施针对的是18岁以下的用户,目的是规范ChatGPT回复的内容。Simo还表示,该公司希望在推出之前推出这一功能。”周四发布的“成人模式”新品似乎主要集中在推理c上。新型号的功能,因此很遗憾没有宣布新的成像仪。今年以来,一些与图像和视频生成产品相关的令人惊叹的新产品已经推出。奥特曼的“紧急警报”备忘录中还提到了增强的成像能力。此前有报道称,OpenAI 计划明年 1 月推出一款新机型,拥有更好的图像处理能力和更全面的定制功能,但该公司周四并未证实这一传闻。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。

文章已创建 178

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

相关文章

开始在上面输入您的搜索词,然后按回车进行搜索。按ESC取消。

返回顶部