滚水科技
banner

【今日资讯】OpenAI 突然发布 GPT-5.2 模型 →

2025-12-16 14:28:14

1.  OpenAI 发布《2025 年企业 AI 现状报告》

OpenAI 发布了《2025 年企业 AI 现状报告》,该报告基于超 100 万企业客户数据及 9000 名员工调研,揭示了企业 AI 应用进入规模化阶段,员工效率显著提升但使用差距扩大,头部企业及员工优势明显。报告亮点如下:


企业 AI 使用量激增
ChatGPT 企业版席位同比增长 9 倍,覆盖超 700 万职场用户;周消息量增长 8 倍,API 推理令牌消耗暴增 320 倍。
定制化工具(如 Custom GPTs)周活跃用户增长 19 倍,20% 企业消息通过此类工具处理,如 BBVA 银行部署超 4000 个定制 GPT 优化日常流程。

生产力与业务影响
员工日均节省 40-60 分钟,技术岗(数据、工程等)可省 60-80 分钟;75% 员工借助 AI 完成新任务(如编程、数据分析)。
典型案例:零售企业 Lowe's 转化率翻倍,招聘平台 Indeed 申请量增 20%,药企 Moderna 研发周期从周缩短至小时。

全球化与行业差异
国际市场中,澳大利亚、巴西、荷兰等增速超 143%;科技、医疗、制造业增速领跑(分别达 11 倍、8 倍、7 倍)。
行业应用:科技企业聚焦 API 开发,金融业从客服切入,制造业优化供应链。

使用差距扩大
头部员工效率:前 5% 员工消息量为中位数 6 倍,编程任务差距达 17 倍;头部企业单席位消息量为普通企业 2 倍。
工具渗透不足:19% 月活用户未用数据分析功能,14% 未尝试推理工具,显示多数企业尚未释放 AI 潜力。

未来趋势
AI 从 “生成输出” 转向 “多步骤工作流委托”,深度集成需企业提升数据就绪度与组织变革能力。
OpenAI 计划投入 1.4 万亿美元基建,企业市场成其商业模式关键支点。


尽管 AI 采用的鸿沟正在扩大,但企业 AI 仍处于早期阶段。落后的企业仍有机会通过采纳前沿工作者和组织的模式来迎头赶上。成功的组织将不仅仅把 AI 用作生产力工具,而是作为收入增长和竞争优势的持久引擎。(OSCHINA)


2.  GPT-5.2 模型发布,做表格 / PPT、处理超长上下文是专长

12 月 12 日消息,凌晨OpenAI 正式发布前沿模型 GPT-5.2。官方将这款模型定位为迄今最先进的模型,专为开发者和专业用户而打造。


GPT-5.2 将通过 API 提供给 ChatGPT 付费用户和开发者,分为 Instant、Thinking 和 Pro 三类。
·Instant 强调速度,适用于信息查询、写作和翻译;
·Thinking 负责处理编码、长文档分析、数学与规划等结构化难题;
·Pro 面向最高难度场景,强调最稳健、最可靠的输出。


据外媒 TechCrunch 报道,OpenAI 首席产品官 Fidji Simo 说,“OpenAI 打造 5.2 的目的在于解锁更多的经济价值,GPT-5.2 在制作表格、生成简报、写代码、理解图像、处理超长上下文以及执行多步骤工具链任务时表现更强。”

从 OpenAI 的官方介绍获悉,GPT-5.2 在编码、数学、科学、视觉、长文本推理和工具使用上的表现全面提升,可支撑更可靠的智能体工作流、更稳定的企业级代码和能处理大规模真实数据的复杂系统。

OpenAI 公布的基准图显示,GPT-5.2 Thinking 在几乎所有推理测试中领先 Gemini 3 和 Claude Opus-4.5,从真实软件工程案例到博士级科学知识,再到抽象推理与模式发现。

OpenAI 产品负责人 Max Schwarzer 指出,GPT-5.2 在代码生成与调试方面提升明显,能够逐步解释复杂数学与逻辑流程。Windsurf 与 CharlieCode 等创业团队报告称,GPT-5.2 的编程水平达到业内最先进,并在多步骤流程中获得“可衡量”的收益。

此外,GPT-5.2 Thinking 的错误率比上一代减少 38%,在决策、研究与写作等日常工作中更加可靠。(IT之家,节选)



3.  阿里千问月活突破3000万 开放AI PPT等四项新功能

自公测23天月活突破3000万后,阿里巴巴千问APP于12月10日正式向用户开放AI PPT、AI写作、AI文库、AI讲题四项新功能,加速从"会聊天"向"能办事"演进。

新功能中,AI PPT支持39种格式输入并提供超10万份免费模板,用户一句话即可生成并修改精美PPT。AI写作内置千所高校论文模板、百余种公文模板及近万份合同范本,可撰写各类文案并支持多格式互转。AI文库覆盖上亿份试卷、曲谱等资料,实现“一句话找资料”并直接下载。AI讲题则能模拟教师思路清晰呈现解题过程,可一键批改作业并生成薄弱点诊断。

为此阿里已成立由副总裁吴嘉负责的千问C端事业群,目标将其打造为AI时代超级APP,覆盖眼镜、PC、汽车等多场景,并依托3800亿元的AI基础设施建设投入,持续接入地图、外卖、办公等生活场景,让AI服务触达每一位普通用户。(新浪财经,经AI提炼)


4. 谷歌推出AI语音同声传译功能,不知道对方是哪国人也能用

12月13日科技巨头谷歌公司周五发布公告称,正式将最先进的Gemini翻译能力引入翻译应用,包括通过佩戴耳机实现的“AI同传/交传”,同时大幅提升文字翻译工具的能力,以提供更自然、地道的翻译,而不是逐字逐句直译。


谷歌还顺便敲打了一番语言学习软件多邻国的“饭碗”,宣布在翻译应用中拓展语言学习工具的覆盖范围。


与苹果的“实时语音翻译”限制必须使用指定AirPods以及开启“苹果智能”的iPhone 15 Pro或后续机型不同,谷歌的实时AI翻译似乎对设备基本没有要求,同时也将在明年支持iOS系统。


谷歌介绍,在翻译应用的持续监听模式下,Gemini会自动将多种语言的语音翻译为单一目标语言,使得用户可以戴上耳机,用母语聆听外语演讲、讲座或者电影;而在双向对话模式下,用户仍能从耳机中听到实时翻译,同时在说话后依靠手机播报对方的语言。


这项新功能还能保留每位说话者的语气、重音和语速,因此更容易跟上对话并分辨是谁在说话。该功能本质上是将任何一副耳机变成一个实时的单向翻译设备,如果对话者都戴上耳机,就能实现双向AI同声传译。


据悉,Gemini模型能够实现超过70种语言和2000个语言对的语音翻译,包括英语、中文(普通话)、西班牙语、德语等主要语言的互译。该功能支持自动识别语言,所以即便不知道对方是哪国人也能实时启动翻译。(财联社


图片


5. 诺顿发布全球首款 “AI 原生安全浏览器” Norton Neo

智谱AI于12月9日开源核心智能体模型AutoGLM,旨在让AI真正学会"使用手机",其背后考量在于AI手机已成趋势,若该能力仅掌握在少数厂商手中,不仅会限制开发者创新空间,更会让用户最重要的设备沦为"别人家的入口"。


这家由清华团队于2019年孵化的大模型独角兽,自去年10月发布首个真机操作版本后,于今年推出2.0并将之部署于云端虚拟手机,实现动作可回放、审计与干预,同时对敏感数据隔离处理,主动规避微信等涉及用户隐私的APP操作风险。通过开源与私有化部署,企业可在自身合规环境中完整掌控数据、日志和权限,确保技术开放的同时将隐私留在使用方。


此次开源涵盖训练好的核心模型、Phone Use能力框架与工具链、可直接运行的Demo、覆盖50+中文App及Android适配层等,能模拟真人点击、滑动、输入完成外卖点单、机票预订等复杂流程。


智谱累计融资已超百亿元并启动IPO辅导,此番布局被视为抢占AI终端入口的关键动作,与近期豆包携手努比亚引发的AI手机热议形成呼应,后者高管同样强调以开放姿态推进AI手机发展,认为合作才能创造1+1>2的用户体验。(界面新闻,经AI提炼)





图片、内容来自网络,部分内容经AI整合,侵删


提交需求,让我们为你的业务

打造一套真正能落地的 AI 软件解决方案