滚水科技-【今日资讯】OpenAI 突然发布 GPT-5.2 模型 →

1. OpenAI 发布《2025 年企业 AI 现状报告》

OpenAI 发布了《2025 年企业 AI 现状报告》，该报告基于超 100 万企业客户数据及 9000 名员工调研，揭示了企业 AI 应用进入规模化阶段，员工效率显著提升但使用差距扩大，头部企业及员工优势明显。报告亮点如下：

企业 AI 使用量激增
ChatGPT 企业版席位同比增长 9 倍，覆盖超 700 万职场用户；周消息量增长 8 倍，API 推理令牌消耗暴增 320 倍。
定制化工具（如 Custom GPTs）周活跃用户增长 19 倍，20% 企业消息通过此类工具处理，如 BBVA 银行部署超 4000 个定制 GPT 优化日常流程。

生产力与业务影响
员工日均节省 40-60 分钟，技术岗（数据、工程等）可省 60-80 分钟；75% 员工借助 AI 完成新任务（如编程、数据分析）。
典型案例：零售企业 Lowe's 转化率翻倍，招聘平台 Indeed 申请量增 20%，药企 Moderna 研发周期从周缩短至小时。

全球化与行业差异
国际市场中，澳大利亚、巴西、荷兰等增速超 143%；科技、医疗、制造业增速领跑（分别达 11 倍、8 倍、7 倍）。
行业应用：科技企业聚焦 API 开发，金融业从客服切入，制造业优化供应链。

使用差距扩大
头部员工效率：前 5% 员工消息量为中位数 6 倍，编程任务差距达 17 倍；头部企业单席位消息量为普通企业 2 倍。
工具渗透不足：19% 月活用户未用数据分析功能，14% 未尝试推理工具，显示多数企业尚未释放 AI 潜力。

未来趋势
AI 从 “生成输出” 转向 “多步骤工作流委托”，深度集成需企业提升数据就绪度与组织变革能力。
OpenAI 计划投入 1.4 万亿美元基建，企业市场成其商业模式关键支点。

尽管 AI 采用的鸿沟正在扩大，但企业 AI 仍处于早期阶段。落后的企业仍有机会通过采纳前沿工作者和组织的模式来迎头赶上。成功的组织将不仅仅把 AI 用作生产力工具，而是作为收入增长和竞争优势的持久引擎。（OSCHINA）

2. GPT-5.2 模型发布，做表格 / PPT、处理超长上下文是专长

12 月 12 日消息，凌晨OpenAI 正式发布前沿模型 GPT-5.2。官方将这款模型定位为迄今最先进的模型，专为开发者和专业用户而打造。

GPT-5.2 将通过 API 提供给 ChatGPT 付费用户和开发者，分为 Instant、Thinking 和 Pro 三类。
·Instant 强调速度，适用于信息查询、写作和翻译；
·Thinking 负责处理编码、长文档分析、数学与规划等结构化难题；
·Pro 面向最高难度场景，强调最稳健、最可靠的输出。

据外媒 TechCrunch 报道，OpenAI 首席产品官 Fidji Simo 说，“OpenAI 打造 5.2 的目的在于解锁更多的经济价值，GPT-5.2 在制作表格、生成简报、写代码、理解图像、处理超长上下文以及执行多步骤工具链任务时表现更强。”

从 OpenAI 的官方介绍获悉，GPT-5.2 在编码、数学、科学、视觉、长文本推理和工具使用上的表现全面提升，可支撑更可靠的智能体工作流、更稳定的企业级代码和能处理大规模真实数据的复杂系统。

OpenAI 公布的基准图显示，GPT-5.2 Thinking 在几乎所有推理测试中领先 Gemini 3 和 Claude Opus-4.5，从真实软件工程案例到博士级科学知识，再到抽象推理与模式发现。

OpenAI 产品负责人 Max Schwarzer 指出，GPT-5.2 在代码生成与调试方面提升明显，能够逐步解释复杂数学与逻辑流程。Windsurf 与 CharlieCode 等创业团队报告称，GPT-5.2 的编程水平达到业内最先进，并在多步骤流程中获得“可衡量”的收益。

此外，GPT-5.2 Thinking 的错误率比上一代减少 38%，在决策、研究与写作等日常工作中更加可靠。（IT之家，节选）

3. 阿里千问月活突破3000万开放AI PPT等四项新功能

自公测23天月活突破3000万后，阿里巴巴千问APP于12月10日正式向用户开放AI PPT、AI写作、AI文库、AI讲题四项新功能，加速从"会聊天"向"能办事"演进。

新功能中，AI PPT支持39种格式输入并提供超10万份免费模板，用户一句话即可生成并修改精美PPT。AI写作内置千所高校论文模板、百余种公文模板及近万份合同范本，可撰写各类文案并支持多格式互转。AI文库覆盖上亿份试卷、曲谱等资料，实现“一句话找资料”并直接下载。AI讲题则能模拟教师思路清晰呈现解题过程，可一键批改作业并生成薄弱点诊断。

为此阿里已成立由副总裁吴嘉负责的千问C端事业群，目标将其打造为AI时代超级APP，覆盖眼镜、PC、汽车等多场景，并依托3800亿元的AI基础设施建设投入，持续接入地图、外卖、办公等生活场景，让AI服务触达每一位普通用户。（新浪财经，经AI提炼）

4. 谷歌推出AI语音同声传译功能，不知道对方是哪国人也能用

12月13日科技巨头谷歌公司周五发布公告称，正式将最先进的Gemini翻译能力引入翻译应用，包括通过佩戴耳机实现的“AI同传/交传”，同时大幅提升文字翻译工具的能力，以提供更自然、地道的翻译，而不是逐字逐句直译。

谷歌还顺便敲打了一番语言学习软件多邻国的“饭碗”，宣布在翻译应用中拓展语言学习工具的覆盖范围。

与苹果的“实时语音翻译”限制必须使用指定AirPods以及开启“苹果智能”的iPhone 15 Pro或后续机型不同，谷歌的实时AI翻译似乎对设备基本没有要求，同时也将在明年支持iOS系统。

谷歌介绍，在翻译应用的持续监听模式下，Gemini会自动将多种语言的语音翻译为单一目标语言，使得用户可以戴上耳机，用母语聆听外语演讲、讲座或者电影；而在双向对话模式下，用户仍能从耳机中听到实时翻译，同时在说话后依靠手机播报对方的语言。

这项新功能还能保留每位说话者的语气、重音和语速，因此更容易跟上对话并分辨是谁在说话。该功能本质上是将任何一副耳机变成一个实时的单向翻译设备，如果对话者都戴上耳机，就能实现双向AI同声传译。

据悉，Gemini模型能够实现超过70种语言和2000个语言对的语音翻译，包括英语、中文（普通话）、西班牙语、德语等主要语言的互译。该功能支持自动识别语言，所以即便不知道对方是哪国人也能实时启动翻译。（财联社）

5. 诺顿发布全球首款 “AI 原生安全浏览器” Norton Neo

智谱AI于12月9日开源核心智能体模型AutoGLM，旨在让AI真正学会"使用手机"，其背后考量在于AI手机已成趋势，若该能力仅掌握在少数厂商手中，不仅会限制开发者创新空间，更会让用户最重要的设备沦为"别人家的入口"。

这家由清华团队于2019年孵化的大模型独角兽，自去年10月发布首个真机操作版本后，于今年推出2.0并将之部署于云端虚拟手机，实现动作可回放、审计与干预，同时对敏感数据隔离处理，主动规避微信等涉及用户隐私的APP操作风险。通过开源与私有化部署，企业可在自身合规环境中完整掌控数据、日志和权限，确保技术开放的同时将隐私留在使用方。

此次开源涵盖训练好的核心模型、Phone Use能力框架与工具链、可直接运行的Demo、覆盖50+中文App及Android适配层等，能模拟真人点击、滑动、输入完成外卖点单、机票预订等复杂流程。

智谱累计融资已超百亿元并启动IPO辅导，此番布局被视为抢占AI终端入口的关键动作，与近期豆包携手努比亚引发的AI手机热议形成呼应，后者高管同样强调以开放姿态推进AI手机发展，认为合作才能创造1+1>2的用户体验。（界面新闻，经AI提炼）

图片、内容来自网络，部分内容经AI整合，侵删

【今日资讯】OpenAI 突然发布 GPT-5.2 模型 →

提交需求，让我们为你的业务