
头条
软银批准对OpenAI剩余225亿美元的投资
第二笔投资能否到位,取决于OpenAI能否在年底前改组为盈利性企业,这也为其最终上市奠定基础。
据报道,OpenAI正在开发新的生成式音乐工具
https://techcrunch.com/2025/10/25/openai-reportedly-developing-new-generative-music-tool/
尽管面临诸多版权纠纷,OpenAI仍未退缩,正在开发一个文本转音乐模型。该模型能为视频(包括Sora生成的视频)添加配乐,还能为声乐轨道叠加乐器音效。
OpenAI可能正在为ChatGPT测试GPT - 5.1 - Mini升级版
https://www.testingcatalog.com/openai-might-be-testing-gpt-5-1-mini-upgrade-for-chatgpt/
周五,ChatGPT的模型选择器向部分企业账户用户临时显示了“GPT - 5 Mini Scout”,这立刻引发了人们对其用途的猜测。不久后,OpenAI官方JavaScript代理库更新,测试文件中出现了对“GPT - 5.1 Mini”的新引用,这表明“GPT - 5.1 Mini”可能是“Mini Scout”的正式产品名称。目前,有关新模型的引用已被移除。
深度分析
对模型规格进行压力测试,揭示语言模型的特性差异
https://alignment.anthropic.com/2025/stress-testing-model-specs/
人工智能公司Anthropic和思维机器实验室的一项联合研究发现,Claude、GPT、Grok和Gemini模型的价值观与它们开发者公开宣称的不符。通过生成30多万个让模型在相互冲突的原则间做选择的场景,研究人员发现Claude模型更看重道德责任,OpenAI的模型更倾向效率,而Gemini和Grok则更强调情感联系。
缓解提示注入问题
https://www.perplexity.ai/hub/blog/mitigating-prompt-injection-in-come
Perplexity 阐述了其深度防御策略,以保护其 AI 助手浏览器 Comet 免受恶意提示注入攻击。这是一种新兴的攻击方式,无需利用软件漏洞就能操控模型行为。
工程
Meta推出自主人工智能的构建模块
https://ai.meta.com/blog/introducing-pytorch-native-agentic-stack/
一套基于 PyTorch 的开源工具集,用于自主智能体 AI,涵盖内核开发、分布式系统和强化学习,支持大规模 GPU 工作负载和边缘部署。
跨模态视觉特征:SVG 和 ASCII 艺术展现跨模态理解
https://transformer-circuits.pub/2025/october-update/index.html#svg-cross-modal
Claude的内部神经元能识别文本何时构成视觉艺术。对“眼睛”这个词有反应的神经元,在看到以ASCII形式排列成眼睛的@符号,或在人脸中以眼睛形式排列的SVG圆形元素时,也会被激活。Anthropic的研究人员在嘴巴、耳朵、狗和猫等方面都发现了这种跨模态模式,这表明该模型能在不同格式下建立概念与其视觉表现之间的联系,就像人类无论笑脸是画出来的、描述出来的,还是用SVG编码的,都能认出来一样。
介绍 FlashPack:为 PyTorch 实现闪电般快速的模型加载
https://blog.fal.ai/introducing-flashpack-lightning-fast-model-loading-for-pytorch/
FlashPack是一种用于PyTorch的高吞吐量文件格式和加载机制,能让模型检查点的输入输出速度极快。它加载任何模型的速度,比现有最先进的方法快3到6倍。FlashPack封装在一个轻量级的纯Python包中,随处可用。即使在无法使用GPU Direct Storage的系统上也能运行。
其他
像外科医生一样编程
https://www.geoffreylitt.com/2025/10/24/code-like-a-surgeon
目标不是把核心工作交出去,然后只当审核员或编辑。应该是把次要任务分担出去,这样你就能专注于真正重要的事。像写文档、修复 TypeScript 错误、快速测试变更这类苦差事,正是 AI 代理擅长的,它们可以在后台异步运行。
英特尔在不到两年的时间里裁员3.55万人。
过去3个月里,英特尔裁掉了多达2.05万名员工。裁员似乎主要集中在第二季度。英特尔首席执行官陈立武此前曾公开表示,要精简公司架构,减少中层管理人员数量,但此次裁员也波及了工程师和技术人员。该公司最新财报显示,尽管营收有所增长,但研发预算同比削减了超8亿美元,这明显表明,英特尔正在砍掉多个处于不同研发阶段的项目和计划。
可可机器人公司聘请加州大学洛杉矶分校教授,领导新的物理人工智能研究实验室
可可机器人公司聘请加州大学洛杉矶分校的周博磊教授,来领导一个新的实体人工智能实验室。该实验室将利用五年的机器人数据,提升自动化水平。
谷歌AI工作室里的活力编码体验
https://blog.google/technology/developers/introducing-vibe-coding-in-google-ai-studio/
谷歌AI Studio新推出的 Vibe Coding 界面简化了构建AI应用程序的流程,让开发者无需复杂设置或手动进行API集成,就能从提示直接进入原型开发。
OLMOCR-2-7B-1025
https://huggingface.co/allenai/olmOCR-2-7B-1025
这次发布的 olmOCR 模型经过了微调,以提升其在处理数学公式、表格和其他复杂 OCR 情况时的性能。
