头条
XAI 已开源 Grok 2.5
https://x.com/elonmusk/status/1959379349322313920
xAI已在Hugging Face上开源了去年的主打模型Grok 2.5的模型权重。马斯克称,Grok 3预计将在约六个月后开源。
Meta与Midjourney合作开展人工智能研究
https://www.threads.com/@alexanddeer/post/DNq4vW5R1O5
Meta宣布与Midjourney建立合作关系,将获得其人工智能图像和视频生成技术的授权。此次合作旨在把Midjourney的工具整合到Meta的研究及未来产品中,这是一项融合人才、算力和行业合作的更广泛战略的一部分。
苹果正洽谈用谷歌的Gemini AI助力新版Siri
https://links.tldrnewsletter.com/VtldCb
达成协议将标志着苹果一改以往隐秘的内部开发风格,这表明在技术问题导致Siri的人工智能全面升级推迟一年多后,投资者的压力与日俱增。
深度分析
人工智能时代的自建还是外购
https://links.tldrnewsletter.com/fPv7Mc
解决问题有两种方法:自行构建解决方案,或者购买解决方案。多亏了生成式人工智能,现在构建方案容易多了。不过,这并不意味着人人都会选择自行构建而没人购买。商业软件往往包含数千条复杂的业务规则,以及数百万行的业务逻辑,涵盖了政策、合规、安全、法律、财务、定价等方面的限制和流程。要弄清楚并编纂这些规则,需要花费大量时间和精力。绝大多数想开发应用程序的人,无论懂不懂技术,对这些业务规则几乎一无所知。
构建可用于生产的CUDA内核
https://huggingface.co/blog/kernel-builder
Kernel-builder是一个用于跨架构构建和部署定制CUDA内核的库。本指南将介绍如何创建内核以及进行可用于生产的部署。
通用人工智能是一个工程问题
https://www.vincirufus.com/posts/agi-is-engineering-problem/
通用人工智能(AGI)不会仅仅通过扩大大语言模型(LLM)规模就能实现,而是要构建能协调数十个或数千个专门子智能体的智能体系统。目前的大语言模型在许多领域的诸多任务上已经和最优秀的人类表现相当,但缺乏有效发挥这些能力所需的架构基础(上下文管理、记忆系统、集成以及容错协调)。
工程
认识AGEX
https://ashenfad.github.io/agex/announce/
Agex是一个原生Python的智能体框架,能让智能体直接使用现有的库和运行时环境。它允许智能体接收和返回复杂的Python对象,比如DataFrames、Plotly图形,甚至可调用对象。Agex只在沙盒中运行列入白名单的操作。智能体的交互式解释器在不同任务间会持续存在,这样智能体就能构建自己的辅助工具,并随着时间不断改进。
如何修复你的上下文
https://www.dbreunig.com/2025/06/26/how-to-fix-your-context.html
上下文管理通常是构建智能体最困难的部分。智能体设计者的工作是确保智能体有合适的上下文窗口。上下文并非免费——上下文中的每个标记都会影响模型行为。现代大语言模型巨大的上下文窗口是一项强大的能力,但它们很容易导致信息管理混乱。要确保上下文中的所有内容都是重要的。
更短的Token 获得更大可能性
https://www.lesswrong.com/posts/iZPKuuWsDXAcQWbLJ/shorter-tokens-are-more-likely
大语言模型可能会被迫选择“邋遢”词汇,因为这些词有更多可能的词尾,即便没有一个词尾是最佳选择。对分词器进行微小且看似无关紧要的改动,可能会对输出结果产生意想不到的重大影响。字符级Transformer可能表现更差,但那些尝试将词元分组以使其具有同等“意外性”的模型或许能改善这种情况。
自信地进行并行思考
https://jiaweizzhao.github.io/deepconf/
Meta AI推出一种并行思维方法,能在生成过程中或生成后利用模型内部的可信度来过滤低质量推理轨迹,无需额外训练或调整,还能集成到现有服务框架中。
其他
OpenAI 警告防范特殊目的收购公司(SPV)及其他“未经授权”的投资
https://techcrunch.com/2025/08/23/openai-warns-against-spvs-and-other-unauthorized-investments/
OpenAI 已警告投资者,不要参与未经授权的投资机会来涉足 OpenAI,包括特殊目的载体(SPV)。虽说并非每一个 OpenAI 股权要约都有问题,但有些公司试图规避这家初创公司的转让限制。这些交易不会得到认可,对买家也没有经济价值。Anthropic 也告知投资者,在即将到来的一轮融资中,避免使用 SPV 进行投资。
中国严控采购后,英伟达拟叫停H20芯片生产
https://www.cnbc.com/2025/08/22/nvidia-halt-h20-chip-production-china-cracks-down.html
英伟达已要求供应商暂停生产面向中国的H20芯片。此前中国政府告知国内科技企业停止采购英伟达芯片,转而选用本土替代产品。
谷歌测试新的Gemini模式,包括智能体、Go和沉浸式视图
https://www.testingcatalog.com/google-tests-new-gemini-modes-including-agent-go-and-immersive-view/
智能体模式将助力自主探索、规划和任务执行,Gemini Go将辅助构思和制作原型,而沉浸式视图将带来可视化答案。
我们把一个编码智能体放进了一个无限循环里,结果它一夜之间推送了6个代码库。
https://github.com/repomirrorhq/repomirror/blob/main/repomirror.md
这个团队在 YC 智能体黑客松活动的一个周末,让 Claude Code 在无界面状态下循环运行,最终实现了一千多次代码提交、移植了六个代码库,还开发出一个借助人工智能对代码仓库进行转换操作的工具。
评估大语言模型以满足我的个人使用需求
https://darkcoding.net/software/personal-ai-evals-aug-2025/
大多数模型都差不多,所以成本和延迟才是关键。
最新款双子座Nano,搭载设备端机器学习套件生成式人工智能应用程序编程接口
生成式人工智能应用程序编程接口旨在让用户使用最新版的Gemini Nano,同时在设备和模型升级过程中保证质量稳定。