2025-05-23 简讯 : 谷歌的“Jules”以Agent方式进军AI编码竞赛

头条

谷歌的“Jules”以Agent方式进军AI编码竞赛

https://blog.google/technology/google-labs/jules/

去年12月推出内部测试版后，谷歌向公众发布了Jules。这个由Gemini 2.5驱动的工具能克隆整个代码库，然后在开发者忙其他事情时自动编写测试、修复漏洞并开发功能。智能编码领域分为同步结对编程助手，以及像Devin和Jules这样完全独立的智能工具。

独家报道：谷歌视智能眼镜为人工智能的“下一个前沿领域”

https://www.cnet.com/tech/computing/exclusive-google-sees-xr-smart-glasses-as-the-ultimate-use-for-ai-with-warby-parker-samsung-and-xreal-on-deck/#ftag=CAD590a51e

谷歌将借助安卓XR重新进军智能眼镜领域，整合其Gemini AI，通过增强现实眼镜实现实时视觉分析、翻译和情境辅助功能。首批推出的将是与三星合作打造的混合现实头戴设备“穆罕项目”，随后是Xreal推出的面向开发者的增强现实眼镜原型“奥拉项目”，以及未来与沃比·帕克和Gentle Monster等合作伙伴推出的消费级人工智能眼镜。

“深度思考”提升谷歌旗舰产品Gemini人工智能模型性能

https://techcrunch.com/2025/05/20/deep-think-boosts-the-performance-of-googles-flagship-google-gemini-ai-model/

谷歌的深度思考是该公司旗舰产品Gemini 2.5 Pro型号的一种增强推理模式。它能在回答问题前考虑多个答案。深度思考让Gemini 2.5在具有挑战性的编码评估LifeCodeBench中拔得头筹，在用于测试感知和推理等技能的MMMU测试中也击败了OpenAI的o3。谷歌将与“可信赖测试人员”一同测试深度思考，并在广泛推出该功能前进行安全评估。

据报道，苹果将向第三方应用开放其本地人工智能模型。

https://www.theverge.com/news/670868/apple-intelligence-ai-third-party-developer-access-model

苹果计划通过软件开发工具包（SDK）开放其大语言模型，以便开发者能在自己的应用程序中使用。该SDK最初将仅运行苹果较小的设备端模型，且不允许开发者访问在云端运行的模型。这一消息可能会在定于6月9日开始的全球开发者大会上宣布。此次大会还将宣布对iOS、macOS和iPadOS进行全面更新，使其更加统一，并与Vision Pro操作系统类似。

研究

POE报告显示人工智能模型市场份额迅速变化

https://poe.com/blog/spring-2025-ai-model-usage-trends

Quora多模型聊天平台Poe的一份报告显示，2025年1月至5月，人工智能模型的使用情况发生了巨大变化。OpenAI的GPT-4.1系列和谷歌的Gemini 2.5 Pro迅速走红，而Anthropic的Claude模型的受欢迎度下降。该报告突出了各领域的明显领先者：一般文本领域由GPT-4.1主导，推理能力方面Gemini 2.5 Pro领先，图像生成由谷歌的Imagen3领先，视频创作则较为分散，目前Runway领先。

企业数据的关系型基础模型

https://kumo.ai/company/news/kumo-relational-foundation-model/

KumoRFM是一种预训练关系基础模型，无需特定任务训练，就能用于任何数据库和预测任务。

工程

强化学习权威概述（教科书）

https://arxiv.org/pdf/2412.05265

谷歌知名研究员凯文·墨菲刚刚更新了他那本200页的强化学习教材，内容涵盖从传统方法到DPO、GPRO和推理等前沿进展的方方面面。

ARC-AGI-2作为下一代人工智能推理基准发布

https://arxiv.org/pdf/2505.11831

弗朗索瓦·肖莱和ARC Prize团队发布了ARC-AGI-2，这是他们抽象推理基准测试更具挑战性的版本。初步测试显示，就连最先进的人工智能系统也很吃力，o3得分仅3%，而在最初基准测试中得分是53%，人类参与者平均成功解决了75%的任务。2025年ARC Prize竞赛奖金达100万美元，首个准确率达到85%的团队将获70万美元大奖。

DeepSeek-V3训练洞察

https://arxiv.org/abs/2505.09343

DeepSeek的研究人员分享了以DeepSeek-V3为例的硬件-模型协同设计的见解。他们探讨了大语言模型（LLM）的扩展限制，并采用多头潜在注意力、专家混合、FP8训练和多平面网络拓扑等创新技术，以最大限度提高GPU效率，降低通信开销。

2025-05-23 简讯 : 谷歌的“Jules”以Agent方式进军AI编码竞赛

2025-05-23 简讯 : 谷歌的“Jules”以Agent方式进军AI编码竞赛

头条

谷歌的“Jules”以Agent方式进军AI编码竞赛

独家报道：谷歌视智能眼镜为人工智能的“下一个前沿领域”

“深度思考”提升谷歌旗舰产品Gemini人工智能模型性能

据报道，苹果将向第三方应用开放其本地人工智能模型。

研究

POE报告显示人工智能模型市场份额迅速变化

企业数据的关系型基础模型

工程

强化学习权威概述（教科书）

ARC-AGI-2作为下一代人工智能推理基准发布

DeepSeek-V3训练洞察

其他

谷歌会议中的实时语音翻译

适用于任何人工智能应用的量产就绪型MCP集成（GitHub仓库）

谷歌搜索开启人工智能模式

推出人工智能网关

IMAGEN 4和VEO 3

推荐阅读更多精彩内容