2025-05-23 简讯 : 谷歌的“Jules”以Agent方式进军AI编码竞赛


头条


谷歌的“Jules”以Agent方式进军AI编码竞赛

https://blog.google/technology/google-labs/jules/

去年12月推出内部测试版后,谷歌向公众发布了Jules。这个由Gemini 2.5驱动的工具能克隆整个代码库,然后在开发者忙其他事情时自动编写测试、修复漏洞并开发功能。智能编码领域分为同步结对编程助手,以及像Devin和Jules这样完全独立的智能工具。

独家报道:谷歌视智能眼镜为人工智能的“下一个前沿领域”

https://www.cnet.com/tech/computing/exclusive-google-sees-xr-smart-glasses-as-the-ultimate-use-for-ai-with-warby-parker-samsung-and-xreal-on-deck/#ftag=CAD590a51e

谷歌将借助安卓XR重新进军智能眼镜领域,整合其Gemini AI,通过增强现实眼镜实现实时视觉分析、翻译和情境辅助功能。首批推出的将是与三星合作打造的混合现实头戴设备“穆罕项目”,随后是Xreal推出的面向开发者的增强现实眼镜原型“奥拉项目”,以及未来与沃比·帕克和Gentle Monster等合作伙伴推出的消费级人工智能眼镜。

“深度思考”提升谷歌旗舰产品Gemini人工智能模型性能

https://techcrunch.com/2025/05/20/deep-think-boosts-the-performance-of-googles-flagship-google-gemini-ai-model/

谷歌的深度思考是该公司旗舰产品Gemini 2.5 Pro型号的一种增强推理模式。它能在回答问题前考虑多个答案。深度思考让Gemini 2.5在具有挑战性的编码评估LifeCodeBench中拔得头筹,在用于测试感知和推理等技能的MMMU测试中也击败了OpenAI的o3。谷歌将与“可信赖测试人员”一同测试深度思考,并在广泛推出该功能前进行安全评估。

据报道,苹果将向第三方应用开放其本地人工智能模型。

https://www.theverge.com/news/670868/apple-intelligence-ai-third-party-developer-access-model

苹果计划通过软件开发工具包(SDK)开放其大语言模型,以便开发者能在自己的应用程序中使用。该SDK最初将仅运行苹果较小的设备端模型,且不允许开发者访问在云端运行的模型。这一消息可能会在定于6月9日开始的全球开发者大会上宣布。此次大会还将宣布对iOS、macOS和iPadOS进行全面更新,使其更加统一,并与Vision Pro操作系统类似。


研究


POE报告显示人工智能模型市场份额迅速变化

https://poe.com/blog/spring-2025-ai-model-usage-trends

Quora多模型聊天平台Poe的一份报告显示,2025年1月至5月,人工智能模型的使用情况发生了巨大变化。OpenAI的GPT-4.1系列和谷歌的Gemini 2.5 Pro迅速走红,而Anthropic的Claude模型的受欢迎度下降。该报告突出了各领域的明显领先者:一般文本领域由GPT-4.1主导,推理能力方面Gemini 2.5 Pro领先,图像生成由谷歌的Imagen3领先,视频创作则较为分散,目前Runway领先。

企业数据的关系型基础模型

https://kumo.ai/company/news/kumo-relational-foundation-model/

KumoRFM是一种预训练关系基础模型,无需特定任务训练,就能用于任何数据库和预测任务。


工程


强化学习权威概述(教科书)

https://arxiv.org/pdf/2412.05265

谷歌知名研究员凯文·墨菲刚刚更新了他那本200页的强化学习教材,内容涵盖从传统方法到DPO、GPRO和推理等前沿进展的方方面面。

ARC-AGI-2作为下一代人工智能推理基准发布

https://arxiv.org/pdf/2505.11831

弗朗索瓦·肖莱和ARC Prize团队发布了ARC-AGI-2,这是他们抽象推理基准测试更具挑战性的版本。初步测试显示,就连最先进的人工智能系统也很吃力,o3得分仅3%,而在最初基准测试中得分是53%,人类参与者平均成功解决了75%的任务。2025年ARC Prize竞赛奖金达100万美元,首个准确率达到85%的团队将获70万美元大奖。

DeepSeek-V3训练洞察

https://arxiv.org/abs/2505.09343

DeepSeek的研究人员分享了以DeepSeek-V3为例的硬件-模型协同设计的见解。他们探讨了大语言模型(LLM)的扩展限制,并采用多头潜在注意力、专家混合、FP8训练和多平面网络拓扑等创新技术,以最大限度提高GPU效率,降低通信开销。


其他


谷歌会议中的实时语音翻译

https://techcrunch.com/2025/05/20/google-meet-is-getting-real-time-speech-translation/

谷歌Meet现在支持实时语音翻译,借助DeepMind的音频语言模型保留不同语言间的声音、语气和情感表达。

适用于任何人工智能应用的量产就绪型MCP集成(GitHub仓库)

https://github.com/Klavis-AI/klavis

克拉维斯人工智能简化了与随时可用的MCP服务器的集成,提供稳定连接、内置认证和多客户端支持。它支持拥有100多种工具集成的定制MCP服务器,优化人工智能应用扩展。托管解决方案包括创建新的MCP实例和设置OAuth以实现无缝运行 。

谷歌搜索开启人工智能模式

https://blog.google/products/search/google-search-ai-mode-update/#ai-mode-search

谷歌正在向所有美国用户推出搜索中的人工智能模式,提供更深入的多模态搜索体验,具备高级推理、跟进提问和快速生成人工智能概述等功能。

推出人工智能网关

https://vercel.com/blog/ai-gateway

Vercel推出了AI Gateway进行alpha测试,无需管理API密钥或账户,就能在约100种AI模型间轻松切换。

IMAGEN 4和VEO 3

https://cloud.google.com/blog/products/ai-machine-learning/announcing-veo-3-imagen-4-and-lyria-2-on-vertex-ai

谷歌推出了用于高保真图像生成的Imagen 4、用于视频的Veo 3和用于音乐的Lyria 2,这些都可在Vertex AI上使用。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容