2024-08-15 简讯 : Sakana 推出 AI 科学家


头条


Sakana 推出 AI 科学家

https://sakana.ai/ai-scientist/

日本 AI 公司 Sakana 发布了一套系统,该系统可以自主进行研究,提出假设、进行实验、编写代码,并将结果总结成有理有据的论文。该公司提供了该系统撰写的论文示例以及系统的开源版本。

随着 Alexa 10 岁生日的临近,亚马逊开始着眼于生成式 AI

https://techcrunch.com/2024/08/10/as-alexa-turns-10-amazon-looks-to-generative-ai/

亚马逊的 Alexa 部门在 2022 年亏损 100 亿美元并裁员,尽管家庭普及率很高,但其亏本销售策略仍不可持续。随着人们对 Siri 和 Google Assistant 等智能助手的热情也逐渐消退,亚马逊正依靠生成式 AI 来重振 Alexa 的功能和用户参与度。该公司的重点是增强对话互动并克服“智能计时器”的限制。

Replika CEO 表示,AI 的未来可能意味着与聊天机器人建立友谊和婚姻

https://www.theverge.com/24216748/replika-ceo-eugenia-kuyda-ai-companion-chatbots-dating-friendship-decoder-podcast-interview

Replika 首席执行官 Eugenia Kuyda 最近讨论了她对人类关系中人工智能伴侣的愿景,强调了该应用程序在通过头像提供友谊、治疗或浪漫方面的作用。随着LLM的发展,Replika 旨在补充而不是取代人类互动,创造一种新的关系类别。尽管存在争议,例如对成人内容的临时限制,但该应用程序的目的仍然是改善用户的情绪健康。 Replika 拥有数百万用户群和 50-60 人的团队,正计划进行重大重塑,以增强对话的互动性和真实感。


研究


SWE-bench 已验证

https://openai.com/index/introducing-swe-bench-verified/

OpenAI 推出了 SWE-bench 的一个子集,它更简单,更符合当今人类和人工智能可以解决的问题。在运行整个原始基准之前,它是一个很好的验证和努力基准。

小而强大:介绍 answerai-colbert-small

https://www.answer.ai/posts/2024-08-13-small-but-mighty-colbert.html

ColBERT 是一种非常强大的检索模型。这个新模型只有 3300 万个参数,但在多个基准上取得了惊人的性能。这篇文章探讨了如何训练类似的模型以及哪些技巧可以带来强大的性能。

用于语义分割的对象掩码发现

https://arxiv.org/abs/2408.04961v1
“惰性视觉基础”是一种用于开放词汇语义分割的两阶段方法,首先在不依赖文本的情况下发现对象掩码,然后分配文本标签。


工程


AI 工具包

https://github.com/ostris/ai-toolkit

一组用于 AI 的脚本和笔记本。它主要关注图像合成和调整。

Flash 线性注意

https://github.com/sustcsonglin/flash-linear-attention

一组用于最先进的线性注意模型和变体的高性能 Triton 内核。

使用 UniBench 进行视觉语言模型评估

https://github.com/facebookresearch/unibench

UniBench 是一个统一的框架,通过将 50 多个基准组合成一个实现来简化视觉语言模型 (VLM) 的评估。它有助于评估 VLM 在从对象识别到空间感知等各种功能方面的进展。


杂七杂八


Agent Q

https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities

MMultion 已经训练了一个代理使用自我游戏来执行网络查询。在训练过程中,它在各种基于网络的任务(如订餐)上的效率从 18% 提高到了 81%。它使用 MCTS 和 DPO 来改进。斯坦福大学的研究人员也参与了这项工作,网站上有一篇论文。它似乎是基于 Salesforce Research 的 xLAM 函数调用模型构建的。

使用点击注意进行交互式细分

https://github.com/hahamyt/clickattention
一种新的点击注意算法改进了交互式细分。这种方法扩大了积极点击的影响,并减少了点击之间的干扰。

人工智能是否值得在董事会上占有一席之地?

https://www.forbes.com/sites/hessiejones/2024/08/01/does-ai-deserve-a-seat-at-the-boardroom-table/

人工智能融入公司治理,促使领导者制定强大的人工智能战略,以进行数据驱动的决策。虽然人工智能提供了宝贵的见解,尤其是对于LLM来说,但挑战仍然存在,包括技能差距和道德问题。人工智能和人类判断之间的适当平衡对于未来的高管决策过程至关重要。

Gemini 1.5 Flash 价格下降,调整推出已完成

https://developers.googleblog.com/en/gemini-15-flash-updates-google-ai-studio-gemini-api/

Gemini 1.5 Flash 价格下降,输入Token 成本下降 78%,输出 Token 成本下降 71%,其 API 现在支持 100 多种语言。

即使周围大多数汽车都是人驾驶的,自动驾驶汽车也有望改善交通状况

https://www.inverse.com/tech/self-driving-cars-traffic-problem

人工智能和强化学习算法可以改善混合交通流——模拟表明,5% 的自动驾驶车辆的存在可以消除交通拥堵。

预测市场 Polymarket 与 Perplexity 合作展示新闻摘要

https://techcrunch.com/2024/08/12/prediction-market-polymarket-partners-with-perplexity-to-show-news-summaries/

Polymarket 已与人工智能搜索引擎 Perplexity 合作,将与事件相关的新闻摘要和数据可视化集成到其预测市场中。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容