闻乐 发自 凹非寺量子位 | 公众号 QbitAI
OpenAI强势更新,也没闲着。

考究发布增强版的Gemini Deep Research,基于Gemini 3 Pro构建,特意减少幻觉,在复杂信息检索与分析任务上施展向上,很快将被集成到谷歌搜索、NotebookLM、Google Finance以及升级版的Gemini App中。

谷歌还配套推出了DeepSearchQA基准测试集,为深度搜索与讨论任务提供了更全面的评估轨范。

同期发布了Interactions API,为成立者提供了与Gemini 3 Pro和Deep Research智能体交互的和洽接口。

原本此次不仅是Deep Research升级,如故Gemini生态的大升级。
更普遍的Gemini生态
有网友仍是迫不足待上手一试,用新的智能体作念了一个论文生成器来生成论文,看起来效力可以。

增强版的Gemini Deep Research唐突完结迭代式推理,它不仅能提议查询需求,还能读取和整合搜索截至,发现哪些常识还存在空缺,然后再针对性地开展新一轮搜索。
通过这种轮回式操作,它大幅进步了收罗搜索才智,唐突深刻彀站握取精信赖息。
这种才智也让该智能体在复杂讨论任务中施展出色。比如在东谈主类终末的老师HLE、BrowseComp、和DeepSearchQA等测试中刷新了SOTA收获。

DeepSearchQA是谷歌开源的基准测试集。它的发布主淌若因为现存基准频频难以体现出真正场景下多步地收罗讨论的复杂特质。
它包含了来自17个界限的900个手工盘算推算的因果链任务,条目必老生成详备的谜底鸠合,这么比传统的事实检索测试更能臆想智能体在多步推理与信息交融中的详细才智。

另一方面,谷歌还发布了Interactions API,这是一个为构建智能哄骗而盘算推算的全新友互接口。
模子功能抑止拓展,才智也徐徐从单纯的无景象文本生成转向想考和高等器具使用,原本的generate Content靠近新的复杂交互面容徐徐显过劲不从心。
如果强即将新功能融入其中,会使API变得过于脆弱。
于是谷歌推出了Interactions API,它盘算推算了原生接口,提供了一个和洽的RESTful端点,通过指定模子或智能体参数,就能与模子和智能体进行复杂高下文的交互。
荒谬相宜需要多步地推理、器具调用以及长程任务实验的场景。

它还推广了generate Content的中枢才智,具备办事器端景象可选、可证据且可组合的数据模子、后台实验以及汉典MCP器具复旧等特质,这么一来,Interactions API就简化了责任流,愈加适配成立者环境。

那里更新模子,这边更新智能体、发力API,谷歌和OpenAI,这是battle又battle啊……
[1]https://x.com/googledeepmind/status/1999165708639302079[2]https://blog.google/technology/developers/deep-research-agent-gemini-api/[3]https://x.com/officiallogank/status/1999163355525956020
— 完 —

