DeepSearch 哪家强?对5 款 AI 搜索全面分析

现在只要启动 Deep Research 模式,告诉它你的问题(比如"研究某个产品的市场策略"),它就能自动搜索和分析大量资料,生成一份带有详细引用的研究报告。

作者: 空格的键盘
分类:工作效率
0 次阅读

在GPT 推出Deepresearch后,各家产品都推出了各自的搜索 Agent 。

以 DeepResearch 为例,简单了解下这类产品。

Deep Research 是 OpenAI 推出的一个能帮你"自动做研究"的智能助手。

以前我们要查资料时,需要自己搜索、整理,还得手动把找到的内容复制粘贴给 ChatGPT,否则它就会靠"模型能力"回答。

现在只要启动 Deep Research 模式,告诉它你的问题(比如"研究某个产品的市场策略"),它就能自动搜索和分析大量资料,生成一份带有详细引用的研究报告。

image.png

这个功能由 OpenAI 最新的 o3 模型支持,它不再只依赖预训练的知识,而是能主动搜索最新信息并进行多步推理。

在GPT Deepresearch上线没几天时间,3月份我们就见证了多家AI 搜索、AI Agent型产品:

  • Gemini  deepsearch:gemini 模型,信息综合分析
  • Grok3 deepsearch:使用Grok3 模型独立执行任务
  • Manus:使用多种 AI 模型如 Claude 和 Qwen 独立执行任务
  • 秘塔AI 浅度研究::由R1负责逻辑框架拆解,自研模型执行网页搜索与整合
  • 智谱 AutoGlm:使用LLM作为基础代理,通过图形用户界面(GUI)自主控制数字设备image.png

可以发现这些产品有共同的特点:

以模型能力为核心,借助搜索为工具,执行任务并交付结果。

上面简单介绍下各家产品的特点,本文主要想探讨,我最近使用此类产品时遇到的几个问题

  • 这几家产品搜索结果有何特点?
  • 哪家AI搜索能力更强?
  • 我该在什么场景选择什么产品?

带着以上疑问,我用同一个问题,要求5个产品给出回答,并让Claude 3.7 对回答结果做综合评分和犀利点评。相信能让你和我一样对这几个产品有更全面的认识。


发送问题:
 
 # 根据下面提纲,交付一篇AI模型研究报告,5000字左右:1.1 当代大语言模型概览(如GPT系列、Claude、LLaMA、DeepSeek等) 1.2 各家模型特点与适用场景对比     1.3 模型能力边界与局限性分析     1.4 开源与闭源模型选择策略     1.5 模型API基础使用教程    1.6 大模型技术原理简明解读

等待时长:

  • Gemini  deepsearch:8分钟,搜索300+网页
  • Grok3 deepsearch:6分钟,搜索160+网页
  • Manus:21分钟,执行8个任务
  • 塔AI 浅度研究:7分钟,搜索300+网页
  • 智谱 AutoGlM:16分钟,搜索71网页

回答摘要:

image.pngimage.pngimage.png

Claude 对各家包含锐评:

这5份AI调研报告都在试图用不同的方式讲述同一个故事,却都未能讲好。

智谱autoGLM

报告把自己包装成学术论文,71个参考文献堆砌出的"专业感"反而暴露了其内容的空洞。

过度学术化的语言像是给内容贫乏披上了一层华丽的外衣,而对模型优劣的分析更像是在复述产品说明书。

Manus

这篇报告走向了另一个极端。它用"面向决策者"为借口,把复杂的技术简化成了快餐。

这种过度把深度分析变成了肤浅的营销文案。它像是在用儿童读物的方式讲解量子物理,既不够深入也不够准确。

gemin deepsearch

Gemini的报告沉溺于学术式写作,大量的引用标记打断了阅读流畅性。行文冗长,一个简单的概念需要多个段落来解释,未能增加实质内容。

其对非技术人员的关注也流于表面,虽然避免了复杂代码,但仍充斥着未经解释的专业术语,导致"面向非技术人员"的目标落空。

Grok 3 deepsearch

Grok的报告的双版本设计是其亮点,却也暴露了内容一致性的问题。简明版过于精简,详细版中部分预测数据缺乏足够的论证基础。

其2025年的预测内容有投机取巧之嫌,有些预测缺乏必要的条件和假设说明。

秘塔AI 浅度研究

秘塔的报告的大量使用表格结构化表达,确实提高了信息获取效率,但过度依赖表格和分隔符使得内容呈现机械化,缺乏叙述的连贯性和深度。

其技术解释未能充分联系实际应用场景,技术部分与应用部分显得割裂。商业成本数据乏不同规模企业的差异化分析,使建议显得一刀切。

这些报告的共同问题在于:它们都在试图用不同的"包装"来掩盖内容上的不足

无论是学术范、商业范还是技术范,都未能触及真正的核心 :对技术本质的深入理解和对实际应用的深度思考

它们对DeepSeek的过度关注反映了整个行业对新技术的盲目追捧,而对数据隐私、伦理合规等关键问题的轻描淡写则暴露了分析视角的局限。

一份优秀的技术调研报告不应该是在玩"文字游戏",而是要真正帮助读者理解技术的本质和影响。它需要的不是更多的引用、更复杂的术语或更漂亮的图表,而是真知灼见和务实的分析。遗憾的是,这5份报告都未能达到这个标准。


综合打分

image.png

  • Gemini:内容组织优秀,覆盖范围广,多语言支持强
  • 秘塔AI:全面且平衡,技术与可读性结合好
  • Grok 3:语言风格灵活,实用性强
  • 智谱autoGLM:技术准确性高,但可读性有限
  • Manus:简洁易懂,但深度不足


使用推荐

搜索特点

  • Gemini:搜索范围广,擅长多语言资源整合,但中文内容理解不如本土产品
  • Grok 3:时效性最强,商业信息丰富,技术内容相对薄弱
  • 智谱autoGLM:参考源质量高,技术理解深入,但搜索范围较窄
  • 秘塔AI:中英文整合能力强,专业领域覆盖全面,结构化信息提取准确

 

搜索能力排名

  1. 秘塔AI:最适合专业领域深度搜索,中英文双语优势明显
  2. Gemini:通用性最强,全球资源覆盖好
  3. 智谱autoGLM:中文技术文献处理最佳
  4. Grok 3:商业信息和实时新闻表现突出

 

场景推荐

  • 学术研究::首选智谱autoGLM,备选秘塔AI。参考源质量高,适合深度研究。
  • 商业分析:首选Grok 3,备选Gemini。实时性强,商业信息全面。
  • 技术开发:首选秘塔AI,备选智谱autoGLM。文档理解能力强,结构化提取准确。
  • 日常使用:首选Gemini,备选Grok 3。覆盖面广,实时性好。
  • 中文研究:首选智谱autoGLM,备选秘塔AI。本土资源理解深度好。

 

要根据具体任务选择合适的工具组合,重要信息需要交叉验证。对于重要决策,建议至少使用两款产品进行对比验证,确保信息的准确性和完整性。

总结:

这篇分析报告存在的问题的最大问题就是仅选择了一个任务进行对比,较为局限,没能展现像manus这样提供多种格式交付物的能力。

但对于后面的使用推荐描述,和我个人的理解是相似的,可作为参考。


本文由公众号“空格的键盘”授权AI产品之家转载,原文连接:  https://mp.weixin.qq.com/s/hkZUWsvNUL3nAEolD4jnng