解锁DeepSeek V3.2新玩法!接入联网搜索和网页阅读能力!基于Dify开发AI智能体技术分享与应用实践

每日快讯 2025-12-10
简介: DeepSeek-V3.2以极致性价比实现性能飞跃,推理能力超GPT-4o,API价格仅其1%。支持128K长上下文与智能agent,结合Dify平台可构建高效联网搜索助手,实现实时信息获取与精准回答引用,真正“好用不贵”。

DeepSeek-V3.2是性能跃迁的一代。其核心优势在于,以极致的成本效益,提供了顶级的推理能力。它在权威测试中超越了GPT-4o,但API价格仅为其百分之一,真正做到了“好用不贵”。同时支持长达128K的上下文以及更强大agent能力,在联网搜索场景下,可以分析选择最准确的数据源,作为回答引用

在AI快速发展的今天,大语言模型虽然拥有海量知识,但面对实时信息、最新事件特定网页内容时,往往显得力不从心。

image.png
(上图为DeepSeek V3.2联网搜索得出的信息并非实时更新资讯)


作为一款大模型,在解决一些比较实时的问题时,DeepSeek本身无法获取最新的数据阅读网页,要发挥DeepSeek V3.2的最大能力,就必须给他解锁联网搜索阅读网页的能力,让大模型自己查资料!


那么,如何系统性地为AI助手赋予联网搜索能力,获取最新、最准确的信息?


本文将详细介绍如何基于Dify平台,高效地搭建一个功能完整的联网搜索助手。此方案能充分发挥DeepSeek V3.2“思考与工具调用融合”的先进能力,系统性解决AI助手的实时信息获取难题。


什么是 Dify 联网搜索?


Dify 是一个强大的 LLM 应用开发平台,通过可视化工作流设计,我们可以轻松构建具备联网搜索能力的 AI 助手。与传统的本地部署方案不同,Dify 提供了更加便捷和稳定的解决方案。


核心架构设计

image.png

image.png

URL 提取模块

def main(response):
   results = response[0].get("webPages", [])
   urls = []
   for item in results[:5]:
       urls.append(item.get("url"))
   return {"results": urls}

从搜索结果中提取前 5 个最相关的 URL,为后续内容获取做准备。


内容格式化模块

模板:[webpage {{ i+1 }} begin]
{{ text }}
[webpage {{ i+1 }} end]

将提取的网页内容格式化为 AI 友好的格式,便于后续处理。


我们实验了Dify平台上的许多搜索及网页内容读取插件,此插件最大的不同是基于AI视觉识别来实现的搜索,并排除了许多无用的网页干扰元素,搜索结果上更加准确实时。


详细配置步骤

步骤 1:创建 Dify 应用

  1. 登录 Dify 平台
  2. 创建新的应用,选择"chatflow"模式
  3. 配置应用基本信息(名称、图标等)

image.png

步骤 2:配置工作流节点

2.1 添加时间获取节点

  • 节点类型:工具
  • 工具选择:获取当前时间
  • 配置格式:YYYY-MM-DD
  • 时区设置:UTC

image.png

2.2 添加搜索节点

  • 节点类型:工具
  • 工具选择:网页搜索
  • 参数配置:搜索关键词绑定到用户输入
  • 返回条数:默认 10 条

image.png

2.3 添加代码处理节点

def main(response):
   results = response[0].get("webPages", [])
   urls = []
   for item in results[:5]:
       urls.append(item.get("url"))
   return {"results": urls}

image.png

2.4 配置迭代器

  • 迭代类型:数组迭代
  • 输入:URL 数组
  • 并行处理:启用(提高效率)
  • 并行数量:10

image.png

2.5 添加网页读取节点

  • 节点类型:工具
  • 工具选择:网页阅读器
  • 参数:URL 来自迭代器当前项
  • 超时设置:根据网络情况调整

image.png

2.6 配置内容格式化

节点类型:模板转换
模板格式:[webpage {{ i+1 }} begin]{{ text }}[webpage {{ i+1 }} end]
变量绑定:文本内容和索引


步骤 3:配置 LLM 模型

3.1 选择模型

  • 模型:DeepSeek Chat
  • 提供商:langgenius/deepseek
  • 温度:0.7(平衡创造性和准确性)

3.2 提示词模板

# 以下内容是基于用户发送的消息的搜索结果:
{{context}}
在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X 代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号<a href="网页链接">X</a>的格式在答案中对应部分引用上下文。
在回答时,请注意以下几点:
- 今天是 {{today}}。
- 并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。
- 对于列举类的问题,尽量将答案控制在 10 个要点以内。
- 对于创作类的问题,请务必在正文的段落中引用对应的参考编号。
- 如果回答很长,请尽量结构化、分段落总结。
- 你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。
- 你的回答应该综合多个相关网页来回答,不能重复引用一个网页。
- 除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。
# 用户消息为:
{{#sys.query#}}

image.png


步骤 4:连接节点

image.png

image.png


核心特性分析

image.png

使用效果展示

示例 1:实时信息查询

用户问题今天北京的天气怎么样?

系统处理

  1. 获取当前时间
  2. 搜索"今天北京天气"
  3. 提取相关网页 URL
  4. 读取天气网站内容
  5. AI 整合信息并回答

image.png

示例 2:技术问题解答

用户问题最新的 Python 3.12 有什么新特性?

系统处理

  1. 搜索"Python 3.12 新特性"
  2. 获取官方文档和技术博客
  3. 提取核心信息
  4. AI 总结并结构化回答

image.png


后续可扩展优化

image.png

技术要点总结

  1. 模块化设计:每个功能模块独立,便于维护和扩展
  2. 错误处理:完善的错误处理机制,确保系统稳定性
  3. 可配置性:关键参数可配置,适应不同使用场景
  4. 扩展性:支持添加更多搜索源和内容处理方式


结语

通过 Dify 平台搭建联网搜索助手,我们不仅实现了 AI 的实时信息获取能力,更重要的是建立了一个可扩展、可维护的智能问答系统。这种方案相比传统的本地部署更加稳定可靠,同时提供了丰富的配置选项和优化空间。

随着 AI 技术的不断发展,联网搜索能力将成为智能助手的基础功能。通过本文的介绍,相信您已经掌握了构建这类系统的核心思路和实现方法。期待看到更多基于此方案的创新应用!


本文基于 Dify 平台实际配置经验编写,所有代码和配置均经过测试验证。如有疑问,欢迎交流讨论

©️版权声明:若无特殊声明,本站所有文章版权均归AI导航猿和数眼智能原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容。否则,我站将依法保留追究相关法律责任的权利。

相关文章