字数 2850,阅读大约需 15 分钟
Dify 又偷偷更新了!笔者上周的今天才码完 1.8.0的教程😅这次是大版本升级 —— v2.0.0-beta.1 全新上线!
本次更新不仅支持了期待已久的“图文混答”,几乎是重构了“知识库”,可以用工作流的方式创建“知识库”,并且支持调试,具备“工作流”的完整功能,是一个正经的”工作流“。提升了知识库开发的灵活性,与智能体的交互体验。

没更新的小伙伴们看过来~



更新了什么?本次更新的核心亮点集中在知识库模块的全面重构与升级。,笔者参考了dify官方release[1],从中提炼了以下四大核心点:
-
• ①全新页面 & 新入口设计 -
• ②支持工作流编排的知识库 -
• ③支持多源数据:爬虫、本地文件、在线文档、云盘 -
• ④支持图文混答输出
意味着什么?简单来说,Dify 把旧版工作流中“知识库处理”这一模块单独拎了出来,进行了全面升级与重构:
-
•在操作层面,通过①②③,让知识库的构建与使用更加灵活、直观; -
•在能力边界上,通过④,首次实现了图文混排输出,拓展了知识库的应用场景和表现力。
用户体验感拉满?虽然目前功能还在Beta阶段,部分体验还有待完善。
因为还有bug的,先埋个坑😁
接下来,我们来逐一拆解这四大新功能,看看它们到底有多“能打”。1. 知识库的新页面&新入口“知识库”页面新增了一种创建方式,叫做“通过知识流水线创建知识库”。

Dify 提供两种模板类型:内置管道(或者叫流水线)和自定义模板。

7个模板分别是:
-
1. 通用模式-ECO -
2. 父子-HQ -
3. 简易问答 -
4. 含图表的复杂PDF -
5. 基于LLM的上下文增强 -
6. 转Markdown -
7. LLM生成回答
根据Dify官方的知识库流水线说明[2],整理如下表:
|
|
|
|
|
|
---|---|---|---|---|---|
|
通用模式-ECO |
|
|
|
|
|
父子-HQ |
|
|
|
|
|
简易问答 |
|
|
|
将表格数据转换成问答形式
|
|
包含图表的复杂 PDF |
|
|
|
|
|
基于LLM的上下文增强 |
|
|
|
|
|
转换为 Markdown |
|
|
|
|
|
LLM 生成问答 |
|
|
|
|
各个模板的预设功能丰富,觉得上手难度大的可以先挑一个看看,按照提示安装缺失插件,并配置APIKEY尝试。
比如这位粉丝朋友就可以用“简易问答”模板,处理他的Excel啦!

2.知识库的工作流编排之前我们实现“1项具体任务”,才会用工作流,现在“知识库”也能用上“工作流编排”啦。

3.支持多源数据具体看到“数据源”这个节点,这里能添加12个官方插件,插件页面也要选“数据源”才能看到。每个知识库均可支持多个数据源(这些插件都可以作为源)。比如本地文件、在线文档、云盘和网络爬虫。也可以开发新的数据源插件。

这下 “苦数据源久矣”的小伙伴们有救了,不用因为新增/减少一种数据源而改每个任务对应的工作流啦。4.图文混答重磅推出“图文混答”的新功能!🔔前提是:
-
1. 你的知识库分段要准确!包含图片的完整链接! -
2. LLM回答时,不能修改图片的链接!

看来这位粉丝朋友期待的“图文并茂”可以实现了!

5. 实战【智能图文问答】最后,笔者这边演示一个实战案例,包括:从创建空白知识库流水线,到知识库编排,再到创建workflow,检索图文知识库,最后返回图文答案。知识库呢,就用dify官方-Step 1: Create KnowledgePipeline[3]文档。
笔者这边翻译成中文,便于中文问答,需要的朋友自取step1-创建知识管道.md[4]
Dfiy官方关于【知识管道编排的说明】建立一条工厂生产线,每个工位(节点)执行一项特定的任务,然后将它们连接起来,将小部件组装成最终产品。这就是知识管道编排——一个可视化的工作流构建器,允许您通过拖放界面配置数据处理序列。
它可以控制文档的提取、处理、分块、索引和检索策略。在本节中,您将了解知识管道流程,了解不同的节点、如何配置它们,并自定义您自己的数据处理工作流程,以有效地管理和优化您的知识库。
5.1 创建知识库5.1.1 从知识流水线创建知识库

5.1.2 编排在开始之前,让我们了解知识管道流程,才能知道怎么如何将你的文档,转换为可搜索的知识库。

【步骤1. 指定数据源】

添加 ”文档提取器“ 节点,对上传的文件进行提取。

【步骤2. 数据处理 / Chunker】
安装“通用文本分块”节点,对文本进行分块。
需要指定分隔符和块长度,其他不是必填。

块长度为什么填5000?
因为md文档关于图片的代码太长了,小于5000图片链接就不完整,正常不需要这么大哈!知识库中你能调试到位就行
然后就能用 “知识库” 节点了。这个节点不用添加,默认有1个。

更多详情见知识管道编排的说明[5]
5.1.3 发布测试成功,就能够发布啦!




啥意思?
就是,如果不是特别需要灵活修改知识库流水线,免费用,就行了。
如果要给别人用,多动动手也可以。5.1.4 上传文档创建完”流水线“,我们还得上传文档,才能用在其他工作流中,才能检索得到内容。因为“流水线”,只是编排了你上传文档/数据源之后,它要走的一套流程,最终生成知识片段。
相当于只是规划了旅行攻略,得安排个人去实施吧!
“知识库流水线”它还只是个壳,你得往里塞东西。



5.2 使用知识库,搭建智能图文问答助手#5.1 ✈️完成创建了“知识库流水线”,创建了包含1个文档的知识库。

其中,
知识库选择 ”Dify知识管道“LLM提示词你是一个Dify最新版【v2.0.0】的知识库智能助手,请总结知识库的内容来回答问题,请列举知识库中的数据详细回答,如果有图片,保持原图片的所有代码,不得删改。当所有知识库内容都与问题无关时,你的回答必须包括“知识库中未找到您要的答案!”这句话。
以下是知识库:
{上下文}
以上是知识库。
示例问答如何创建知识管道?附图示
💡一句话总结”知识库单节点“,到“知识库工作流”的翻新,从知识库源头处,改善了知识库的单一界面,变得更全面(支持多源数据)、更透明(支持调试),并且支持图文混答!
以上,就是今天的教程,恭喜你又比同行领先一步,了解到Dify最新版功能的特性。新功能还包含“基于队列的图形引擎”,后续有机会再跟进
关于最新教程、踩坑实录以及解决方法,会先分享在群里

💬 如果你喜欢Dify的实用教程,别忘了点赞、转发并关注我们,第一时间掌握Dify 等工作流平台的最新动态!
|
|
|
|
|
|
|
实践出真知,与君共勉引用链接
[1]
dify官方release:https://github.com/langgenius/dify/releases/tag/2.0.0-beta.1[2]
Dify官方的知识库流水线说明:https://docs.dify.ai/en/guides/knowledge-base/knowledge-pipeline/create-knowledge-pipeline[3]
dify官方-Step 1: Create KnowledgePipeline:https://docs.dify.ai/en/guides/knowledge-base/knowledge-pipeline/create-knowledge-pipeline[4]
step1-创建知识管道.md:https://github.com/LGRY/AI-Workflow-Hub/blob/main/Dify/%E6%96%B0%E5%8A%9F%E8%83%BD%E6%B5%8B%E8%AF%95/v2.0.0-beta/step1-%E5%88%9B%E5%BB%BA%E7%9F%A5%E8%AF%86%E7%AE%A1%E9%81%93.md[5]
知识管道编排的说明:https://docs.dify.ai/en/guides/knowledge-base/knowledge-pipeline/knowledge-pipeline-orchestration

