AI热点 2月前 75 阅读 0 评论

全网首发!Dify 2.0.0 图文混排上线,每个新功能都是爆款!附实战教程(建议收藏)

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

Dify 又偷偷更新了!


笔者上周的今天才码完 1.8.0的教程😅


这次是大版本升级 —— v2.0.0-beta.1 全新上线!


本次更新不仅支持了期待已久的“图文混答”,几乎是 重构了“知识库”,可以用工作流的方式创建“知识库”,并且支持调试,具备“工作流”的完整功能,是一个正经的”工作流“。提升了知识库开发的灵活性,与智能体的交互体验。


可以说,每个新功能都是爆款



没更新的小伙伴们看过来~


新功能【一图速览】



Dify v2.0.0的知识库支持工作流编排



Dify v2.0.0的知识库支持多源数据



Dify v2.0.0 支持图文混答


更新了什么?


本次更新的核心亮点集中在 知识库模块的全面重构与升级。,笔者参考了dify官方release[1],从中提炼了以下四大核心点:


① 全新页面 & 新入口设计

②支持工作流编排的知识库

③支持多源数据:爬虫、本地文件、在线文档、云盘

④支持图文混答输出


意味着什么?


简单来说,Dify 把旧版工作流中“知识库处理”这一模块单独拎了出来,进行了全面升级与重构


在操作层面,通过①②③,让知识库的构建与使用更加灵活、直观;

在能力边界上,通过④,首次实现了图文混排输出,拓展了知识库的应用场景和表现力。


用户体验感拉满?


虽然目前功能还在 Beta 阶段,部分体验还有待完善。


因为还有bug的,先埋个坑😁


接下来,我们来逐一拆解这四大新功能,看看它们到底有多“能打”。


1. 知识库的新页面&新入口


知识库”页面新增了一种创建方式,叫做“通过知识流水线创建知识库”。



Dify 提供两种模板类型:内置管道(或者叫流水线)和自定义模板


点进来看到 1个自定义模板 和 7个内置管道模板


7个模板分别是:


  1. 通用模式-ECO
  2. 父子-HQ
  3. 简易问答
  4. 含图表的复杂PDF
  5. 基于LLM的上下文增强
  6. 转Markdown
  7. LLM生成回答


根据Dify官方的知识库流水线说明[2],整理如下表:



比如这位粉丝朋友就可以用“简易问答”模板,处理他的Excel啦!



2.知识库的工作流编排


之前我们实现“1项具体任务”,才会用工作流,现在“知识库”也能用上“工作流编排”啦。


点开任意一个空白流水线,或者,模板流水线。就进入”工作流编排“。



3.支持多源数据


具体看到 “数据源” 这个节点,这里能添加12个官方插件,插件页面也要选“数据源”才能看到。


每个知识库均可支持多个数据源(这些插件都可以作为源)。


比如本地文件、在线文档、云盘和网络爬虫。也可以开发新的数据源插件。



Dify v2.0.0的知识库支持多源数据


这下 “苦数据源久矣”的小伙伴们有救了,不用因为新增/减少一种数据源而改每个任务对应的工作流啦。


4.图文混答


重磅推出图文混答”的新功能!


🔔前提是:


1.你的知识库分段要准确!包含图片的完整链接!2. LLM回答时,不能修改图片的链接!



看来这位粉丝朋友期待的“图文并茂”可以实现了!



5. 实战【智能图文问答】


最后,笔者这边演示一个实战案例,包括:从创建空白知识库流水线,到知识库编排,再到创建workflow,检索图文知识库,最后返回图文答案。


知识库呢,就用dify官方-Step 1: Create KnowledgePipeline[3]文档。


笔者这边翻译成中文,便于中文问答,需要的朋友自取 step1-创建知识管道.md[4]


Dfiy官方关于【知识管道编排的说明】
建立一条工厂生产线,每个工位(节点)执行一项特定的任务,然后将它们连接起来,将小部件组装成最终产品。这就是知识管道编排——一个可视化的工作流构建器,允许您通过拖放界面配置数据处理序列。
它可以控制文档的提取、处理、分块、索引和检索策略。
在本节中,您将了解知识管道流程,了解不同的节点、如何配置它们,并自定义您自己的数据处理工作流程,以有效地管理和优化您的知识库。


5.1 创建知识库


5.1.1 从知识流水线创建知识库


先创建一个空白知识库



5.1.2 编排


在开始之前,让我们了解知识管道流程,才能知道怎么如何将你的文档,转换为可搜索的知识库



【步骤1. 指定数据源】


这里指定为 "File"类型。



【步骤2. 数据处理 / 提取器】


添加 ”文档提取器“ 节点,对上传的文件进行提取。



【步骤2. 数据处理 / Chunker】


安装“通用文本分块”节点,对文本进行分块。


需要指定 分隔符块长度,其他不是必填。



块长度为什么填5000?
因为md文档关于图片的代码太长了,小于5000图片链接就不完整,正常不需要这么大哈!知识库中你能调试到位就行


【步骤3. 知识库】


然后就能用 “知识库” 节点了。这个节点不用添加,默认有1个。



完整的知识库管道构建完毕,若想要更灵活的查询,可以加上“输入字段”等等。


更多详情见 知识管道编排的说明[5]


5.1.3 发布


测试成功,就能够发布啦!


点击右上角


发布“知识流水线”


意思是要么付费发布-方便日后重复使用/修改。要么免费-手动搬运。



虽然我们左上角导出,手动搬来搬去,但是官方说了“一旦发布,块结构就无法修改。“



啥意思?


就是,如果不是特别需要灵活修改 知识库流水线,免费用,就行了。


如果要给别人用,多动动手也可以。


5.1.4 上传文档


创建完”流水线“,我们还得上传文档,才能用在其他工作流中,才能检索得到内容。


因为“流水线”,只是编排了你上传文档/数据源之后,它要走的一套流程,最终生成知识片段。


相当于只是规划了旅行攻略,得安排个人去实施吧!
"知识库流水线"它还只是个壳,你得往里塞东西。


点击左侧栏的“文档”,右上角的“添加文件”,上传1个文档



这个操作界面跟旧版知识库一样,就不赘述了。




仔细看,每一个分段,必须包含完整的图片链接,才能正常显示,后面才能正常地给到大模型检索。


5.2 使用知识库,搭建智能图文问答助手


#5.1 ✈️完成创建了“知识库流水线”,创建了包含1个文档的知识库。


能看到这的朋友,应该是相当熟练了,直接贴完整的工作流截图。



其中,


知识库选择 ”Dify知识管道“


LLM提示词


你是一个Dify最新版【v2.0.0】的知识库智能助手,请总结知识库的内容来回答问题,请列举知识库中的数据详细回答,如果有图片,保持原图片的所有代码,不得删改。当所有知识库内容都与问题无关时,你的回答必须包括“知识库中未找到您要的答案!”这句话。
以下是知识库:
{上下文}
以上是知识库。




示例问答


如何创建知识管道?附图示


💡一句话总结


”知识库单节点“,到“知识库工作流”的翻新,从知识库源头处,改善了知识库的单一界面,变得更全面(支持多源数据)、更透明(支持调试),并且支持图文混答!


以上,就是今天的教程,恭喜你又比同行领先一步,了解到Dify最新版功能的特性。


新功能还包含“基于队列的图形引擎”,后续有机会再跟进


文章来自微信公众号 “ AI早高峰 “

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!