用trae自动开发一个知识图谱生成器

AI 知识库11小时前发布
522 0 0
熊猫办公
春节过得差不多了,也该活动活动了,那么我们就继续在人工智能的海洋里探索一下吧。
知识图谱是在生成式人工智能爆火之前的一个热门关键词,大家在创建数字校园的过程中,都纷纷提到了知识图谱,在生成式人工智能爆火后,我们的目光转向了另外一个词——语料,两者有很大的区别,但其中用到了一些相关的技术,比如分词技术,在知识图谱中可以用分词技术结合大模型梳理核心概念、子概念、相关概念,在语料准备中可以借助大模型来自动标注语料属性关系。为了后续深入研究语料(知识图谱)的自动化处理,我们今天使用trae来自动开发一套知识图谱可视化工具,当然也可以使用其他工具,目前最牛的莫过于cursor和claude了,但trae的免费和中文的良好支持让我不得不选中了他。
1.工具:trae,网址:https://www.trae.cn/ide/download
2.梳理开发思路:上传一份文档,将文档中的内容梳理成知识点,并梳理知识点的前驱关系、后驱关系,形成知识关系表,然后根据知识关系表绘制关系图。这里面有两个关键,一个是文档的理解,一个是知识图谱的呈现。对于文档的理解,有两种思路,一种是借助开源专用工具,如分词工具实现分词即可,这种思路智能化程度较低。一种思路是借助大模型直接生成知识关系表。对于知识图谱的呈现,有2D和3D两种模式,可以考虑使用可视化库,如D3.js v6(2D)、Three.js(3D)。
3.输入提示词:编写一个python程序,上传文档,支持pdf、word、pptx等格式,基于上传的文档,支持一个或多个文档,基于文档生成知识图谱,并支持动态知识网络的可视化呈现,点击动态知识网络中关键词右侧呈现原文中内容。
大概过了十多分钟,就生成了一个包含以下功能的python程序:

– 多格式文档支持 :- PDF 文档解析- Word (.docx) 文档解析- PowerPoint (.pptx) 文档解析- 纯文本 (.txt) 文档解析- 智能知识图谱生成 :- 基于jieba中文分词- TF-IDF关键词提取- 关键词共现关系构建- 动态权重计算- 交互式可视化界面 :- 现代化Web界面设计- 拖拽上传文件- 动态知识网络展示- 点击关键词查看原文上下文- 高级功能 :- 关键词搜索- 相关关键词推荐- 统计信息展示- 多文档同时处理程序结构如下图所示:

用trae自动开发一个知识图谱生成器
使用的模块或技术如下:

– 后端框架 :Flask 3.0.0- 文档处理 :pypdf, python-docx, python-pptx- 自然语言处理 :jieba中文分词, scikit-learn- 图算法 :NetworkX- 前端可视化 :vis-network.js- 跨域支持 :Flask-CORS中间我发现文档生成的知识图谱呈现要么缩在一角,要么不停地转圈圈,于是反复追问了几个提示词,让程序自动调整。最终程序将可视化模块换成了echarts,终于符合我的要求了,可见trae并没有按照我们的预期使用2D和3D的显示。当然我们可以使用上述的一些关键技术或解决方案的提示词来追问,这里我感觉已经符合我的要求了,就没有继续改,暂时作为一个版本使用。看一下效果如下图:

用trae自动开发一个知识图谱生成器
用trae自动开发一个知识图谱生成器
用trae自动开发一个知识图谱生成器
用trae自动开发一个知识图谱生成器
用trae自动开发一个知识图谱生成器
用trae自动开发一个知识图谱生成器

效果还是比较符合预期的。

© 版权声明

相关文章