一个强大的知识图谱生成工具


项目简介

一个基于Streamlit的应用程序,使用LangChain和OpenAI的GPT模型从文本输入中提取图谱数据(实体和关系),并生成交互式图谱。


功能特性

  • 两种输入方式:文本上传(.txt文件)或直接文本输入
  • 交互式知识图谱可视化
  • 可自定义的物理布局图谱展示
  • 基于OpenAI GPT-4o模型的实体关系提取功能

安装指南

先决条件

  • Python 3.8或更高版本
  • OpenAI API密钥

依赖项

应用程序需要以下Python包:

  • langchain (>= 0.1.0): 核心LLM框架
  • langchain-experimental (>= 0.0.45): LangChain实验性功能
  • langchain-openai (>= 0.1.0): LangChain的OpenAI集成
  • python-dotenv (>= 1.0.0): 环境变量支持
  • pyvis (>= 0.3.2): 图谱可视化工具
  • streamlit (>= 1.32.0): 网页UI框架

使用提供的requirements.txt文件安装所有依赖项:

pip install -r requirements.txt

设置步骤

  1. 克隆本仓库:

    git clone [仓库URL]cd knowledge_graph_app_2

    注意:将[仓库URL]替换为此仓库的实际URL。

    • 在根目录创建.env文件并填入您的OpenAI API密钥:

      OPENAI_API_KEY=您的OpenAI_API密钥

    运行应用程序

    运行Streamlit应用:

    ounter(linestreamlit run app.py

    这将启动应用程序并在默认浏览器中打开(通常访问地址为http://localhost:8501)。

    使用说明

    1. 从侧边栏选择输入方式(上传txt文件或直接输入文本)
    2. 如果选择文件上传,请从电脑中选择一个.txt文件
    3. 如果使用直接输入,请在文本区域键入或粘贴文本
    4. 点击”生成知识图谱”按钮
    5. 等待图谱生成(根据文本长度可能需要一些时间)
    6. 探索交互式知识图谱:
      • 拖动节点可重新排列图谱
      • 悬停节点和边可查看额外信息
      • 使用鼠标滚轮缩放
      • 可筛选特定节点和边

    工作原理

    应用程序使用LangChain的实验性图谱转换器与OpenAI的GPT-4o模型实现以下功能:

    1. 从输入文本中提取实体
    2. 识别这些实体之间的关系
    3. 生成表示这些信息的图谱结构
    4. 使用PyVis(vis.js可视化库的Python接口)实现图谱可视化

    项目地址

    https://github.com/thu-vu92/knowledge-graph-llms/blob/main/README.md





    扫码加入技术交流群,备注「开发语言-城市-昵称

    (文:GitHubStore)

    发表评论