昊梵体育网

传统知识库管理文档需要反复切換工具:OCR解析PDF、向量化嵌入、检索匹配、每次

传统知识库管理文档需要反复切換工具:OCR解析PDF、向量化嵌入、检索匹配、每次查询重新构建上下文,效率低下且知识无法积累。

OpenKB 将文档处理全流程整合,提供开源LLM知识库解决方案,无需向量数据库。

利用LLM自动编译原始文档为结构化wiki,支持长文档树索引、多模态检索、概念交叉链接,知识持续积累而非每次重算。

GitHub:github.com/VectifyAI/OpenKB

主要功能:

- 广格式支持:PDF、Word、PPT、Excel、HTML、图像等多文件类型;- 长文档处理:PageIndex树索引,无向量精准检索超长PDF(≥20页);- 原生多模态:理解图表、表格、图像,而非纯文本;- 编译wiki:自动生成摘要、概念页、跨文档链接,保持同步;- 查询&聊天:单次问答或多轮交互,支持会话恢复;- Lint检查:检测矛盾、空白、孤儿页,Watch模式实时更新;- Obsidian兼容:纯Markdown + [[wikilinks]],图谱浏览知识图谱。

CLI安装:pip install openkb,初始化后直接添加文档运行,支持多LLM(OpenAI/Claude/Gemini)。

AI工具 知识管理 LLM RAG替代