安全公告 — 恶意 litellm 版本 1.82.7 与 1.82.8 已从 PyPI 移除(存在 API 密钥外泄风险)。请卸载、轮换已暴露凭据,并升级至安全版本(如 1.82.9+)。运行 pip show litellm 以确认。 PyPI · README

知识与 RAG

使用 AgenticX 构建文档智能与 RAG。

知识与 RAG

概述

AgenticX 提供完整的文档智能流水线 — 从入库、分块到混合检索与 GraphRAG。


文档入库

python
1from agenticx.knowledge import KnowledgeBase
2
3kb = KnowledgeBase(name="my-docs")
4
5# Add documents
6kb.add_file("report.pdf")
7kb.add_url("https://example.com/article")
8kb.add_text("AgenticX is a multi-agent framework...", source="manual")
9
10# Process (chunk, embed, index)
11kb.build()

检索

python
1# Vector retrieval
2results = kb.search("What are the key features?", top_k=5)
3
4# Hybrid retrieval (vector + BM25)
5results = kb.search("key features", mode="hybrid", top_k=10)
6
7# With reranking
8results = kb.search("key features", mode="hybrid", rerank=True, top_k=5)

GraphRAG

对于关系复杂的文档,可使用 GraphRAG:

python
1from agenticx.knowledge import GraphKnowledgeBase
2
3gkb = GraphKnowledgeBase(
4 name="research-papers",
5 graph_backend="neo4j", # or "nebula"
6 neo4j_uri="bolt://localhost:7687"
7)
8
9gkb.add_file("research_paper.pdf")
10gkb.build() # Extracts entities and relationships
11
12# Graph-aware retrieval
13results = gkb.search("relationship between agent memory and performance")

为智能体挂载知识库

python
1from agenticx.tools import KnowledgeBaseTool
2
3kb_tool = KnowledgeBaseTool(knowledge_base=kb)
4
5executor = AgentExecutor(
6 agent=agent,
7 llm=llm,
8 tools=[kb_tool]
9)

支持的文档格式

格式解析器
PDFMinerU / PyMuPDF
Word (.docx)python-docx
PowerPoint (.pptx)python-pptx
MarkdownNative
HTMLBeautifulSoup
CSV / ExcelPandas
Plain textNative

嵌入(Embeddings)

python
1from agenticx.embeddings import OpenAIEmbeddings
2
3embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
4kb = KnowledgeBase(name="my-docs", embeddings=embeddings)

支持的 embedding 供应商:OpenAI、Bailian、SiliconFlow、LiteLLM。


向量存储

存储说明
Faiss本地、快速,无需独立服务
Chroma本地或 server 模式
Qdrant生产级,支持云端
Milvus大规模企业场景
PgVectorPostgreSQL 扩展
Pinecone托管云服务
Weaviate托管云服务,支持 GraphQL