ailine/backend/rag_core/retriever_factory.py

"""
RAG 检索器工厂模块

提供创建各种检索器的工厂函数，包括：
- 基础向量检索器
- ParentDocumentRetriever（父子文档）
- 混合检索器（稠密+稀疏）
"""
from typing import Optional
from langchain_core.embeddings import Embeddings
from langchain_core.retrievers import BaseRetriever
from langchain_classic.retrievers import ParentDocumentRetriever
from langchain_text_splitters import RecursiveCharacterTextSplitter, TextSplitter
from langchain_core.stores import BaseStore

from .embedders import LlamaCppEmbedder
from .vector_store import QdrantVectorStore
from .store import create_docstore


def create_parent_retriever(
    collection_name: str = "rag_documents",
    parent_splitter: Optional[TextSplitter] = None,
    child_splitter: Optional[TextSplitter] = None,
    docstore: Optional[BaseStore] = None,
    search_k: int = 5,
    parent_chunk_size: int = 1000,
    parent_chunk_overlap: int = 100,
    child_chunk_size: int = 200,
    child_chunk_overlap: int = 20,
    embeddings: Optional[Embeddings] = None,
) -> ParentDocumentRetriever:
    """
    创建 ParentDocumentRetriever 实例（基础稠密向量版本）。
    
    Args:
        collection_name: Qdrant 集合名称，默认 "rag_documents"
        parent_splitter: 父文档切分器，默认 None（使用默认参数创建）
        child_splitter: 子文档切分器，默认 None（使用默认参数创建）
        docstore: 文档存储实例，默认 None（使用默认参数创建）
        search_k: 检索时返回的结果数，默认 5
        parent_chunk_size: 父文档块大小，默认 1000
        parent_chunk_overlap: 父文档块重叠大小，默认 100
        child_chunk_size: 子文档块大小，默认 200
        child_chunk_overlap: 子文档块重叠大小，默认 20
        embeddings: 嵌入模型实例，默认 None（使用内部默认的 LocalLlamaCppEmbedder）
    
    Returns:
        ParentDocumentRetriever 实例
    """
    # 嵌入模型
    if embeddings is None:
        embedder = LlamaCppEmbedder()
        embeddings = embedder.as_langchain_embeddings()
    
    # 向量存储（只读）
    vector_store = QdrantVectorStore(collection_name=collection_name, embeddings=embeddings)
    
    # 切分器（若未提供则创建默认）
    if parent_splitter is None:
        parent_splitter = RecursiveCharacterTextSplitter(
            chunk_size=parent_chunk_size,
            chunk_overlap=parent_chunk_overlap,
        )
    if child_splitter is None:
        child_splitter = RecursiveCharacterTextSplitter(
            chunk_size=child_chunk_size,
            chunk_overlap=child_chunk_overlap,
        )
    
    # 文档存储
    if docstore is None:
        docstore, _ = create_docstore()
    
    return ParentDocumentRetriever(
        vectorstore=vector_store.get_langchain_vectorstore(),
        docstore=docstore,
        child_splitter=child_splitter,
        parent_splitter=parent_splitter,
        search_kwargs={"k": search_k},
    )


def create_hybrid_retriever_factory(
    collection_name: str = "rag_documents",
    search_k: int = 5,
    embeddings: Optional[Embeddings] = None,
) -> BaseRetriever:
    """
    【不完整，仅占位】创建混合检索器的工厂函数占位符。
    
    注意：完整的混合检索逻辑在 app/rag/retriever.py 中实现。
    这里仅返回 QdrantVectorStore 作为基础。
    
    Args:
        collection_name: Qdrant 集合名称
        search_k: 检索返回结果数
        embeddings: 嵌入模型实例
    
    Returns:
        基础的 QdrantVectorStore（仅稠密检索）
    """
    # 嵌入模型
    if embeddings is None:
        embedder = LlamaCppEmbedder()
        embeddings = embedder.as_langchain_embeddings()
    
    # 创建向量存储
    vector_store = QdrantVectorStore(collection_name=collection_name, embeddings=embeddings)
    
    # 返回 LangChain 兼容的 retriever
    return vector_store.get_langchain_vectorstore().as_retriever(search_kwargs={"k": search_k})
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
+								"""
 								RAG 检索器工厂模块
 								提供创建各种检索器的工厂函数，包括：
 								- 基础向量检索器
 								- ParentDocumentRetriever（父子文档）
 								- 混合检索器（稠密+稀疏）
 								"""
 								from typing import Optional
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								from langchain_core.embeddings import Embeddings
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
+								from langchain_core.retrievers import BaseRetriever
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								from langchain_classic.retrievers import ParentDocumentRetriever
 								from langchain_text_splitters import RecursiveCharacterTextSplitter, TextSplitter
-												参数配置统一

											
										
										
											2026-04-21 19:06:34 +08:00
+								from langchain_core.stores import BaseStore
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
-												refactor: 统一导入方式，移除 sys.path 操作

- 重构所有模块导入，移除 sys.path.insert
- 统一使用 from backend.xxx 的绝对导入方式
- rag_core 包内使用相对导入（from .xxx）
- 移动 visualize_graph.py 到 tools/ 目录
- 添加必要的 __init__.py 文件
- 清理废弃文档和脚本

											
										
										
											2026-05-04 12:55:45 +08:00
+								from .embedders import LlamaCppEmbedder
 								from .vector_store import QdrantVectorStore
 								from .store import create_docstore
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
-												参数配置统一

											
										
										
											2026-04-21 19:06:34 +08:00
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								def create_parent_retriever(
 								    collection_name: str = "rag_documents",
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
+								    parent_splitter: Optional[TextSplitter] = None,
 								    child_splitter: Optional[TextSplitter] = None,
 								    docstore: Optional[BaseStore] = None,
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								    search_k: int = 5,
 								    parent_chunk_size: int = 1000,
 								    parent_chunk_overlap: int = 100,
 								    child_chunk_size: int = 200,
 								    child_chunk_overlap: int = 20,
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
+								    embeddings: Optional[Embeddings] = None,
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								) -> ParentDocumentRetriever:
-												参数配置统一

											
										
										
											2026-04-21 19:06:34 +08:00
+								    """
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
+								    创建 ParentDocumentRetriever 实例（基础稠密向量版本）。
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
-												参数配置统一

											
										
										
											2026-04-21 19:06:34 +08:00
+								    Args:
 								        collection_name: Qdrant 集合名称，默认 "rag_documents"
 								        parent_splitter: 父文档切分器，默认 None（使用默认参数创建）
 								        child_splitter: 子文档切分器，默认 None（使用默认参数创建）
 								        docstore: 文档存储实例，默认 None（使用默认参数创建）
 								        search_k: 检索时返回的结果数，默认 5
 								        parent_chunk_size: 父文档块大小，默认 1000
 								        parent_chunk_overlap: 父文档块重叠大小，默认 100
 								        child_chunk_size: 子文档块大小，默认 200
 								        child_chunk_overlap: 子文档块重叠大小，默认 20
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
+								        embeddings: 嵌入模型实例，默认 None（使用内部默认的 LocalLlamaCppEmbedder）
-												参数配置统一

											
										
										
											2026-04-21 19:06:34 +08:00
+								    Returns:
 								        ParentDocumentRetriever 实例
 								    """
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								    # 嵌入模型
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
+								    if embeddings is None:
 								        embedder = LlamaCppEmbedder()
 								        embeddings = embedder.as_langchain_embeddings()
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								    # 向量存储（只读）
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
+								    vector_store = QdrantVectorStore(collection_name=collection_name, embeddings=embeddings)
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								    # 切分器（若未提供则创建默认）
 								    if parent_splitter is None:
 								        parent_splitter = RecursiveCharacterTextSplitter(
 								            chunk_size=parent_chunk_size,
 								            chunk_overlap=parent_chunk_overlap,
 								        )
 								    if child_splitter is None:
 								        child_splitter = RecursiveCharacterTextSplitter(
 								            chunk_size=child_chunk_size,
 								            chunk_overlap=child_chunk_overlap,
 								        )
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								    # 文档存储
 								    if docstore is None:
-												参数配置统一

											
										
										
											2026-04-21 19:06:34 +08:00
+								        docstore, _ = create_docstore()
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								    return ParentDocumentRetriever(
 								        vectorstore=vector_store.get_langchain_vectorstore(),
 								        docstore=docstore,
 								        child_splitter=child_splitter,
 								        parent_splitter=parent_splitter,
 								        search_kwargs={"k": search_k},
-												参数配置统一

											
										
										
											2026-04-21 19:06:34 +08:00
+								    )
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
 								def create_hybrid_retriever_factory(
 								    collection_name: str = "rag_documents",
 								    search_k: int = 5,
 								    embeddings: Optional[Embeddings] = None,
 								) -> BaseRetriever:
 								    """
 								    【不完整，仅占位】创建混合检索器的工厂函数占位符。
 								    注意：完整的混合检索逻辑在 app/rag/retriever.py 中实现。
 								    这里仅返回 QdrantVectorStore 作为基础。
 								    Args:
 								        collection_name: Qdrant 集合名称
 								        search_k: 检索返回结果数
 								        embeddings: 嵌入模型实例
 								    Returns:
 								        基础的 QdrantVectorStore（仅稠密检索）
 								    """
 								    # 嵌入模型
 								    if embeddings is None:
 								        embedder = LlamaCppEmbedder()
 								        embeddings = embedder.as_langchain_embeddings()
 								    # 创建向量存储
 								    vector_store = QdrantVectorStore(collection_name=collection_name, embeddings=embeddings)
 								    # 返回 LangChain 兼容的 retriever
 								    return vector_store.get_langchain_vectorstore().as_retriever(search_kwargs={"k": search_k})