ailine/backend/app/rag/tools.py

"""
RAG 工具模块（完全异步）

将检索功能封装为 LangChain Tool，供 Agent 调用。
采用固定流水线：多路改写 → 并行检索 → RRF 融合 → 重排序 → 返回父文档。

默认使用混合检索（稠密+BM25稀疏）+ 父子文档模式。
"""
from typing import Callable, Optional
from langchain_core.tools import tool
from langchain_core.language_models import BaseLanguageModel
from langchain_core.retrievers import BaseRetriever
from ..rag.pipeline import RAGPipeline, create_rag_pipeline


def create_rag_tool(
    retriever: Optional[BaseRetriever] = None,
    llm: Optional[BaseLanguageModel] = "default_small",
    num_queries: int = 3,
    rerank_top_n: int = 5,
    collection_name: str = "rag_documents",
) -> Callable:
    """
    创建一个配置好的 RAG 检索工具（完全异步）。
    
    默认使用混合检索（稠密+BM25稀疏）+ 父子文档模式。
    
    Args:
        retriever: 基础检索器对象（可选，不提供则自动创建）
        llm: 用于生成多路查询的语言模型。
             - "default_small": (默认) 使用小模型（本地 + DeepSeek）
             - None / False: 不做查询改写
             - BaseLanguageModel 实例: 自定义模型
        num_queries: 生成的查询变体数量
        rerank_top_n: 最终返回的文档数量
        collection_name: Qdrant 集合名称
    
    Returns:
        Async LangChain Tool 函数
    """
    pipeline = RAGPipeline(
        retriever=retriever,
        llm=llm,
        num_queries=num_queries,
        rerank_top_n=rerank_top_n,
        collection_name=collection_name,
    )

    @tool
    async def search_knowledge_base(query: str) -> str:
        """
        在知识库中搜索与查询相关的文档片段（完全异步）。
        
        使用混合检索（稠密向量语义 + BM25 关键词）+ 父子文档模式，
        检索效果最优。
        
        Args:
            query: 用户提出的问题或查询字符串
        
        Returns:
            格式化后的相关文档内容
        """
        try:
            documents = await pipeline.aretrieve(query)
            if not documents:
                return f"在知识库 '{collection_name}' 中未找到与 '{query}' 相关的信息。"
            
            context = pipeline.format_context(documents)
            return context
        except Exception as e:
            return f"检索过程中发生错误: {str(e)}"
    
    return search_knowledge_base
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								"""
-												refactor: 重构RAG核心组件，简化代码结构和测试文件

											
										
										
											2026-05-04 17:58:10 +08:00
+								RAG 工具模块（完全异步）
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
 								将检索功能封装为 LangChain Tool，供 Agent 调用。
 								采用固定流水线：多路改写 → 并行检索 → RRF 融合 → 重排序 → 返回父文档。
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
 								默认使用混合检索（稠密+BM25稀疏）+ 父子文档模式。
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								"""
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
+								from typing import Callable, Optional
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								from langchain_core.tools import tool
 								from langchain_core.language_models import BaseLanguageModel
 								from langchain_core.retrievers import BaseRetriever
-												导入方式修改

											
										
										
											2026-05-05 23:17:00 +08:00
+								from ..rag.pipeline import RAGPipeline, create_rag_pipeline
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
-												refactor: 重构RAG核心组件，简化代码结构和测试文件

											
										
										
											2026-05-04 17:58:10 +08:00
+								def create_rag_tool(
-												修改rag，实现混合检索

											
										
										
											2026-05-04 04:28:32 +08:00
+								    retriever: Optional[BaseRetriever] = None,
-												refactor: 重构RAG核心组件，简化代码结构和测试文件

											
										
										
											2026-05-04 17:58:10 +08:00
+								    llm: Optional[BaseLanguageModel] = "default_small",
-												修改rag，实现混合检索

											
										
										
											2026-05-04 04:28:32 +08:00
+								    num_queries: int = 3,
 								    rerank_top_n: int = 5,
 								    collection_name: str = "rag_documents",
 								) -> Callable:
 								    """
-												refactor: 重构RAG核心组件，简化代码结构和测试文件

											
										
										
											2026-05-04 17:58:10 +08:00
+								    创建一个配置好的 RAG 检索工具（完全异步）。
-												修改rag，实现混合检索

											
										
										
											2026-05-04 04:28:32 +08:00
 								    默认使用混合检索（稠密+BM25稀疏）+ 父子文档模式。
 								    Args:
 								        retriever: 基础检索器对象（可选，不提供则自动创建）
-												refactor: 重构RAG核心组件，简化代码结构和测试文件

											
										
										
											2026-05-04 17:58:10 +08:00
+								        llm: 用于生成多路查询的语言模型。
 								             - "default_small": (默认) 使用小模型（本地 + DeepSeek）
 								             - None / False: 不做查询改写
 								             - BaseLanguageModel 实例: 自定义模型
-												修改rag，实现混合检索

											
										
										
											2026-05-04 04:28:32 +08:00
+								        num_queries: 生成的查询变体数量
 								        rerank_top_n: 最终返回的文档数量
 								        collection_name: Qdrant 集合名称
 								    Returns:
 								        Async LangChain Tool 函数
 								    """
 								    pipeline = RAGPipeline(
 								        retriever=retriever,
 								        llm=llm,
 								        num_queries=num_queries,
 								        rerank_top_n=rerank_top_n,
 								        collection_name=collection_name,
 								    )
 								    @tool
-												refactor: 重构RAG核心组件，简化代码结构和测试文件

											
										
										
											2026-05-04 17:58:10 +08:00
+								    async def search_knowledge_base(query: str) -> str:
-												修改rag，实现混合检索

											
										
										
											2026-05-04 04:28:32 +08:00
+								        """
-												refactor: 重构RAG核心组件，简化代码结构和测试文件

											
										
										
											2026-05-04 17:58:10 +08:00
+								        在知识库中搜索与查询相关的文档片段（完全异步）。
-												修改rag，实现混合检索

											
										
										
											2026-05-04 04:28:32 +08:00
 								        使用混合检索（稠密向量语义 + BM25 关键词）+ 父子文档模式，
 								        检索效果最优。
 								        Args:
 								            query: 用户提出的问题或查询字符串
 								        Returns:
 								            格式化后的相关文档内容
 								        """
 								        try:
 								            documents = await pipeline.aretrieve(query)
 								            if not documents:
 								                return f"在知识库 '{collection_name}' 中未找到与 '{query}' 相关的信息。"
 								            context = pipeline.format_context(documents)
 								            return context
 								        except Exception as e:
 								            return f"检索过程中发生错误: {str(e)}"
-												refactor: 重构RAG核心组件，简化代码结构和测试文件

											
										
										
											2026-05-04 17:58:10 +08:00
+								    return search_knowledge_base