修改readme

2026-05-05 13:30:31 +08:00
parent 128aad0c22
commit 8c021c264e
5 changed files with 730 additions and 1037 deletions
--- a/README.md
+++ b/README.md
--- a/backend/app/agent/agent_service.py
+++ b/backend/app/agent/agent_service.py
@@ -10,7 +10,6 @@ import asyncio
 from ..main_graph.utils.main_graph_builder import build_react_main_graph
 from ..main_graph.tools.graph_tools import AVAILABLE_TOOLS, TOOLS_BY_NAME
 from ..main_graph.config import set_stream_writer
 from ..model_services.chat_services import get_all_chat_services, LocalVLLMChatProvider
 from ..main_graph.utils.rag_initializer import init_rag_tool
 from ..core.intent_classifier import get_intent_classifier
 from ..logger import info, warning, error
@@ -33,18 +32,10 @@ class AIAgentService:
    async def initialize(self):
        # 0. 初始化 Mem0 客户端
        from ..memory.mem0_client import Mem0Client
-        # 创建一个临时的 LLM 用于 Mem0（用第一个可用的）
+        self.mem0_client = Mem0Client()
        chat_services = get_all_chat_services()
        temp_llm = None
        if chat_services:
            temp_llm = list(chat_services.values())[0]
        self.mem0_client = Mem0Client(temp_llm)
        # 1. 初始化 RAG 工具（如果需要）
-        def create_local_llm():
+        rag_tool = await init_rag_tool()
            provider = LocalVLLMChatProvider()
            return provider.get_service()
        rag_tool = await init_rag_tool(create_local_llm)
        if rag_tool:
            self.tools.append(rag_tool)
            self.tools_by_name[rag_tool.name] = rag_tool
--- a/backend/app/main_graph/utils/rag_initializer.py
+++ b/backend/app/main_graph/utils/rag_initializer.py
@@ -20,12 +20,11 @@ def is_initialized() -> bool:
    return _initialized
-async def init_rag_tool(local_llm_creator, force: bool = False):
+async def init_rag_tool(force: bool = False):
    """
-    初始化 RAG 工具（注册到模块级变量）
+    初始化 RAG 工具（注册到模块级变量，内部获取所需服务）
    Args:
        local_llm_creator: 返回 LLM 实例的函数
        force: 是否强制重新初始化
    Returns:
@@ -39,20 +38,22 @@ async def init_rag_tool(local_llm_creator, force: bool = False):
        return _rag_tool
    try:
        from app.model_services.chat_services import get_chat_service
        info("🔄 正在初始化 RAG 检索系统...")
        embeddings = get_embedding_service()
        retriever = create_parent_hybrid_retriever(
            collection_name="rag_documents",
            search_k=5,
-            embeddings=embeddings
+            embeddings=embeddings,
        )
-        rewrite_llm = local_llm_creator()
+        rewrite_llm = get_chat_service()
        rag_tool = create_rag_tool(
            retriever=retriever,
            llm=rewrite_llm,
            num_queries=3,
-            rerank_top_n=5
+            rerank_top_n=5,
        )
        _rag_tool = rag_tool
--- a/backend/app/memory/mem0_client.py
+++ b/backend/app/memory/mem0_client.py
@@ -1,33 +1,36 @@
 from app.config import (
    LLM_API_KEY, ZHIPUAI_API_KEY,
    VLLM_BASE_URL, QDRANT_URL, QDRANT_COLLECTION_NAME, QDRANT_API_KEY,
    LLAMACPP_EMBEDDING_URL, LLAMACPP_API_KEY,
    ZHIPU_EMBEDDING_MODEL, ZHIPU_API_BASE
 )
 from ..model_services import get_embedding_service
 from app.logger import info, warning, error
 import time
 """
 Mem0 记忆层客户端封装模块
 负责 Mem0 的初始化、检索和存储
 """
 import asyncio
-from typing import Optional, List, Dict
+import time
 from typing import Optional, List
 from mem0 import AsyncMemory
 from app.config import (
    LLM_API_KEY,
    ZHIPUAI_API_KEY,
    VLLM_BASE_URL,
    QDRANT_URL,
    QDRANT_COLLECTION_NAME,
    QDRANT_API_KEY,
    LLAMACPP_EMBEDDING_URL,
    LLAMACPP_API_KEY,
    ZHIPU_EMBEDDING_MODEL,
    ZHIPU_API_BASE,
 )
 from app.logger import info, warning, error
 from app.model_services import get_embedding_service
 from app.model_services.chat_services import get_chat_service
 class Mem0Client:
    """Mem0 异步客户端封装类"""
-    def __init__(self, llm_instance):
+    def __init__(self):
-        """
+        """初始化 Mem0 客户端（内部获取所需服务）"""
        初始化 Mem0 客户端
        Args:
            llm_instance: LangChain LLM 实例（用于事实提取）
        """
        self.llm = llm_instance
        self.mem0: Optional[AsyncMemory] = None
        self._initialized = False
@@ -44,9 +47,11 @@ class Mem0Client:
            embedding_dim = len(test_embedding)
            info(f"✅ 嵌入服务可用，向量维度: {embedding_dim}")
-            # 构建 embedder 配置 - 改进的方法
+            # 构建 embedder 配置
-            # 检查本地 provider
+            from app.model_services.embedding_services import (
-            from ..model_services.embedding_services import LocalLlamaCppEmbeddingProvider, ZhipuEmbeddingProvider
+                LocalLlamaCppEmbeddingProvider,
                ZhipuEmbeddingProvider,
            )
            embedder_config = None
            local_provider = LocalLlamaCppEmbeddingProvider()
@@ -59,22 +64,20 @@ class Mem0Client:
                        "model": "Qwen3-Embedding-0.6B-Q8_0",
                        "api_key": LLAMACPP_API_KEY or "dummy-key",
                        "openai_base_url": LLAMACPP_EMBEDDING_URL,
-                    }
+                    },
                }
            else:
                # 检查智谱
                zhipu_provider = ZhipuEmbeddingProvider()
                if zhipu_provider.is_available():
                    info("✅ 使用智谱 API 作为 mem0 embedder")
                    # 使用自定义 embedder 或者 openai 兼容方式
                    # 注意：这里我们使用一个特殊的配置方法
                    embedder_config = {
                        "provider": "openai",
                        "config": {
                            "model": ZHIPU_EMBEDDING_MODEL,
                            "api_key": ZHIPUAI_API_KEY,
                            "openai_base_url": ZHIPU_API_BASE,
-                        }
+                        },
                    }
                else:
                    # 都不可用，使用 dummy 配置并警告
@@ -83,12 +86,17 @@ class Mem0Client:
                        "provider": "openai",
                        "config": {
                            "model": "text-embedding-ada-002",
-                            "api_key": "dummy-key",
+                            "api_key": "***",
                            "openai_base_url": "http://localhost:8080/v1",
-                        }
+                        },
                    }
-            # Mem0 配置 - 简化配置，先确保能启动
+            # 获取 LLM 服务（内部获取）
            info("🔄 正在获取 LLM 服务...")
            chat_llm = get_chat_service()
            info("✅ LLM 服务获取成功")
            # Mem0 配置
            info("🔄 正在构建 Mem0 配置...")
            config = {
                "vector_store": {
@@ -98,7 +106,7 @@ class Mem0Client:
                        "api_key": QDRANT_API_KEY,
                        "collection_name": QDRANT_COLLECTION_NAME,
                        "embedding_model_dims": embedding_dim,
-                    }
+                    },
                },
                "llm": {
                    "provider": "openai",
@@ -108,10 +116,10 @@ class Mem0Client:
                        "openai_base_url": VLLM_BASE_URL or ZHIPU_API_BASE,
                        "temperature": 0.1,
                        "max_tokens": 2000,
-                    }
+                    },
                },
                "embedder": embedder_config,
-                "version": "v1.1"
+                "version": "v1.1",
            }
            info("🔄 正在初始化 Mem0 实例...")
@@ -121,10 +129,9 @@ class Mem0Client:
            # 尝试进行连接测试，但失败不会阻止初始化
            try:
                info("🔄 正在测试 Mem0 连接...")
                # 使用短超时的测试
                await asyncio.wait_for(
                    self.mem0.search("ping", user_id="test", limit=1),
-                    timeout=10.0
+                    timeout=10.0,
                )
                info("✅ Mem0 连接测试成功")
            except Exception as e:
@@ -140,11 +147,14 @@ class Mem0Client:
        except Exception as e:
            error(f"❌ Mem0 初始化失败: {e}")
            import traceback
            error(f"详细错误信息:\n{traceback.format_exc()}")
            self.mem0 = None
            self._initialized = False
-    async def search_memories(self, query: str, user_id: str, limit: int = 5) -> List[str]:
+    async def search_memories(
        self, query: str, user_id: str, limit: int = 5
    ) -> List[str]:
        """
        检索相关记忆
@@ -163,7 +173,7 @@ class Mem0Client:
        try:
            memories = await asyncio.wait_for(
                self.mem0.search(query, user_id=user_id, limit=limit),
-                timeout=30.0
+                timeout=30.0,
            )
            if memories and "results" in memories:
@@ -183,17 +193,25 @@ class Mem0Client:
            return []
    async def add_memories(self, messages, user_id):
        """添加记忆"""
        if not self.mem0:
            return False
        try:
            start = time.time()
            info(f"📝 开始 Mem0 add，消息数: {len(messages)}")
            await asyncio.wait_for(
-            self.mem0.add(messages, user_id=user_id, metadata={"type": "conversation"}),
+                self.mem0.add(
-            timeout=60.0
+                    messages, user_id=user_id, metadata={"type": "conversation"}
                ),
                timeout=60.0,
            )
            info(f"✅ Mem0 add 完成，耗时: {time.time() - start:.2f}s")
            return True
        except asyncio.TimeoutError:
-        error(f"❌ Mem0 记忆添加超时 (60s)，已等待 {time.time() - start:.2f}s")
+            error(
                f"❌ Mem0 记忆添加超时 (60s)，已等待 {time.time() - start:.2f}s"
            )
            return False
        except Exception as e:
            error(f"❌ Mem0 add 失败: {e}")
            return False
--- a/tools/test/test_graph_branches.py
+++ b/tools/test/test_graph_branches.py
@@ -31,25 +31,25 @@ TEST_CASES = [
        "query": "吕布的事迹？",
        "description": "测试快速 RAG 分支"
    },
-    # # 测试3: 需要推理的复杂问题 - 应该直接到 React 循环
+    # 测试3: 需要推理的复杂问题 - 应该直接到 React 循环
-    # {
+    {
-    #     "name": "复杂推理测试",
+        "name": "复杂推理测试",
-    #     "query": "请帮我分析：如果我有10万元，想要在一年内获得15%的收益，有哪些低风险的投资方案？",
+        "query": "请帮我分析：如果我有10万元，想要在一年内获得15%的收益，有哪些低风险的投资方案？",
-    #     "description": "测试 React 循环推理分支"
+        "description": "测试 React 循环推理分支"
-    # },
+    },
    # # 测试4: 需要工具调用的问题
    # {
    #     "name": "工具调用测试",
    #     "query": "搜索一下今天的天气怎么样",
    #     "description": "测试工具调用分支"
    # },
-    # # 测试5: 带记忆的对话
+    # 测试5: 带记忆的对话
-    # {
+    {
-    #     "name": "记忆测试",
+        "name": "记忆测试",
-    #     "query": "你刚才回答了我什么问题？",
+        "query": "你刚才回答了我什么问题？",
-    #     "description": "测试记忆检索分支",
+        "description": "测试记忆检索分支",
-    #     "thread_id": "test_memory_thread"
+        "thread_id": "test_memory_thread"
-    # }
+    }
 ]