ailine/backend/app/agent/agent_service.py

"""
AI Agent 服务类
"""

from typing import AsyncGenerator, Dict, Any

from langgraph.checkpoint.serde.jsonplus import JsonPlusSerializer

from backend.app.model_services import get_cached_chat_services
from backend.app.main_graph.main_graph_builder import build_agent_graph
from backend.app.logger import info
from backend.app.memory.mem0_client import Mem0Client

from .service_config import ServiceConfig
from .stream_handler import run_graph_stream


class AIAgentService:
    def __init__(self, checkpointer):
        self.checkpointer = checkpointer
        self.graph = None
        self.config: ServiceConfig = None
        self.mem0_client = None

    async def initialize(self) -> "AIAgentService":
        """初始化 Agent 服务"""
        self.mem0_client = Mem0Client()

        self.chat_services = get_cached_chat_services()
        info(f"✅ 加载了 {len(self.chat_services)} 个可用模型: {list(self.chat_services.keys())}")

        graph_builder = build_agent_graph(
            chat_services=self.chat_services,
            mem0_client=self.mem0_client
        )
        self.graph = graph_builder.compile(checkpointer=self.checkpointer)

        self.config = ServiceConfig(self.chat_services)
        info(f"✅ Agent 图初始化完成")

        return self

    def _resolve_and_build(
        self, message: str, thread_id: str, model: str, user_id: str
    ):
        """解析模型并构建调用参数"""
        resolved_model = self.config.resolve_model(model)
        return resolved_model, self.config.build_invocation(
            message, thread_id, resolved_model, user_id
        )

    async def process_message(
        self, message: str, thread_id: str, model: str = "", user_id: str = "default_user"
    ) -> dict:
        """处理用户消息，返回包含回复、token统计和耗时的字典"""
        resolved_model, (config, input_state) = self._resolve_and_build(
            message, thread_id, model, user_id
        )

        result = await self.graph.ainvoke(input_state, config=config)

        reply = result.get("final_reply", "")
        if not reply and result.get("messages"):
            reply = result["messages"][-1].content

        return {
            "reply": reply,
            "token_usage": result.get("last_token_usage", {}),
            "elapsed_time": result.get("last_elapsed_time", 0.0),
            "model_used": resolved_model,
            "metadata": result.get("metadata", {}),
        }

    async def process_message_stream(
        self, message: str, thread_id: str, model: str = "", user_id: str = "default_user"
    ) -> AsyncGenerator[Dict[str, Any], None]:
        """流式处理消息"""
        resolved_model, (config, input_state) = self._resolve_and_build(
            message, thread_id, model, user_id
        )

        info(f"🚀 开始执行 Agent 图，指定模型: {resolved_model}")

        async for event in run_graph_stream(self.graph, input_state, config):
            if event.get("type") != "done":
                yield event
            else:
                yield {**event, "model_used": resolved_model}
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								"""
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								AI Agent 服务类
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								"""
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								from typing import AsyncGenerator, Dict, Any
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
-												导入方式修改

											
										
										
											2026-05-05 23:17:00 +08:00
+								from langgraph.checkpoint.serde.jsonplus import JsonPlusSerializer
-												重构：简化流式架构，将 ReAct 循环移入 agent 节点

主要变更：
- 简化 agent_service：移除复杂双协程，只用 stream_mode=["updates"]
- stream_context：提供更清晰的 API (set_stream_queue/get_stream_queue)
- main_graph_builder：简化图结构，移除 tools 节点和条件边
- agent 节点：包含完整 ReAct 循环 + 流式 Tool Calling 拼接
- 前端：适配新的事件格式
- 添加测试文件：test_full_react_streaming.py, test_stream.py

											
										
										
											2026-05-07 02:56:35 +08:00
+								from backend.app.model_services import get_cached_chat_services
 								from backend.app.main_graph.main_graph_builder import build_agent_graph
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								from backend.app.logger import info
 								from backend.app.memory.mem0_client import Mem0Client
 								from .service_config import ServiceConfig
 								from .stream_handler import run_graph_stream
-												导入方式修改

											
										
										
											2026-05-05 23:17:00 +08:00
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								class AIAgentService:
 								    def __init__(self, checkpointer):
 								        self.checkpointer = checkpointer
-												feat: 完成极简 LangGraph 架构迁移，添加 Baosi API 支持

主要变更：
- 迁移到极简 LangGraph 标准架构（START → init_state → 记忆 → Agent ⇄ Tools → finalize → END）
- 添加 Baosi API 支持，配置 ops4.7 模型
- 保留本地模型作为默认首选，Baosi 作为备选
- 新架构使用 LangGraph 原生 ToolNode 和 bind_tools
- 移除旧的混合路由、JSON 解析等复杂逻辑
- 把旧代码移到 deprecated/ 目录
- 添加新的 Agent 节点和 Tools 模块
- 添加测试脚本验证新架构
- 所有测试通过 ✓

											
										
										
											2026-05-07 00:48:17 +08:00
+								        self.graph = None
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								        self.config: ServiceConfig = None
-												整合旧图和新图：添加完整的记忆检索、总结和完成流程

											
										
										
											2026-05-01 15:43:45 +08:00
+								        self.mem0_client = None
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								    async def initialize(self) -> "AIAgentService":
 								        """初始化 Agent 服务"""
-												修改readme

											
										
										
											2026-05-05 13:30:31 +08:00
+								        self.mem0_client = Mem0Client()
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
-												refactor: 单图方案重构 + 动态模型选择 + chat_services优化

## 核心改动

### 1. 单图方案重构
- 删除了多图（self.graphs），改为单图（self.graph）
- 新增 MainGraphState.current_model 字段用于运行时注入模型
- llm_call 节点改为动态选择模型（create_dynamic_llm_call_node）

### 2. chat_services 优化
- 添加 _cached_services 缓存，避免重复初始化
- 新增 get_cached_chat_services() 函数，用于单图注入
- 新增 _check_http_service_available() 统一HTTP探测逻辑
- 减少重复代码，LocalVLLMChatProvider和LocalSmallModelProvider共用探测方法

### 3. AIAgentService 重构
- initialize() 只构建一次图，传入 chat_services 字典
- 新增 _resolve_model() 模型回退逻辑
- 新增 _build_invocation() 统一构建调用参数
- process_message() 和 process_message_stream() 改为注入 current_model
- 流式处理代码拆分，增加可读性

### 4. 新增和删除文件
- 新增：backend/app/main_graph/main_graph_builder.py（图构建）
- 新增：backend/app/main_graph/subgraph_wrapper.py（子图封装）
- 新增：tools/test/test_tavily_search.py（测试）
- 删除：backend/app/main_graph/graph.py（旧图）
- 删除：backend/app/main_graph/utils/main_graph_builder.py（旧构建器）
- 删除：backend/app/main_graph/utils/__init__.py

### 5. 其他更新
- README.md：新增模型服务使用情况详解章节
- backend/app/model_services/__init__.py：新增 get_cached_chat_services 导出

## 方案优势

- 内存优化：N张图 → 1张图
- 灵活性：运行时动态选择模型，支持同会话不同模型
- 性能：模型服务缓存，初始化仅一次
- 可维护性：减少重复代码，统一HTTP探测逻辑

											
										
										
											2026-05-05 17:30:55 +08:00
+								        self.chat_services = get_cached_chat_services()
 								        info(f"✅ 加载了 {len(self.chat_services)} 个可用模型: {list(self.chat_services.keys())}")
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
-												feat: 完成极简 LangGraph 架构迁移，添加 Baosi API 支持

主要变更：
- 迁移到极简 LangGraph 标准架构（START → init_state → 记忆 → Agent ⇄ Tools → finalize → END）
- 添加 Baosi API 支持，配置 ops4.7 模型
- 保留本地模型作为默认首选，Baosi 作为备选
- 新架构使用 LangGraph 原生 ToolNode 和 bind_tools
- 移除旧的混合路由、JSON 解析等复杂逻辑
- 把旧代码移到 deprecated/ 目录
- 添加新的 Agent 节点和 Tools 模块
- 添加测试脚本验证新架构
- 所有测试通过 ✓

											
										
										
											2026-05-07 00:48:17 +08:00
+								        graph_builder = build_agent_graph(
-												refactor: 单图方案重构 + 动态模型选择 + chat_services优化

## 核心改动

### 1. 单图方案重构
- 删除了多图（self.graphs），改为单图（self.graph）
- 新增 MainGraphState.current_model 字段用于运行时注入模型
- llm_call 节点改为动态选择模型（create_dynamic_llm_call_node）

### 2. chat_services 优化
- 添加 _cached_services 缓存，避免重复初始化
- 新增 get_cached_chat_services() 函数，用于单图注入
- 新增 _check_http_service_available() 统一HTTP探测逻辑
- 减少重复代码，LocalVLLMChatProvider和LocalSmallModelProvider共用探测方法

### 3. AIAgentService 重构
- initialize() 只构建一次图，传入 chat_services 字典
- 新增 _resolve_model() 模型回退逻辑
- 新增 _build_invocation() 统一构建调用参数
- process_message() 和 process_message_stream() 改为注入 current_model
- 流式处理代码拆分，增加可读性

### 4. 新增和删除文件
- 新增：backend/app/main_graph/main_graph_builder.py（图构建）
- 新增：backend/app/main_graph/subgraph_wrapper.py（子图封装）
- 新增：tools/test/test_tavily_search.py（测试）
- 删除：backend/app/main_graph/graph.py（旧图）
- 删除：backend/app/main_graph/utils/main_graph_builder.py（旧构建器）
- 删除：backend/app/main_graph/utils/__init__.py

### 5. 其他更新
- README.md：新增模型服务使用情况详解章节
- backend/app/model_services/__init__.py：新增 get_cached_chat_services 导出

## 方案优势

- 内存优化：N张图 → 1张图
- 灵活性：运行时动态选择模型，支持同会话不同模型
- 性能：模型服务缓存，初始化仅一次
- 可维护性：减少重复代码，统一HTTP探测逻辑

											
										
										
											2026-05-05 17:30:55 +08:00
+								            chat_services=self.chat_services,
 								            mem0_client=self.mem0_client
 								        )
 								        self.graph = graph_builder.compile(checkpointer=self.checkpointer)
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
 								        self.config = ServiceConfig(self.chat_services)
-												feat: 完成极简 LangGraph 架构迁移，添加 Baosi API 支持

主要变更：
- 迁移到极简 LangGraph 标准架构（START → init_state → 记忆 → Agent ⇄ Tools → finalize → END）
- 添加 Baosi API 支持，配置 ops4.7 模型
- 保留本地模型作为默认首选，Baosi 作为备选
- 新架构使用 LangGraph 原生 ToolNode 和 bind_tools
- 移除旧的混合路由、JSON 解析等复杂逻辑
- 把旧代码移到 deprecated/ 目录
- 添加新的 Agent 节点和 Tools 模块
- 添加测试脚本验证新架构
- 所有测试通过 ✓

											
										
										
											2026-05-07 00:48:17 +08:00
+								        info(f"✅ Agent 图初始化完成")
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								        return self
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								    def _resolve_and_build(
-												refactor: 单图方案重构 + 动态模型选择 + chat_services优化

## 核心改动

### 1. 单图方案重构
- 删除了多图（self.graphs），改为单图（self.graph）
- 新增 MainGraphState.current_model 字段用于运行时注入模型
- llm_call 节点改为动态选择模型（create_dynamic_llm_call_node）

### 2. chat_services 优化
- 添加 _cached_services 缓存，避免重复初始化
- 新增 get_cached_chat_services() 函数，用于单图注入
- 新增 _check_http_service_available() 统一HTTP探测逻辑
- 减少重复代码，LocalVLLMChatProvider和LocalSmallModelProvider共用探测方法

### 3. AIAgentService 重构
- initialize() 只构建一次图，传入 chat_services 字典
- 新增 _resolve_model() 模型回退逻辑
- 新增 _build_invocation() 统一构建调用参数
- process_message() 和 process_message_stream() 改为注入 current_model
- 流式处理代码拆分，增加可读性

### 4. 新增和删除文件
- 新增：backend/app/main_graph/main_graph_builder.py（图构建）
- 新增：backend/app/main_graph/subgraph_wrapper.py（子图封装）
- 新增：tools/test/test_tavily_search.py（测试）
- 删除：backend/app/main_graph/graph.py（旧图）
- 删除：backend/app/main_graph/utils/main_graph_builder.py（旧构建器）
- 删除：backend/app/main_graph/utils/__init__.py

### 5. 其他更新
- README.md：新增模型服务使用情况详解章节
- backend/app/model_services/__init__.py：新增 get_cached_chat_services 导出

## 方案优势

- 内存优化：N张图 → 1张图
- 灵活性：运行时动态选择模型，支持同会话不同模型
- 性能：模型服务缓存，初始化仅一次
- 可维护性：减少重复代码，统一HTTP探测逻辑

											
										
										
											2026-05-05 17:30:55 +08:00
+								        self, message: str, thread_id: str, model: str, user_id: str
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								    ):
 								        """解析模型并构建调用参数"""
 								        resolved_model = self.config.resolve_model(model)
 								        return resolved_model, self.config.build_invocation(
 								            message, thread_id, resolved_model, user_id
 								        )
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
-												refactor: 单图方案重构 + 动态模型选择 + chat_services优化

## 核心改动

### 1. 单图方案重构
- 删除了多图（self.graphs），改为单图（self.graph）
- 新增 MainGraphState.current_model 字段用于运行时注入模型
- llm_call 节点改为动态选择模型（create_dynamic_llm_call_node）

### 2. chat_services 优化
- 添加 _cached_services 缓存，避免重复初始化
- 新增 get_cached_chat_services() 函数，用于单图注入
- 新增 _check_http_service_available() 统一HTTP探测逻辑
- 减少重复代码，LocalVLLMChatProvider和LocalSmallModelProvider共用探测方法

### 3. AIAgentService 重构
- initialize() 只构建一次图，传入 chat_services 字典
- 新增 _resolve_model() 模型回退逻辑
- 新增 _build_invocation() 统一构建调用参数
- process_message() 和 process_message_stream() 改为注入 current_model
- 流式处理代码拆分，增加可读性

### 4. 新增和删除文件
- 新增：backend/app/main_graph/main_graph_builder.py（图构建）
- 新增：backend/app/main_graph/subgraph_wrapper.py（子图封装）
- 新增：tools/test/test_tavily_search.py（测试）
- 删除：backend/app/main_graph/graph.py（旧图）
- 删除：backend/app/main_graph/utils/main_graph_builder.py（旧构建器）
- 删除：backend/app/main_graph/utils/__init__.py

### 5. 其他更新
- README.md：新增模型服务使用情况详解章节
- backend/app/model_services/__init__.py：新增 get_cached_chat_services 导出

## 方案优势

- 内存优化：N张图 → 1张图
- 灵活性：运行时动态选择模型，支持同会话不同模型
- 性能：模型服务缓存，初始化仅一次
- 可维护性：减少重复代码，统一HTTP探测逻辑

											
										
										
											2026-05-05 17:30:55 +08:00
+								    async def process_message(
 								        self, message: str, thread_id: str, model: str = "", user_id: str = "default_user"
 								    ) -> dict:
 								        """处理用户消息，返回包含回复、token统计和耗时的字典"""
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								        resolved_model, (config, input_state) = self._resolve_and_build(
 								            message, thread_id, model, user_id
 								        )
-												refactor: 单图方案重构 + 动态模型选择 + chat_services优化

## 核心改动

### 1. 单图方案重构
- 删除了多图（self.graphs），改为单图（self.graph）
- 新增 MainGraphState.current_model 字段用于运行时注入模型
- llm_call 节点改为动态选择模型（create_dynamic_llm_call_node）

### 2. chat_services 优化
- 添加 _cached_services 缓存，避免重复初始化
- 新增 get_cached_chat_services() 函数，用于单图注入
- 新增 _check_http_service_available() 统一HTTP探测逻辑
- 减少重复代码，LocalVLLMChatProvider和LocalSmallModelProvider共用探测方法

### 3. AIAgentService 重构
- initialize() 只构建一次图，传入 chat_services 字典
- 新增 _resolve_model() 模型回退逻辑
- 新增 _build_invocation() 统一构建调用参数
- process_message() 和 process_message_stream() 改为注入 current_model
- 流式处理代码拆分，增加可读性

### 4. 新增和删除文件
- 新增：backend/app/main_graph/main_graph_builder.py（图构建）
- 新增：backend/app/main_graph/subgraph_wrapper.py（子图封装）
- 新增：tools/test/test_tavily_search.py（测试）
- 删除：backend/app/main_graph/graph.py（旧图）
- 删除：backend/app/main_graph/utils/main_graph_builder.py（旧构建器）
- 删除：backend/app/main_graph/utils/__init__.py

### 5. 其他更新
- README.md：新增模型服务使用情况详解章节
- backend/app/model_services/__init__.py：新增 get_cached_chat_services 导出

## 方案优势

- 内存优化：N张图 → 1张图
- 灵活性：运行时动态选择模型，支持同会话不同模型
- 性能：模型服务缓存，初始化仅一次
- 可维护性：减少重复代码，统一HTTP探测逻辑

											
										
										
											2026-05-05 17:30:55 +08:00
 								        result = await self.graph.ainvoke(input_state, config=config)
-												feat: 适配 finalize 节点返回的 final_reply 和 metadata

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

											
										
										
											2026-05-08 02:05:35 +08:00
 								        reply = result.get("final_reply", "")
 								        if not reply and result.get("messages"):
-												refactor: 统一使用新版 React 模式图，移除旧版 GraphBuilder 调用

											
										
										
											2026-05-01 00:13:13 +08:00
+								            reply = result["messages"][-1].content
-												feat: 适配 finalize 节点返回的 final_reply 和 metadata

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

											
										
										
											2026-05-08 02:05:35 +08:00
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								        return {
 								            "reply": reply,
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								            "token_usage": result.get("last_token_usage", {}),
 								            "elapsed_time": result.get("last_elapsed_time", 0.0),
-												feat: 适配 finalize 节点返回的 final_reply 和 metadata

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

											
										
										
											2026-05-08 02:05:35 +08:00
+								            "model_used": resolved_model,
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								            "metadata": result.get("metadata", {}),
-												重构代码，统一config配置

											
										
										
											2026-04-21 11:02:16 +08:00
+								        }
-												refactor: 单图方案重构 + 动态模型选择 + chat_services优化

## 核心改动

### 1. 单图方案重构
- 删除了多图（self.graphs），改为单图（self.graph）
- 新增 MainGraphState.current_model 字段用于运行时注入模型
- llm_call 节点改为动态选择模型（create_dynamic_llm_call_node）

### 2. chat_services 优化
- 添加 _cached_services 缓存，避免重复初始化
- 新增 get_cached_chat_services() 函数，用于单图注入
- 新增 _check_http_service_available() 统一HTTP探测逻辑
- 减少重复代码，LocalVLLMChatProvider和LocalSmallModelProvider共用探测方法

### 3. AIAgentService 重构
- initialize() 只构建一次图，传入 chat_services 字典
- 新增 _resolve_model() 模型回退逻辑
- 新增 _build_invocation() 统一构建调用参数
- process_message() 和 process_message_stream() 改为注入 current_model
- 流式处理代码拆分，增加可读性

### 4. 新增和删除文件
- 新增：backend/app/main_graph/main_graph_builder.py（图构建）
- 新增：backend/app/main_graph/subgraph_wrapper.py（子图封装）
- 新增：tools/test/test_tavily_search.py（测试）
- 删除：backend/app/main_graph/graph.py（旧图）
- 删除：backend/app/main_graph/utils/main_graph_builder.py（旧构建器）
- 删除：backend/app/main_graph/utils/__init__.py

### 5. 其他更新
- README.md：新增模型服务使用情况详解章节
- backend/app/model_services/__init__.py：新增 get_cached_chat_services 导出

## 方案优势

- 内存优化：N张图 → 1张图
- 灵活性：运行时动态选择模型，支持同会话不同模型
- 性能：模型服务缓存，初始化仅一次
- 可维护性：减少重复代码，统一HTTP探测逻辑

											
										
										
											2026-05-05 17:30:55 +08:00
+								    async def process_message_stream(
 								        self, message: str, thread_id: str, model: str = "", user_id: str = "default_user"
 								    ) -> AsyncGenerator[Dict[str, Any], None]:
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								        """流式处理消息"""
 								        resolved_model, (config, input_state) = self._resolve_and_build(
 								            message, thread_id, model, user_id
 								        )
-												refactor: 单图方案重构 + 动态模型选择 + chat_services优化

## 核心改动

### 1. 单图方案重构
- 删除了多图（self.graphs），改为单图（self.graph）
- 新增 MainGraphState.current_model 字段用于运行时注入模型
- llm_call 节点改为动态选择模型（create_dynamic_llm_call_node）

### 2. chat_services 优化
- 添加 _cached_services 缓存，避免重复初始化
- 新增 get_cached_chat_services() 函数，用于单图注入
- 新增 _check_http_service_available() 统一HTTP探测逻辑
- 减少重复代码，LocalVLLMChatProvider和LocalSmallModelProvider共用探测方法

### 3. AIAgentService 重构
- initialize() 只构建一次图，传入 chat_services 字典
- 新增 _resolve_model() 模型回退逻辑
- 新增 _build_invocation() 统一构建调用参数
- process_message() 和 process_message_stream() 改为注入 current_model
- 流式处理代码拆分，增加可读性

### 4. 新增和删除文件
- 新增：backend/app/main_graph/main_graph_builder.py（图构建）
- 新增：backend/app/main_graph/subgraph_wrapper.py（子图封装）
- 新增：tools/test/test_tavily_search.py（测试）
- 删除：backend/app/main_graph/graph.py（旧图）
- 删除：backend/app/main_graph/utils/main_graph_builder.py（旧构建器）
- 删除：backend/app/main_graph/utils/__init__.py

### 5. 其他更新
- README.md：新增模型服务使用情况详解章节
- backend/app/model_services/__init__.py：新增 get_cached_chat_services 导出

## 方案优势

- 内存优化：N张图 → 1张图
- 灵活性：运行时动态选择模型，支持同会话不同模型
- 性能：模型服务缓存，初始化仅一次
- 可维护性：减少重复代码，统一HTTP探测逻辑

											
										
										
											2026-05-05 17:30:55 +08:00
-												feat: 完成极简 LangGraph 架构迁移，添加 Baosi API 支持

主要变更：
- 迁移到极简 LangGraph 标准架构（START → init_state → 记忆 → Agent ⇄ Tools → finalize → END）
- 添加 Baosi API 支持，配置 ops4.7 模型
- 保留本地模型作为默认首选，Baosi 作为备选
- 新架构使用 LangGraph 原生 ToolNode 和 bind_tools
- 移除旧的混合路由、JSON 解析等复杂逻辑
- 把旧代码移到 deprecated/ 目录
- 添加新的 Agent 节点和 Tools 模块
- 添加测试脚本验证新架构
- 所有测试通过 ✓

											
										
										
											2026-05-07 00:48:17 +08:00
+								        info(f"🚀 开始执行 Agent 图，指定模型: {resolved_model}")
-												重构：简化流式架构，将 ReAct 循环移入 agent 节点

主要变更：
- 简化 agent_service：移除复杂双协程，只用 stream_mode=["updates"]
- stream_context：提供更清晰的 API (set_stream_queue/get_stream_queue)
- main_graph_builder：简化图结构，移除 tools 节点和条件边
- agent 节点：包含完整 ReAct 循环 + 流式 Tool Calling 拼接
- 前端：适配新的事件格式
- 添加测试文件：test_full_react_streaming.py, test_stream.py

											
										
										
											2026-05-07 02:56:35 +08:00
-												优化查询代码，优化工具代码

											
										
										
											2026-05-08 22:30:26 +08:00
+								        async for event in run_graph_stream(self.graph, input_state, config):
 								            if event.get("type") != "done":
 								                yield event
 								            else:
 								                yield {**event, "model_used": resolved_model}