📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md - 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构 - 更新 README.md：加入混合路由、双模型服务等新特性 - 更新 backend/app/README.md：加入 hybrid_router.py - 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service - 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传 - 新增 backend/test/test_hybrid_router.py：测试脚本
2026-05-03 16:53:34 +08:00
parent a5fc9cd5d8
commit 53fbfb4741
6 changed files with 218 additions and 278 deletions
--- a/backend/app/README.md
+++ b/backend/app/README.md
@@ -36,6 +36,7 @@ app/
 │   ├── nodes/               # 主图节点
 │   │   ├── __init__.py
 │   │   ├── react_nodes.py   # React 模式节点（推理、路由）
+│   │   ├── hybrid_router.py # ⭐ 混合路由节点（前置快速路由 + 自动升级）
 │   │   ├── llm_call.py      # LLM 调用节点
 │   │   ├── retrieve_memory.py # 记忆检索节点
 │   │   ├── memory_trigger.py # 记忆触发节点
@@ -52,7 +53,7 @@ app/
 │   │
 │   └── utils/               # 主图工具函数
 │       ├── __init__.py
-│       ├── main_graph_builder.py # 主图构建器
+│       ├── main_graph_builder.py # 主图构建器（支持混合路由开关）
 │       ├── retry_utils.py   # 重试工具
 │       ├── rag_initializer.py # RAG 初始化工具
 │       └── visualize_graph.py # 图可视化工具
--- a/backend/app/model_services/README.md
+++ b/backend/app/model_services/README.md
@@ -1,31 +1,85 @@
 """
 模型服务模块（model_services）

-提供统一的嵌入和重排模型服务获取接口，支持自动降级：
-1. 优先使用本地 llama.cpp 服务
-2. 本地服务不可用时，自动降级到智谱 API 服务
+提供统一的嵌入、重排和生成式大模型服务获取接口，支持自动降级。

-使用方法：
+---

-from app.model_services import get_embedding_service, get_rerank_service, BaseReranker
+## 📚 生成式大模型服务（Chat）
+
+### 双模型服务
+| 函数 | 说明 |
+|------|------|
+| `get_chat_service()` | 获取大模型服务（用于复杂推理、生成） |
+| `get_small_llm_service()` | 获取轻量级模型服务（用于简单意图分类、快速问答） |
+| `get_all_chat_services()` | 获取所有可用的生成式大模型服务（用于多模型切换） |
+
+### 使用方法
+
+```python
+from app.model_services import get_chat_service, get_small_llm_service
+
+# 获取大模型服务（复杂任务）
+llm = get_chat_service()
+response = llm.invoke("什么是 LangGraph?")
+
+# 获取轻量级模型服务（简单任务）
+small_llm = get_small_llm_service()
+response = small_llm.invoke("分类用户意图：'你好'")
+```
+
+---
+
+## 📚 嵌入模型服务（Embedding）
+
+| 函数 | 说明 |
+|------|------|
+| `get_embedding_service()` | 获取嵌入模型服务（自动降级） |
+
+### 使用方法
+
+```python
+from app.model_services import get_embedding_service

 # 获取嵌入服务（LangChain 兼容的 Embeddings）
 embeddings = get_embedding_service()
+```
+
+---
+
+## 📚 重排模型服务（Rerank）
+
+| 函数 | 说明 |
+|------|------|
+| `get_rerank_service()` | 获取重排模型服务（自动降级） |
+
+### 使用方法
+
+```python
+from app.model_services import get_rerank_service

 # 获取重排服务
 reranker = get_rerank_service()
 sorted_docs = reranker.compress_documents(documents, query, top_n=5)
+```

-环境变量配置：
+---

+## 🔧 环境变量配置
+
+```env
 # 智谱 API 配置
-ZHIPUAI_API_KEY=your_api_key
+ZHIPUAI_API_KEY=***
 ZHIPU_EMBEDDING_MODEL=embedding-3  # 可选：embedding-2、embedding-3
 ZHIPU_RERANK_MODEL=rerank-2        # 可选：rerank-1、rerank-2
 ZHIPU_API_BASE=https://open.bigmodel.cn/api/paas/v4

+# DeepSeek API 配置（用于大模型）
+DEEPSEEK_API_KEY=***
+
 # 本地 llama.cpp 服务配置（原有配置保持不变）
 LLAMACPP_EMBEDDING_URL=http://localhost:port/v1
 LLAMACPP_RERANKER_URL=http://localhost:port/v1
-LLAMACPP_API_KEY=your_api_key
+LLAMACPP_API_KEY=***
+```
 """