ailine/backend/app/model_services/README.md

"""
模型服务模块（model_services）

提供统一的嵌入、重排和生成式大模型服务获取接口，支持自动降级。

---

## 📚 生成式大模型服务（Chat）

### 双模型服务
| 函数 | 说明 |
|------|------|
| `get_chat_service()` | 获取大模型服务（用于复杂推理、生成） |
| `get_small_llm_service()` | 获取轻量级模型服务（用于简单意图分类、快速问答） |
| `get_all_chat_services()` | 获取所有可用的生成式大模型服务（用于多模型切换） |

### 使用方法

```python
from app.model_services import get_chat_service, get_small_llm_service

# 获取大模型服务（复杂任务）
llm = get_chat_service()
response = llm.invoke("什么是 LangGraph?")

# 获取轻量级模型服务（简单任务）
small_llm = get_small_llm_service()
response = small_llm.invoke("分类用户意图：'你好'")
```

---

## 📚 嵌入模型服务（Embedding）

| 函数 | 说明 |
|------|------|
| `get_embedding_service()` | 获取嵌入模型服务（自动降级） |

### 使用方法

```python
from app.model_services import get_embedding_service

# 获取嵌入服务（LangChain 兼容的 Embeddings）
embeddings = get_embedding_service()
```

---

## 📚 重排模型服务（Rerank）

| 函数 | 说明 |
|------|------|
| `get_rerank_service()` | 获取重排模型服务（自动降级） |

### 使用方法

```python
from app.model_services import get_rerank_service

# 获取重排服务
reranker = get_rerank_service()
sorted_docs = reranker.compress_documents(documents, query, top_n=5)
```

---

## 🔧 环境变量配置

```env
# 智谱 API 配置
ZHIPUAI_API_KEY=***
ZHIPU_EMBEDDING_MODEL=embedding-3  # 可选：embedding-2、embedding-3
ZHIPU_RERANK_MODEL=rerank-2        # 可选：rerank-1、rerank-2
ZHIPU_API_BASE=https://open.bigmodel.cn/api/paas/v4

# DeepSeek API 配置（用于大模型）
DEEPSEEK_API_KEY=***

# 本地 llama.cpp 服务配置（原有配置保持不变）
LLAMACPP_EMBEDDING_URL=http://localhost:port/v1
LLAMACPP_RERANKER_URL=http://localhost:port/v1
LLAMACPP_API_KEY=***
```
"""
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
+								"""
 								模型服务模块（model_services）
-												📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md
- 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构
- 更新 README.md：加入混合路由、双模型服务等新特性
- 更新 backend/app/README.md：加入 hybrid_router.py
- 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service
- 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传
- 新增 backend/test/test_hybrid_router.py：测试脚本

											
										
										
											2026-05-03 16:53:34 +08:00
+								提供统一的嵌入、重排和生成式大模型服务获取接口，支持自动降级。
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
-												📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md
- 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构
- 更新 README.md：加入混合路由、双模型服务等新特性
- 更新 backend/app/README.md：加入 hybrid_router.py
- 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service
- 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传
- 新增 backend/test/test_hybrid_router.py：测试脚本

											
										
										
											2026-05-03 16:53:34 +08:00
+								---
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
-												📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md
- 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构
- 更新 README.md：加入混合路由、双模型服务等新特性
- 更新 backend/app/README.md：加入 hybrid_router.py
- 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service
- 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传
- 新增 backend/test/test_hybrid_router.py：测试脚本

											
										
										
											2026-05-03 16:53:34 +08:00
+								## 📚 生成式大模型服务（Chat）
 								### 双模型服务
 								| 函数 | 说明 |
 								|------|------|
 								| `get_chat_service()` | 获取大模型服务（用于复杂推理、生成） |
 								| `get_small_llm_service()` | 获取轻量级模型服务（用于简单意图分类、快速问答） |
 								| `get_all_chat_services()` | 获取所有可用的生成式大模型服务（用于多模型切换） |
 								### 使用方法
 								```python
 								from app.model_services import get_chat_service, get_small_llm_service
 								# 获取大模型服务（复杂任务）
 								llm = get_chat_service()
 								response = llm.invoke("什么是 LangGraph?")
 								# 获取轻量级模型服务（简单任务）
 								small_llm = get_small_llm_service()
 								response = small_llm.invoke("分类用户意图：'你好'")
 								```
 								---
 								## 📚 嵌入模型服务（Embedding）
 								| 函数 | 说明 |
 								|------|------|
 								| `get_embedding_service()` | 获取嵌入模型服务（自动降级） |
 								### 使用方法
 								```python
 								from app.model_services import get_embedding_service
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
 								# 获取嵌入服务（LangChain 兼容的 Embeddings）
 								embeddings = get_embedding_service()
-												📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md
- 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构
- 更新 README.md：加入混合路由、双模型服务等新特性
- 更新 backend/app/README.md：加入 hybrid_router.py
- 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service
- 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传
- 新增 backend/test/test_hybrid_router.py：测试脚本

											
										
										
											2026-05-03 16:53:34 +08:00
+								```
 								---
 								## 📚 重排模型服务（Rerank）
 								| 函数 | 说明 |
 								|------|------|
 								| `get_rerank_service()` | 获取重排模型服务（自动降级） |
 								### 使用方法
 								```python
 								from app.model_services import get_rerank_service
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
 								# 获取重排服务
 								reranker = get_rerank_service()
 								sorted_docs = reranker.compress_documents(documents, query, top_n=5)
-												📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md
- 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构
- 更新 README.md：加入混合路由、双模型服务等新特性
- 更新 backend/app/README.md：加入 hybrid_router.py
- 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service
- 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传
- 新增 backend/test/test_hybrid_router.py：测试脚本

											
										
										
											2026-05-03 16:53:34 +08:00
+								```
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
-												📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md
- 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构
- 更新 README.md：加入混合路由、双模型服务等新特性
- 更新 backend/app/README.md：加入 hybrid_router.py
- 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service
- 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传
- 新增 backend/test/test_hybrid_router.py：测试脚本

											
										
										
											2026-05-03 16:53:34 +08:00
+								---
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
-												📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md
- 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构
- 更新 README.md：加入混合路由、双模型服务等新特性
- 更新 backend/app/README.md：加入 hybrid_router.py
- 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service
- 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传
- 新增 backend/test/test_hybrid_router.py：测试脚本

											
										
										
											2026-05-03 16:53:34 +08:00
+								## 🔧 环境变量配置
 								```env
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
+								# 智谱 API 配置
-												📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md
- 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构
- 更新 README.md：加入混合路由、双模型服务等新特性
- 更新 backend/app/README.md：加入 hybrid_router.py
- 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service
- 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传
- 新增 backend/test/test_hybrid_router.py：测试脚本

											
										
										
											2026-05-03 16:53:34 +08:00
+								ZHIPUAI_API_KEY=***
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
+								ZHIPU_EMBEDDING_MODEL=embedding-3  # 可选：embedding-2、embedding-3
 								ZHIPU_RERANK_MODEL=rerank-2        # 可选：rerank-1、rerank-2
 								ZHIPU_API_BASE=https://open.bigmodel.cn/api/paas/v4
-												📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md
- 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构
- 更新 README.md：加入混合路由、双模型服务等新特性
- 更新 backend/app/README.md：加入 hybrid_router.py
- 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service
- 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传
- 新增 backend/test/test_hybrid_router.py：测试脚本

											
										
										
											2026-05-03 16:53:34 +08:00
+								# DeepSeek API 配置（用于大模型）
 								DEEPSEEK_API_KEY=***
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
+								# 本地 llama.cpp 服务配置（原有配置保持不变）
 								LLAMACPP_EMBEDDING_URL=http://localhost:port/v1
 								LLAMACPP_RERANKER_URL=http://localhost:port/v1
-												📚 整理并更新文档

- 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md
- 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构
- 更新 README.md：加入混合路由、双模型服务等新特性
- 更新 backend/app/README.md：加入 hybrid_router.py
- 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service
- 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传
- 新增 backend/test/test_hybrid_router.py：测试脚本

											
										
										
											2026-05-03 16:53:34 +08:00
+								LLAMACPP_API_KEY=***
 								```
-												重构：添加模型服务模块，支持嵌入和重排服务的自动降级

新增功能：
- 创建 app/model_services 模块，提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API
- 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API
- 支持单例管理，确保全局只有一个服务实例

修改内容：
- 更新 app/config.py，添加智谱 API 相关配置
- 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py：使用 get_embedding_service()
- 修改 app/rag/pipeline.py：使用 get_rerank_service()
- 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容
- 修改 rag_indexer/config.py：添加智谱配置

环境变量：
- ZHIPUAI_API_KEY：智谱 API 密钥（必选）
- ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3
- ZHIPU_RERANK_MODEL：可选，默认 rerank-2
- ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4

											
										
										
											2026-04-24 22:52:36 +08:00
+								"""