- 删除冗余文档:backend/app/README.md、backend/app/model_services/README.md - 保留重要深度文档:backend/app/rag/README.md(RAG 模块详细说明) - 更新 REACT_MODE_SUMMARY.md:加入模型服务层的关键内容
This commit is contained in:
@@ -104,7 +104,7 @@ END
|
||||
|
||||
---
|
||||
|
||||
## 📁 关键文件清单
|
||||
## 📦 关键文件清单
|
||||
|
||||
| 文件 | 说明 |
|
||||
|------|------|
|
||||
@@ -119,6 +119,39 @@ END
|
||||
|
||||
---
|
||||
|
||||
## 🛠️ 模型服务层
|
||||
|
||||
### 生成式大模型服务(Chat)
|
||||
|
||||
| 函数 | 说明 |
|
||||
|------|------|
|
||||
| `get_chat_service()` | 获取大模型服务(用于复杂推理、生成) |
|
||||
| `get_small_llm_service()` | 获取轻量级模型服务(用于简单意图分类、快速问答) |
|
||||
| `get_all_chat_services()` | 获取所有可用的生成式大模型服务(用于多模型切换) |
|
||||
|
||||
### 使用方法
|
||||
|
||||
```python
|
||||
from app.model_services import get_chat_service, get_small_llm_service
|
||||
|
||||
# 获取大模型服务(复杂任务)
|
||||
llm = get_chat_service()
|
||||
response = llm.invoke("什么是 LangGraph?")
|
||||
|
||||
# 获取轻量级模型服务(简单任务)
|
||||
small_llm = get_small_llm_service()
|
||||
response = small_llm.invoke("分类用户意图:'你好'")
|
||||
```
|
||||
|
||||
### 嵌入与重排模型服务
|
||||
|
||||
| 函数 | 说明 |
|
||||
|------|------|
|
||||
| `get_embedding_service()` | 获取嵌入模型服务(自动降级) |
|
||||
| `get_rerank_service()` | 获取重排模型服务(自动降级) |
|
||||
|
||||
---
|
||||
|
||||
## 🚀 快速使用
|
||||
|
||||
```python
|
||||
|
||||
Reference in New Issue
Block a user