update: 升级模型版本 - 智谱 glm-4.7-flash -> glm-5.1, DeepSeek deepseek-reasoner -> deepseek-v4-pro
All checks were successful
构建并部署 AI Agent 服务 / deploy (push) Successful in 5m43s

This commit is contained in:
2026-05-01 02:56:09 +08:00
parent a8d760cc11
commit c4c86a5476
2 changed files with 6 additions and 6 deletions

View File

@@ -54,8 +54,8 @@
| 层级 | 组件 | 技术选型 | 版本 | 说明 | | 层级 | 组件 | 技术选型 | 版本 | 说明 |
|------|------|---------|------|------| |------|------|---------|------|------|
| **LLM 服务** | 云端模型 | 智谱 AI (glm-4.7-flash) | v4.7 | 快速响应,适合日常对话 | | **LLM 服务** | 云端模型 | 智谱 AI (glm-5.1) | v5.1 | 快速响应,适合日常对话 |
| | | DeepSeek (deepseek-reasoner) | v3 | 深度推理,适合复杂问题 | | | | DeepSeek (deepseek-v4-pro) | v4 | 深度推理,适合复杂问题 |
| | 本地模型 | Gemma-4-E4B-it | v4 | 本地部署,保护隐私 | | | 本地模型 | Gemma-4-E4B-it | v4 | 本地部署,保护隐私 |
| **模型服务层** | Chat 服务 | chat_services.py | - | 统一的生成式大模型接口 | | **模型服务层** | Chat 服务 | chat_services.py | - | 统一的生成式大模型接口 |
| | Embedding 服务 | embedding_services.py | - | 统一的嵌入模型接口 | | | Embedding 服务 | embedding_services.py | - | 统一的嵌入模型接口 |

View File

@@ -3,8 +3,8 @@
本模块提供统一的生成式大模型服务获取接口,支持多种模型: 本模块提供统一的生成式大模型服务获取接口,支持多种模型:
1. Local VLLM 服务:本地 gemma-4-E4B-it 模型 1. Local VLLM 服务:本地 gemma-4-E4B-it 模型
2. Zhipu AI智谱 glm-4.7-flash 模型 2. Zhipu AI智谱 glm-5.1 模型
3. DeepSeekdeepseek-reasoner 模型 3. DeepSeekdeepseek-v4-pro 模型
主要功能: 主要功能:
- LocalVLLMChatProvider本地 VLLM 服务提供者 - LocalVLLMChatProvider本地 VLLM 服务提供者
@@ -121,7 +121,7 @@ class ZhipuChatProvider(BaseServiceProvider[BaseChatModel]):
智谱 AI 生成式大模型服务提供者 智谱 AI 生成式大模型服务提供者
""" """
def __init__(self, model: str = "glm-4.7-flash"): def __init__(self, model: str = "glm-5.1"):
super().__init__("zhipu_chat") super().__init__("zhipu_chat")
self._model = model self._model = model
@@ -170,7 +170,7 @@ class DeepSeekChatProvider(BaseServiceProvider[BaseChatModel]):
DeepSeek 生成式大模型服务提供者 DeepSeek 生成式大模型服务提供者
""" """
def __init__(self, model: str = "deepseek-reasoner"): def __init__(self, model: str = "deepseek-v4-pro"):
super().__init__("deepseek_chat") super().__init__("deepseek_chat")
self._model = model self._model = model