Files

构建并部署 AI Agent 服务 / deploy (push) Successful in 6m8s

Details

1. 双模型服务 (llm + smallLLM)
   - 增加 get_small_llm_service() 函数
   - 支持智谱/DeepSeek 小模型作为轻量级选项

2. 前置混合路由
   - 规则快速分流（无 LLM，超快速）
   - 轻量级意图分类（smallLLM）
   - 快速路径：fast_chitchat, fast_rag, fast_tool

3. 自动升级机制
   - 快速路径失败 → 自动回到 React 循环
   - SSE 事件增强：intent_classified, path_decision, fast_path_*, escalation

4. 向后兼容
   - build_react_main_graph(use_hybrid_router=True/False)
   - 可选择启用或禁用混合路由

5. 更新 intent.py
   - 支持 use_small_llm 参数
   - 保留原有完整功能供 React 循环使用

2026-05-03 16:45:46 +08:00

__init__.py

fix: 修复导入错误 BaseReranker -> BaseRerankService

2026-04-26 21:35:31 +08:00

base.py

重构：添加模型服务模块，支持嵌入和重排服务的自动降级

2026-04-24 22:52:36 +08:00

chat_services.py

✨ 完整的混合路由优化系统

2026-05-03 16:45:46 +08:00

embedding_services.py

修复嵌入服务，使用自定义 ZhipuAI 嵌入实现

2026-04-29 22:08:47 +08:00

README.md

重构：添加模型服务模块，支持嵌入和重排服务的自动降级

2026-04-24 22:52:36 +08:00

rerank_services.py

fix: 改进服务可用性检测 - 本地VLLM实际测试连接，智谱rerank降级到LLM方案

2026-05-01 02:15:02 +08:00

README.md

""" 模型服务模块（model_services）

提供统一的嵌入和重排模型服务获取接口，支持自动降级：

优先使用本地 llama.cpp 服务
本地服务不可用时，自动降级到智谱 API 服务

使用方法：

from app.model_services import get_embedding_service, get_rerank_service, BaseReranker

获取嵌入服务（LangChain 兼容的 Embeddings）

embeddings = get_embedding_service()

获取重排服务

reranker = get_rerank_service() sorted_docs = reranker.compress_documents(documents, query, top_n=5)

环境变量配置：

智谱 API 配置

ZHIPUAI_API_KEY=your_api_key ZHIPU_EMBEDDING_MODEL=embedding-3 # 可选：embedding-2、embedding-3 ZHIPU_RERANK_MODEL=rerank-2 # 可选：rerank-1、rerank-2 ZHIPU_API_BASE=https://open.bigmodel.cn/api/paas/v4

本地 llama.cpp 服务配置（原有配置保持不变）

LLAMACPP_EMBEDDING_URL=http://localhost:port/v1 LLAMACPP_RERANKER_URL=http://localhost:port/v1 LLAMACPP_API_KEY=your_api_key """

README.md Unescape Escape

获取嵌入服务（LangChain 兼容的 Embeddings）

获取重排服务

智谱 API 配置

本地 llama.cpp 服务配置（原有配置保持不变）

README.md