All checks were successful
构建并部署 AI Agent 服务 / deploy (push) Successful in 6m8s
1. 双模型服务 (llm + smallLLM) - 增加 get_small_llm_service() 函数 - 支持智谱/DeepSeek 小模型作为轻量级选项 2. 前置混合路由 - 规则快速分流(无 LLM,超快速) - 轻量级意图分类(smallLLM) - 快速路径:fast_chitchat, fast_rag, fast_tool 3. 自动升级机制 - 快速路径失败 → 自动回到 React 循环 - SSE 事件增强:intent_classified, path_decision, fast_path_*, escalation 4. 向后兼容 - build_react_main_graph(use_hybrid_router=True/False) - 可选择启用或禁用混合路由 5. 更新 intent.py - 支持 use_small_llm 参数 - 保留原有完整功能供 React 循环使用
""" 模型服务模块(model_services)
提供统一的嵌入和重排模型服务获取接口,支持自动降级:
- 优先使用本地 llama.cpp 服务
- 本地服务不可用时,自动降级到智谱 API 服务
使用方法:
from app.model_services import get_embedding_service, get_rerank_service, BaseReranker
获取嵌入服务(LangChain 兼容的 Embeddings)
embeddings = get_embedding_service()
获取重排服务
reranker = get_rerank_service() sorted_docs = reranker.compress_documents(documents, query, top_n=5)
环境变量配置:
智谱 API 配置
ZHIPUAI_API_KEY=your_api_key ZHIPU_EMBEDDING_MODEL=embedding-3 # 可选:embedding-2、embedding-3 ZHIPU_RERANK_MODEL=rerank-2 # 可选:rerank-1、rerank-2 ZHIPU_API_BASE=https://open.bigmodel.cn/api/paas/v4
本地 llama.cpp 服务配置(原有配置保持不变)
LLAMACPP_EMBEDDING_URL=http://localhost:port/v1 LLAMACPP_RERANKER_URL=http://localhost:port/v1 LLAMACPP_API_KEY=your_api_key """