ailine

Author	SHA1	Message	Date
root	44d89acdb5	fix: 修复本地llm服务不可用问题 + 统一模型缓存目录位置 Some checks failed 构建并部署 AI Agent 服务 / deploy (push) Has been cancelled Details - 修复 config.py 添加 LOCAL_MODEL_NAME 配置项 - 修复 chat_services.py 本地模型检测时API路径重复问题(/v1/models -> /models) - 更新 .gitignore，移除模型目录跟踪 - 统一模型缓存到 docker/models/fastembed_cache，避免重复 - 更新 Dockerfile，正确复制预下载的BM25模型缓存	2026-05-04 03:26:19 +08:00
root	60afa86ded	feat: 实现 BM25 稀疏 + 稠密向量混合检索功能 Some checks failed 构建并部署 AI Agent 服务 / deploy (push) Has been cancelled Details	2026-05-04 02:01:22 +08:00
root	b647150814	🗑️ 精简文档结构 All checks were successful 构建并部署 AI Agent 服务 / deploy (push) Successful in 5m42s Details - 删除冗余文档：backend/app/README.md、backend/app/model_services/README.md - 保留重要深度文档：backend/app/rag/README.md（RAG 模块详细说明） - 更新 REACT_MODE_SUMMARY.md：加入模型服务层的关键内容	2026-05-03 17:01:15 +08:00
root	53fbfb4741	📚 整理并更新文档 All checks were successful 构建并部署 AI Agent 服务 / deploy (push) Successful in 6m41s Details - 删除过时文档：REACT_PLAN.md、backend/docs/HYBRID_ROUTER.md - 更新 REACT_MODE_SUMMARY.md：加入新的混合路由架构 - 更新 README.md：加入混合路由、双模型服务等新特性 - 更新 backend/app/README.md：加入 hybrid_router.py - 更新 backend/app/model_services/README.md：加入 get_chat_service/get_small_llm_service - 更新 .gitignore：允许 REACT_MODE_SUMMARY.md 上传 - 新增 backend/test/test_hybrid_router.py：测试脚本	2026-05-03 16:53:34 +08:00
root	a5fc9cd5d8	✨ 完整的混合路由优化系统 All checks were successful 构建并部署 AI Agent 服务 / deploy (push) Successful in 6m8s Details 1. 双模型服务 (llm + smallLLM) - 增加 get_small_llm_service() 函数 - 支持智谱/DeepSeek 小模型作为轻量级选项 2. 前置混合路由 - 规则快速分流（无 LLM，超快速） - 轻量级意图分类（smallLLM） - 快速路径：fast_chitchat, fast_rag, fast_tool 3. 自动升级机制 - 快速路径失败 → 自动回到 React 循环 - SSE 事件增强：intent_classified, path_decision, fast_path_*, escalation 4. 向后兼容 - build_react_main_graph(use_hybrid_router=True/False) - 可选择启用或禁用混合路由 5. 更新 intent.py - 支持 use_small_llm 参数 - 保留原有完整功能供 React 循环使用	2026-05-03 16:45:46 +08:00
root	c4c86a5476	update: 升级模型版本 - 智谱 glm-4.7-flash -> glm-5.1, DeepSeek deepseek-reasoner -> deepseek-v4-pro All checks were successful 构建并部署 AI Agent 服务 / deploy (push) Successful in 5m43s Details	2026-05-01 02:56:09 +08:00
root	3b16f7dd38	fix: 改进服务可用性检测 - 本地VLLM实际测试连接，智谱rerank降级到LLM方案 All checks were successful 构建并部署 AI Agent 服务 / deploy (push) Successful in 5m52s Details	2026-05-01 02:15:02 +08:00
root	3bf0446ef8	feat: 修复数据库持久化，完善服务降级机制 All checks were successful 构建并部署 AI Agent 服务 / deploy (push) Successful in 5m37s Details - 恢复使用 AsyncPostgresSaver 持久化短期记忆 - 添加 LLM 作为 Rerank 服务的最后降级方案 - 完善降级链：Local llama.cpp → Zhipu Rerank → LLM Fallback	2026-04-30 17:45:06 +08:00
root	aad7cb9829	修复嵌入服务，使用自定义 ZhipuAI 嵌入实现 All checks were successful 构建并部署 AI Agent 服务 / deploy (push) Successful in 13m44s Details	2026-04-29 22:08:47 +08:00
root	d6805d1db8	修复重构后的导入错误和缺失模块 Some checks failed 构建并部署 AI Agent 服务 / deploy (push) Failing after 6m26s Details	2026-04-29 17:23:20 +08:00
root	17c1fab41c	fix: 修复导入错误 BaseReranker -> BaseRerankService Some checks failed 构建并部署 AI Agent 服务 / deploy (push) Failing after 6m20s Details	2026-04-26 21:35:31 +08:00
root	534ee129c0	refactor: 将生成式大模型提取为服务层架构，移除 llm_factory Some checks failed 构建并部署 AI Agent 服务 / deploy (push) Failing after 6m0s Details	2026-04-26 12:00:57 +08:00
root	f63c394fcd	refactor: 重构 rerank 架构，分离服务层和业务逻辑 Some checks failed 构建并部署 AI Agent 服务 / deploy (push) Has been cancelled Details - rerank_services.py：纯服务层，只负责调用 rerank server - rag/rerank.py：业务逻辑层，负责文档处理、排序、top_n - 更新 pipeline.py 使用新架构 - 架构与 embedding_services.py 保持一致	2026-04-26 11:57:42 +08:00
root	8db63e7a8d	重构：添加模型服务模块，支持嵌入和重排服务的自动降级新增功能： - 创建 app/model_services 模块，提供统一的模型服务获取接口 - 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链 - 实现 get_embedding_service()：优先本地 llama.cpp，降级到智谱 API - 实现 get_rerank_service()：优先本地 llama.cpp，降级到智谱 API - 支持单例管理，确保全局只有一个服务实例修改内容： - 更新 app/config.py，添加智谱 API 相关配置 - 修改 rag_core/vector_store.py：支持接受外部传入的 embeddings - 修改 rag_core/retriever_factory.py：支持接受外部传入的 embeddings - 修改 app/agent/rag_initializer.py：使用 get_embedding_service() - 修改 app/rag/pipeline.py：使用 get_rerank_service() - 修改 app/memory/mem0_client.py：智能判断可用服务配置 mem0 - 修改 rag_indexer/index_builder.py：支持使用新服务，保持向后兼容 - 修改 rag_indexer/config.py：添加智谱配置环境变量： - ZHIPUAI_API_KEY：智谱 API 密钥（必选） - ZHIPU_EMBEDDING_MODEL：可选，默认 embedding-3 - ZHIPU_RERANK_MODEL：可选，默认 rerank-2 - ZHIPU_API_BASE：可选，默认 https://open.bigmodel.cn/api/paas/v4	2026-04-24 22:52:36 +08:00

14 Commits