|
|
8db63e7a8d
|
重构:添加模型服务模块,支持嵌入和重排服务的自动降级
新增功能:
- 创建 app/model_services 模块,提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service():优先本地 llama.cpp,降级到智谱 API
- 实现 get_rerank_service():优先本地 llama.cpp,降级到智谱 API
- 支持单例管理,确保全局只有一个服务实例
修改内容:
- 更新 app/config.py,添加智谱 API 相关配置
- 修改 rag_core/vector_store.py:支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py:支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py:使用 get_embedding_service()
- 修改 app/rag/pipeline.py:使用 get_rerank_service()
- 修改 app/memory/mem0_client.py:智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py:支持使用新服务,保持向后兼容
- 修改 rag_indexer/config.py:添加智谱配置
环境变量:
- ZHIPUAI_API_KEY:智谱 API 密钥(必选)
- ZHIPU_EMBEDDING_MODEL:可选,默认 embedding-3
- ZHIPU_RERANK_MODEL:可选,默认 rerank-2
- ZHIPU_API_BASE:可选,默认 https://open.bigmodel.cn/api/paas/v4
|
2026-04-24 22:52:36 +08:00 |
|
|
|
5e9bbd519f
|
测试修改
|
2026-04-21 20:49:10 +08:00 |
|
|
|
37e86f3bb1
|
参数配置统一
|
2026-04-21 19:06:34 +08:00 |
|
|
|
e2eaac9498
|
修改配置
|
2026-04-21 18:41:14 +08:00 |
|
|
|
726236eaff
|
重构代码,实现相对导入
构建并部署 AI Agent 服务 / deploy (push) Failing after 5m26s
|
2026-04-21 10:26:37 +08:00 |
|
|
|
3143e0e4e6
|
修改引用逻辑,修改长期记忆bug
|
2026-04-20 15:55:58 +08:00 |
|
|
|
4e981e9dcf
|
文件变更
|
2026-04-20 14:05:57 +08:00 |
|
|
|
3c906e91d9
|
重排,多路查询
构建并部署 AI Agent 服务 / deploy (push) Successful in 35m37s
|
2026-04-20 01:10:18 +08:00 |
|