28 Commits

Author SHA1 Message Date
3ae9daa01a 导入方式修改
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 6m44s
2026-05-05 23:17:00 +08:00
8b5fbbd395 修改readme
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 6m35s
2026-05-05 14:06:36 +08:00
d050dcf835 修改readme
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 6m22s
2026-05-05 13:57:19 +08:00
9841f47432 refactor: 重构RAG核心组件,简化代码结构和测试文件
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 6m53s
2026-05-04 17:58:10 +08:00
a07e398739 refactor!: 完全异步化 RAG 系统,移除 LangChain ParentDocumentRetriever 依赖
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 6m34s
- 重写 rag_core/vector_store.py:完全异步实现 aadd_documents、asimilarity_search
- 重写 app/rag/retriever.py:异步混合检索,移除同步兼容代码
- 修改 rag_indexer/index_builder.py:全链路异步调用
- 删除 rag_core/retriever_factory.py:不再使用 LangChain ParentDocumentRetriever
- 清理冗余导入和代码:移除 model_services 兼容、不需要的异常导入
- 更新 rag_indexer/README.md:反映新架构

核心改进:
- 完全异步化:索引构建和检索全链路 async/await
- 自定义实现:不再依赖 LangChain 的 ParentDocumentRetriever
- 双向量支持:子文档同时存储 dense + sparse 向量到 Qdrant
- 架构清晰:rag_core 公共组件、rag_indexer 索引、app/rag 检索
2026-05-04 14:33:12 +08:00
4209386c77 refactor: 统一导入方式,移除 sys.path 操作
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 6m22s
- 重构所有模块导入,移除 sys.path.insert
- 统一使用 from backend.xxx 的绝对导入方式
- rag_core 包内使用相对导入(from .xxx)
- 移动 visualize_graph.py 到 tools/ 目录
- 添加必要的 __init__.py 文件
- 清理废弃文档和脚本
2026-05-04 12:55:45 +08:00
8af82f8f7f feat: RAG混合检索系统完整实现 + 启动脚本修复
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 5m4s
- 实现了稠密+稀疏混合检索,使用 Qdrant 原生 RRF 融合
- 修复了 retriever.py 的 BaseRetriever 继承和稀疏向量包装问题
- 修复了 pipeline.py 的 Optional 导入问题
- 添加了稀疏 embedder 的缓存配置
- 简化了 vector_store.py,移除不必要的逻辑
- 修复了 start.sh 的 PROJECT_DIR 硬编码和端口配置问题
- 完善了 RAG 检索的测试文件
2026-05-04 02:54:37 +08:00
60afa86ded feat: 实现 BM25 稀疏 + 稠密向量混合检索功能
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Has been cancelled
2026-05-04 02:01:22 +08:00
2183c901b4 添加稀疏模型本地缓存功能
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 13m54s
- 创建 download_sparse_model.py 脚本用于下载稀疏模型到本地
- 添加 SPARSE_MODEL_PATH 和 SPARSE_MODEL_NAME 配置
- 修改 retriever.py 和 index_builder.py 使用 cache_dir
- 更新 .gitignore 排除 models/ 目录
- 更新 Dockerfile 在构建时下载稀疏模型
2026-05-03 18:55:39 +08:00
5c45806ad3 🚀 完全实现 Qdrant 混合检索功能
All checks were successful
构建并部署 AI Agent 服务 / deploy (push) Successful in 11m7s
- 不需要兼容,完全重写为混合检索
- 检索器:强制使用 FastEmbedSparse + RetrievalMode.HYBRID
- 索引器:强制启用稀疏向量,混合检索模式
- 添加 fastembed 依赖到 requirements.txt
- 语法检查通过
2026-05-03 18:12:20 +08:00
ce6e459e19 添加可选稀疏向量支持到索引器
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Has been cancelled
- 完全兼容现有代码:默认 enable_sparse=False
- 启用时:需要安装 fastembed,设置 enable_sparse=True
- 自动初始化 FastEmbedSparse 和 RetrievalMode.HYBRID
- 失败时优雅回退到纯稠密
- 语法检查通过
2026-05-03 18:08:39 +08:00
8db63e7a8d 重构:添加模型服务模块,支持嵌入和重排服务的自动降级
新增功能:
- 创建 app/model_services 模块,提供统一的模型服务获取接口
- 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链
- 实现 get_embedding_service():优先本地 llama.cpp,降级到智谱 API
- 实现 get_rerank_service():优先本地 llama.cpp,降级到智谱 API
- 支持单例管理,确保全局只有一个服务实例

修改内容:
- 更新 app/config.py,添加智谱 API 相关配置
- 修改 rag_core/vector_store.py:支持接受外部传入的 embeddings
- 修改 rag_core/retriever_factory.py:支持接受外部传入的 embeddings
- 修改 app/agent/rag_initializer.py:使用 get_embedding_service()
- 修改 app/rag/pipeline.py:使用 get_rerank_service()
- 修改 app/memory/mem0_client.py:智能判断可用服务配置 mem0
- 修改 rag_indexer/index_builder.py:支持使用新服务,保持向后兼容
- 修改 rag_indexer/config.py:添加智谱配置

环境变量:
- ZHIPUAI_API_KEY:智谱 API 密钥(必选)
- ZHIPU_EMBEDDING_MODEL:可选,默认 embedding-3
- ZHIPU_RERANK_MODEL:可选,默认 rerank-2
- ZHIPU_API_BASE:可选,默认 https://open.bigmodel.cn/api/paas/v4
2026-04-24 22:52:36 +08:00
4db8a51461 url报错修复
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 6m6s
2026-04-22 13:28:14 +08:00
d8da45bc97 fix: 修复前后端启动问题,添加 BACKEND_PORT 配置
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Has been cancelled
2026-04-22 01:34:34 +08:00
a869d884b7 docs: 更新文档路径引用,移除硬编码密钥,修复 Docker 配置
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 7m1s
2026-04-22 00:43:06 +08:00
5e9bbd519f 测试修改 2026-04-21 20:49:10 +08:00
37e86f3bb1 参数配置统一 2026-04-21 19:06:34 +08:00
e2eaac9498 修改配置 2026-04-21 18:41:14 +08:00
08826c70a3 容器处理 2026-04-21 16:27:05 +08:00
8b354b7ccc 重构代码,统一config配置
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 47m14s
2026-04-21 11:02:16 +08:00
726236eaff 重构代码,实现相对导入
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 5m26s
2026-04-21 10:26:37 +08:00
8d4fc76a95 修改容器生成
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 6m16s
2026-04-21 00:00:56 +08:00
3143e0e4e6 修改引用逻辑,修改长期记忆bug 2026-04-20 15:55:58 +08:00
4e981e9dcf 文件变更 2026-04-20 14:05:57 +08:00
3c906e91d9 重排,多路查询
All checks were successful
构建并部署 AI Agent 服务 / deploy (push) Successful in 35m37s
2026-04-20 01:10:18 +08:00
933d418d77 检索器重构
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 17m12s
2026-04-19 22:01:55 +08:00
cc8ef41ef9 RAG数据库生成 2026-04-19 15:01:40 +08:00
c18e8a9860 向量数据库
Some checks failed
构建并部署 AI Agent 服务 / deploy (push) Failing after 32m6s
2026-04-18 16:56:23 +08:00