fix: 修复本地llm服务不可用问题 + 统一模型缓存目录位置

- 修复 config.py 添加 LOCAL_MODEL_NAME 配置项 - 修复 chat_services.py 本地模型检测时API路径重复问题(/v1/models -> /models) - 更新 .gitignore，移除模型目录跟踪 - 统一模型缓存到 docker/models/fastembed_cache，避免重复 - 更新 Dockerfile，正确复制预下载的BM25模型缓存
2026-05-04 03:26:19 +08:00
parent 8af82f8f7f
commit 44d89acdb5
44 changed files with 11 additions and 3928 deletions
--- a/tools/download_bm25.py
+++ b/tools/download_bm25.py
@@ -1,22 +0,0 @@
-"""
-BM25模型预下载脚本
-执行后将模型缓存到 ./models/fastembed_cache 目录，打包进Docker镜像
-"""
-import os
-from fastembed.sparse.sparse_text_embedding import SparseTextEmbedding
-
-if __name__ == "__main__":
-    # 指定缓存目录
-    cache_dir = "./models/fastembed_cache"
-    os.makedirs(cache_dir, exist_ok=True)
-
-    print("正在下载BM25稀疏向量模型...")
-    model = SparseTextEmbedding(
-        model_name="Qdrant/bm25",
-        cache_dir=cache_dir
-    )
-    
-    # 触发一次推理，确保模型文件完整下载
-    list(model.embed(["init trigger"]))
-    print(f"✅ BM25模型已成功缓存到: {cache_dir}")
-    print("请将该目录提交到项目仓库，打包进Docker镜像")