新增功能: - 创建 app/model_services 模块,提供统一的模型服务获取接口 - 实现 BaseServiceProvider 基类和 FallbackServiceChain 降级链 - 实现 get_embedding_service():优先本地 llama.cpp,降级到智谱 API - 实现 get_rerank_service():优先本地 llama.cpp,降级到智谱 API - 支持单例管理,确保全局只有一个服务实例 修改内容: - 更新 app/config.py,添加智谱 API 相关配置 - 修改 rag_core/vector_store.py:支持接受外部传入的 embeddings - 修改 rag_core/retriever_factory.py:支持接受外部传入的 embeddings - 修改 app/agent/rag_initializer.py:使用 get_embedding_service() - 修改 app/rag/pipeline.py:使用 get_rerank_service() - 修改 app/memory/mem0_client.py:智能判断可用服务配置 mem0 - 修改 rag_indexer/index_builder.py:支持使用新服务,保持向后兼容 - 修改 rag_indexer/config.py:添加智谱配置 环境变量: - ZHIPUAI_API_KEY:智谱 API 密钥(必选) - ZHIPU_EMBEDDING_MODEL:可选,默认 embedding-3 - ZHIPU_RERANK_MODEL:可选,默认 rerank-2 - ZHIPU_API_BASE:可选,默认 https://open.bigmodel.cn/api/paas/v4
102 lines
3.1 KiB
Python
102 lines
3.1 KiB
Python
"""
|
||
环境变量集中管理模块
|
||
所有配置项统一定义,避免散落在各个文件中
|
||
配置分组:相关配置放在一起,URL 和 API Key 配对
|
||
所有配置直接从环境变量读取,无默认值,避免配置混乱
|
||
需要类型转换的配置在此处理
|
||
"""
|
||
|
||
import os
|
||
from dotenv import load_dotenv
|
||
|
||
load_dotenv()
|
||
|
||
# ========== 辅助函数:类型转换 ==========
|
||
def _get_str(key: str) -> str | None:
|
||
"""获取字符串配置"""
|
||
return os.getenv(key)
|
||
|
||
|
||
def _get_int(key: str) -> int | None:
|
||
"""获取整数配置,自动转换"""
|
||
value = os.getenv(key)
|
||
if value is not None:
|
||
try:
|
||
return int(value)
|
||
except (ValueError, TypeError):
|
||
pass
|
||
return None
|
||
|
||
|
||
def _get_bool(key: str) -> bool | None:
|
||
"""获取布尔配置,自动转换"""
|
||
value = os.getenv(key)
|
||
if value is not None:
|
||
return value.lower() in ("true", "1", "yes", "on")
|
||
return None
|
||
|
||
|
||
# ========== 第三方 API 密钥 ==========
|
||
ZHIPUAI_API_KEY = _get_str("ZHIPUAI_API_KEY")
|
||
DEEPSEEK_API_KEY = _get_str("DEEPSEEK_API_KEY")
|
||
|
||
|
||
# ========== 智谱 API 配置 ==========
|
||
# 嵌入模型:根据 https://docs.bigmodel.cn/cn/guide/start/model-overview
|
||
# 可选:embedding-2、embedding-3
|
||
ZHIPU_EMBEDDING_MODEL = _get_str("ZHIPU_EMBEDDING_MODEL") or "embedding-3"
|
||
# 重排模型:可选 rerank-1、rerank-2
|
||
ZHIPU_RERANK_MODEL = _get_str("ZHIPU_RERANK_MODEL") or "rerank-2"
|
||
ZHIPU_API_BASE = _get_str("ZHIPU_API_BASE") or "https://open.bigmodel.cn/api/paas/v4"
|
||
|
||
|
||
# ========== llama.cpp 服务配置(URL + API密钥 配对) ==========
|
||
# 主 LLM 服务
|
||
VLLM_BASE_URL = _get_str("VLLM_BASE_URL")
|
||
LLM_API_KEY = _get_str("LLAMACPP_API_KEY")
|
||
|
||
# Embedding 服务 (用于 Mem0 的向量化)
|
||
LLAMACPP_EMBEDDING_URL = _get_str("LLAMACPP_EMBEDDING_URL")
|
||
LLAMACPP_API_KEY = _get_str("LLAMACPP_API_KEY")
|
||
|
||
# Reranker 服务
|
||
LLAMACPP_RERANKER_URL = _get_str("LLAMACPP_RERANKER_URL")
|
||
|
||
|
||
# ========== Qdrant 向量数据库配置(URL + API密钥 配对) ==========
|
||
QDRANT_URL = _get_str("QDRANT_URL")
|
||
QDRANT_API_KEY = _get_str("QDRANT_API_KEY")
|
||
QDRANT_COLLECTION_NAME = _get_str("QDRANT_COLLECTION_NAME")
|
||
|
||
|
||
# ========== PostgreSQL 数据库配置(分离配置 + 完整URI) ==========
|
||
# 分离配置(优先使用)
|
||
DB_HOST = _get_str("DB_HOST")
|
||
DB_PORT = _get_int("DB_PORT")
|
||
DB_USER = _get_str("DB_USER")
|
||
DB_PASSWORD = _get_str("DB_PASSWORD")
|
||
DB_NAME = _get_str("DB_NAME")
|
||
|
||
# 完整连接字符串(直接从环境变量读取)
|
||
DB_URI = _get_str("DB_URI")
|
||
if not DB_URI and all([DB_HOST, DB_PORT, DB_USER, DB_PASSWORD, DB_NAME]):
|
||
DB_URI = f"postgresql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}?sslmode=disable"
|
||
|
||
# ========== 后端服务配置 ==========
|
||
BACKEND_PORT = _get_int("BACKEND_PORT")
|
||
|
||
|
||
# ========== Mem0 记忆层配置 ==========
|
||
# 记忆提取间隔:每 N 轮对话生成一次摘要
|
||
MEMORY_SUMMARIZE_INTERVAL = _get_int("MEMORY_SUMMARIZE_INTERVAL")
|
||
|
||
|
||
# ========== Graph 执行追踪配置 ==========
|
||
# 是否启用 Graph 流转追踪(通过环境变量控制)
|
||
ENABLE_GRAPH_TRACE = _get_bool("ENABLE_GRAPH_TRACE")
|
||
|
||
|
||
# ========== 日志配置 ==========
|
||
LOG_LEVEL = _get_str("LOG_LEVEL")
|
||
DEBUG = _get_bool("DEBUG")
|