ailine/docker/docker-compose.yml

services:
  backend:
    build:
      context: .. # 构建上下文为项目根目录
      dockerfile: docker/backend/Dockerfile
    container_name: ai-backend
    environment:
      # =========================================================================
      # ⭐ 敏感密钥配置 - 必须配置（本地：.env 文件 | CI/CD：Secrets）
      # =========================================================================
      - ZHIPUAI_API_KEY=${ZHIPUAI_API_KEY:?请配置 ZHIPUAI_API_KEY（本地：.env 文件 | CI/CD：Secrets）}   # ⭐ 敏感密钥配置
      - DEEPSEEK_API_KEY=${DEEPSEEK_API_KEY:?请配置 DEEPSEEK_API_KEY（本地：.env 文件 | CI/CD：Secrets）}  # ⭐ 敏感密钥配置
      - LLAMACPP_API_KEY=${LLAMACPP_API_KEY:?请配置 LLAMACPP_API_KEY（本地：.env 文件 | CI/CD：Secrets）}  # ⭐ 敏感密钥配置
      - SILICONFLOW_API_KEY=${SILICONFLOW_API_KEY:-}  # 硅基流动API密钥（可选，本地服务故障时降级使用）

      # =========================================================================
      # PostgreSQL 数据库配置
      # =========================================================================
      - DB_HOST=115.190.121.151
      - DB_PORT=5432
      - DB_USER=postgres
      - DB_PASSWORD=${DB_PASSWORD:?请配置 DB_PASSWORD（本地：.env 文件 | CI/CD：Secrets）}  # ⭐ 敏感密钥配置
      - DB_NAME=langgraph_db

      # =========================================================================
      # Qdrant 向量数据库配置（URL + API密钥 配对）
      # =========================================================================
      - QDRANT_URL=http://115.190.121.151:6333
      - QDRANT_API_KEY=${QDRANT_API_KEY:?请配置 QDRANT_API_KEY（本地：.env 文件 | CI/CD：Secrets）}  # ⭐ 敏感密钥配置
      - QDRANT_COLLECTION_NAME=mem0_user_memories

      # =========================================================================
      # llama.cpp 服务配置（URL + API密钥 配对）
      # =========================================================================
      # 主 LLM 服务 (Gemma-4-E2B GGUF) - Docker host 端口 18000
      - VLLM_BASE_URL=http://host.docker.internal:18000/v1
      # Embedding 服务 (Qwen3-Embedding-0.6B GGUF) - Docker host 端口 18001
      - LLAMACPP_EMBEDDING_URL=http://host.docker.internal:18001/v1
      # Reranker 服务 (bge-reranker-v2-m3) - Docker host 端口 18002
      - LLAMACPP_RERANKER_URL=http://host.docker.internal:18002/v1

      # =========================================================================
      # RAG 索引构建配置（非敏感）
      # =========================================================================
      - RAG_COLLECTION_NAME=rag_documents
      - RAG_CHUNK_SIZE=500
      - RAG_CHUNK_OVERLAP=50
      - RAG_PARENT_CHUNK_SIZE=1000
      - RAG_CHILD_CHUNK_SIZE=200
      - RAG_PARENT_CHUNK_OVERLAP=100
      - RAG_CHILD_CHUNK_OVERLAP=20
      - RAG_STRATEGY=parent-child
      - RAG_STORAGE_TYPE=postgres

      # =========================================================================
      # 日志调试配置（可通过 .env 覆盖）
      # =========================================================================
      - LOG_LEVEL=${LOG_LEVEL:-DEBUG}
      - DEBUG=${DEBUG:-true}
      - ENABLE_GRAPH_TRACE=${ENABLE_GRAPH_TRACE:-true}

      # =========================================================================
      # 应用行为配置
      # =========================================================================
      - BACKEND_PORT=8079
      - MEMORY_SUMMARIZE_INTERVAL=${MEMORY_SUMMARIZE_INTERVAL:-10}
      - FASTEMBED_CACHE_PATH=${FASTEMBED_CACHE_PATH:-/app/fastembed_cache}

      # =========================================================================
      # Tavily 搜索配置（可选，有 API Key 时优先使用）
      # =========================================================================
      - TAVILY_API_KEY=${TAVILY_API_KEY:-}
      - TAVILY_MAX_RESULTS=${TAVILY_MAX_RESULTS:-5}

      # =========================================================================
      # 前端通信地址（Docker 内部网络）
      # =========================================================================
      - API_URL=http://backend:8079/chat

    volumes:
      - ../data/user_docs:/app/data/user_docs # 挂载文档目录
      - ../logs:/app/logs
    networks:
      - ai-network
    # ⭐ 移除对 postgres 和 qdrant 的依赖（使用远程服务）
    restart: unless-stopped
    ports:
      - "8079:8079"

  frontend:
    build:
      context: ..
      dockerfile: docker/frontend/Dockerfile
    container_name: ai-frontend
    environment:
      # Docker 内部网络使用服务名 'backend' 解析后端服务
      - API_URL=http://backend:8079/chat
    # volumes:
    #   - ../frontend/src:/app/src  # 挂载源代码目录，修改立即生效
    ports:
      - "8501:8501"
    networks:
      - ai-network
    depends_on:
      - backend
    restart: unless-stopped

networks:
  ai-network:
    driver: bridge
-												```
docs(.gitignore/README/QUICKSTART): 更新文档和忽略配置

- 添加IDE配置、日志和数据文件到.gitignore
- 重构QUICKSTART.md，提供Docker Compose和本地开发两种部署方式
- 更新README.md，优化项目介绍和架构说明
- 移除旧的agent.py和backend.py文件
```

											
										
										
											2026-04-13 23:57:16 +08:00
+								services:
 								  backend:
 								    build:
-												修改

											
										
										
											2026-04-14 01:10:02 +08:00
+								      context: .. # 构建上下文为项目根目录
-												重构代码，实现相对导入

											
										
										
											2026-04-21 10:26:37 +08:00
+								      dockerfile: docker/backend/Dockerfile
-												```
docs(.gitignore/README/QUICKSTART): 更新文档和忽略配置

- 添加IDE配置、日志和数据文件到.gitignore
- 重构QUICKSTART.md，提供Docker Compose和本地开发两种部署方式
- 更新README.md，优化项目介绍和架构说明
- 移除旧的agent.py和backend.py文件
```

											
										
										
											2026-04-13 23:57:16 +08:00
+								    container_name: ai-backend
 								    environment:
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
+								      # =========================================================================
-												添加配置

											
										
										
											2026-04-21 22:32:42 +08:00
+								      # ⭐ 敏感密钥配置 - 必须配置（本地：.env 文件 | CI/CD：Secrets）
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
+								      # =========================================================================
-												fix: 指定读取根目录的.env文件

											
										
										
											2026-05-01 01:27:26 +08:00
+								      - ZHIPUAI_API_KEY=${ZHIPUAI_API_KEY:?请配置 ZHIPUAI_API_KEY（本地：.env 文件 | CI/CD：Secrets）}   # ⭐ 敏感密钥配置
 								      - DEEPSEEK_API_KEY=${DEEPSEEK_API_KEY:?请配置 DEEPSEEK_API_KEY（本地：.env 文件 | CI/CD：Secrets）}  # ⭐ 敏感密钥配置
 								      - LLAMACPP_API_KEY=${LLAMACPP_API_KEY:?请配置 LLAMACPP_API_KEY（本地：.env 文件 | CI/CD：Secrets）}  # ⭐ 敏感密钥配置
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
+								      - SILICONFLOW_API_KEY=${SILICONFLOW_API_KEY:-}  # 硅基流动API密钥（可选，本地服务故障时降级使用）
-												添加长期存储，流式检查

											
										
										
											2026-04-17 01:26:05 +08:00
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
+								      # =========================================================================
 								      # PostgreSQL 数据库配置
 								      # =========================================================================
-												fix: 指定读取根目录的.env文件

											
										
										
											2026-05-01 01:27:26 +08:00
+								      - DB_HOST=115.190.121.151
 								      - DB_PORT=5432
 								      - DB_USER=postgres
 								      - DB_PASSWORD=${DB_PASSWORD:?请配置 DB_PASSWORD（本地：.env 文件 | CI/CD：Secrets）}  # ⭐ 敏感密钥配置
 								      - DB_NAME=langgraph_db
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
 								      # =========================================================================
 								      # Qdrant 向量数据库配置（URL + API密钥 配对）
 								      # =========================================================================
-												采用向量数据库实现长期记忆

											
										
										
											2026-04-15 23:52:13 +08:00
+								      - QDRANT_URL=http://115.190.121.151:6333
-												添加配置

											
										
										
											2026-04-21 22:32:42 +08:00
+								      - QDRANT_API_KEY=${QDRANT_API_KEY:?请配置 QDRANT_API_KEY（本地：.env 文件 | CI/CD：Secrets）}  # ⭐ 敏感密钥配置
-												修改配置

											
										
										
											2026-04-21 18:41:14 +08:00
+								      - QDRANT_COLLECTION_NAME=mem0_user_memories
-												添加长期存储，流式检查

											
										
										
											2026-04-17 01:26:05 +08:00
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
+								      # =========================================================================
 								      # llama.cpp 服务配置（URL + API密钥 配对）
 								      # =========================================================================
 								      # 主 LLM 服务 (Gemma-4-E2B GGUF) - Docker host 端口 18000
 								      - VLLM_BASE_URL=http://host.docker.internal:18000/v1
 								      # Embedding 服务 (Qwen3-Embedding-0.6B GGUF) - Docker host 端口 18001
 								      - LLAMACPP_EMBEDDING_URL=http://host.docker.internal:18001/v1
 								      # Reranker 服务 (bge-reranker-v2-m3) - Docker host 端口 18002
 								      - LLAMACPP_RERANKER_URL=http://host.docker.internal:18002/v1
 								      # =========================================================================
 								      # RAG 索引构建配置（非敏感）
 								      # =========================================================================
 								      - RAG_COLLECTION_NAME=rag_documents
 								      - RAG_CHUNK_SIZE=500
 								      - RAG_CHUNK_OVERLAP=50
 								      - RAG_PARENT_CHUNK_SIZE=1000
 								      - RAG_CHILD_CHUNK_SIZE=200
 								      - RAG_PARENT_CHUNK_OVERLAP=100
 								      - RAG_CHILD_CHUNK_OVERLAP=20
 								      - RAG_STRATEGY=parent-child
 								      - RAG_STORAGE_TYPE=postgres
 								      # =========================================================================
 								      # 日志调试配置（可通过 .env 覆盖）
 								      # =========================================================================
-												update: 日志级别改为DEBUG，推理步数改为40

											
										
										
											2026-05-01 10:49:19 +08:00
+								      - LOG_LEVEL=${LOG_LEVEL:-DEBUG}
 								      - DEBUG=${DEBUG:-true}
 								      - ENABLE_GRAPH_TRACE=${ENABLE_GRAPH_TRACE:-true}
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
 								      # =========================================================================
 								      # 应用行为配置
 								      # =========================================================================
-												fix: 修复前后端启动问题，添加 BACKEND_PORT 配置

											
										
										
											2026-04-22 01:34:34 +08:00
+								      - BACKEND_PORT=8079
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
+								      - MEMORY_SUMMARIZE_INTERVAL=${MEMORY_SUMMARIZE_INTERVAL:-10}
-												feat: 实现 BM25 稀疏 + 稠密向量混合检索功能

											
										
										
											2026-05-04 02:01:22 +08:00
+								      - FASTEMBED_CACHE_PATH=${FASTEMBED_CACHE_PATH:-/app/fastembed_cache}
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
 								      # =========================================================================
-												refactor: 单图方案重构 + 动态模型选择 + chat_services优化

## 核心改动

### 1. 单图方案重构
- 删除了多图（self.graphs），改为单图（self.graph）
- 新增 MainGraphState.current_model 字段用于运行时注入模型
- llm_call 节点改为动态选择模型（create_dynamic_llm_call_node）

### 2. chat_services 优化
- 添加 _cached_services 缓存，避免重复初始化
- 新增 get_cached_chat_services() 函数，用于单图注入
- 新增 _check_http_service_available() 统一HTTP探测逻辑
- 减少重复代码，LocalVLLMChatProvider和LocalSmallModelProvider共用探测方法

### 3. AIAgentService 重构
- initialize() 只构建一次图，传入 chat_services 字典
- 新增 _resolve_model() 模型回退逻辑
- 新增 _build_invocation() 统一构建调用参数
- process_message() 和 process_message_stream() 改为注入 current_model
- 流式处理代码拆分，增加可读性

### 4. 新增和删除文件
- 新增：backend/app/main_graph/main_graph_builder.py（图构建）
- 新增：backend/app/main_graph/subgraph_wrapper.py（子图封装）
- 新增：tools/test/test_tavily_search.py（测试）
- 删除：backend/app/main_graph/graph.py（旧图）
- 删除：backend/app/main_graph/utils/main_graph_builder.py（旧构建器）
- 删除：backend/app/main_graph/utils/__init__.py

### 5. 其他更新
- README.md：新增模型服务使用情况详解章节
- backend/app/model_services/__init__.py：新增 get_cached_chat_services 导出

## 方案优势

- 内存优化：N张图 → 1张图
- 灵活性：运行时动态选择模型，支持同会话不同模型
- 性能：模型服务缓存，初始化仅一次
- 可维护性：减少重复代码，统一HTTP探测逻辑

											
										
										
											2026-05-05 17:30:55 +08:00
+								      # Tavily 搜索配置（可选，有 API Key 时优先使用）
 								      # =========================================================================
 								      - TAVILY_API_KEY=${TAVILY_API_KEY:-}
 								      - TAVILY_MAX_RESULTS=${TAVILY_MAX_RESULTS:-5}
 								      # =========================================================================
-												修改端口信息

											
										
										
											2026-04-16 00:31:33 +08:00
+								      # 前端通信地址（Docker 内部网络）
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
+								      # =========================================================================
-												重构代码，实现相对导入

											
										
										
											2026-04-21 10:26:37 +08:00
+								      - API_URL=http://backend:8079/chat
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
-												```
docs(.gitignore/README/QUICKSTART): 更新文档和忽略配置

- 添加IDE配置、日志和数据文件到.gitignore
- 重构QUICKSTART.md，提供Docker Compose和本地开发两种部署方式
- 更新README.md，优化项目介绍和架构说明
- 移除旧的agent.py和backend.py文件
```

											
										
										
											2026-04-13 23:57:16 +08:00
+								    volumes:
-												修改

											
										
										
											2026-04-14 01:10:02 +08:00
+								      - ../data/user_docs:/app/data/user_docs # 挂载文档目录
-												```
docs(.gitignore/README/QUICKSTART): 更新文档和忽略配置

- 添加IDE配置、日志和数据文件到.gitignore
- 重构QUICKSTART.md，提供Docker Compose和本地开发两种部署方式
- 更新README.md，优化项目介绍和架构说明
- 移除旧的agent.py和backend.py文件
```

											
										
										
											2026-04-13 23:57:16 +08:00
+								      - ../logs:/app/logs
 								    networks:
 								      - ai-network
-												添加配置

											
										
										
											2026-04-21 22:07:20 +08:00
+								    # ⭐ 移除对 postgres 和 qdrant 的依赖（使用远程服务）
-												```
docs(.gitignore/README/QUICKSTART): 更新文档和忽略配置

- 添加IDE配置、日志和数据文件到.gitignore
- 重构QUICKSTART.md，提供Docker Compose和本地开发两种部署方式
- 更新README.md，优化项目介绍和架构说明
- 移除旧的agent.py和backend.py文件
```

											
										
										
											2026-04-13 23:57:16 +08:00
+								    restart: unless-stopped
-												```
docs(quickstart): 更新快速开始文档以支持Nginx反向代理配置

- 修改环境变量配置方式，从直接创建.env文件改为复制模板文件
- 添加必需和可选配置项的详细说明
- 更新Docker Compose启动命令以使用正确的路径
- 增加Nginx反向代理访问方式的说明
- 为本地开发模式添加额外的数据库配置说明

fix(readme): 修正部署说明中的环境变量配置方法

- 将硬编码的环境变量配置改为使用模板文件复制方式
- 更新Docker Compose启动命令路径
- 补充Nginx反向代理访问说明
- 修正数据库配置注意事项

feat(backend): 支持从环境变量读取数据库连接配置

- 添加os模块导入
- 修改DB_URI配置逻辑，优先从环境变量读取
- 适配Docker和本地开发环境的不同数据库连接地址

refactor(docker): 优化Docker Compose配置支持Nginx代理

- 限制后端端口仅本机访问
- 修改前端API URL为相对路径，通过Nginx代理访问
- 限制前端端口仅本机访问

refactor(frontend): 适配Nginx反向代理后端API调用

- 将硬编码的后端API地址改为相对路径
- 支持通过Nginx代理转发请求到后端服务

chore(scripts): 更新启动脚本中的访问地址提示信息

- 修改前端启动成功后的访问地址提示
- 添加Nginx代理访问方式的说明
```

											
										
										
											2026-04-14 01:44:55 +08:00
+								    ports:
-												重构代码，实现相对导入

											
										
										
											2026-04-21 10:26:37 +08:00
+								      - "8079:8079"
-												```
docs(.gitignore/README/QUICKSTART): 更新文档和忽略配置

- 添加IDE配置、日志和数据文件到.gitignore
- 重构QUICKSTART.md，提供Docker Compose和本地开发两种部署方式
- 更新README.md，优化项目介绍和架构说明
- 移除旧的agent.py和backend.py文件
```

											
										
										
											2026-04-13 23:57:16 +08:00
 								  frontend:
 								    build:
 								      context: ..
-												重构代码，实现相对导入

											
										
										
											2026-04-21 10:26:37 +08:00
+								      dockerfile: docker/frontend/Dockerfile
-												```
docs(.gitignore/README/QUICKSTART): 更新文档和忽略配置

- 添加IDE配置、日志和数据文件到.gitignore
- 重构QUICKSTART.md，提供Docker Compose和本地开发两种部署方式
- 更新README.md，优化项目介绍和架构说明
- 移除旧的agent.py和backend.py文件
```

											
										
										
											2026-04-13 23:57:16 +08:00
+								    container_name: ai-frontend
 								    environment:
-												添加长期记忆

											
										
										
											2026-04-14 17:34:12 +08:00
+								      # Docker 内部网络使用服务名 'backend' 解析后端服务
-												重构代码，实现相对导入

											
										
										
											2026-04-21 10:26:37 +08:00
+								      - API_URL=http://backend:8079/chat
-												优化memory、rag和embedding模块

											
										
										
											2026-04-29 10:52:01 +08:00
+								    # volumes:
 								    #   - ../frontend/src:/app/src  # 挂载源代码目录，修改立即生效
-												```
docs(.gitignore/README/QUICKSTART): 更新文档和忽略配置

- 添加IDE配置、日志和数据文件到.gitignore
- 重构QUICKSTART.md，提供Docker Compose和本地开发两种部署方式
- 更新README.md，优化项目介绍和架构说明
- 移除旧的agent.py和backend.py文件
```

											
										
										
											2026-04-13 23:57:16 +08:00
+								    ports:
-												重新部署

											
										
										
											2026-04-14 02:48:27 +08:00
+								      - "8501:8501"
-												```
docs(.gitignore/README/QUICKSTART): 更新文档和忽略配置

- 添加IDE配置、日志和数据文件到.gitignore
- 重构QUICKSTART.md，提供Docker Compose和本地开发两种部署方式
- 更新README.md，优化项目介绍和架构说明
- 移除旧的agent.py和backend.py文件
```

											
										
										
											2026-04-13 23:57:16 +08:00
+								    networks:
 								      - ai-network
 								    depends_on:
 								      - backend
 								    restart: unless-stopped
 								networks:
 								  ai-network:
 								    driver: bridge