agent-Specialization/doc/答辩PPT_大纲与逐页内容.md
2026-01-05 21:48:55 +08:00

14 KiB
Raw Permalink Blame History

答辩 PPT大纲与逐页内容基于 doc/TECH_DOC.md + doc/开题报告.txt

目标:给你一个“可直接照着做 PPT”的逐页脚本。
建议页数:18 页(答辩 812 分钟可控;如需 15/20 页我也可以再压缩/扩展)。
你需要自行补充:系统截图(登录/聊天/终端/文件/监控/虚拟显示器/管理员面板)、架构图(可用 draw.io


0. PPT 叙事主线(建议)

  1. 为什么做:涉密/内网 + 成本 + 可控性痛点
  2. 做了什么Docker 多用户隔离的 AI 开发平台(终端/文件/对话/监控一体)
  3. 怎么做:后端编排 + 容器执行层 + 前端实时交互 + 监控与安全
  4. 做得怎么样:指标/实战测试/稳定性
  5. 还能怎么做更好:生产化补齐项(安全/DB/CI/伸缩)

1. 页面总览(大纲)

  1. 标题页
  2. 背景与痛点
  3. 目标与需求(四大目标)
  4. 研究现状对比与创新点
  5. 系统总体架构(三层/数据流)
  6. 运行时拓扑(宿主机 + 多容器)
  7. 后端核心终端编排与会话MainTerminal/WebTerminal
  8. 核心模块 1用户容器管理UserContainerManager
  9. 核心模块 2容器文件代理Container File Proxy
  10. 核心模块 3持久化终端与超时控制Persistent Terminal
  11. 上下文构建与对话管理Context/Conversation Manager
  12. 分层思考模式fast/thinking/deep
  13. 子智能体机制Sub-Agent
  14. 前端架构与虚拟显示器回放Vue + Monitor
  15. 安全与权限模型CSRF/限流/上传隔离/容器隔离)
  16. 监控与日志CPU/内存/网速/磁盘/Token
  17. 评估指标与实战测试结果(表格 + 数据)
  18. 总结与展望(贡献/局限/下一步)

2. 逐页内容(每页可直接做成 PPT

第 1 页:标题页

标题:基于 Docker 容器的多用户 AI 智能体开发平台
副标题:自主可控、可私有化部署、支持 OpenAI 兼容国产模型
作者/学校/专业/导师/日期:按你的信息填写
建议配图:系统主界面截图(聊天 + 终端 + 资源面板同屏),或一张“浏览器 + 容器”的示意图。 讲稿要点1015 秒):一句话定义:这是一个“多用户隔离 + 全工具链”的 AI 编程/开发助手平台。


第 2 页:背景与痛点(为什么要做)

标题课题背景AI 辅助编程的现实痛点
内容要点

  • 商业产品强但有问题:国外服务依赖、内网/涉密不可用、费用高、难定制
  • 国产模型生态成熟DeepSeek/Qwen/GLM 等具备商用性能与更低成本,支持私有化
  • 需求场景明确:涉密项目、企业内网、高校教学多用户实验 建议配图对比表Copilot/Cursor/Claude Code vs 本项目)。 讲稿要点:强调“不是再做一个聊天网页”,而是“可执行、可隔离、可监控”的开发平台。

第 3 页:目标与需求(做成什么样)

标题:课题目的:四大目标
内容要点(四象限)

  1. 技术自主OpenAI 兼容 API可私有化部署
  2. 功能完整:终端/文件/对话管理/监控
  3. 安全隔离:单用户单容器、配额限制、沙箱化文件与命令
  4. 实用性:涉密开发、降低企业成本、教学平台 建议配图:四象限图或 checklist。 讲稿要点:这四点对应后面四条主线:架构、工具、隔离、安全与监控。

第 4 页:研究现状与创新点(你做的“新”在哪里)

标题:研究现状与不足 → 本项目创新点
对比要点

  • Copilot/灵码:主要是补全,缺少终端/文件/多租户
  • Cursor/Claude Code工具更强但闭源/云端/单用户或国内受限
  • 开源 AutoGPT/Open-WebUI偏聊天/框架,工程化与隔离不足
    本项目创新点(落地型)
  • 多用户隔离:单用户单容器 + 资源配额
  • 工具完整:持久化终端 + 文件代理 + 对话管理 + 监控
  • 分层思考模式:推理模型首轮 + 快速模型后续(节省成本)
  • 子智能体并行:任务拆分与交付 讲稿要点:把“创新”说成“可验证的工程机制”,而不是抽象概念。

第 5 页:系统总体架构(概览)

标题:总体架构:浏览器 → Web 服务器 → 业务逻辑 → 容器层
内容要点(建议画图):

  • 前端Vue SPA + Socket.IO Client
  • Web ServerFlask + Socket.IO鉴权、API、事件
  • 业务层WebTerminal/MainTerminal、ContextManager、UserContainerManager、UploadQuarantineManager
  • 容器层:每用户一个容器,执行命令与文件操作
    讲稿要点:解释“工具调用并不在宿主机直接执行”,而是通过容器代理统一落地。

第 6 页:运行时拓扑(多用户隔离如何工作)

标题:运行时拓扑:单机多用户、多容器并发
内容要点

  • 用户登录 → 创建/复用容器 → 挂载用户工作区project/data/logs
  • 宿主机仅运行 Web 服务与调度,执行尽量在容器内完成
  • 并发上限:最多 N 个活跃容器(配置项 MAX_ACTIVE_USER_CONTAINERS 建议配图:宿主机盒子 + N 个容器盒子,每个容器挂载各自 workspace。 讲稿要点:突出横向隔离:用户 A 无法看到用户 B 的文件/进程。

第 7 页后端核心终端编排与会话MainTerminal/WebTerminal

标题:后端核心:统一编排层
内容要点

  • CLI 与 Web 共用核心:core/main_terminal.py
  • Web 版继承:core/web_terminal.py,增加消息回调与自动加载/创建对话
  • 统一处理运行模式fast/thinking/deep、工具分类开关、聚焦文件、Todo/记忆、子代理状态
    建议配图类关系简图WebTerminal → MainTerminal → modules/utils/config。 讲稿要点:强调“核心逻辑只写一套”,降低维护成本。

第 8 页:核心模块 1用户容器管理UserContainerManager

标题:容器生命周期管理(按用户)
内容要点

  • 创建/复用/回收:ensure_container / release_container
  • 资源限制CPU/内存/网络/卷挂载路径;容器上限与资源繁忙提示
  • 状态采集:支持 docker stats/inspect 汇报到监控
    建议配图时序图login → ensure_container → handlelogout/idle → release。 可讲实现细节
  • 容器模式与回退docker 不可用时可回退 host可配置 require 强制失败)
  • 容器命名与记录:保存 container_name/container_id/last_active

第 9 页:核心模块 2容器文件代理Container File Proxy

标题:容器内文件操作:安全、低开销
内容要点

  • 方案:docker exec 执行内联 Python 脚本(避免 docker cp 往返与临时文件)
  • 安全:路径解析 resolve + 前缀检查,阻止目录遍历;限制文件大小与行范围
  • 功能create/read/write/rename/delete、读片段、可扩展 diff/搜索)
    建议配图:对比图:传统 docker cp 三次 IO vs exec 一次 IO。
    讲稿要点:把“效率 + 安全”作为这页核心论点。

第 10 页:核心模块 3持久化终端与超时控制

标题:持久化终端:多会话 + 输出缓冲 + 超时不杀会话
内容要点

  • 多终端会话管理:modules/terminal_manager.py(最大会话数、快照行数/字符上限)
  • 持久化终端:modules/persistent_terminal.py(读写线程、输出队列、循环缓冲、回显检测)
  • 一次性工具命令:modules/terminal_ops.py + modules/toolbox_container.py(专用工具容器,避免状态污染)
    建议配图终端会话结构图session → process → output buffer
    讲稿要点:强调工程难点:交互式程序、输出爆炸、超时机制(只杀命令不杀终端)。

第 11 页:上下文构建与对话管理

标题ContextManager把“可用信息”组装给模型
内容要点

  • 对话持久化:utils/conversation_manager.py(对话文件 + index支持重建索引与容错
  • 上下文来源历史消息、工具结果、聚焦文件、Todo/记忆、资源限额、个性化偏好
  • Token 统计:对话级 + 工作区累计(写入 token_totals.json
    建议配图上下文拼装示意System prompt + tools + focused files + history + memory/todo。
    讲稿要点:说明为什么需要“聚焦文件”:让模型稳定获取关键代码片段,减少无关信息。

第 12 页分层思考模式fast / thinking / deep

标题:分层思考模式:质量/速度/成本的平衡
内容要点

  • fast快速响应适合简单问题
  • thinking推理更充分适合复杂任务
  • deep更强推理/更长思考(用于难题)
  • 机制:首轮推理结果缓存,后续复用(节约成本;可配置切换间隔 THINKING_FAST_INTERVAL
    建议配图:模式切换流程图或对比表(质量/成本/延迟)。
    讲稿要点:把“成本控制”说成一个可量化的工程机制,而不是主观感受。

第 13 页子智能体机制Sub-Agent

标题:子智能体:任务并行与交付
内容要点

  • 主智能体负责编排与拆分;子智能体负责执行子任务并返回交付物
  • 生命周期create → wait → close状态pending/running/completed/failed
  • 隔离独立工作区references/deliverables避免污染主会话
    建议配图:主/子代理协作图(任务拆分、并行、合并结果)。
    讲稿要点:突出价值:复杂任务“可并行”,主对话更清晰。

第 14 页:前端架构与虚拟显示器回放

标题Vue 前端:实时交互 + 可视化回放
内容要点

  • SPAVue3 + Pinia + Socket.IO Client
  • 状态域聊天、工具、monitor、resource、files、upload、policy、subAgent 等
  • 虚拟显示器:static/src/components/chat/monitor/*,将工具执行过程转为可回放动画(指针/窗口/右键/进度气泡)
    建议配图:虚拟显示器截图 + 简单事件流tool event → store → MonitorDirector
    讲稿要点:强调“可解释性/可观测性”:用户能看到智能体“在做什么”。

第 15 页:安全与权限模型

标题:安全设计:多层防护(容器 + Web 安全 + 上传隔离)
内容要点

  • 容器隔离:单用户单容器,配额限制,宿主机不直接执行用户命令
  • Web 安全CSRF token、登录失败锁定/限流、Session 过期
  • 上传安全:隔离区暂存 + 后缀/大小校验 + 可选 ClamAV 扫描 + 审计日志
  • 路径安全:resolve + 越界检查,阻止 ../../../
    建议配图:安全“洋葱模型”图(外层 Web → 内层容器 → 文件代理)。
    讲稿要点:同时说明局限:仍需进一步收紧 CORS、移除硬编码密钥等生产化事项下一页或总结提

第 16 页:监控与日志(可观测性)

标题:可观测性:资源 + Token + 审计日志
内容要点

  • 容器监控CPU/内存/网络 IO采样写入 logs/container_stats.log,前端计算网速并展示
  • 磁盘配额:项目已用/上限/百分比(轮询,退避策略)
  • Token 统计:当前上下文 + 对话累计 + 工作区累计
  • 审计:上传扫描日志按用户分文件记录
    建议配图资源面板截图CPU/内存/网速/存储/Token
    讲稿要点:强调这是“教学/企业可用”的关键:管理员能看到资源与风险点。

第 17 页:评估指标与实战测试结果

标题:评估与验证:实战测试 + 指标达成
建议一张表 + 一张要点

  • 代码规模:约 41,500 行模块数25+
  • 并发能力8 个容器;单容器 3 个终端会话
  • 响应:交互响应 < 100ms本地条件下
  • 成功率diff 补丁 ~85%;终端命令 ~98%
  • 稳定性:连续运行 72h 无崩溃300+ 次 dogfooding
  • 安全测试:路径遍历/命令注入/恶意上传均拦截 建议配图:一页“指标表格”,或“雷达图/柱状图”。
    讲稿要点:把“测过/跑过/能用”说清楚,体现工程完成度。

第 18 页:总结与展望

标题:总结与下一步
总结(贡献点)

  • 多用户容器隔离的 AI 开发平台(端到端可运行)
  • 文件代理 + 持久化终端 + 对话上下文 + 监控面板形成闭环
  • 分层思考模式与子智能体增强复杂任务能力
    局限(坦诚但可控)
  • 安全基线仍需生产化密钥治理、CORS 收紧、日志脱敏、DB/权限细化)
  • 可扩展性:后端可拆分执行层/引入任务队列与多 worker
    下一步(可选):
  • 数据库化(用户/会话/审计、CI/CD、镜像漏洞扫描、RAG/代码索引、rootless/gVisor 等 建议配图Roadmap 时间线(短期/中期/长期)。 讲稿要点:以“可落地的下一步”收尾,体现工程规划能力。

3. 你需要准备的素材清单(做 PPT 前先收集)

  1. 截图:登录页、聊天页、终端页、文件管理、上传、资源面板、虚拟显示器、管理员策略页
  2. 结构图:总体架构、运行时拓扑、工具调用时序、子智能体协作图
  3. 数据:并发容器/终端数量、成功率、72h 稳定性、token 成本(用你真实运行数据替换“目标值/示例值”)
  4. 演示脚本:一条典型任务(搜索→修改文件→运行命令→展示监控/回放)

4. 版本说明

  • 生成时间2026-01-05
  • 依据文件:doc/TECH_DOC.mddoc/开题报告.txt