# 每日对话知识库使用指南 ## 功能说明 自动从 Claude Code 对话历史中提取问答对,使用 LLM 进行智能总结,生成结构化的 Markdown 知识库。 ## 快速开始 ### 1. 手动触发总结 ```bash # 总结今天的对话(使用 LLM) python summarize_daily.py --use-llm # 总结指定日期 python summarize_daily.py --use-llm --date 2026-04-23 # 使用指定模型 python summarize_daily.py --use-llm --model "deepseek/deepseek-chat-v3-0324" # 不使用 LLM(简单格式化) python summarize_daily.py ``` ### 2. 自动触发(集成到 pipeline) 在 `.env` 文件中添加: ```bash ENABLE_KNOWLEDGE_SUMMARY=true ``` 然后运行 pipeline,完成后会自动生成知识总结: ```bash python run_search_agent.py ``` ## 配置选项 ### 环境变量 ```bash # 是否启用知识总结(默认 false) ENABLE_KNOWLEDGE_SUMMARY=true # 知识库目录(默认 knowledge/) KNOWLEDGE_BASE_DIR=knowledge # 总结使用的模型(默认 anthropic/claude-sonnet-4.5) KNOWLEDGE_SUMMARY_MODEL=deepseek/deepseek-chat-v3-0324 # 最小问题长度(默认 10 字符) KNOWLEDGE_MIN_QUESTION_LENGTH=10 ``` ### 推荐模型 由于 Claude 模型在某些区域不可用,推荐使用以下模型: - `deepseek/deepseek-chat-v3-0324` - 性价比高,效果好 - `openai/gpt-4o-mini` - OpenAI 便宜模型 - `qwen/qwen-2.5-72b-instruct` - 通义千问 ## 输出格式 知识库按日期组织: ``` knowledge/ ├── 2026-04/ │ ├── 2026-04-23.md │ ├── 2026-04-24.md │ └── ... └── 2026-05/ └── ... ``` 每个文件包含当天所有会话的总结: ```markdown # 2026-04-23 对话总结 > 生成时间:2026-04-23 18:30:00 > 会话数:3 > 问答对数:12 --- ## 会话 1 ### Q: 问题简述 **问题**:完整问题描述 **解决方案**: - 关键步骤1 - 关键步骤2 **涉及文件**: - `path/to/file.py` **相关技术**: - 技术名称 --- ``` ## 工作原理 1. **解析对话历史**:从 `~/.claude/projects/{project}/` 读取 JSONL 文件 2. **提取问答对**:过滤系统消息,配对用户问题和助手回答 3. **LLM 总结**:使用 LLM 提取关键信息,生成结构化输出 4. **保存到文件**:按日期组织,追加到当天的 Markdown 文件 ## 注意事项 1. **API Key**:使用 LLM 需要设置 `OPEN_ROUTER_API_KEY` 环境变量 2. **区域限制**:某些模型在特定区域不可用,建议使用 DeepSeek 或 GPT-4o-mini 3. **成本控制**:LLM 总结会产生 API 调用费用,可以选择不使用 LLM 4. **文件追加**:同一天多次运行会追加内容,不会覆盖 ## 故障排除 ### 问题:找不到对话历史 确保你在正确的项目目录下运行,或使用 `--cwd` 参数指定: ```bash python summarize_daily.py --cwd /path/to/project ``` ### 问题:LLM 调用失败 检查 API Key 是否正确,或尝试其他模型: ```bash python summarize_daily.py --use-llm --model "deepseek/deepseek-chat-v3-0324" ``` ### 问题:没有提取到问答对 检查对话内容是否太短(默认最小 10 字符),可以调整: ```bash export KNOWLEDGE_MIN_QUESTION_LENGTH=5 python summarize_daily.py ``` ## 扩展功能(未来) - [ ] 语义搜索:集成向量数据库 - [ ] 知识图谱:提取实体和关系 - [ ] 定期复盘:每周/每月自动生成总结报告 - [ ] 知识评分:根据使用频率评估价值 - [ ] 多项目支持:跨项目知识聚合