自动从 Claude Code 对话历史中提取问答对,使用 LLM 进行智能总结,生成结构化的 Markdown 知识库。
# 总结今天的对话(使用 LLM)
python summarize_daily.py --use-llm
# 总结指定日期
python summarize_daily.py --use-llm --date 2026-04-23
# 使用指定模型
python summarize_daily.py --use-llm --model "deepseek/deepseek-chat-v3-0324"
# 不使用 LLM(简单格式化)
python summarize_daily.py
在 .env 文件中添加:
ENABLE_KNOWLEDGE_SUMMARY=true
然后运行 pipeline,完成后会自动生成知识总结:
python run_search_agent.py
# 是否启用知识总结(默认 false)
ENABLE_KNOWLEDGE_SUMMARY=true
# 知识库目录(默认 knowledge/)
KNOWLEDGE_BASE_DIR=knowledge
# 总结使用的模型(默认 anthropic/claude-sonnet-4.5)
KNOWLEDGE_SUMMARY_MODEL=deepseek/deepseek-chat-v3-0324
# 最小问题长度(默认 10 字符)
KNOWLEDGE_MIN_QUESTION_LENGTH=10
由于 Claude 模型在某些区域不可用,推荐使用以下模型:
deepseek/deepseek-chat-v3-0324 - 性价比高,效果好openai/gpt-4o-mini - OpenAI 便宜模型qwen/qwen-2.5-72b-instruct - 通义千问知识库按日期组织:
knowledge/
├── 2026-04/
│ ├── 2026-04-23.md
│ ├── 2026-04-24.md
│ └── ...
└── 2026-05/
└── ...
每个文件包含当天所有会话的总结:
# 2026-04-23 对话总结
> 生成时间:2026-04-23 18:30:00
> 会话数:3
> 问答对数:12
---
## 会话 1
### Q: 问题简述
**问题**:完整问题描述
**解决方案**:
- 关键步骤1
- 关键步骤2
**涉及文件**:
- `path/to/file.py`
**相关技术**:
- 技术名称
---
~/.claude/projects/{project}/ 读取 JSONL 文件OPEN_ROUTER_API_KEY 环境变量确保你在正确的项目目录下运行,或使用 --cwd 参数指定:
python summarize_daily.py --cwd /path/to/project
检查 API Key 是否正确,或尝试其他模型:
python summarize_daily.py --use-llm --model "deepseek/deepseek-chat-v3-0324"
检查对话内容是否太短(默认最小 10 字符),可以调整:
export KNOWLEDGE_MIN_QUESTION_LENGTH=5
python summarize_daily.py