# 每日对话知识库使用指南

## 功能说明

自动从 Claude Code 对话历史中提取问答对，使用 LLM 进行智能总结，生成结构化的 Markdown 知识库。

## 快速开始

### 1. 手动触发总结

```bash
# 总结今天的对话（使用 LLM）
python summarize_daily.py --use-llm

# 总结指定日期
python summarize_daily.py --use-llm --date 2026-04-23

# 使用指定模型
python summarize_daily.py --use-llm --model "deepseek/deepseek-chat-v3-0324"

# 不使用 LLM（简单格式化）
python summarize_daily.py
```

### 2. 自动触发（集成到 pipeline）

在 `.env` 文件中添加：

```bash
ENABLE_KNOWLEDGE_SUMMARY=true
```

然后运行 pipeline，完成后会自动生成知识总结：

```bash
python run_search_agent.py
```

## 配置选项

### 环境变量

```bash
# 是否启用知识总结（默认 false）
ENABLE_KNOWLEDGE_SUMMARY=true

# 知识库目录（默认 knowledge/）
KNOWLEDGE_BASE_DIR=knowledge

# 总结使用的模型（默认 anthropic/claude-sonnet-4.5）
KNOWLEDGE_SUMMARY_MODEL=deepseek/deepseek-chat-v3-0324

# 最小问题长度（默认 10 字符）
KNOWLEDGE_MIN_QUESTION_LENGTH=10
```

### 推荐模型

由于 Claude 模型在某些区域不可用，推荐使用以下模型：

- `deepseek/deepseek-chat-v3-0324` - 性价比高，效果好
- `openai/gpt-4o-mini` - OpenAI 便宜模型
- `qwen/qwen-2.5-72b-instruct` - 通义千问

## 输出格式

知识库按日期组织：

```
knowledge/
├── 2026-04/
│   ├── 2026-04-23.md
│   ├── 2026-04-24.md
│   └── ...
└── 2026-05/
    └── ...
```

每个文件包含当天所有会话的总结：

```markdown
# 2026-04-23 对话总结

> 生成时间：2026-04-23 18:30:00
> 会话数：3
> 问答对数：12

---

## 会话 1

### Q: 问题简述
**问题**：完整问题描述

**解决方案**：
- 关键步骤1
- 关键步骤2

**涉及文件**：
- `path/to/file.py`

**相关技术**：
- 技术名称

---
```

## 工作原理

1. **解析对话历史**：从 `~/.claude/projects/{project}/` 读取 JSONL 文件
2. **提取问答对**：过滤系统消息，配对用户问题和助手回答
3. **LLM 总结**：使用 LLM 提取关键信息，生成结构化输出
4. **保存到文件**：按日期组织，追加到当天的 Markdown 文件

## 注意事项

1. **API Key**：使用 LLM 需要设置 `OPEN_ROUTER_API_KEY` 环境变量
2. **区域限制**：某些模型在特定区域不可用，建议使用 DeepSeek 或 GPT-4o-mini
3. **成本控制**：LLM 总结会产生 API 调用费用，可以选择不使用 LLM
4. **文件追加**：同一天多次运行会追加内容，不会覆盖

## 故障排除

### 问题：找不到对话历史

确保你在正确的项目目录下运行，或使用 `--cwd` 参数指定：

```bash
python summarize_daily.py --cwd /path/to/project
```

### 问题：LLM 调用失败

检查 API Key 是否正确，或尝试其他模型：

```bash
python summarize_daily.py --use-llm --model "deepseek/deepseek-chat-v3-0324"
```

### 问题：没有提取到问答对

检查对话内容是否太短（默认最小 10 字符），可以调整：

```bash
export KNOWLEDGE_MIN_QUESTION_LENGTH=5
python summarize_daily.py
```

## 扩展功能（未来）

- [ ] 语义搜索：集成向量数据库
- [ ] 知识图谱：提取实体和关系
- [ ] 定期复盘：每周/每月自动生成总结报告
- [ ] 知识评分：根据使用频率评估价值
- [ ] 多项目支持：跨项目知识聚合