# Agent Core

**Agent 核心框架**：提供单个 Agent 的执行能力

## 文档维护规范

0. **先改文档，再动代码** - 新功能或重大修改需先完成文档更新、并完成审阅后，再进行代码实现；除非改动较小、不被文档涵盖
1. **文档分层，链接代码** - 重要或复杂设计可以另有详细文档；关键实现需标注代码文件路径；格式：`module/file.py:function_name`
2. **简洁快照，日志分离** - 只记录最重要的、与代码准确对应的或者明确的已完成的设计的信息，避免推测、建议，或大量代码；决策依据或修改日志若有必要，可在`docs/decisions.md`另行记录

---

## 概述

Agent Core 是一个完整的 Agent 执行框架，提供：
- Trace、Message、Goal 管理
- 工具系统（文件、命令、网络、浏览器）
- LLM 集成（Gemini、OpenRouter、Yescode）
- Skills（领域知识注入）
- 子 Agent 机制

**独立性**：Agent Core 不依赖任何其他模块，可以独立运行。

---

## 模块结构

```
agent/
├── core/                  # 核心引擎
│   ├── runner.py          # AgentRunner + 运行时配置
│   └── presets.py         # Agent 预设（explore、analyst 等）
│
├── trace/                 # 执行追踪（含计划管理）
│   ├── models.py          # Trace, Message
│   ├── goal_models.py     # Goal, GoalTree, GoalStats
│   ├── protocols.py       # TraceStore 接口
│   ├── store.py           # FileSystemTraceStore 实现
│   ├── goal_tool.py       # goal 工具（计划管理）
│   ├── compaction.py      # Context 压缩
│   ├── api.py             # REST API
│   └── websocket.py       # WebSocket API
│
├── tools/                 # 外部交互工具
│   ├── registry.py        # 工具注册表
│   ├── schema.py          # Schema 生成器
│   ├── models.py          # ToolResult, ToolContext
│   └── builtin/
│       ├── file/          # 文件操作
│       ├── browser/       # 浏览器自动化
│       ├── bash.py        # 命令执行
│       ├── subagent.py    # 子 Agent 创建
│       └── a2a_im.py      # A2A IM 工具（桥接到 Gateway）
│
├── skill/                 # 技能系统
│   ├── models.py          # Skill
│   ├── skill_loader.py    # Skill 加载器
│   └── skills/            # 内置 Skills
│
└── llm/                   # LLM 集成
    ├── gemini.py          # Gemini Provider
    ├── openrouter.py      # OpenRouter Provider
    └── yescode.py         # Yescode Provider
```

---

## 核心概念

### Trace（任务执行）

一次完整的 Agent 执行。所有 Agent（主、子、人类协助）都是 Trace。

**实现位置**：`agent/trace/models.py:Trace`

### Goal（目标节点）

计划中的一个目标，支持层级结构。

**实现位置**：`agent/trace/goal_models.py:Goal`

### Message（执行消息）

对应 LLM API 的消息，每条 Message 关联一个 Goal。

**实现位置**：`agent/trace/models.py:Message`

---

## 快速开始

### 基础使用

```python
from agent.core.runner import AgentRunner, RunConfig
from agent.trace import FileSystemTraceStore, Trace, Message
from agent.llm import create_qwen_llm_call

runner = AgentRunner(
    llm_call=create_qwen_llm_call(model="qwen3.5-plus"),
    trace_store=FileSystemTraceStore(base_path=".trace"),
    skills_dir="./skills",      # 项目 skills 目录（可选）
)

async for item in runner.run(
    messages=[{"role": "user", "content": "分析项目架构"}],
    config=RunConfig(model="qwen3.5-plus"),
):
    if isinstance(item, Trace):
        print(f"Trace: {item.trace_id}")
    elif isinstance(item, Message) and item.role == "assistant":
        print(item.content)
```

### RunConfig 关键参数

```python
RunConfig(
    model="qwen3.5-plus",
    temperature=0.3,
    max_iterations=200,
    agent_type="default",           # Agent 预设（对应 presets.json）
    name="任务名称",
    tools=None,                      # 精确指定工具列表（优先于 tool_groups）
    tool_groups=["core", "browser"], # 工具分组白名单，默认 ["core"]
    goal_compression="on_overflow", # Goal 压缩："none" / "on_complete" / "on_overflow"
    knowledge=KnowledgeConfig(...), # 知识提取配置
)
```

### 续跑已有 Trace

```python
config = RunConfig(model="qwen3.5-plus", trace_id="existing-trace-id")
async for item in runner.run(messages=[{"role": "user", "content": "继续"}], config=config):
    ...
```

### Skill 指定注入（设计中）

同一个长期续跑的 agent，不同调用可以注入不同 skill：

```python
# 不同调用场景注入不同策略
async for item in runner.run(
    messages=[...], config=config,
    inject_skills=["ask_strategy"],     # 本次需要的 skill
    skill_recency_threshold=10,         # 最近 N 条消息内有就不重复注入
):
    ...
```

详见 [Context 管理 § Skill 指定注入](./docs/context-management.md#3-skill-指定注入设计中未实现)

### 自定义工具

```python
from agent.tools import tool, ToolContext, ToolResult

@tool(description="自定义工具")
async def my_tool(arg: str, ctx: ToolContext) -> ToolResult:
    return ToolResult(title="成功", output=f"处理结果: {arg}")
```

### 完整示例

参考 `examples/research/` — 一个完整的调研 agent 项目：

```
examples/research/
├── run.py              # 入口（含交互控制、续跑、暂停）
├── config.py           # RunConfig + KnowledgeConfig 配置
├── presets.json        # Agent 预设（工具权限、skills 过滤）
├── requirement.prompt  # 任务 prompt（$system$ + $user$ 段）
├── skills/             # 项目自定义 skills
└── tools/              # 项目自定义工具
```

---

## 文档

| 文档 | 内容 |
|------|------|
| [架构设计](./docs/architecture.md) | 框架完整架构 |
| [Context 管理](./docs/context-management.md) | 注入机制、压缩策略、Skill 指定注入 |
| [工具系统](./docs/tools.md) | 工具定义、注册、参数注入 |
| [Skills 指南](./docs/skills.md) | Skill 分类、编写、加载 |
| [Prompt 规范](./docs/prompt-guidelines.md) | Prompt 撰写原则 |
| [Trace API](./docs/trace-api.md) | REST API 和 WebSocket 接口 |
| [设计决策](./docs/decisions.md) | 架构决策记录 |

---

## REST API

| 方法 | 路径 | 说明 |
|------|------|------|
| GET  | `/api/traces` | 列出 Traces |
| GET  | `/api/traces/{id}` | 获取 Trace 详情 |
| GET  | `/api/traces/{id}/messages` | 获取 Messages |
| POST | `/api/traces` | 新建 Trace 并执行 |
| POST | `/api/traces/{id}/run` | 续跑或回溯 |
| POST | `/api/traces/{id}/stop` | 停止运行 |

**实现**：`agent/trace/api.py`, `agent/trace/run_api.py`

---

## 附录：工具分组

通过 `RunConfig(tool_groups=[...])` 控制 Agent 可用的工具范围。默认仅 `["core"]`。每个工具在 `@tool(groups=[...])` 中声明分组，支持多标签。

机制详见 [docs/tools.md § 工具分组](./docs/tools.md#工具分组)。

### core — 基础能力（13）

| 工具 | 说明 |
|------|------|
| `read_file` | 读取单个文件（文本/图片/PDF） |
| `read_images` | 批量读图 + 网格拼图 |
| `edit_file` | 编辑文件 |
| `write_file` | 写入文件 |
| `glob_files` | 文件模式匹配 |
| `grep_content` | 内容搜索（正则） |
| `bash_command` | 执行 shell 命令 |
| `skill` | 调用 skill |
| `list_skills` | 列出可用 skill |
| `agent` | 创建子 Agent |
| `evaluate` | 评估执行结果 |
| `goal` | 目标/计划管理 |
| `get_current_context` | 获取当前执行上下文 |

### browser — 浏览器自动化（14）

| 工具 | 说明 |
|------|------|
| `browser_navigate` | 导航到 URL |
| `browser_search` | 搜索引擎搜索 |
| `browser_back` | 返回上一页 |
| `browser_interact` | 元素交互（click/type/send_keys/upload/dropdown） |
| `browser_scroll` | 滚动页面 |
| `browser_screenshot` | 截图（可带元素编号标注） |
| `browser_elements` | 获取可交互元素列表 |
| `browser_read` | 读取页面内容（html/find/long） |
| `browser_extract` | LLM 驱动的结构化数据提取 |
| `browser_tabs` | 标签页管理（switch/close） |
| `browser_cookies` | Cookie/登录态（load/export/ensure_login） |
| `browser_wait` | 等待（定时/等用户操作） |
| `browser_js` | 执行 JavaScript |
| `browser_download` | 下载文件 |

### content — 内容搜索（6）

| 工具 | 说明 |
|------|------|
| `content_platforms` | 列出/查询平台及参数（支持模糊匹配） |
| `content_search` | 跨 11 平台搜索（小红书/B站/知乎/GitHub/YouTube/X 等） |
| `content_detail` | 查看内容详情（从搜索缓存按索引取） |
| `content_suggest` | 搜索关键词补全建议 |
| `extract_video_clip` | YouTube 视频片段截取 |
| `import_content` | 批量导入文章到 CMS |

### knowledge — 知识管理（2）

| 工具 | 说明 |
|------|------|
| `ask_knowledge` | 向知识库查询（通过 Librarian Agent） |
| `upload_knowledge` | 上传调研结果到知识库 |

### toolhub — 远程工具库（3）

| 工具 | 说明 |
|------|------|
| `toolhub_health` | 检查远程工具库状态 |
| `toolhub_search` | 搜索远程 AI 工具 |
| `toolhub_call` | 调用远程工具（图片参数支持本地路径） |

### feishu — 飞书（4）

| 工具 | 说明 |
|------|------|
| `feishu_get_contact_list` | 获取联系人列表 |
| `feishu_send_message_to_contact` | 给联系人发消息 |
| `feishu_get_contact_replies` | 获取联系人回复 |
| `feishu_get_chat_history` | 获取聊天历史 |

### im — IM 通信（8）

| 工具 | 说明 |
|------|------|
| `im_setup` | 初始化 IM 连接 |
| `im_send_message` | 发送消息 |
| `im_receive_messages` | 接收消息 |
| `im_check_notification` | 检查通知 |
| `im_get_contacts` | 获取联系人 |
| `im_get_chat_history` | 获取聊天历史 |
| `im_open_window` | 打开 IM 窗口 |
| `im_close_window` | 关闭 IM 窗口 |

### resource — 资源查询（2）

| 工具 | 说明 |
|------|------|
| `resource_list_tools` | 列出资源工具 |
| `resource_get_tool` | 获取工具详情 |

### knowledge_internal — 知识库内部操作（14）

> 仅供 Librarian Agent 内部使用，普通 Agent 不可见。通过 `tools=[...]` 精确指定访问。

| 工具 | 说明 |
|------|------|
| `knowledge_search` | 知识检索（语义 + 精排） |
| `knowledge_save` | 保存知识条目 |
| `knowledge_list` | 列出知识 |
| `knowledge_update` | 更新知识反馈 |
| `knowledge_batch_update` | 批量更新反馈 |
| `knowledge_slim` | 知识瘦身 |
| `resource_save` | 保存资源 |
| `resource_get` | 获取资源 |
| `tool_search` | 搜索工具记录 |
| `tool_list` | 列出工具记录 |
| `capability_search` | 搜索能力记录 |
| `capability_list` | 列出能力记录 |
| `requirement_search` | 搜索需求记录 |
| `requirement_list` | 列出需求记录 |