elksmmx a065e3b294 feat:0309 6 часов назад
..
input a065e3b294 feat:0309 6 часов назад
skills a065e3b294 feat:0309 6 часов назад
tool a065e3b294 feat:0309 6 часов назад
README.md a065e3b294 feat:0309 6 часов назад
run.py a065e3b294 feat:0309 6 часов назад
test.prompt a065e3b294 feat:0309 6 часов назад

README.md

图片模态特征提取研究

功能说明

这个示例用于研究:根据输入的原始图片和得到的亮点 JSON 数据,应该提取什么样的图片模态特征。

研究方式:

  1. 运用模型自己的知识:基于计算机视觉、图像特征提取的理解
  2. 搜索内容平台经验:从小红书、知乎等平台搜索实践经验

使用方法

1. 准备输入数据

将原始图片和对应的 JSON 数据放入 input/ 目录:

input/
  ├── image1.jpg
  ├── image1_highlights.json
  ├── image2.png
  └── image2_highlights.json

2. 配置环境变量

需要配置 OpenRouter API Key:

export OPENROUTER_API_KEY="your-api-key"

3. 运行研究任务

cd examples/find\ knowledge
python3 run.py

4. 交互操作

执行过程中可以:

  • 输入 ppause 暂停并进入交互模式
  • 输入 qquit 停止执行

5. 恢复执行

如果任务中断,可以使用 trace ID 恢复:

python3 run.py --trace <trace-id>

输出结果

  • knowledge/ - 研究过程和发现(包含原始来源 URL)
  • output/result.txt - 最终研究报告
  • .trace/ - 执行轨迹数据

模型配置

默认使用 OpenRouter 调用 anthropic/claude-sonnet-4.6,可在 test.prompt 中修改:

---
model: anthropic/claude-sonnet-4.6
temperature: 0.3
---

支持的模型格式(通过 OpenRouter):

  • Anthropic Claude: anthropic/claude-sonnet-4.6, anthropic/claude-opus-4
  • Google Gemini: google/gemini-2.5-flash-lite, google/gemini-2.5-pro
  • 其他 OpenRouter 支持的模型