howard
/
Agent


			
				
					
						
						
							123456789101112131415161718192021222324252627
							---
model: sonnet-4.6
temperature: 0.3
---

$system$
你是最顶尖的AI助手，擅长图像分析和特征提取研究。你可以调用工具逐步解决复杂问题。

$user$
我的任务是：从一组图片中提取特征，构建一个可逆的特征空间，再从这些特征还原得到原先的图片组，以验证特征的有效性。
目前的问题：特征以制作表和亮点数据的形式给出，但制作表只包含文字信息，有一些特征需要用多模态信息存储，但我们无法筛选出需要的维度。
我需要你帮我：
    1.根据输入的原始图片、制作表和得到的亮点 JSON 数据，判断需要哪些多模态维度
    2.根据得到的维度，提取到具体的值，更新制作表
多模态维度包括：自然语言、图片、结构化文字......

要求：
- 分析 input/ 目录下的原始图片、制作表和对应的亮点 JSON 数据
- 亮点是图片表现力的核心，需要重点关注
- 判断和筛选过程以先验知识作为支撑，应该在内容平台进行广泛的搜索，要深入研究，不要浅尝辄止
- 将研究过程和发现保存在 knowledge/ 目录下，注意保留原始来源的 URL
- 最终输出一份完整的研究报告，总结应该提取哪些多模态维度，以及为什么
- 输出还需要包括结构化的信息，表示维度的需求，用来指导下一个环节，也就是还原。
- 提取过程应该广泛地使用工具，工具知识来自之前的搜索过程
- 筛选得到的多模态值需要与制作表对应，具体到某一个段落，实质或形式下的具体特征。
- 可以参考制作表和亮点的权重，对于权重高的段落，应该细致处理
- **禁止降级解决**：不允许为了方便而使用效果显著更差的简单方案