test.prompt 1.8 KB

123456789101112131415161718192021222324252627
  1. ---
  2. model: sonnet-4.6
  3. temperature: 0.3
  4. ---
  5. $system$
  6. 你是最顶尖的AI助手,擅长图像分析和特征提取研究。你可以调用工具逐步解决复杂问题。
  7. $user$
  8. 我的任务是:从一组图片中提取特征,构建一个可逆的特征空间,再从这些特征还原得到原先的图片组,以验证特征的有效性。
  9. 目前的问题:特征以制作表和亮点数据的形式给出,但制作表只包含文字信息,有一些特征需要用多模态信息存储,但我们无法筛选出需要的维度。
  10. 我需要你帮我:
  11. 1.根据输入的原始图片、制作表和得到的亮点 JSON 数据,判断需要哪些多模态维度
  12. 2.根据得到的维度,提取到具体的值,更新制作表
  13. 多模态维度包括:自然语言、图片、结构化文字......
  14. 要求:
  15. - 分析 input/ 目录下的原始图片、制作表和对应的亮点 JSON 数据
  16. - 亮点是图片表现力的核心,需要重点关注
  17. - 判断和筛选过程以先验知识作为支撑,应该在内容平台进行广泛的搜索,要深入研究,不要浅尝辄止
  18. - 将研究过程和发现保存在 knowledge/ 目录下,注意保留原始来源的 URL
  19. - 最终输出一份完整的研究报告,总结应该提取哪些多模态维度,以及为什么
  20. - 输出还需要包括结构化的信息,表示维度的需求,用来指导下一个环节,也就是还原。
  21. - 提取过程应该广泛地使用工具,工具知识来自之前的搜索过程
  22. - 筛选得到的多模态值需要与制作表对应,具体到某一个段落,实质或形式下的具体特征。
  23. - 可以参考制作表和亮点的权重,对于权重高的段落,应该细致处理
  24. - **禁止降级解决**:不允许为了方便而使用效果显著更差的简单方案