|
@@ -98,13 +98,12 @@ class PushMessageEvaluator(AgentEvaluator):
|
|
|
"""
|
|
|
prompt = f"""
|
|
|
**评估任务说明:**
|
|
|
- **任务场景**: agent 和用户超过 24h 没有对话,agent 主动推送消息(message),希望能够与用户保持联系。
|
|
|
+ **任务场景**: agent和用户超过一段时间没有对话,agent 主动推送消息(message),希望能够与用户保持联系。
|
|
|
**评估任务**:请基于以下输入信息:
|
|
|
- 历史对话记录:dialogue_history
|
|
|
- 用户预设信息:user_profile
|
|
|
- agent 预设信息:agent_profile
|
|
|
- 消息发送时间:send_time
|
|
|
- - 历史唤起记录:history_push_record
|
|
|
结合以下评估指标对 message 的质量进行打分
|
|
|
**每个子指标满分 1 分**:
|
|
|
**评估维度与示例说明:**
|
|
@@ -209,11 +208,11 @@ class PushMessageEvaluator(AgentEvaluator):
|
|
|
- 每项后附简要中文评估理由,客观明确, 如果是节日日期相关,把节日日期也展示。
|
|
|
|
|
|
**输入:**
|
|
|
- - **对话历史**: {dialogue_history}
|
|
|
- - **Agent 预设信息**: {agent_profile}
|
|
|
- - **用户预设信息**: {user_profile}
|
|
|
- - **Agent 消息**: {message}
|
|
|
- - **Agent 发送消息时间**:{send_time}
|
|
|
+ - **dialogue_history**: {dialogue_history}
|
|
|
+ - **agent_profile**: {agent_profile}
|
|
|
+ - **user_profile**: {user_profile}
|
|
|
+ - **message**: {message}
|
|
|
+ - **send_time**:{send_time}
|
|
|
|
|
|
**输出格式要求:JSON 格式**
|
|
|
输出格式参考:{self.output_format}
|
|
@@ -245,8 +244,7 @@ class PushMessageEvaluator(AgentEvaluator):
|
|
|
return None
|
|
|
|
|
|
def evaluate(self):
|
|
|
- with open("push_dataset_new_0613_24h.json", encoding="utf-8") as f:
|
|
|
- data = json.load(f)
|
|
|
+
|
|
|
|
|
|
# data = data[:8]
|
|
|
|