对话生成质量 User Study

您将评估 5 组不同场景下的对话质量。每组包含三段由不同方法生成的对话,请仔细阅读后对各维度进行评分。