帮助 Google 改进 AI 模型的合同工被要求对比 Gemini AI 与竞争对手 Anthropic 公司的 Claude 模型的输出结果。科技巨头们正在竞相构建更出色的 AI 模型,模型的性能通常会与竞争对手进行比较,但主要是通过行业基准测试,而不是让合同工们费力去评估竞争对手 AI 的反应。Google Gemini AI 模型的合同工们被要求根据真实性和详细程度等指标对每个 AI 响应进行评分,每次提示有最多 30 分钟时间去判断 Gemini 和 Claude 谁的答案更好。
https://techcrunch.com/2024/12/24/google-is-using-anthropics-claude-to-improve-its-gemini-ai/