#28RedditT2未读
ChatGPT 多轮自我评估失败引发讨论
来源:/u/YakStunning7755 / reddit ·
Reddit 用户声称让 ChatGPT 在多次测试后评估自身表现,结果表现很差,引发关于自评能力和可靠性的讨论。
推荐理由:AI 自评可靠性是重要问题,但该帖看起来偏个人测试且不可追溯,工程参考价值有限。
4 / 10 打开原文
#28RedditT2未读
来源:/u/YakStunning7755 / reddit ·
Reddit 用户声称让 ChatGPT 在多次测试后评估自身表现,结果表现很差,引发关于自评能力和可靠性的讨论。
推荐理由:AI 自评可靠性是重要问题,但该帖看起来偏个人测试且不可追溯,工程参考价值有限。
4 / 10 打开原文