CMMLU是一个综合性的汉语评估基准,专门用于评估语言模型在汉语背景下的知识和推理能力。CMMLU涵盖了从基础学科到高级专业水平的67个主题。
它包括:需要计算和推理的自然科学,需要人文科学和社会科学知识,以及需要生活常识的中国驾驶规则等。另外,CMMLU中的许多任务具有中国特定的答案,可能在其他地区或语言中因此并不普遍适用。中国化的中文测试基准。
©️版权声明:如涉及作品内容、版权和其它问题,请联系我方删除,我方将在收到通知后第一时间删除内容!本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。