<
调查问卷

中文语言理解测评基准(CLUE)

内容体系:代表性的数据集、基线(预训练)模型、语料库、论文、工具包、排行榜。

定位:为更好的服务中文语言理解、任务和产业界,做为通用语言模型测评的补充,通过搜集整理发布中文任务及标准化测评等方式完善基础设施,最终促进中文NLP的发展。


                                       更新23年09月27日:
SuperCLUE2023年9月新榜单发布!新增AI Agent榜和四大能力维度榜
                                       更新23年09月12日: 为大模型安全护航!中文大模型多轮对抗安全基准SC-Safety发布
Copyright @2019 - 2023