CLUE1.1分类任务排行榜 CLUE1.1/1.0提交规则
| 项目地址
CLUE1.1与CLUE1.0区别:区别与原有的CLUE1.0,CLUE1.1在部分任务启用了新的测试集,训练集和验证集保持不变;CLUE1.0保留CMNLI自然语言推理任务
2021年07月25/29日:TNEWS/CLUEWSC2020(简称WSC)的测试集已更新,请重新拉取并提交;排名按照Score1.1的分数为准;TNEWS1.1/WSC默认使用RoBERTa-wwm-large模型分数作初始化
排行 | 模型
研究机构 |
测评时间 |
Score1.1 |
认证 |
AFQMC |
TNEWS |
IFYTEK |
OCNLI_50K |
WSC |
WSC1.0 |
CSL |
ALBERT(Ensemble)
GitHub/模型网址:
提交日期:9月17日
分数:9月17日
更多详情:
参数说明
单任务微调。我们从MNLI为RTE、STS和MRPC优化的模型开始
诊断信息
诊断主混淆矩阵
|
C |
N |
E |
C |
182 |
36 |
40 |
N |
81 |
189 |
116 |
E |
17 |
69 |
374 |
C = 对立
N = 不包含
E = 包含