CLUE1.1阅读理解排行榜 CLUE1.1/1.0提交规则
| 项目地址
CLUE1.1与CLUE1.0区别:区别与原有的CLUE1.0,CLUE1.1在部分任务启用了新的测试集,训练集和验证集保持不变;CLUE1.0保留CMNLI自然语言推理任务
2021年09月5日:C3/CHID的测试集已更新,请重新拉取并提交;排名按照Score1.1的分数为准;C3/CHID默认使用RoBERTa-wwm-large模型分数作初始化
排行 |
模型 |
研究机构 |
测评时间 |
Score1.1 |
认证 |
cluener |
ALBERT(Ensemble)
GitHub/模型网址:
提交日期:9月17日
分数:9月17日
更多详情:
参数说明
单任务微调。我们从MNLI为RTE、STS和MRPC优化的模型开始
诊断信息
诊断主混淆矩阵
|
C |
N |
E |
C |
182 |
36 |
40 |
N |
81 |
189 |
116 |
E |
17 |
69 |
374 |
C = 对立
N = 不包含
E = 包含