FewCLUE小样本学习榜
 Github地址 |
 提交样例 |
 测评规则 |
 小样本榜-提交多份,新
 
模型描述需包含关键词"FewCLUE"; 提交需实名,即:队伍名称、模型名称、Url/Github、模型描述,需有真实有效。无意义的提交将被移除。
 2021-05-24: 更新了iflytek的测试集(test.json,长度2600),请重新拉取一下,并在这个测试集上做预测;有问题发邮件:CLUEbenchmark@163.com
排行 |
模型 |
研究机构 |
测评时间 |
Score |
认证 |
EPRSTMT |
CSLDCP |
TNEWS |
IFLYTEK |
OCNLI |
BUSTM |
CHID |
CSL |
CLUEWSC |
ALBERT(Ensemble)
GitHub/模型网址:
提交日期:9月17日
分数:9月17日
更多详情:
参数说明
单任务微调。我们从MNLI为RTE、STS和MRPC优化的模型开始
诊断信息
诊断主混淆矩阵
|
C |
N |
E |
C |
182 |
36 |
40 |
N |
81 |
189 |
116 |
E |
17 |
69 |
374 |
C = 对立
N = 不包含
E = 包含