CLUE1.1分类任务排行榜     CLUE1.1/1.0提交规则  |   项目地址
CLUE1.1与CLUE1.0区别:区别与原有的CLUE1.0,CLUE1.1在部分任务启用了新的测试集,训练集和验证集保持不变;CLUE1.0保留CMNLI自然语言推理任务
2021年07月25/29日:TNEWS/CLUEWSC2020(简称WSC)的测试集已更新,请重新拉取并提交;排名按照Score1.1的分数为准;TNEWS1.1/WSC默认使用RoBERTa-wwm-large模型分数作初始化

模型
排行模型研究机构测评时间Score1.1认证AFQMCTNEWS1.1IFLYTEKOCNLI_50KWSC1.1CSL
1玉言 网易伏羲 23-07-3184.685待认证86.4574.0467.9686.3395.7397.6
2HUMANCLUE19-12-0184.100已认证817180.390.39884
3HunYuan-NLP 1T腾讯混元AI大模型团队22-11-2683.632待认证85.1170.4467.5486.59696.2
4通义-AliceMind达摩院NLP22-11-2283.365待认证84.0773.4767.4285.8794.3395.03
5CHAOSOPPO研究院融智团队22-11-0983.178待认证83.3773.2265.8186.3794.695.7
6WenJinMeituan NLP22-10-2083.042待认证84.4973.0464.3886.2394.4495.67
7OBERTOPPO小布助手22-11-0781.755待认证81.0267.756684.5391.399.93
8HunYuan_nlp腾讯TEG22-05-1180.888待认证83.3764.0166.5885.2392.2793.87
9XuanYuan度小满 AI-Lab21-12-0680.718待认证82.4465.0768.5480.6393.8693.77
10ShenNonG云小微AI21-12-0180.660待认证82.5765.5664.4285.9794.2191.23
11PERKS快手搜索21-11-0480.618待认证77.5765.7964.4284.493.6397.9
12disco-bert1024er21-12-3080.573待认证77.5265.7964.3584.3393.5597.9
13TI-NLP优图实验室 & 腾讯云21-10-1980.560待认证82.770.4765.2384.5790.2990.1
14ShenZhouQQ浏览器实验室(QQ Browser Lab)21-09-1979.997待认证80.5565.3667.6586.3789.0890.97
15MusaBertmthreads22-12-1679.908待认证86.9265.2263.8881.688.9392.9
16roberta_baselineroberta_baseline22-12-0279.028待认证78.365.0564.6984.0389.792.4
17bertclbert22-03-3079.013待认证82.4464.0164.8182.7788.5891.47
18CL-BERTCL-BERT22-04-0679.013待认证82.4464.0164.8182.7788.5891.47
19clbertclbert22-03-3078.987待认证82.4464.0164.8182.7788.4291.47
20BERTBe_yourself22-12-2778.553待认证87.3659.4162.577.2785.0899.7

ALBERT(Ensemble)

GitHub/模型网址:

提交日期:9月17日

分数:9月17日

更多详情:

型号说明

阿尔伯特模型集合

参数说明

单任务微调。我们从MNLI为RTE、STS和MRPC优化的模型开始

总参数:-1

共享参数:-1

诊断信息

诊断主混淆矩阵

C N E
C 182 36 40
N 81 189 116
E 17 69 374

C = 对立

N = 不包含

E = 包含

类别相关马修分数

获取排行榜数据成功!