自然语言推理榜*记最佳得分(目前只有ocnli任务集有效)

排行模型研究机构测评时间Score认证OCNLI_50KOCNLI_30K
1HUMAN-OCNLICLUE20-10-0790.300已认证90.30090.300
2STBertPCG搜索中台22-11-2584.483待认证86.93382.033
3ShenZhouQQ浏览器实验室(QQ Browser Lab)21-09-1983.534待认证86.36780.700
4MotianQQ浏览器搜索21-06-2582.834待认证84.96780.700
5wyd1wyd124-05-1080.700待认证80.70080.700
6NM-BERTCMB-AI-zh22-03-3179.284待认证79.26779.300
7Macbert_text_understanding游击队22-03-2279.267待认证79.16779.367
8ensemble_model奋斗的咸鱼22-04-1879.217待认证79.36779.067
9ensemble_modelCMB AI Lab22-04-1979.217待认证79.36779.067
10bert别动我的汉堡包22-04-2179.217待认证79.36779.067
11M6-LMETONTHEFLY21-01-2179.050待认证79.10079.000
12BERTETONTHEFLY21-01-1578.916待认证78.83379.000
13 Macbert_text_understanding游击队22-04-1377.867待认证76.66779.067
14robert-base我爱吃羊肉22-09-2770.900待认证70.90070.900
15bert_chinese_basewyd124-04-2270.467待认证70.46770.467
16test-20-11-1569.816待认证71.00068.633
17bert-chinese12324-04-2069.750待认证70.30069.200
18testt22-03-3052.667待认证52.66752.667
19adsfasdf21-07-2949.283待认证98.5670.0
20asdasdf21-07-2949.267待认证98.5330.0

ALBERT(Ensemble)

GitHub/模型网址:

提交日期:9月17日

分数:9月17日

更多详情:

型号说明

阿尔伯特模型集合

参数说明

单任务微调。我们从MNLI为RTE、STS和MRPC优化的模型开始

总参数:-1

共享参数:-1

诊断信息

诊断主混淆矩阵

C N E
C 182 36 40
N 81 189 116
E 17 69 374

C = 对立

N = 不包含

E = 包含

类别相关马修分数

获取排行榜数据成功!