pCLUE:1200000+多任务提示学习数据集
项目地址 | 在线demo | 提交样例
  模型描述需包含关键词"pCLUE"; 2022-10-01: pCLUE榜启用;p指的是prompt learning即提示学习。由于包含了多种任务,也是多任务学习的数据集。任务类型分为四种类型:分类、阅读理解、推理、生成。
   提交需实名,即:队伍名称、模型名称、Url/Github、模型描述,需有真实有效。无意义的提交将被移除;有问题发邮件:CLUEbenchmark@163.com;有效的提交,需在一个模型上进行多任务学习并预测。
排行 |
模型 |
研究机构 |
测评时间 |
F1 Score |
EM |
ALBERT(Ensemble)
GitHub/模型网址:
提交日期:9月17日
分数:9月17日
更多详情:
参数说明
单任务微调。我们从MNLI为RTE、STS和MRPC优化的模型开始
诊断信息
诊断主混淆矩阵
|
C |
N |
E |
C |
182 |
36 |
40 |
N |
81 |
189 |
116 |
E |
17 |
69 |
374 |
C = 对立
N = 不包含
E = 包含