Posted in Web 请问 HuggingFace 的 roberta 的 pooler_output 是怎么来的? March 29, 2026 pooler output是取 [CLS]标记处对应的向量后面接个全连接再接tanh激活后的输出。 一般来说可以在这个pooler output后面接个分类层,进行句子级别的分类任务。 roberta由于没有NSP任务也就是句子对分类任务,因此应该他们训练的时候是没有这部分权重的。 https://www.zhihu.com/question/466862920