Posted in Web pytorch中文语言模型bert预训练代码 – 知乎 February 2, 2025 因为中文roberta类的配置文件比如vocab.txt,都是采用bert的方法设计的。 英文roberta模型读取配置文件的格式默认是vocab.json。 对于一些英文roberta模型,倒是可以通过AutoModel自动读取。 这就解释了huggingface的模型库的中文roberta示例代码为什么跑不通。 https://www.zhihu.com/tardis/sogou/art/161301389