用RoBERTa模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎

March 15, 2026

全词掩码是训练任务，训练时的输入依然是 RoBERTa 的 tokenizer 处理后的字。“重新写下tokenizor函数来按词进行分割” 效果会很差因为其它的参数并没有训练。个人建议如下： 1.在开源的RoBERTa的基础上further pretrain RoBERTa ，输入是分词的token。个人不建议因为会使词表很大，且比较耗资源。 2.可以把词 …

https://www.zhihu.com/question/512409063

用RoBERTa模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 <body> <h1> Array ( [0] => 用eoberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [1] => 用doberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [2] => 用foberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [3] => 用toberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [4] => 用5oberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [5] => 用4oberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [6] => 用riberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [7] => 用rkberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [8] => 用rlberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [9] => 用rpberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [10] => 用r0berta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [11] => 用r9berta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [12] => 用roverta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [13] => 用ronerta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [14] => 用roherta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [15] => 用rogerta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [16] => 用robwrta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [17] => 用robsrta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [18] => 用robdrta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [19] => 用robrrta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [20] => 用rob4rta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [21] => 用rob3rta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [22] => 用robeeta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [23] => 用robedta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [24] => 用robefta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [25] => 用robetta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [26] => 用robe5ta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [27] => 用robe4ta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [28] => 用roberra模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [29] => 用roberfa模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [30] => 用roberga模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [31] => 用roberya模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [32] => 用rober6a模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [33] => 用rober5a模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [34] => 用robertz模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [35] => 用roberts模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [36] => 用robertw模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [37] => 用robertq模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ – 知乎 [38] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ ᰫ 知乎 [39] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ &#u211; 知乎 [40] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ &#i211; 知乎 [41] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ ⏻ 知乎 [42] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ ᾯ 知乎 [43] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ &#8q11; 知乎 [44] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ &#8w11; 知乎 [45] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ ⁷ 知乎 [46] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ ” 知乎 [47] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ &#82q1; 知乎 [48] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ — 知乎 [49] => 用roberta模型希望得到中文词向量而非字向量的情况，可以在输入时不切分成字而用分词工具切词输入吗？ &#821q; 知乎 ) </h1> </body>