文本表示进阶 记录预训练语言模型的一些总结,包括从ELMo到BERT再到XLNet的小结。没有细化,有点冗长。 2020-07-06 Notes NLP BERT representation pretrained LM XLNet
文本表示 计算机做不到直接对文本字符串进行语义理解和表示,因此需要进行数值化或者向量化。良好的文本表示形式可以极大的提升机器学习算法效果。记录一下常见的文本表示方法。 2020-07-06 Notes NLP fastText representation word2vec