A Sentence Embedding Baseline 记录普林斯顿大学对 SENTENCE EMBEDDING 进行优化的论文,使用SVD来区分出“无区分度的共有信息”和“有区分度的信息”,一种优化 SENTENCE EMBEDDING 的简单方法。 2020-07-07 Notes NLP sentence embedding
文本相似性 记录传统的文本相似性匹配方法(编辑距离、SimHash等),与word2vec等方法。 2020-07-07 Notes NLP text similarity word2vec doc2vec SimHash