Word2vec和GloVe的准确率差异

tamoadmin 球队新闻 2024-04-27 18 0

Word2vec和GloVe是两种常见的词嵌入模型，它们都可以将词语转化为数值向量，以便于计算机进行处理。尽管它们的基本理念相似，即根据词汇的共现信息将其编码为向量，但具体的实现方式和应用场景略有不同，从而导致了准确率上的差异。

1.模型理念

Word2vec是一种“predictive”的模型，它通过预测上下文来训练模型。Word2vec主要有skipgram和CBOW两种模型。skipgram是给定input

word来预测上下文，比较适合用于大规模的数据集上。cbow是给定上下文，来预测input

word，比较适用于小规模或者内存有限的情况。GloVe（Global

Vectors

for

Word

Representation）则是“countbased”的模型，它首先基于语料库构建词的共现矩阵，然后基于共现矩阵学习词向量。

2.训练速度和准确率

不采用negativesampling的Word2Vec速度非常快，但是准确率仅有57.4%。这是因为Word2Vec只告诉模型什么是有关的，却不告诉它什么是无关的，模型很难对无关的词进行惩罚从而提高自己的准确率。然而，当使用了negativesampling之后，为了将准确率提高到68.3%，Word2Vec就需要花较长的时间了（8h38m）。

相比之下，GloVe因为更容易并行化，所以速度更快，达到67.1%的准确率，只需要花4h12m。这表明在追求高准确率的情况下，GloVe具有更高的性价比。