Word Embeddings

Topic: NLP

Word Vector Representations

Word embeddings map words to dense vectors.

Skip-gram: predict context from word. CBOW: predict word from context. Negative sampling speeds up training.

Pre-trained: GoogleNews vectors, GloVe vectors.

ELMO: bidirectional LSTM. BERT: transformer-based. These give different embeddings per context.

gensim.models.Word2Vec. Load pre-trained: KeyedVectors.load_word2vec_format.

Get personalized data science help from ChatWhole's AI-powered platform.