MJay

Word2Vec 본문

Cloud Computing/NLP

Word2Vec

MJSon 2017. 5. 16. 20:32
데모사이트가 있다고 한다. 

Word2Vector

- 단어를 vector로 표현

고양이를 [1,0,0,0]
개          [0,1,0,0]
사람       [0,0,1,0]
이걸로는 단어의 의미를 전혀 알 수 없으니

단어의 의미를 파악하는 벡터를 알고싶다

n-gram

어떤 단어의 출현확률은 이전 (n-1)개의 단어에 의존한다.

CBOW(Original)

- Continuous Bag of Word

Skipgram

With Center Word, we can predict context words.



WordEmbedding


CBOW( Continuous Bag of Word Model)

Idea: Using context words, we can predict center word

Probability ( “It is ( ) to finish” -> “time”)