'찐비전공자를 위한' : Cosine Similarity 구현(1)
시작. 말로만, 논문으로만 Cosine Similarity를 구했던 저인지라.. 양심의 가책을 늘 느껴오고 있었습니다. Cosine Similarity를 구하는 이유는 king = [1,1,0,0] man = [1,1,1,0] queen = [0,0,1,1] woman = [0,1,1,1] 이렇게 임베딩 값일 있을 때, 저 vector만을 놓고 봤을 때는 단순히 0,1로만 이루어져 있기 때문에, 실제 단어 사이의 연관성을 읽어낼 수 없다는 단점이 생기기 때문입니다. 우리는 "king + man // queen + woman" 이렇게 단어 사이에도 연관 관계를 잘 알 수 있지만, 컴퓨터는 그렇지 않죠. 그래서 vector를 어떤 임의의 그래프 상에 나타내었을 때, 기울기 정도와, representation..