[오직 컨셉] Word Embedding
One hot representation기본 개념 하나의 사물(단어)를 하나 element만 1 나마지는 0인 벡터로 표현하는 방식 예시전세계의 과일이 3개 밖에 없다고 했을 때 사과, 배, 바나나벡터 길이 = 3사과 = [1, 0, 0]배 = [0,1,0]바나나 = [0,0,1] 단점사물이 늘어날 수록 벡터 길이도 같이 늘어나서 용량을 많이 먹는다벡터에 아무런 의미가 들어가 있지 않다. Distributed Representaion기본개념one hot은 하나의 element 만으로 표시 되었다면,이것은 벡터내의 여러 element의 조합으로 나타내는 것 예시첫번때 element = 평균 당도두번째 elemet = 둥글기사과 = [0.6, 0.9]배 = [0.7, 0.9]바나나 = [0.9, 0.1] 장..
[Tensorflow 101 - 2] 기본 Neural Network Classifier(Feed Forward NN)
텐서플로우로 아주 간단한 classifier를 만들어봅시다. 흔한 예제인 스팸필터를 만든다고 생각해봅니다. 광고라는 단어가 있으면 1 없으면 0 상관 없는 단어인 김치라는 단어가 있으면 1, 없으면0 전화번호가 저장되어 있으면 1, 없으면 0이라고 해봅시다. [1,1, 1]은 광고라는 단어도 있고, 김치라는 단어도 있고, 전화번호도 저장되어 있는 경우입니다. 상식적으론 데이터 [1,0,0], [1,1,0] => 스팸 [1,0]나머지 데이터 => no 스팸 [0,1] 일겁니다. 이걸 구별하는 코드를 만들어 봅시다. (트레이닝 데이터와 테스트 데이터와 동일하므로 좋은 예는 아니겠지만) import tensorflow as tf import numpy as np #트레이닝 데이터 만들기 x_data = np...