본문 바로가기
728x90
반응형

코딩/데이터 분석 이론 & 응용

[3] Predicting Forest Cover with Decision Trees [3] Predicting Forest Cover with Decision Trees Decision Trees 위의 그림은 우유가 상했는지 , 상하지 않았는지 판단하는 의사결정 방법이다. 의사결정 방법의 구조와 트리와 닮아있기 때문에 의사결정 트리 , Decision Trees라고 한다. 트리의 구조를 가지고 있기 때문에 구조를 살펴보면 Leaf와 Node , Edge 같은 요소들을 가지고 있는 것을 확인할 수 있다. Decision Trees에서의 주목할 점은 Leaf에는 무엇이 들어갈지 모두 정해져 있다는 것이다. Leaf node 안의 내용이 중요한 것이 아니라 우유가 상했는지 상하지 않았는지를 판단하는 기준이 중요하다는 것을 의미한다. Feature와 lable을 보고 가장 잘 분류할 수 있는 .. 더보기
[2] K-means clustering algorithm [2] K-means clustering algorithm K-means clustering 지도 학습에 사용하는 데이터의 경우 정답 , lable이 존재했다. Regression이나 Classification 등의 지도 학습에 사용하는 데이터 set들은 모두 Input Feature가 있고 그에 따른 lable이 존재한다. 하지만 비지도 학습의 경우 lable이 존재하지 않는다. 비지도 학습의 경우 lable이 없는 데이터를 사용한다. 사용하는 Training data에는 Input Feature 만이 존재한다는 것이다. K-means clustering algorithm의 경우 위처럼 lable이 없는 데이터에 lable을 붙여주는 역할을 한다. 위의 그림의 경우 2차원 상에 데이터들이 분포해 있어 .. 더보기
[1] Collaborating Filtering & Alternating Least Squares [1] Collaborating Filtering & Alternating Least Squares Gradient Descent Algorithm 다음과 같은 linear regression 식을 세울 때 식 h(x)는 다음과 같은 과정을 거쳐 나타낼 수 있다. 존재하는 Training Set에 Learning Algorithm을 적용하여 가설 h를 도출하고 , x값을 가설 h에 적용해 추정되는 y값을 도출한다. 만약 linear regression의 경우 가설 h는 일차식의 형태로 나타낼 수 있을 것이다. 이후 최적화는 목적함수의 값을 최소화 하는 방향으로 이루어진다. 만약 위의 linear regression의 경우는 다음과 같은 목적함수값을 최소화하는 방향으로 최적화가 이루어질 것이다. 목적함수의.. 더보기
반응형