목록Artificial Intelligence (44)
ROKO
Ensemble (앙상블) Combine multiple models into a ensemble Better than the individual model Particularly well suited to decision trees in ML Intution : majority is less likely to make mistakes and has more information than individuals How to make different models with same structure? 앙상블은 여러 모델을 혼합하여 하나의 모델로 구성하는데 한 종류의 모델을 가지고 앙상블을 구성하기 위해서는 각 모델들이 구조는 같을 지라도 서로 다른 모델로 구분되어야한다. 이를 위해 아래와 같은 방식을 적용해..
Decision trees(결정 트리)의 기본적인 형태이다. Internal nodes(Decision nodes) 들은 속성을 test한다 Branch, 기준에 따라 가지가 나뉘어 진다 Leaf nodes 결과값을 의미한다. (predictions) CART(Classification and Regression trees)라고도 불린다 DT(Decision Trees) 고려할 점 모든 객체는 속성-값 pair로 구성 Target function은 이산변수을 다룸 명제 논리 필요 (Ex 키위는 지름이 10cm보다 작다) 이상치에 유연하게 대응 가능 일반화가 가능하도록 조정 Leaf node에 가능한 같은 Label에 해당하는 값들을 분류 DT를 모든 데이터에 대해 잘게 분류할 수 있지만 고려할점에 써있는..
Nearest Neighbor(최근접 이웃)은 ML의 대표적인 방법론 중 하나이다. NN을 논하기 전에 필요한 정의부터 살펴보자. ML은 training set을 통해 inductive learning(귀납적 학습) 최종 목표는 input \(x\)를 넣었을때 그에 해당하는 결과를 출력하는 함수 \(f(x)\) 이상적인 알고리즘은 쉽게 찾을수 없으므로 다양한 방법론을 통해 근사 이상적인 함수를 \(f\) (target function), 이에 근사하는 함수를 \(h\) (hypothesis) 가능한 모든 \(h\) 를 모아논 함수들의 공간을 Hypothesis space \(H\)(가설 공간)이라 하며 최적의 함수 \(h\) 를 찾는다. 이를 위해 training set에 대한 error function..
ML(Machine Learning)을 다루기 앞서 컴퓨터 공학에서 학습의 의미란 무엇일까? 컴퓨터 프로그램은 experience(E)이나 Data를 통해 학습하여 tasks들을 수행하고 performance measure(P)를 나타낸다. 즉, ML 은 데이터 학습을 통해 알고리즘을 자동으로 만드는 프로그래밍이다. 예를 들면 강아지와 고양이 사진 10000장을 구분하는 작업을 할때, 한장씩 사람이 구분하는것보다 사진에서 강아지와 고양이의 특징을 구분해 분류하는 알고리즘을 만들어 낸다면 작업효율이 올라갈 것이다. 그리고 프로그램이 분류 알고리즘 또한 스스로 학습할 수 있다면 우리는 좋은 데이터를 구하여 학습만 시키면 된다. ML은 데이터를 패턴을 파악하여 넣어주어야 하는데 DL(Deep Learning)..