데이터마이닝 2

데이터마이닝_머신러닝_지도학습, 비지도학습, 강화학습

▣ 데이터마이닝_머신러닝_지도학습, 비지도학습, 강화학습 구분 소구분 내용 알고리즘 지도학습(Supervised Learning), 문제(입력)와 답의 쌍으로 구성된 데이터들이 주어질 때, 새로운 문제를 풀 수 있는 함수 또는 패턴을 찾는 것 정답이 있는 데이터를 활용해 데이터를 학습시키는 것 입력 값(X data)이 주어지면 입력값에 대한 Label(Y data)를 주어 학습 분류 (Classification) 주어진 데이터를 정해진 카테고리(라벨)에 따라 분류 레이블이 이산적(discrete)인 경우 분류는 '맞다', '아니다' 등의 이진 분류 문제 또는 사과다 바나나다 포도다 등의 2가지 이상으로 분류하는 다중 분류 문제가 있음 kNN Naive Bayes Support Vector Machine ..

시스템구조 2021.11.04

데이터마이닝_확률기반 기계학습_나이브 베이즈(Naïve Bayes Classification), 나이브 베이지안 분류

▣ 데이터마이닝_확률기반 기계학습_나이브 베이즈(Naïve Bayes Classification) - 데이터가 각 클래스에 속할 특징 확률을 계산하는 조건부 확률 기반의 분류 방법이다. - 일어나지 않은 일(사건)에 대하여 이 사건과 관련된 여러 가지 확률을 이용하여 새롭게 일어날 수 있는 사건에 대하여 추론 - 사전확률 P(A)과 우도(가능도, likelihood)확률(B|A)를 안다면 사후확률 P(A|B)을 알 수 있다. A : 가설, B : 알고 있는 데이터(evidence - 관찰값) - 나이브(Naïve) : 예측한 특징이 상호 독립적이라는 가정 하에 확률 계산을 단순화, 나이브라는 의미는 순진하다라는 뜻을 담고 있으며 모든 변수(특징)들이 동등하다는 것을 의미한다. - 베이즈(Bayes) : ..

데이터베이스 2021.10.01