비지도학습 2

데이터마이닝_머신러닝_지도학습, 비지도학습, 강화학습

▣ 데이터마이닝_머신러닝_지도학습, 비지도학습, 강화학습 구분 소구분 내용 알고리즘 지도학습(Supervised Learning), 문제(입력)와 답의 쌍으로 구성된 데이터들이 주어질 때, 새로운 문제를 풀 수 있는 함수 또는 패턴을 찾는 것 정답이 있는 데이터를 활용해 데이터를 학습시키는 것 입력 값(X data)이 주어지면 입력값에 대한 Label(Y data)를 주어 학습 분류 (Classification) 주어진 데이터를 정해진 카테고리(라벨)에 따라 분류 레이블이 이산적(discrete)인 경우 분류는 '맞다', '아니다' 등의 이진 분류 문제 또는 사과다 바나나다 포도다 등의 2가지 이상으로 분류하는 다중 분류 문제가 있음 kNN Naive Bayes Support Vector Machine ..

시스템구조 2021.11.04

데이터 마이닝_비지도학습_군집분석_코사인 유사도, 코사인 거리

▣ 데이터 마이닝_비지도학습_군집분석_코사인 유사도 코사인 유사도는 두 벡터 간의 코사인 각도를 이용하여 구할 수 있는 두 벡터의 유사도를 의미합니다. 두 벡터의 방향이 완전히 동일한 경우에는 1의 값을 가지며, 90°의 각을 이루면 0, 180°로 반대의 방향을 가지면 -1의 값을 갖게 됩니다. 즉, 결국 코사인 유사도는 -1 이상 1 이하의 값을 가지며 값이 1에 가까울수록 유사도가 높다고 판단할 수 있습니다. 이를 직관적으로 이해하면 두 벡터가 가리키는 방향이 얼마나 유사한가를 의미합니다. 두 벡터 A, B에 대해서 코사인 유사도는 식으로 표현하면 다음과 같습니다. 문서 간 유사도를 측정하는 방법 중 유클리드 거리 기반의 지표도 있습니다. 하지만 희소 행렬에서 문서와 문서 벡터 간의 크기에 기반한 ..

데이터베이스 2021.10.15