2021/08/29 3

오분류표 (confusion matrix), 정분류율, 오분류율, 재현율(민감도), 정밀도, 정확도, 특이도, F1 Score, 정보검색모델

▣ 오분류표 (confusion matrix), 정분류율, 오분류율, 재현율(민감도), 정밀도, 정확도, 특이도, F1 Score, 정보검색모델 - 정분류율 (Accuracy): 전체 데이터 중 예측한게 맞을 확률 - 오분류율 (Error Rate) : 1-정분류율 - 재현율 or 민감도(Recall or Sensitivity) : 실제 Positive로 나온 데이터 중 Positive로 예측한 데이터 - 정확도 or 정밀도(Precison) : 예측을 Positvie로 한 데이터 중 실제 Positive로 나온 데이터 - 특이도(Specificity) : 실제 Negative로 나온 데이터 중 Negatvie로 예측한 데이터 - F1 Score(조화평균) : 2*(정밀도*재현율)/(정밀도+재현율)=2*..

데이터베이스 2021.08.29

데이터마이닝_연관규칙(Association)_지지도, 신뢰도, 향상도, Apriori, 빈발항목

▣ 연관규칙(Association)_지지도, 신뢰도, 향상도, Apriori, 빈발항목 - 항목들 간의 관계를 얻기 위해 한 항목의 존재가 다른 항목의 존재를 암시하는 조합을 발견하는 분석 방법 - 동시에 발생한 사건 간의 관계 정의 - 지지도는 X->Y = Y->X (상호대칭) - 신뢰도는 X->Y ≠ Y->X (지지도가 낮아도 신뢰도가 높은 경우 유용한 규칙) - 향상도는 X->Y = Y->X (상호대칭) L > 1 : 양의 상관관계 (같이 구매할 확률 높음) L < 1 : 음의 상관관계 (같이 구매할 확률 낮음) L = 1 : 독립적 상관관계 (서로 영향 미치지 않음) ▣ Apriori 알고리즘 Apriori 원리 전체 거래 중 A, B가 포함되는 거래 빈도는 A, B, C가 포함되는 거래 빈도보다..

데이터베이스 2021.08.29

정규화- BCNF 분해

▣ 정규화- BCNF 분해 2015년 51번 정답 : 3번 후보키(A,B)가 C를 종속하고, C가 후보키 B를 종속 2012년 56번 정답 : 3번 C->D가 R3(C,D)릴레이션으로 추출 E->C가 R2(E,C)릴레이션으로 추출 마지막으로 A->(B,C,D,E), B->(A,C,D,E)에서 C,D,E가 나왔으므로 A->(B,E) 혹은 B->(A,E)만 추가하면 문제에서 제시하는 종속이 보존되므로 R1(A,B,E) 혹은 R1(B,A,E) A와 B는 같은 릴레이션 내 동격인 후보키임 (A->B, B->A) ∴ R1(A,B,E), R2(E,C), R3(C,D) 이거나 R1(B,A,E), R2(E,C), R3(C,D) 로 분해됨 2013년 55번 정답 : 4번 보이스/코드(BCNF) 분할 결과는 (X, Z)와..

데이터베이스 2021.08.29