데이터베이스 70

데이터베이스 시스템 언어_DDL, DML, DCL

▣ 데이터베이스 시스템 언어_DDL, DML, DCL DDL (Data Definition Language) 데이터베이스를 정의, 수정할 때 사용하는 언어 CREATE, ALTER, RENAME, DROP 등 (암기법 : CARD) DML (Data Manipulation Language) 생성된 데이터베이스의 정보를 검색, 삽입, 삭제, 수정 등의 처리 목적 SELECT, UPDATE, DELETE, INSERT 등 사용자가 무슨 데이터를 어떻게 접근하여 처리해야 하는지를 명세해야 하는 데이터 언어 PL/SQL 등 DCL (Data Control Language) 데이터 베이스를 제어하기 위한 언어 보안, 데이터 무결성, 회복, 병행제어 GRANT, REVOKE, SET 등 TCL COMMIT, ROL..

데이터베이스 2021.12.10

데이터 마이닝_비지도학습_군집분석_코사인 유사도, 코사인 거리

▣ 데이터 마이닝_비지도학습_군집분석_코사인 유사도 코사인 유사도는 두 벡터 간의 코사인 각도를 이용하여 구할 수 있는 두 벡터의 유사도를 의미합니다. 두 벡터의 방향이 완전히 동일한 경우에는 1의 값을 가지며, 90°의 각을 이루면 0, 180°로 반대의 방향을 가지면 -1의 값을 갖게 됩니다. 즉, 결국 코사인 유사도는 -1 이상 1 이하의 값을 가지며 값이 1에 가까울수록 유사도가 높다고 판단할 수 있습니다. 이를 직관적으로 이해하면 두 벡터가 가리키는 방향이 얼마나 유사한가를 의미합니다. 두 벡터 A, B에 대해서 코사인 유사도는 식으로 표현하면 다음과 같습니다. 문서 간 유사도를 측정하는 방법 중 유클리드 거리 기반의 지표도 있습니다. 하지만 희소 행렬에서 문서와 문서 벡터 간의 크기에 기반한 ..

데이터베이스 2021.10.15

모바일 데이터베이스_동작원리, 캐싱, 프락시 proxy, 무효보고서, 단절성, 일관성, 충돌, 보안 위협

▣ 모바일 데이터베이스_동작원리, 캐싱, 프락시 proxy, 무효보고서, 단절성, 일관성, 충돌 -현장업무에서 발생한 데이터를 가공 후 동기화를 통해 중앙서버로 전송할 수 있도록 이동 컴퓨팅기기에 탑재된 데이터베이스 ■ 모바일 환경 특성 - 높은 통신 지연, 간혈적인 무선 연결, 제한된 배터리 전력, 클라이언트의 위치 변경 - 캐싱(caching) 높은 통신 지연과 불안정한 연결성을 보상하기 위해서 클라이언트는 자주 접근하는 데이터의 사본을 캐시해서 필요한 경우에 오프라인으로 작업 데이터 가용성과 응답시간의 개선 및 전력 소모 최소화 효과 - 프락시(proxy) 서버가 클라이언트에 접속하지 못할 경우를 대비해서 프락시 추가 다시 연결될 때 자동으로 이 프락시는 저장해 놓은 변경을 최종 목적지로 전송 ■ ..

데이터베이스 2021.10.15

객체 데이터 모델(object data model)_객체 식별자 OID(Object Identifier), 객체지향, 객체지향 데이터베이스, 클래스의 속성

▣ 객체 데이터 모델(object data model)_객체 식별자 OID(Object Identifier) 1. 객체 식별자 (OID : Object identifier) 특징 - 객체는 실세계 환경에서 존재하는 개체를 추상적으로 표현한 것 - 객체 식별자는 객체의 식별성을 표현 객체 생성 시 시스템에 의해 같이 생성, 생성된 후에는 어떤 경우도 변경되지 않음 객체에 대한 참조 관계는 한 객체의 속성값으로 피 참조객체의 식별자를 포함시켜 구현함 2. OID는 관계모델에서의 기본키(PK)와 구별 기본키는 갱신(UPDATE)이 가능함, OID는 시스템 의해 지정되고 객체의 애트리뷰트 값에 의존하지 않기 때문에 결코 변경될 수 없음 OID는 객체가 제거될 때만 삭제되며 삭제된 OID는 재사용될 수 없음 20..

데이터베이스 2021.10.15

데이터 품질 표준_ISO 8000_데이터 품질 기준, 유효성(정확성{사실성, 적합성, 필수성, 연관성}, 일관성{정합성, 일치성, 무결성), 활용성(유용성{충분성, 유연성, 사용성, 추적성}, 접근성, 적시성,..

▣ 데이터 품질 표준_ISO 8000_데이터 품질 기준, 유효성(정확성{사실성, 적합성, 필수성, 연관성}, 일관성{정합성, 일치성, 무결성), 활용성(유용성{충분성, 유연성, 사용성, 추적성}, 접근성, 적시성, 보안성) 구분 지표 설명 세부지표 유효성 정확성 실세계를 정확히 반영 사실성, 적합성, 필수성, 연관성 일관성 동일 데이터간 불일치 미존재 정합성, 일치성, 무결성 활용성 유용성 요구되는 데이터 충족 충분성, 유연성, 사용성, 추적성 접근성 원하는 데이터를 손쉽게 이용 - 적시성 최신성 유지 - 보안성 내외부 요인으로부터 데이터 보호 보호성, 책임성, 안정성 * 활용성 유용성 유연하게사용하고추적함 보안성 보호하고책임지면안정됨 2021년 51번 정답 : 4번 국제 데이터 품질 표준은 크게 유효성..

데이터베이스 2021.10.14

GROUP BY, HAVING SQL 예제 5, NULL 사용주의, 사원, 급여, 부서번호, Sailor, rating, age

▣ GROUP BY, HAVING 예제 5 2020년 62번 정답 : 3번 1) 부서번호 GROUP BY의해 부서별 평균 급여 나타냄 (O) 2) GROUP BY, HAVING 절에 따라 2명 이상가진 부서의 사원이름, 급여 나타냄(O) * IN 조건은 NULL을 제외한 결과값만 검색됨 3) 메인쿼리와 서브쿼리 간 부서번호로 조인되어 연결되어 있음 부서의 평균 급여보다 큰 사원이름, 급여 나타냄 (X) 결과는 "김좌진, 이몽령" 임 4) MAX함수로 최고 급여를 받는 사원이름, 급여 나타냄(O) 2020년 63번 정답 : 2번 Silors 릴레이션에서 연산후 Results 릴레이션을 나움 Results 차수 2, 카디널리티는 4 1~4번 보기 모두 차수 2임 rating에 중복값이 없으므로 GROUP B..

데이터베이스 2021.10.07

SQL_DROP SCHEMA, DOMAIN, TABLE, VIEW, INDEX, RESTRICT, CASCADE

▣ SQL_DROP SCHEMA, DOMAIN, TABLE, VIEW, INDEX, RESTRICT, CASCADE DROP SCHEMA 스키마_명 [CASCADE | RESTRICT]; DROP DOMAIN 스키마_명 [CASCADE | RESTRICT]; DROP TABLE 스키마_명 [CASCADE | RESTRICT]; DROP VIEW 스키마_명 [CASCADE | RESTRICT]; DROP INDEX 스키마_명 [CASCADE | RESTRICT]; - RESTRICT : 삭제할 요소가 참조 중이면 삭제되지 않음 - CASCADE : 삭제할 요소가 참조 중이라도 삭제됨 2020년 57번 정답 : 2번 - RESTRICT가 명세되면 스키마가 공백인 경우에만 삭제됨

데이터베이스 2021.10.07

데이터베이스 응용_GIS(지리 정보 시스템), 공간 DB(Spartial DB), 공간 질의(spatial query), 공간조인(spatial join)

▣ 데이터베이스 응용_GIS(지리 정보 시스템), 공간 DB(Spartial DB), 공간 질의(spatial query), 공간조인(spatial join) 공간 DB(Spartial DB)는 문자와 숫자 등으로 표현되는 비공간 데이터와 공간 객체의 좌표 값으로 표현되는 공간 데이터의 집 - 지리객체인 기하(geometry)와 객체간 공간관계에 대한 위상(topology) 포함 - 비정형데이터의 처리 및 대량의 데이터 신속하게 처리 - 공간적(위상적, 기하학적) 특성을 반영 - 정렬이 불가능한 데이터를 위한 새로운 색인, 연산(R-Tree Index사용) - 복잡한 정보를 표현할 수 있는 표현력 있는 데이터모델 - 공간 데이터와 비공간 데이터의 결합을 지원 공간조인(spatial join)이란 두개 혹..

데이터베이스 2021.10.06

데이터 마이닝_시퀀스, 순차 패턴, 서브시퀀스 지지도

▣ 데이터 마이닝_시퀀스, 순차 패턴, 서브시퀀스 지지도 2019년 73번 정답 : 3번 - 시퀀스 : 원소(혹은 트랜잭션)들의 순서 리스트 - 서브시퀀스 : 시퀀스 내에 포함된 시퀀스 - 서비시퀀스 x의 지지도 : x를 포함하는 시퀀스의 비율 1) s() = 4/5*100 = 80% -> A, B, C, D 2) s() = 3/5*100 = 60% -> A, C, D 3) s() = 3/5*100 = 60% -> A, C, D 4) s() = 4/5*100 = 80% -> A, B, C, E

데이터베이스 2021.10.02

데이터베이스 저장기법_트리, B - Tree, B+ - Tree, B* - Tree

▣ 데이터베이스 저장기법_B - Tree, B+ - Tree, B* - Tree 인덱스를 조직하는 구조로 가장 많이 사용하는 것이 B-트리(B-tree)임 데이터를 효율적으로 검색/갱신하기 위해 탐색트리에 몇개의 제약을 붙이고 확장한 것 1) 트리는 공백이거나 높이가 1 이상인 m원 탐색 트리임 2) Root와 Leaf node를 제외한 각 노드는 최대 m개, 최소 m/2개의 서브트리를 가져야 함 3) 노드에는 최대 M-1개 부터 [M/2]-1개의 키가 포함될 수 있음 4) 노드의 키가 X개 라면 자식의 수는 X+1개 입니다. 5) Root node는 그 자체가 Leaf가 아닌 이상 적어도 2개의 서브트리를 가져야 함 6) 모든 Leaf node는 같은 레벨에 있어야 함 B-Tree는 삽입, 삭제 시 균..

데이터베이스 2021.10.02