구글(Google)의 PageRank 알고리즘

데이터베이스

구글(Google)의 PageRank 알고리즘

스윙스윙 2021. 9. 10. 19:33

▣ 구글(Google)의 PageRank 알고리즘

구글의 페이지 순위 알고리즘은 기본적으로 얼마나 많은 참조(hyper link)가 있는가를 기준으로 순위를 결정함

서로 링크가 걸려있는 A, B, C 라는 3개의 페이지가 있을 경우,

특정페이지 A의 순위(Rank)는 다음과 같이 계산함
A의 Rank = (B의 Rank / B가 가진 Link수) + (C의 Rank / C가 가진 Link수) + …

즉, 특정 페이지의 Rank 를 해당 페이지에 존재하는 참조(Link)수로 나눈 것을 모두 합하면

페이지 A의 순위(Rank)가 결정된다.

* 이 문제는 위의 내용은 참고만 하고 박스안의 공식만 집중해서 이해하고 풀어야함

- 핵심은 총 링크 개수, 해당 페이지 참조 개수로 전이 행렬을 구해야함

예) 페이지 1의 경우 총 참조(Link)는 2개 이고, 그 중 페이지 1에 대한 참조는 1 이므로,
M11 = 1/2 이다.

* 참조(Link)는 위의 선의 화살표가 본인한테 향해 있는 것이다.

▶ j가 링크한 전체 페이지 수 : 본인(j)한테 화살표가 향해 있는 것

Mj(j=1) : 2개

Mj(j=2) : 2개

Mj(j=3) : 1개

▶ 페이지 j가 페이지 i에 대한 링크 : 본인(j)한테 향한 화살표 중 페이지 i에서 온 링크

Mij(i=1, j=1) : 1/2

Mij(i=2, j=1) : 1/2

Mij(i=3, j=1) : 0

Mij(i=1, j=2) : 1/2

Mij(i=2, j=2) : 0

Mij(i=3, j=2) : 1/2

Mij(i=1, j=3) : 0

Mij(i=2, j=3) : 1/1 = 1

Mij(i=3, j=3) : 0

M값이 1/2 인 항목은 총 4개, M값이 1인 항목은 총 1개가 존재함

'데이터베이스' 카테고리의 다른 글

데이터베이스 설계 단계_요구분석, 개념적, 논리적, 물리적, 구현, 보안 (0)	2021.09.16
GROUP BY, HAVING SQL 예제 4, 3명 이상의 사원이 근무하는 부서에서 연봉이 4만불 이상 사원수 검색 (0)	2021.09.11
분산 데이터베이스_분할(fragmentation) 수직, 수평, 혼합, 분산데이터 베이스 크기, 세미조인, 단편화 (0)	2021.09.10
의사결정 트리(decision tree), 정보 이득 (information gain), 엔트로피 (entropy) (0)	2021.09.10
권한 부여(GRANT, REVOKE, WITH GRANT OPTION) (0)	2021.09.10

현재글구글(Google)의 PageRank 알고리즘

정보시스템감리사, 정보관리기술사

정보시스템감리사, 감리, 사업관리, 소프트웨어 공학, DB, 시스템 구조, 보안

BCNF, 지원형, having, 네트워크 계층, SQL, 블록체인, TTAK, 계획수립, 신뢰성, 정규화, 행정기관 및 공공기관 정보시스템 구축·운영 지침, cpu, group by, 라우팅 기법, 인덱스, 보안, 디자인패턴, ISO 25010, 프락시 proxy, 정보시스템 감리기준,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

정보시스템감리사, 정보관리기술사