요약
<aside>
📖 **PageRank란? “웹 페이지들을 그래프로 표현했을 때, 가장 중요한 웹페이지(node)는 무엇인가?”
⇒ 그래프에서 node의 중요도를 계산하는 Link Analysis 접근 방법 사용
PageRank는 Random-walk를 응용한 random-surfer 정의 (random-walk + teleport)
문제점인 (1) dead ends (2) spider trap이 있고, teleport로 해결
PageRank는 수학적인 관점에서 Eigen vector, Katz centrality와 동치로 고정 수렴한다.
PankRank를 변형한 알고리즘은 대표적으로 두 가지가 있다.
- Personalized PageRank: PageRank+특정 주제에 가중치 (more teleport)
- Random Walk with Restarts: PageRank+한 노드에 가중치(always teleport same node)
Node Embedding & MF
“Node Embedding를 내적했을 때, 인접행렬 A가 나온다.”
한계점
- 새로운 노드를 학습할 수 없음
- 구조적 유사도를 잡아내지 못함
- node, edge, graph feature를 사용하지 못함**
</aside>
Intro
PageRank
Matrix Factorization and Node Embedding
Limits
- 새로운 데이터가 들어오면 처음부터 다시 학습해야 함
- 구조적 유사성을 잡지 못함
- node, edge, graph의 feature를 사용하지 못함