요약

<aside> 📖 **PageRank란? “웹 페이지들을 그래프로 표현했을 때, 가장 중요한 웹페이지(node)는 무엇인가?” ⇒ 그래프에서 node의 중요도를 계산하는 Link Analysis 접근 방법 사용 PageRank는 Random-walk를 응용한 random-surfer 정의 (random-walk + teleport) 문제점인 (1) dead ends (2) spider trap이 있고, teleport로 해결 PageRank는 수학적인 관점에서 Eigen vector, Katz centrality와 동치로 고정 수렴한다.

PankRank를 변형한 알고리즘은 대표적으로 두 가지가 있다.

  1. Personalized PageRank: PageRank+특정 주제에 가중치 (more teleport)
  2. Random Walk with Restarts: PageRank+한 노드에 가중치(always teleport same node) Node Embedding & MF “Node Embedding를 내적했을 때, 인접행렬 A가 나온다.” 한계점
  3. 새로운 노드를 학습할 수 없음
  4. 구조적 유사도를 잡아내지 못함
  5. node, edge, graph feature를 사용하지 못함**

</aside>

Intro

PageRank

Matrix Factorization and Node Embedding

Limits

  1. 새로운 데이터가 들어오면 처음부터 다시 학습해야 함
  2. 구조적 유사성을 잡지 못함
  3. node, edge, graph의 feature를 사용하지 못함