그래프 신경망이란 무엇일까? (기본)

변환식 정점 표현 학습과 귀납식 정점 표현 학습

출력으로 임베딩 자체를 얻는 변환식 임베딩 방법의 한계

학습이 진행된 이후 정점에 대해서는 임베딩을 얻을 수 없음
모든 정점에 대한 임베딩을 미리 계산해서 저장해야 함
정점의 속성 정보는 고려하지 않음

→ 출력으로 인코더를 얻는 귀납식 임베딩 방법은 위 문제 모두 해결

그래프 신경망

그래프 신경망의 구조

그래프와 정점의 속성 정보를 입력으로 받음
정점 u 의 속성 벡터는 $X_u$ 라고 하고 이는 속성의 수 m 차원 벡터이다.
정점의 속성의 예시
- SNS 에서 사용자의 지역, 성별, 연령 등
- 논문 인용 그래프에서 논문에 사용된 키워드에 대한 원-핫 벡터
- 페이지랭크 등의 정점 중심성, 군집 계수 등
그래프 신경망은 이웃 정점들의 정보를 집계하는 과정을 반복하여 임베딩을 얻음
- 대상 정점의 임베딩을 얻기 위해 이웃들 그리고 이웃들의 정보를 집계함
- 각 집계 단계를 층 (Layer) 라고 부르고, 각 층마다 임베딩을 얻음
- 0번 층, 즉 입력 층의 임베딩으로는 정점의 속성 벡터 사용
대상 정점마다 집계되는 정보가 상이함
대상 정점 별 집계되는 구조를 계산 그래프라고 부름
서로 다른 대상 정점간에도 층 별 집계 함수 공유
집계 함수는 이웃의 정보를 평균 계산하고 신경망에 적용함
마지막 층의 임베딩이 출력 임베딩 $z_v$ 이 됨
그래프 신경망의 학습 변수는 층 별 신경망의 가중치 $W_k, B_k$ (k 는 층)

그래프 신경망의 학습

손실함수 결정, 정점간 거리를 보존하는 것이 목표
인접성을 기반으로 유사도를 정의하면 손실함수는 아래와 같음
후속 과제 (Downstream Task) 의 손실함수로 종단종 (End-to-End) 학습 가능
- 정점 분류가 최종 목표
  - 그래프 신경망을 통해 정점의 임베딩을 얻음
  - 이를 분류기의 입력으로 사용함
  - 각 정점의 유형을 분류
- 분류기의 손실함수, 크로스 엔트로피를 전체 프로세스의 손실함수로 사용하여 종단종 학습 가능
  - 분류 정확도가 가장 높게끔 그래프 신경망의 학습 변수들을 학습
그래프 신경망의 종단종 학습을 통한 분류는 변환적 정점 임베딩 후 별도의 분류기를 학습하는 것보다 성능이 좋음 (정확도가 높음)
학습에 모든 정점을 사용할 필요 없음. 일부 선택해서 그래프 신경망 학습하면 됨. 층마다 학습 변수가 있기 때문!
마지막으로 백프로파게이션을 통해 손실 함수 최소화 (학습)
학습 완료되면 학습에 사용하지 않은 정점의 임베딩 얻을 수 있음

→ 새로 추가된 정점도 임베딩 가능

→ 심지어 한 그래프로 학습하고, 다른 그래프에도 적용 가능

그래프 신경망 변형

그래프 합성곱 신경망

다양한 형태의 집계 함수 사용 가능
GCN (Graph Convolutional Network) 의 집계 함수
- B 로 이전 신경망 들어오는거 없어짐
- 정규화 방법이 기하 평균으로 변함

GraphSAGE

집계 함수
AGG 함수 (어그리게이션) 를 이용해 이웃의 임베딩을 합친 후 자신의 임베딩과 연결함
AGG 함수로는 Mean, Pool, LSTM 등 사용 가능

합성곱 신경망 (CNN) 과의 비교

합성곱 신경망과 그래프 신경망의 유사성

합성곱 신경망과 그래프 신경망은 모두 이웃의 정보를 집계하는 과정 반복
- 구체적으로 합성곱 신경망은 이웃 픽셀의 정보를 집계하는 과정 반복

합성곱 신경망과 그래프 신경망의 차이

합성곱 신경망에서는 이웃의 수가 균일하지만, 그래프 신경망은 아님 (정점 별로 집계하는 이웃의 수가 다름)
그래프의 인접 행렬에 합성곱 신경망을 적용하면 효과적일까?
- 그래프에는 합성곱 신경망이 아닌 그래프 신경망을 적용해야함 (흔히 범하는 실수)
- 합성곱 신경망이 주로 쓰이는 이미지에서는 인접 픽셀이 유용한 정보를 담고 있을 가능성이 높음
- 하지만 그래프의 인접 행렬에서 인접 원소는 제한된 정보를 가짐, 특히 인접 행렬의 행과 열의 순서가 임의로 결정되는 경우가 많음

Further Reading

Semi-Supervised Classification with Graph Convolutional Networks

그래프 신경망이란 무엇일까? (심화)

그래프 신경망에서의 어텐션

기본 그래프 신경망의 한계

기본 그래프 신경망에서는 이웃들의 정보를 동일한 가중치로 평균냄
그래프 합성곱 신경망 역시 단순히 연결성을 고려한 가중치로 평균냄
즉, 더 친한 친구 등 관계에 대한 가중치가 고려되지 않음

그래프 어텐션 신경망

그래프 어텐션 신경망 (Graph Attention Network, GAT) 에서는 가중치 자체도 학습
- 실제 그래프에서는 이웃 별로 미치는 영향이 다를 수 있기 때문
- 가중치를 학습하기 위해 셀프-어텐션이 사용됨
각 층에서 정점 i 로부터 이웃 j 로의 가중치 $a_\mathit{ij}$ 는 세 단계를 통해 계산됨
- 1) 해당 층의 정점 i 의 임베딩 $h_i$ 에 신경망 W 를 곱해 새로운 임베딩을 얻음
- 2) 정점 i 와 정점 j 의 새로운 임베딩을 연결 (컨캣) 한 후, 어텐션 계수 a 를 내적함. 어텐션 계수 a 는 모든 정점이 공유하는 학습 변수
- 3) 2)의 결과에 소프트맥스 적용
여러 개의 어텐션을 동시에 학습한 뒤, 결과를 연결하여 사용 → 멀티헤드 어텐션
GAT 가 GCN 보다 정확도가 향상됨

그래프 표현 학습과 그래프 풀링

그래프 표현 학습

그래프 표현 학습 or 그래프 임베딩은 그래프 전체를 벡터의 형태로 표현하는 것 (개별 정점으 다루는 정점 표현 학습과 구분됨)
그래프 임베딩은 벡터의 형태로 표현된 그래프 자체를 의미하기도 함
그래프 임베딩은 그래프 분류 등에 활용
- 그래프로 표현된 화합물의 분자 구조로부터 특성을 예측하는 것이 한가지 예시

그래프 풀링

그래프 풀링이란 정점 임베딩들로부터 그래프 임베딩을 얻는 과정
평균 등 단순한 방법보다 그래프의 구조를 고려한 방법을 사용할 경우 그래프 분류 등 후속 과제에서 더 높은 성능을 얻음

DiffPool
정점별 임베딩 → 군집별 임베딩 → 군집의 군집 임베딩 → 최종 벡터 → 분류 문제 사용
그래프 신경망으로 임베딩 얻기, 군집 얻기, 군집 내 합산 총 세 종류의 곳에서 그래프 신경망이 활용

지나친 획일화 문제

개념

지나친 획일화 (Over-smoothing) 문제란 그래프 신경망 층의 수가 증가하면서 정점의 임베딩이 서로 유사해지는 현상
작은 세상 효과와 관련 있음, 정점 간 거리가 너무 가까워서 문제
적은 수의 층으로도 다수의 정점에 의해 영향 받음, 즉 층이 적어도 다수의 정점을 보면 그래프 전반을 보기 때문에 모두 비슷해짐

결과적으로 그래프 신경망 층의 수를 늘렸을 때, 후속 과제에서 정확도가 감소함

그래프 신경망의 층이 2 or 3 개일 때 정확도가 가장 높음
문제 해결을 위해 잔차항 (Residual) 을 넣음, 하지만 여전히 문제가 있음

지나친 획일화 문제에 대한 대응

JK 네트워크 (Jumping Knowledge Network) 는 마지막 층의 임베딩 뿐 아니라, 모든 층의 임베딩을 함께 사용함
APPNP 라는 그래프 신경망에서는 0번째 층에만 신경망을 사용함 (W 곱하기)
두 방법 모두 효과 있음
특히 APPNP 의 경우, 층의 수 증가에 따른 정확도 감소 효과가 없음을 확인

그래프 데이터의 증강

그래프 데이터 증강

CNN 에서는 이미지 augmentation 을 통해 데이터를 증강했음
Data Augmentation, 데이터 증강은 다양한 기계학습 분야에서 효과적
그래프에서도 누락되거나 부정확한 간선이 있을 수 있고, 데이터 증강을 통해 보완 가능
임의 보행을 통해 정점간 유사도를 계산하고, 유사도가 높은 정점 간의 간선을 추가하는 방법 제안됨

그래프 데이터 증강에 따른 효과

정점 분류의 정확도가 개선됨

Further Reading

GNN Survey Paper

Further Questions

GraphSAGE 모델에서는 하나의 정점을 나타내기 위하여 집계 함수를 활용합니다. 이때, 자기 자신만의 임베딩 뿐 아니라 이웃 정점의 임베딩까지 사용합니다. 이러한 방식으로 정점을 정의하게 된다면, 어떠한 장점이 있을까요?

마스터 클래스

실생활에서 경험할 수 있는 추천시스템들이 더 발전될 수 있을까요? 사람의 마음이 그 때 그 때 다를거 같은데 어떻게 방향을 정해서 추천 알고리즘을 개선하나요?

유튜브 추천 시스템을 써보면 지엽적이라 더 발전될 가능성이 있어보임
문맥 정보, 사람 마음 정보 등 까지 주면 더 잘할 것 같다. 현재로선 그런 정보들이 먼저 수집되어야 함
회사 입장에서는 항상 고객에게 맞는 추천보다는 회사의 이윤이 되는 추천을 해야할 수도 있음
사람 취향이 바뀔 가능성도 있음

객체인식 세그멘테이션 등 CV 에서 그래프를 사용할 방법이 있나요

3D 처리할 때 매쉬? 를 처리하기 위해 그래프 사용
사람 신체 관절 등도 그래프 사용 가능
비디오에서도 캐릭터간 관계 추정을 위해 그래프 사용 가능

시중에 나오는 딥러닝 관련 서적에는 GNN, GCN 같은 그래프 내용이 거의 없는데 왜그럴까요?

CNN 등 보다 4~5년 늦게 나와서 그럼
2016년 정도부터 다시 주목받음
아직 GNN 은 초창기임. 특정 문제 해결은 잘하지만 현재 기술들을 대체하기에는 부족

추천 시스템이 발전하고 있는 방향이 궁금합니다. 자연어처리 분야는 self-supervised learning + 큰 모델로 가는데, 추천 시스템도 이런 트렌드가 있을까요?

추천 시스템도 더 복잡하게 딥러닝 많이 쓰고 비선형 구조도 추가하고 있음
이제 GNN 과 추천 시스템이 관계 맺으면서 효과를 보는중

교수님께서 그래프 분야를 선택한 이유가 궁금합니다. 그래프 분야가 다른 딥러닝 분야에 비해 어떤 메리트가 있을까요?

원래부터 그래프 관련 일을 하고 있었는데 최근에 그래프 관련 딥러닝이 나오면서 더 공부를 함
알고리즘에서 사용하는 DFS, BFS 등 그래프가 재밌었음
사회 등 다양한 곳에서 그래프 사용
다른 딥러닝분야보다 폭넓게 사용될 수 있어서 좋다
외국 페북 같은데서는 그래프 연구하면 플러스

최근 교수님이 연구하시는 연구 주제나 방향이 궁금합니다

그래프나 행렬 분해
그래프보다 파워풀한 모델, 하이퍼그래프 (노드 2개 관계를 넘어 여러 노드간 관계 표현)
시계열 분석, 텐서 분해
일기예보 관련 문제 등

딥러닝을 활용한 그래프가 실제 산업에서 어떻게 사용되는지 궁금합니다. 추천시스템 외 적용분야

페이지랭크 같이 검색 엔진
물리 현상 (공의 궤적과 여러 요소들을 그래프로 나타내 예측)

사회적 관점에서 추천시스템이 편향을 강화시키고 집단끼리 고립된 군집화 되는 결과를 가져올 수 있는데, 이런 윤리적 문제를 어떻게 해결할 수 있을까요?

현재는 이론적으로 bias 등을 줄여주고 그럼
데이터들이 풀려야 좋은데 민감한 문제라 묶여있음

기존의 다른 뉴럴 네트워크를 사용하지 않고 GNN 을 사용했을 때 이점이 무엇일까요

그래프 처리할 때 GNN 이 적합
무작위로 관련을 보기 때문에

GNN 공부할 자료

CS224W
https://ogb.stanford.edu/
Networks, Crowds, and Markets
Linked

어떤 경우 그래프 모델이 적절한가요

데이터 자체가 그래프인 경우
억지로 그래프를 적용하면 잘 안됨
이미지에서도 픽셀이 너무 많을 때도 그래프로 표현하면 괜춘

CV, NLP, 추천시스템 중 어떤 분야가 취업이 가장 유리할까요

당장은 CV, NLP 가 인기많겠지만 추후엔 추천시스템도?!

피어 세션

수업 질문

[히스] CNN 과 GNN

부캠 중간 점검

샐리 : CV 관심있는데 여전히 재밌, 서버 가거나 하기엔 늦은거 같다, 하던거 하자는 생각

후미 : 작년에 인턴으로 AI CV쪽 처음 해봄. 만들고 싶은 서비스들이 AI 를 필요로 함. 취업할 수 있을까..? 석사..? AI쪽 재미는 있는데, 재미만 있지 먹고살 수 있을지는 모르겠다. 그냥 서버쪽 공부하면서 취업이나 할까 싶음

서폿 : 심리학 -> 이건 아니다 -> 컴공 : 그럭저럭 괜찮았습니다. 분야를 골라야함, 동아리 들어가서 백엔드, 부캠 선택할 떄만 해도 AI 재밌었는데 마음이 바뀌었음. 흥미가 없어짐… 어떻게 해야 할까요? U스테이지까지만 한다면 인강같은거로 백엔드 진지하게 해볼것같다

원딜 : 원래부터 프로그래밍에 관심이 많았음, 고등학교때 고인물에 밀림 ㅠㅠ, 근데 어떻게 살다보니 대학교때 다시 프로그래밍을 시작하게 되었네요, 그 고인물 친구들이 ‘이루다 챗봇’, ‘텐서플로우 컨퍼런스’ 에서 발표…, 개발을 잘하는 친구들이 인공지능 들어오고 있는데 여기서 시작해도 괜찮은 걸까…, 부캠은 데이터분석 하다보니까 비슷하고 관심이가서 들어오게 되었는데, 저도 쌓아온게 이것밖에 없다보니까 관성으로 결국 갈 수 밖에 없는 것 같다, 학교공부만 열심히 했지 대학원은…

펭귄: 스타트업 인턴 시절, 잘하는 사람(캐글)의 조언을 들음, X-ray 사진에서 척추사진만 따서 cov 각도 계산, 다음학기 때 인공지능 All-in!, 해커톤에서 서비스단까지 만들어 봤는데 너무 재밌다!!!, 노마드 코더로 시작, 인공지능도 병행, 대학원을 알아볼 수록 괴담같은 이야기만 수두룩…, 2년을 확정으로 학교를 다니는 것도 부담, 인공지능이 안 쓰이는 곳은 없으니까~,

히스 : 백엔드 하려고 싸피 지원했었음, AI는 잘가르쳐주는 곳이 이곳밖에 없을거같다. 백엔드는 기회가 많을 것 같아 다른곳에서 배울 수 있으니 좀 더 좋은 것을 배워보자 하고 왔음. 지금은 대학원 지원생각중 취업되면 취업하고. 좀 더 재밌는 일 하면 좋지 않을까

Today I Felt

멀리서 보면 쉬움, 가까이서 보면 어려움

이번주 강의는 특히 그랬다. 그냥 내용만 듣고 있으면 그래프 자체도 친숙한 개념이고 해서 술술 이해되는듯 했다. 하지만 군집 계수, 군집성, 군집 최대화, GNN 등 그 수식이나 개념을 자세히 이해하려니 쉽지 않았다. 모든 공부가 다 그런 것 같다. 항상 어딜 가도 나보다 잘하는 사람이 존재하고, 공부 또한 안다고 생각해도 끝이 없는 것 같다. 항상 부족함을 알고 깊이 이해하려고 노력하는 사람이 돼야지.

Ustage Day 25

목차