1 Introduction

머신러닝은 재료의 특성을 예측하고, 시뮬레이션을 가속화하며, 새로운 재료를 설계하고, 새로운 재료의 합성 방법을 예측하는 등의 화학 및 재료 과학의 분야에서 점점 더 중요한 역할을 하고 있습니다.
GNN(그래프 신경망)분야는 머신러닝 모델 중 가장 빠르게 성장하는 분야로, 그래프 데이터 형태는 분자와 재료의 구조적 표현을 직접 작업할 수 있기 때문에 이를 특성화 하는데 필요한 모든 관련 정보에 완전히 접근할 수 있습니다.
GNN 모델의 경우 분자와 재료의 자연스러운 표현, 원자와 결합, 그리고 3D 구조 등을 직접 작업할 수 있기에 원자 수준에서의 완전한 표현에 접근할 수 있으며, 이에 따른 더 큰 규모의 현상도 함께 작업할 수 있습니다.
결론적으로, GNN은 지난 몇 년간 분자 특성 예측에서 전통적인 머신러닝 모델의 성능을 뛰어 넘었습니다.

2 Graph neural networks in materials science and chemistry

2.1 Basic principles

그래프는 node와 edge로 표현되는 데이터 형태로, 서로간의 관계가 있다는 추상적인 구조를 기술하는데 사용됩니다.

$$ G =(V, E)\\ v \in V \\ e_{v,w} = (v,w)\in E $$

분자 구조에 대해 원자는 node로, 화학 결합은 edge인 무방향 그래프로 표현됩니다. 이에 대해 전체 분자 구조, 혹은 기하학적 구조가 입력으로 사용되어 GNN 자체가 주어진 분자의 특성을 예측하기 위한 유익한 분자 표현을 학습합니다.
Node와 edge를 분자 구조와 결합하여 사용하므로써, 가장 기본적인 MPNN (메세지 전달 그래프 신경망) 프레임 워크를 통해 각 node(원자)의 상태를 업데이트하고 GNN은 각 원자를 포함한 개별 화학 환경을 나타내는 벡터를 도출해 낼 수 있습니다.

Untitled

2.2 Structure representation

많은 그래프 네트워크는 화학 그래프를 입력으로 사용하여 분자와 무기 화합물(격자 구조)을 모두 표현하고, 유연성과 확장성에서 고정 크기 벡터 표현보다 더 많은 장점을 갖습니다.
원자에 대한 특성, 원자 사이의 결합에 대한 특성, 그리고 분자 자체에 대한 일반적인 특성까지 모두 표현 가능합니다.
위에서 설명한 단순 원자 사이의 연결성을 나타낼 때에는, 분자 기하학에 의존하는 양자역학적 전자 구조 특성을 정확히 예측하기 어렵습니다. 이에 대응하기 위해 최근 연구에서는 기하학적 정보를 대칭성 또는 기저 함수로 확장하여 입력으로 사용합니다.
그럼에도 고체 결정체를 포함한 주기적 구조를 나타내기 위한 주기성과 공간 그룹 대칭은 GNN의 표현에 추가되어야 할 추가적인 과제입니다.

2.3 State-of-the-art architectures and benchmarks

Untitled

최신 연구에서는 MPNN을 넘어 자연어 처리에 사용되었던 셀프 어텐션 레이어를 사용하기도 하고, 슈뢰딩거 방정식의 근사 해로부터 파생된 원자 위치를 함께 입력으로 사용하는 경우도 있습니다.