Reconstructing the Unseen: GRIOT for Attributed Graph Imputation with Optimal Transport
Reconstruire l'invisible: GRIOT pour l'Imputation de Graphes Attribués par Transport Optimal
Abstract
In recent years, there has been a significant surge in machine learning techniques, particularly in the domain of deep learning, tailored for handling attributed graphs. Nevertheless, to work, these methods assume that the attribute values are fully known, which is not realistic in numerous real-world applications. This paper explores the potential of Optimal Transport (OT) to impute missing attribute values on graphs. To proceed, we design a novel multi-view OT loss function that can encompass both node feature data and the underlying topological structure of the graph by utilizing multiple graph representations. We then utilize this novel loss to train efficiently a Graph Convolutional Neural Network (GCN) architecture capable of imputing all missing values over the graph at once. We evaluate the interest of our approach with experiments both on synthetic data and real-world graphs, including different missingness mechanisms and a wide range of missing data. These experiments demonstrate that our method is competitive with the state-of-the-art in all cases and of particular interest on weakly homophilic graphs.
Ces dernières années, les techniques d’apprentissage automatique ont connu un essor considérable, en particulier dans le domaine de l’apprentissage profond, notamment adaptées à la gestion des graphes attribués. Néanmoins, pour fonctionner, ces méthodes supposent que les valeurs des attributs sont entièrement connues, ce qui n’est pas réaliste dans de nombreuses applications du monde réel. Cet article explore le potentiel du transport optimal (TO) pour imputer les valeurs d'attributs manquantes sur les graphes. Pour ce faire, nous concevons une nouvelle fonction de perte basée sur du TO multi-vues qui peut englober à la fois les attributs des nœuds et la structure topologique sous-jacente du graphe à travers plusieurs représentations (vues) de ce dernier. Nous utilisons ensuite cette nouvelle fonction de perte pour former efficacement une architecture de réseau de neurones convolutif en graphes (GCN) capable d'imputer simultanément toutes les valeurs manquantes du graphe. Nous évaluons l'intérêt de notre approche avec des expérimentations à la fois sur des données synthétiques et sur des graphiques du monde réel, incluant différents mécanismes et une grande plage de données manquantes. Ces expériences démontrent que notre méthode est compétitive avec l’état de l’art dans tous les cas et particulièrement intéressante sur les graphes faiblement homophiles.
Origin | Files produced by the author(s) |
---|---|
Licence |