关键词:图表示学习,图嵌入,随机游走
论文题目:GRAPE for fast and scalable graph processing and random-walk-based embedding
期刊来源:Nature Computational Science
论文链接:https://pattern.swarma.org/paper/b7c59134-1477-11ee-9f2e-0242ac17000d
图表示学习(Graph representation learning)方法为解决由图表示的复杂现实问题开辟了新途径。然而,这些应用程序中使用的许多图由数百万个节点和数十亿个边组成,超出了当前方法和软件实现的能力。这篇论文中提出 GRAPE (Graph Representation Learning, Prediction and Evaluation,图表示学习、预测和评估) ,一个用于图处理和嵌入的软件资源,它能够通过使用专门的和智能的数据结构、算法,以及基于随机游走方法的快速并行实现,随着输入图的大小提升算法性能。
与最先进的软件资源相比,GRAPE 在实际的空间与时间复杂度方面有数量级的提高,而且在边和节点的标签预测性能上也有所提高。GRAPE 包含大约170万行完整的 Python 和 Rust 代码,提供69个节点嵌入方法、25个推理模型、一系列高效的图形处理工具,以及来自文献和其他来源的超过8万个图。标准化的界面允许第三方包进行无缝集成,而现成的和模块化的管道允许对图表示学习方法进行易于使用的评估,因此 GRAPE 也被定位为可在图表征和嵌入的方法和软件包之间进行公平比较的软件工具。
图1 a)GRAPE的处理模块;b)用于对图嵌入技术、图处理方法和库进行简单、公平和可重复的比较的流程;c)对KGCOVID19的图进行可视化,通过显示通过使用 Node2Vec SkipGram 模型计算的 t 分布随机邻居嵌入的前两个组件获得,并对节点类型、边类型及边标签进行预测。
图2 不同节点数的图作为输入时,载入图,使用一阶及二阶随机游走时,不同软件包消耗的峰值内存与运行时间,可以看到GRAPE在大数据时,表现最佳
图3 使用GRAPE中的多种方法,对图进行嵌入时的准确性,其中紫色是为GRAPE包直接实现的方法,蓝色的为在cran包中集成的算法
编译|郭瑞东
原标题:《图表示学习、预测和评估 | Nat. Comput. Sci. 速递》