图神经网络2021的顶级应用

本文转自：《Top Applications of Graph Neural Networks 2021》
由Google完成翻译，机器翻译效果不好，但不影响整体理解。

在年初，我感到Graph神经网络（GNN）成为流行语。作为该领域的研究人员，我为自己的工作感到自豪（至少不感到羞愧）。并非总是如此：三年前，当我与忙于GAN和Transformers的同行交谈时，他们对我的总体印象是我正在研究特殊的利基问题。嗯，这个领域已经相当成熟，在这里我建议看看我们最近拥有的GNN的顶级应用。

如果这个关于卷积神经网络的深入教育内容对您有用，您可以订阅我们的AI研究邮件列表，以在我们发布新材料时收到通知。

组合优化

组合优化（CO）问题的解决方案是金融，物流，能源，生命科学和硬件设计中许多重要应用程序的主力军。这些问题大多数是用图形表示的。结果，在过去的一个世纪中，大量的墨水被洒在了更有效地解决CO问题的算法方法上。然而，机器学习驱动的现代计算革命为学习解决此类问题的方法提供了一种令人信服的新方式。

Google Brain团队使用GNN优化了新硬件（例如Google的TPU）的芯片块的功率，面积和性能。计算机芯片可以分为内存和逻辑组件的图形，每个图形均由其坐标和类型表示。在遵守密度和布线拥塞的限制的同时，确定每个组件的位置是一项费力的过程，这仍然是电气工程师的工作。他们的GNN模型与策略和价值RL功能结合在一起，能够为匹配或优于手动设计的硬件的电路芯片生成优化的布局。

与Chess and Go相比，Chip Placement问题的复杂性。（来源）

另一种方法采用不同的途径，并将ML模型集成到现有求解器中。例如， Gasse等。提出了一种图网，用于学习分支定界变量选择策略：混合整数线性程序（MILP）求解器中的关键步骤。这样，学习到的表示试图使求解器的运行时间最小化，并已证明是推理时间与决策质量之间的良好折衷。

在 DeepMind和Google的最新工作中，图形网用于MILP求解器中涉及的两个关键子任务：联合变量分配和限制目标值。他们的神经网络方法比包括Google生产包装和计划系统在内的庞大数据集的现有求解器快2–10倍。有关此主题的更多结果，你可以参考几个最近的调查是讨论GNNS，ML，和CO的更深度的结合。

计算机视觉

由于世界上的对象之间有着密切的联系，包含这些对象的图像也可以从GNN中受益。感知图像的一种方法是通过场景图，即场景中存在的一组对象以及它们之间的关系。场景图已在图像检索，理解和推理，字幕，视觉问题解答以及图像生成中得到了应用，表明它可以极大地提高模型的性能。

在Facebook的作品中，可以将流行的CV数据集COCO中的对象放置在画布中，指定对象的位置和大小，并从中创建场景图。然后，使用GNN对图形进行编码以确定每个对象的嵌入，然后将其与CNN一起使用以生成对象的蒙版，边界框和外观。因此，最终用户只需为GNN / CNN在图中添加新节点（指定该节点的相对位置和大小）即可生成带有这些对象的图像。

使用场景图生成图像。用户可以将对象放置在画布上的任何位置（红色的“河”；从中心移到右下角）以反映图像的变化（图像中生成的河流也移到右下角）。

CV中图形的另一个来源是两个相关图像的匹配-过去是手工制作的描述符来完成的一个经典问题。3D图形公司 Magic Leap 发布了一种名为SuperGlue的GNN体系结构，该体系结构可在实时视频中执行图形匹配，用于完成3D重建，位置识别，本地化和制图（SLAM）等任务。SuperGlue由一个基于注意力的GNN组成，该GNN学习图像关键点的表示形式，这些图像关键点被进一步馈送到进行匹配的最佳传输层中。该模型可以在现代GPU上实时执行匹配，并且可以轻松集成到现代SLAM系统中。有关图形与计算机视觉相交的更多详细信息，请查看这些调查。

物理/化学

生命科学受益于将粒子或分子之间的相互作用表示为图形，然后使用GNN预测此类系统的属性。在 Facebook和CMU的Open Catalyst项目中，最终目标是找到存储诸如太阳或风能之类的可再生能源的新方法。潜在的解决方案之一是通过化学反应将这种能量转换成其他燃料，例如氢气。然而，这需要发现新的催化剂以高速率驱动化学反应，并且已知的方法例如 DFT 非常昂贵。 Open Catalyst项目打开最大的催化剂数据集，其DFT弛豫和GNN基线。希望找到新的低成本分子，这些分子可以增加当前耗时数天的昂贵仿真，并具有有效的分子能量和力的ML近似值（可能需要数毫秒）。

吸附物（小连接分子）和催化剂表面的初始状态和松弛状态的示例。为了找到一对吸附剂催化剂的松弛状态，必须执行昂贵的DFT模拟，这可能需要几天的时间。 Zitnick等。2020年

DeepMind的研究人员还应用GNN来模拟复杂粒子系统（例如水或沙子）的动力学。通过在每个步骤中预测每个粒子的相对运动，可以合理地重建整个系统的动力学，并进一步了解控制运动的基本定律。例如，这用于理解玻璃化转变，这是固态理论中最有趣的未解决问题之一。使用GNN不仅可以模拟过渡过程中的动力学，而且可以更好地理解粒子如何根据距离和时间相互影响。

此外，位于美国的物理实验室 Fermilab 致力于将GNN运送到 CERN的大型强子对撞机（LHC）。目标是处理数百万个图像并选择与发现新粒子有关的图像。他们的任务是在FPGA上实现 GNN ，并将它们与数据采集处理器集成在一起，这将允许在全球范围内远程运行GNN。有关GNN在粒子物理学中的更多应用，请查看此最新调查。

药物发现

凭借数十亿美元的研发资金和激烈的竞争，制药公司在激烈地寻找新的药物开发范例。在生物学中，图可以表示各种规模的相互作用。在分子水平上，边缘可以是分子中原子之间的键或蛋白质中氨基酸残基之间的相互作用。在更大的范围内，图形可以代表更复杂的结构（例如蛋白质，mRNA或代谢物）之间的相互作用。根据特定的抽象级别，这些图可用于目标识别，分子特性预测，高通量筛选，新型药物设计，蛋白质工程和药物再利用。

也许，使用GNN进行药物发现的最有希望的结果之一是麻省理工学院的研究人员及其合作者发表在Cell（2020）上。在这项工作中，训练了一个名为Chemprop的深层GNN模型，以预测分子是否具有抗生素特性：对细菌大肠杆菌的生长抑制作用。在仅使用FDA批准的药物库中的约2500个分子对其进行训练后，Chemprop就应用于更大的数据集，其中包括含有Halicin分子的Drug Repurpose Hub，该药物在 2001年的《太空漫游》中被命名为 HAL 9000。

值得注意的是，以前仅对Halicin分子进行过研究，因为其结构与已知的抗生素相差很大。但是，实验室的体内和体外临床实验表明，Halicin是一种广谱抗生素。针对强大的NN模型进行的广泛基准测试凸显了在Halicin的发现中使用GNN学习功能的重要性。除了这项工作的实用性之外，Chemprop的体系结构还应引起更多关注：与许多GNN模型不同，Chemprop具有5层和1600个隐藏维，远远超过了用于此类任务的典型GNN参数。希望这只是即将到来的人工智能新医学发现中的一小部分。有关此主题的更多结果，请查看最近的调查和博客文章研究了药物发现领域中更多的GNN应用。

推荐系统

组合优化

计算机视觉

物理/化学

药物发现

打不死的小强 Author

Previous

Next

Comments

Leave a comment 取消回复

关于 easyAI

关注我们的公众号：easyai-tech

推荐系统

组合优化

计算机视觉

物理/化学

药物发现

打不死的小强 Author

Previous

Next

Comments

Leave a comment 取消回复

关于 easyAI

热门标签

关注我们的公众号：easyai-tech