近日,人工智能领域顶级国际学术会议IJCAI 2022在奥地利维也纳成功召开。信也科技受邀参会,并通过线上参与的方式发表了题为《DGraph:A Large-Scale Financial Benchmark for Graph Anomaly Detection》的演讲,分享了信也科技联合浙江大学发布的大规模动态图数据集DGraph,以助力推动整个图领域的发展,为人工智能创新发展贡献自己的一份力量。
信也科技首席科学家王春平指出,当前图领域正在经历算法繁荣期,新算法的提出相当活跃,实际落地场景与公开用于学术领域的数据集逐渐丰富。然而,现实场景的复杂度远超现有公开数据的复杂度,尤其是图的异常检测(Graph Anomaly Detection, GAD)领域,极度缺乏大规模、异常比例较低的数据集。
信也科技首席科学家王春平分享
本次面向学术研究领域公开的数据集DGraph,来自于真实的金融业务场景,节点数超过370万,是此前常用的GAD领域大规模数据集Elliptic的17倍;它的异常节点比例低于2%,远低于主流GAD数据集。很重要的是,DGraph保留了边的时间信息,从而反映了整个图结构随着时间的变化,填补了带有节点特征、边特征的动态图空白。此外,DGraph还保留了真实场景中数据的复杂性。比如,它包含超过200万不作为预测目标但与目标节点可能有千丝万缕联系的背景节点;它的节点特征带有大量的缺失值。这些特点可以帮助对算法进行真刀真枪的打磨。
大规模动态图数据集DGraph
此前IJCAI 2022公开数据显示,此次大会共收到来自全球的4535篇论文投稿,最终接收率仅为15%。信也科技与浙江大学联合提交的论文《Beyond Homophily:Structure-aware Path Aggregation Graph Neural Network》成功入选,应邀参加此次大会分享。该论文突破了经典图神经网络的同质性约束,拓展提升了图神经网络的表达能力,对于反欺诈、反洗钱、AI芯片设计等具有异质倾向的图数据领域都具有潜在的应用价值。
一直以来,信也科技始终保持对科技研发的关注与投入,不仅在业务应用落地方面,在人工智能学术产出方面也是硕果累累。仅在图算法领域,信也科技联合浙江大学、UCLA等高校先后在CKIM、TKDE、AAAI等人工智能顶级学术会议、期刊发表了多篇论文,聚焦的内容从图的GAD场景有效应用,到图的鲁棒性和攻击对抗、预训练和泛化性等更为基础的问题,得到了国际同行越来越多的认可。
此次发布公开数据集DGraph,浓缩了信也科技在图领域的观察和尝试,旨在提供更为有挑战的动态GAD数据,激发更多有价值问题的提出,推动整个图算法领域的发展。这标志着信也科技在人工智能领域的研究进程中取得了重要的阶段性成果,也展示出信也科技持续对科技进行投入的诚意和信心。