- 图信号处理中的局部分布;
- 具有循环的关系因果模型:表示和推理;
- PyTorch Geometric Signed Directed: 符号和有向图的图神经网络综述及软件;
- 从基于主体的模型到假新闻传播的宏观描述:能力在数据驱动应用中的作用;
- 选择边化,社交媒体上一种新型的反移民话语?使用 BERT 对有关移民的社交媒体消息进行分类;
- 在 COVID-19 大流行的头两年评估法国疫苗批评者的影响;
- 使用广义相似性度量的空间热风险评估框架;
- 利用二部图评估职业相似性;
- 消息一路向上;
- 分析 COVID-19 大流行锁定期间的安全和隐私威胁:Twitter 数据集案例研究;
图信号处理中的局部分布
原文标题: On Local Distributions in Graph Signal Processing
地址: http://arxiv.org/abs/2202.10649
作者: T. Mitchell Roddenberry, Fernando Gama, Richard G. Baraniuk, Santiago Segarra
摘要: 图过滤是图信号处理(GSP)中的基石操作。因此,理解它是开发有效 GSP 方法的关键。图过滤器是局部和分布式线性运算,其输出仅取决于每个节点的局部邻域。此外,通过与直接邻居进行重复交换,可以在每个节点上分别计算图过滤器的输出。图过滤器可以紧凑地写成图移位算子的多项式(通常是图的稀疏矩阵描述)。这导致将过滤器的属性与相应矩阵的谱属性相关联——该矩阵编码了图的全局结构。在这项工作中,我们提出了一个仅依赖于图邻域的局部分布的框架。这种方法的关键是根据根球的可测量空间来描述图和图信号。利用这一点,我们能够无缝地比较不同大小和来自不同模型的图,产生关于谱密度收敛、滤波器在任意图上的可转移性以及图信号属性相对于局部子结构分布的连续性的结果。
具有循环的关系因果模型:表示和推理
原文标题: Relational Causal Models with Cycles:Representation and Reasoning
地址: http://arxiv.org/abs/2202.10706
作者: Ragib Ahsan, David Arbour, Elena Zheleva
摘要: 关系领域的因果推理是研究现实世界社会现象的基础,在这些社会现象中,个体单位可以影响彼此的特征和行为。相互关联的单元之间的动态可以表示为关系因果模型的实例化;然而,对这种实例化的因果推理需要额外的模板假设来捕捉影响的反馈循环。以前的研究已经开发了提升表示来解决这种动态的关系性质,但严格要求表示没有循环。为了促进关系表示和学习的循环,我们引入了关系sigma-separation,这是一种理解具有反馈循环的关系系统的新标准。我们还引入了一种新的提升表示,sigma-abstract ground graph,它有助于在循环关系模型的所有可能实例中抽象统计独立关系。我们展示了sigma-AGG 完备性的充分必要条件,并且在存在一个或多个任意长度的循环的情况下,关系sigma-分离是合理且完备的。据我们所知,这是第一个关于循环关系因果模型的表示和推理的工作。
PyTorch Geometric Signed Directed: 符号和有向图的图神经网络综述及软件
原文标题: PyTorch Geometric Signed Directed: A Survey and Software on Graph Neural Networks for Signed and Directed Graphs
地址: http://arxiv.org/abs/2202.10793
作者: Yixuan He, Xitong Zhang, Junjie Huang, Mihai Cucuringu, Gesine Reinert
摘要: 符号网络在许多实际应用中无处不在(例如,编码信任/不信任关系的社会网络、由时间序列数据产生的相关网络)。虽然许多有符号网络是有向的,但缺乏专门为有向网络设计的图神经网络 (GNN) 的调查论文和软件包。在本文中,我们介绍了 PyTorch Geometric Signed Directed,这是一种用于有符号和有向网络的 GNN 调查和软件。我们回顾了有符号和有向网络分析中的典型任务、损失函数和评估指标,讨论了相关实验中使用的数据,并概述了所提出的方法。深度学习框架由易于使用的 GNN 模型、合成和真实世界数据,以及针对有符号和有向网络的特定任务评估指标和损失函数组成。该软件以模块化方式呈现,因此签名和有向网络也可以分开处理。作为 PyTorch Geometric 的扩展库,我们提议的软件通过开源版本、详细文档、持续集成、单元测试和代码覆盖检查来维护。我们的代码在 urlhttps://github.com/SherylHYX/pytorch_geometric_signed_directed 上公开可用。
从基于主体的模型到假新闻传播的宏观描述:能力在数据驱动应用中的作用
原文标题: From agent-based models to the macroscopic description of fake-news spread: the role of competence in data-driven applications
地址: http://arxiv.org/abs/2202.10809
作者: Jonathan Franceschi, Lorenzo Pareschi, Mattia Zanella
摘要: 以操纵个人对事实的看法为目的的虚假新闻传播现在被认为是许多民主社会的一个主要问题。然而,迄今为止,人们对假新闻如何在社会网络上传播、个人教育水平的影响、假新闻何时有效影响公众舆论以及哪些干预措施可能成功减轻其影响等方面知之甚少。在本文中,从前两位作者最近引入的具有能力的动力学多智能体模型开始,我们建议通过源自经典流体动力学的平均场近似中的社会封闭概念推导出降阶模型动力学理论的闭合。这种方法允许获得简化的模型,其中主体的能力和学习保持其在动态中的作用,同时,此类模型的结构更适合与数据驱动的应用程序接口。描述和讨论了不同的基于 Twitter 的测试用例的示例。
选择边化,社交媒体上一种新型的反移民话语?使用 BERT 对有关移民的社交媒体消息进行分类
原文标题: Co-opted marginality, a new type of anti-immigrant discourse on social media? Classifying social media messages about immigrants with BERT
地址: http://arxiv.org/abs/2202.10830
作者: Claire Stravato Emes, Anfan Chen
摘要: 这篇文章分析了新加坡六个月内 11 个社交媒体社区平台的评论部分关于移民的公共话语。
在 COVID-19 大流行的头两年评估法国疫苗批评者的影响
原文标题: Assessing the influence of French vaccine critics during the two first years of the COVID-19 pandemic
地址: http://arxiv.org/abs/2202.10952
作者: Mauro Faccin, Floriana Gargiulo, Laëtitia Atlani-Duault, Jeremy K. Ward
摘要: 当 COVID-19 的威胁得到广泛承认时,许多人希望这种流行病能够压制“反疫苗运动”。然而,当疫苗在 2020 年底开始抵达富裕国家时,即使在这种重大流行病的背景下,疫苗犹豫似乎也可能是一个问题。这是否意味着在社交媒体上动员对疫苗至关重要的活动家是这种对 COVID-19 疫苗接种保持沉默的主要原因之一?在本文中,我们希望通过研究可能导致对疫苗保持沉默的众多机制之一,为目前在 COVID-19 流行期间疫苗犹豫的工作做出贡献:疫苗关键活动家在社交媒体上影响更广泛公众的能力.我们分析了在大流行的头两年期间法国 Twittosphere 上关于 COVID-19 疫苗的辩论的演变,特别关注疫苗关键网站的传播能力。我们解决了两个主要问题:1) 在此期间,疫苗关键内容是否取得了进展? 2) 谁是传播这些内容的主要参与者?虽然在此期间关于疫苗的辩论经历了巨大的激增,但这些辩论中疫苗关键内容的份额保持稳定,除了与特定事件相关的有限数量的短期内容。其次,分析转发超图的社区结构,重构信息流的中尺度结构,识别和表征用户的主要社区。我们分析了他们在信息生态系统中的作用:最大的右翼社区具有典型的回声室行为,从外部收集所有对疫苗至关重要的推文,并在社区内部再循环。较小的左翼社区对疫苗关键内容的渗透性较低,但一旦被采用,就有很大的传播能力。
使用广义相似性度量的空间热风险评估框架
原文标题: A framework for spatial heat risk assessment using a generalized similarity measure
地址: http://arxiv.org/abs/2202.10963
作者: Akshay Bansal, Ayda Kianmehr
摘要: 在这项研究中,我们开发了一个新的框架来评估马里兰州各个地区(邮政编码)由于热危害引起的健康风险,并借助两个常用指标,即暴露和脆弱性。我们的方法通过开发相应的特征向量来量化上述两个指标中的每一个,然后通过在经验风险谱的末端对数据点进行聚类来计算表示高风险环境的指标特定参考向量。所提出的框架规避了基于信息论熵的聚合方法,这些方法的使用随熵的不同观点而变化,这些观点本质上是主观的,更重要的是,使用具有未知参考点的余弦相似度概括了风险估值的概念。
利用二部图评估职业相似性
原文标题: Occupation similarity through bipartite graphs
地址: http://arxiv.org/abs/2202.11064
作者: Pavle Boškoski, Matija Perne, Tjaša Redek, Biljana Mileva Boshkoska
摘要: 在做出职业决策时,职业之间的相似性是至关重要的信息。然而,单一和统一的职业相似性度量的概念更多的是限制而不是资产。该研究的目的是评估多种可解释的职业相似性度量,这些度量可以为不同的职业间关系提供不同的见解。使用二部图的框架得出了几个这样的度量。对 2012 年至 2021 年期间斯洛文尼亚发生的超过 450,000 次工作转换对它们的可行性进行了评估。结果支持这样一个假设,即几种相似性度量是合理的,并且它们提供了不同的可行职业道路。完整的实现和部分数据集可在 https://repo.ijs.si/pboskoski/bipartite_job_similarity_code 获得。
消息一路向上
原文标题: Message passing all the way up
地址: http://arxiv.org/abs/2202.11097
作者: Petar Veličković
摘要: 消息传递框架是近年来图神经网络 (GNN) 取得巨大成功的基础。尽管它很优雅,但在给定的输入图上,存在许多它无法解决的问题。这导致了关于“超越消息传递”的研究激增,构建不受这些限制的 GNN——这个术语在常规话语中已经无处不在。然而,这些方法真的超越了消息传递吗?在这篇立场文件中,我讨论了使用这个术语的危险——尤其是在向新手教授图表示学习时。我表明,我们想要在图上计算的任何感兴趣的函数很可能都可以使用成对的消息传递来表达——就在一个可能修改过的图上,并争论大多数实际的实现如何巧妙地完成这种技巧。为了发起富有成效的讨论,我建议用一个更温和的术语“增强消息传递”替换“超越消息传递”。
分析 COVID-19 大流行锁定期间的安全和隐私威胁:Twitter 数据集案例研究
原文标题: Analysing Security and Privacy Threats in the Lockdown Periods of COVID-19 Pandemic: Twitter Dataset Case Study
地址: http://arxiv.org/abs/2202.10543
作者: Bibhas Sharma, Ishan Karunanayake, Rahat Masood, Muhammad Ikram
摘要: COVID-19 大流行将被铭记为一个独特的破坏性时期,它改变了全球数十亿公民的生活,导致人们的生活和工作方式进入新常态。随着冠状病毒大流行,每个人都必须适应“在家工作或学习”的运营模式,这种模式改变了我们的在线生活,并成倍增加了网络空间的使用。同时,在 COVID-19 锁定期间,Facebook 和 Twitter 等社交媒体平台出现了大幅增长。这些锁定期导致了一系列新的网络犯罪,从而使攻击者能够在恐惧、不确定和怀疑的时候成为社交媒体平台用户的受害者。威胁范围从运行网络钓鱼活动和恶意域到出于恶意目的提取有关受害者的私人信息。本研究论文进行了一项大规模研究,以调查 COVID-19 大流行期间锁定期对社交媒体用户安全和隐私的影响。我们从 533 天的数据抓取中分析了 1060 万条与 COVID 相关的推文,并调查了三个不同时期(即锁定之前、期间和之后)用户的安全和隐私行为。我们的研究表明,用户在推文中撰写有关大流行情况的信息时,无意中分享了更多的个人身份信息。如果用户发布三个或更多关于大流行的敏感推文,隐私风险将达到 100%。我们调查了不同流行阶段在社交媒体中共享的可疑域的数量。我们的分析显示,与其他锁定阶段相比,锁定期间的可疑域有所增加。我们观察到 IT、搜索引擎和企业是包含可疑域的前三个类别。我们的分析表明,对手煽动恶意活动的策略会随着该国的大流行情况而变化。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在公众号“网络科学研究速递”(netsci)和个人博客进行同步更新。