- 具有社区结构的网络上的自适应组测试;
- 交叉协同效应:通过信息分解解开交叉身份的不可约化影响;
- 元种群模型暗示了事件间时间的非泊松统计;
- 时间依赖性传染性对流行动态的影响;
- 走出舒适区:针对联网系统的更具包容性的内容推荐;
- 通过动态图卷积网络预测时间网络中的关键节点;
- 通过局部信息寻找复杂网络中的关键边;
- 在线社会网络中的社交可见性服务定价:建模和算法;
- 知识网络中的累积结构和路径长度;
- TweeNLP:自然语言处理的 Twitter 探索门户;
- 通过联合建模项目和注释者来提高标签质量;
- 具有一致性行为的复杂网络的优化控制;
- Apache Spark 中的大规模网络嵌入;
- TD-GEN:使用树分解生成图;
- Twitter 和 Facebook 上的双面人:为人类个性分析收集社交多媒体;
- 用于测量隔离的整体行为指数 (OBI);
- 动态组测试以控制和监测人群中的疾病进展;
- 通过多态q投票模型中的淬灭无序促进不连续相变;
- 说出他们的名字:乔治·弗洛伊德死后,对警察暴力致死的黑人受害者的集体关注重新抬头;
- 使用考虑乘客流动的模型确定航班上 COVID-19 超级传播的缓解策略;
具有社区结构的网络上的自适应组测试
原文标题: Adaptive Group Testing on Networks with Community Structure
地址: http://arxiv.org/abs/2101.02405
作者: Surin Ahn, Wei-Ning Chen, Ayfer Ozgur
摘要: 自从二战中群体测试问题出现以来,该问题的概率变体中的一个普遍假设是人群中的个体独立地被一种疾病感染。然而,这种假设在实践中很少成立,因为疾病通常通过个体之间的相互作用传播,因此导致感染相互关联。受 COVID-19 和类似疾病特征的启发,我们考虑了网络上的感染模型,该模型概括了传统的 i.i.d。来自概率组测试的模型。在这种感染模型下,我们询问是否可以利用网络结构的知识来更有效地执行组测试,特别关注从随机块模型中绘制的社区结构图。我们证明,当网络和感染参数有利于“强大的社区结构”时,我们提出的自适应图感知算法优于基线二元分裂算法,甚至在某些参数范围内是顺序最优的。我们通过数值模拟支持我们的结果。
交叉协同效应:通过信息分解解开交叉身份的不可约化影响
原文标题: Intersectional synergies: untangling irreducible effects of intersecting identities via information decomposition
地址: http://arxiv.org/abs/2106.10338
作者: Thomas F. Varley
摘要: 交叉性的想法已成为学术社会学以及争取社会正义的流行运动(例如黑人的命也是命、交叉女权主义和 LGBT 权利)中经常讨论的话题。交叉性提出,个人对社会的体验具有无法归结为单独考虑的各种身份的总和的方面,但“大于其各部分的总和”。在这项工作中,我们表明可以使用信息论在经验数据中统计观察交叉身份的影响。我们表明,当考虑各种身份类别(例如种族、性别和收入(作为阶级的代表))对健康和保健等结果的预测关系时,会出现强大的统计协同作用。这些协同效应表明,身份对结果的共同影响是不可简化为任何单独考虑的身份,并且只有在将特定类别一起考虑时才会出现(例如,种族和性别对收入不可减少的共同考虑存在巨大的协同效应种族或性别)。然后,我们使用合成数据表明,当前评估数据交叉性的黄金标准方法(具有乘法交互系数的线性回归)无法消除真正协同、大于其部分总和的交互和冗余之间的歧义相互作用。我们在推断数据中的交叉关系的背景下探索这两种不同类型的交互的重要性,以及能够可靠地区分两者的重要性。最后,我们得出结论,作为对数据中的非线性和协同作用敏感的无模型框架,信息论是探索高阶社会动态空间的自然方法。
元种群模型暗示了事件间时间的非泊松统计
原文标题: Metapopulation models imply non-Poissonian statistics of interevent times
地址: http://arxiv.org/abs/2106.10348
作者: Elohim Fonseca dos Reis, Naoki Masuda
摘要: 来自人类和动物的时间接触数据的事件间时间通常服从重尾分布,并且这种特性影响网络上的传染和其他动态过程。我们从理论上表明,比指数分布重尾的事件间时间分布是流行病学和生态学中使用的最基本的元种群模型的结果,其中个体根据简单的随机游走从一个补丁移到另一个补丁。无论网络结构如何,我们的结果都适用,也适用于更现实的移动规则,例如高阶随机游走和用于模拟人类动力学的循环移动模式。
时间依赖性传染性对流行动态的影响
原文标题: The effect of time-dependent infectiousness on epidemic dynamics
地址: http://arxiv.org/abs/2106.10384
作者: Nicholas Landry
摘要: 与流行病模型中个体之间感染率恒定的常见假设相反,实际上,个体的病毒载量决定了他们的传染性。我们比较了一个模型的平均和个体再生数、流行动态和干预策略,该模型结合了时间依赖传染性和标准 SIR 模型,用于完全混合和类别混合的人群。我们发现再生数仅取决于总传染性暴露和混合矩阵的最大特征值,并且这两种效应相互独立。我们还发现,当我们将我们的时间相关平均场模型与具有相同速率的 SIR 模型进行比较时,流行高峰提前且更加明显,并且修改感染率函数对流行的时间动态有很强的影响。最后,我们探讨了社会和药物干预对我们的理论框架的影响。
走出舒适区:针对联网系统的更具包容性的内容推荐
原文标题: Step Out of Your Comfort Zone: More Inclusive Content Recommendation for Networked Systems
地址: http://arxiv.org/abs/2106.10408
作者: Jiaxin Wu, Supawit Chockchowwat
摘要: 网络系统广泛适用于现实世界的场景,如社会网络、基础设施网络和生物网络。在这些应用程序中,我们对社会网络感兴趣,因为它们的复杂性和流行性。社会网络上的一项关键任务是根据图结构的特殊特征推荐新内容。在这个项目中,我们的目标是通过防止推荐倾向于来自封闭社区的内容来增强推荐系统。为了抵消这种偏见,我们将考虑跨网络的信息传播作为评估内容推荐的指标,例如新的连接和新闻提要。我们使用来自 Yelp 的学术协作网络和用户-项目交互数据集来模拟连接推荐环境并验证所提出的算法。
通过动态图卷积网络预测时间网络中的关键节点
原文标题: Predicting Critical Nodes in Temporal Networks by Dynamic Graph Convolutional Networks
地址: http://arxiv.org/abs/2106.10419
作者: En-Yu Yu, Yan Fu, Jun-Lin Zhou, Hong-Liang Sun, Duan-Bing Chen
摘要: 许多现实世界的系统可以用时间网络来表示,节点在结构和功能上扮演着截然不同的角色,边代表节点之间的关系。识别关键节点可以帮助我们控制舆论或流行病的传播,预测学术界的领军人物,为各种商品做广告等等。然而,由于时间网络中的网络结构随时间变化,因此识别关键节点相当困难。在本文中,考虑到时间网络的序列拓扑信息,提出了一种基于特殊 GCN 和 RNN 组合的新颖有效的学习框架来识别具有最佳传播能力的节点。该方法的有效性通过加权易感-感染-恢复模型进行评估。在四个真实世界的时间网络上的实验结果表明,所提出的方法在 Kendall tau 系数和最高 k 命中率方面优于传统和深度学习基准方法。
通过局部信息寻找复杂网络中的关键边
原文标题: Finding critical edges in complex networks through local information
地址: http://arxiv.org/abs/2106.10420
作者: En-Yu Yu, Yan Fu, Jun-Lin Zhou, Hong-Liang Sun, Duan-Bing Chen
摘要: 在交通、通讯、社交等现实网络中,有一些关键边在交通流和信息包的传递中起着重要作用。识别复杂网络中的关键边在理论研究和实际应用中都具有重要意义。考虑到社区在边附近的重叠,本文提出了一种新颖有效的索引,称为子图重叠(SO)。在一个合成网络和八个真实网络上的实验结果表明,SO 在识别关键边方面优于五种基准方法,这对于保持网络结构和功能的完整性至关重要。
在线社会网络中的社交可见性服务定价:建模和算法
原文标题: Pricing Social Visibility Service in Online Social Networks: Modeling and Algorithms
地址: http://arxiv.org/abs/2106.10473
作者: Shiyuan Zheng, Hong Xie, John C.S. Lui
摘要: YoutTube、Instagram、Twitter、Facebook 等在线社会网络 (OSN) 是用户向朋友或关注者分享信息或内容的重要平台。很多时候,用户希望提高自己的社会知名度,因为这可以让他们的内容,如观点、视频、图片等,吸引更多用户的注意力,进而可能给他们带来更高的商业利益。受此启发,我们提出了一种机制,其中 OSN 运营商提供“社交可见性提升服务”以激励请求者(通过添加新“邻居”来寻求提高其社交可见性的用户)和供应商(用户)之间的“交易”。愿意在提供某些“奖励”时被添加为任何请求者的新“邻居”)。我们为 OSN 提供者设计了一个公布的定价方案,向使用这种增强服务的请求者收费,并奖励对这种增强服务做出贡献的供应商。 OSN 运营商保留一部分来自请求者的付款,并将剩余部分通过 Shapley 值“公平地”分配给参与的供应商。 OSN 提供者的目标是选择价格和供应商集,以在请求者的预算约束下最大化收入总额。我们首先表明收入最大化问题并不比 NP-hard 问题简单。然后我们将其分解为两个子程序,其中一个专注于选择最佳供应商集,另一个专注于选择最佳价格。我们证明了每个子程序的难度,并最终设计了一种计算效率高的近似算法来解决收入最大化问题,并在收入差距上提供可证明的理论保证。我们对四个公共数据集进行了大量实验,以验证我们提出的算法的卓越性能。
知识网络中的累积结构和路径长度
原文标题: Cumulative structure and path length in networks of knowledge
地址: http://arxiv.org/abs/2106.10480
作者: P.G.J. Persoon
摘要: 科学技术的一个重要知识维度是其发展的累积程度,即后来的发现建立在早期发现的程度。可以使用网络方法研究累积知识结构,其中节点代表发现,链接代表知识流。这些研究特别感兴趣的是网络路径和路径长度的概念。从网络增长的价格模型出发,我们推导出从给定初始节点到网络中每个节点的所有唯一路径的路径长度分布的精确解。我们研究了平均入度和累积优势效应的相对重要性,并实现了一个概括,其中入度取决于节点的数量。发现累积优势效应从根本上减缓了路径长度的增长。由于所有唯一路径的集合可能包含许多冗余,因此我们另外考虑到网络中每个节点的最长路径的子集。由于这种情况更复杂,我们只在简单的上下文中近似最长路径长度分布。在给定长度的所有唯一路径的数量无限增长的情况下,给定长度的最长路径的数量收敛到一个有限的极限,这与给定的路径长度呈指数关系。因此,基本网络特性和动力学特征会塑造这些网络中的累积结构,因此在研究这些结构时应予以考虑。
TweeNLP:自然语言处理的 Twitter 探索门户
原文标题: TweeNLP: A Twitter Exploration Portal for Natural Language Processing
地址: http://arxiv.org/abs/2106.10512
作者: Viraj Shah, Shruti Singh, Mayank Singh
摘要: 我们展示了 TweeNLP,这是一个一站式门户,用于组织 Twitter 的自然语言处理 (NLP) 数据并构建可视化和探索平台。它策划了来自各种 NLP 会议和一般 NLP 讨论的 19,395 条推文(截至 2021 年 4 月)。它支持 TweetExplorer 等多种功能,可按主题探索推文、可视化整个会议组织周期中 Twitter 活动的见解、发现流行的研究论文和研究人员。它还建立了会议和研讨会提交截止日期的时间表。我们设想 TweeNLP 通过将与研究论文相关的推文与 NLPExplorer 科学文献搜索引擎集成,作为 NLP 社区的集体记忆单元。当前系统托管在此 http URL 上。
通过联合建模项目和注释者来提高标签质量
原文标题: Improving Label Quality by Jointly Modeling Items and Annotators
地址: http://arxiv.org/abs/2106.10600
作者: Tharindu Cyril Weerasooriya, Alexander G. Ororbia, Christopher M. Homan
摘要: 我们提出了一个完全贝叶斯框架,用于从嘈杂的注释器中学习真实标签。我们的框架通过将标签分布上的生成式贝叶斯软聚类模型分解到经典的 David 和 Skene 联合注释器数据模型中来确保可扩展性。沿着这些方向的早期研究既没有完全合并标签分布,也没有探索仅由注释者或仅通过数据进行的聚类。我们的框架将所有这些属性合并为:(1)一个图模型,旨在提供更好的注释者响应的真实估计作为 emphany 黑盒监督学习算法的输入,以及(2)一个独立的神经模型,其内部结构刻画图模型的许多属性。我们使用这两种模型进行监督学习实验,并将它们与一个基线和最先进模型的性能进行比较。
具有一致性行为的复杂网络的优化控制
原文标题: Optimal control of complex networks with conformity behavior
地址: http://arxiv.org/abs/2106.10607
作者: Zu-Yu Qian, Cheng Yuan, Jie Zhou, Shi-Ming Chen, Sen Nie
摘要: 尽管在识别驱动节点和网络控制所需的能量方面取得了重大进展,但包含更复杂动态的框架仍然具有挑战性。在这里,我们将一致性行为考虑到网络控制中,表明只要外部输入的数量超过临界点,对具有一致性的网络系统的控制就会变得更容易。我们发现这个临界点从根本上是由网络连通性决定的。特别是,我们研究了网络控制中的节点结构特征,并提出了最佳控制策略,以减少控制具有一致性行为的网络系统所需的能量。我们在各种合成和真实网络中检查了这些发现,确认它们在描述网络系统的控制能量方面具有普遍性。我们的结果促进了对实际应用中网络控制的理解。
Apache Spark 中的大规模网络嵌入
原文标题: Large-Scale Network Embedding in Apache Spark
地址: http://arxiv.org/abs/2106.10620
作者: Wenqing Lin
摘要: 网络嵌入已广泛应用于社交推荐和网络分析,例如推荐系统和图异常检测。然而,大多数以前的方法不能有效地处理大图,因为(i)图的计算通常很昂贵,(ii)图的大小或向量的中间结果可能非常大,难以处理一台机器。在本文中,我们提出了一种使用 Apache Spark 在大图上进行网络嵌入的高效且有效的分布式算法,该算法将图递归地划分为几个小尺寸的子图以刻画节点的内部和外部结构信息,然后计算网络嵌入对于并行的每个子图。最后,通过聚合所有子图上的输出,我们以线性成本获得节点的嵌入。之后,我们在各种实验中证明,我们提出的方法能够在几个小时内处理具有数十亿条边的图,并且至少比最先进的方法快 4 倍。此外,它在链路预测和节点分类任务上分别实现了高达 4.25% 和 4.27% 的改进。最后,我们在腾讯的两款网游中部署了推荐算法,应用好友推荐和物品推荐,使竞争对手的运行时间提高了91.11%,相应的评测提高了12.80%指标。
TD-GEN:使用树分解生成图
原文标题: TD-GEN: Graph Generation With Tree Decomposition
地址: http://arxiv.org/abs/2106.10656
作者: Hamed Shirzad, Hossein Hajimirsadeghi, Amir H. Abdi, Greg Mori
摘要: 我们提出了 TD-GEN,一种基于树分解的图生成框架,并引入了图生成所需的最大决策数的减少上限。该框架包括一个置换不变树生成模型,该模型构成了图生成的主干。树节点是超级节点,每个节点代表图中的一组节点。通过遍历树超级节点,尊重树分解的结构,并遵循集群之间的节点共享决策,在集群内部逐步生成图节点和边。最后,我们讨论了基于生成图的统计特性作为性能度量的标准评估标准的缺点。我们建议基于似然比较模型的性能。各种标准图生成数据集的实证结果证明了我们方法的优越性能。
Twitter 和 Facebook 上的双面人:为人类个性分析收集社交多媒体
原文标题: Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia for Human Personality Profiling
地址: http://arxiv.org/abs/2106.10673
作者: Qi Yang, Aleksandr Farseev, Andrey Filchenkov
摘要: 人类的性格特征是我们决策背后的关键驱动因素,每天都会影响我们的人生道路。推断个性特征,例如 Myers-Briggs 个性类型,以及理解个性特征与用户在各种社交媒体平台上的行为之间的依赖关系,对于现代研究和行业应用至关重要。多样化和跨用途的社交媒体途径的出现使得基于跨多种数据模式表示的数据自动有效地执行用户个性分析成为可能。然而,基于多源多模态社交媒体数据进行个性分析的研究相对较少,不同社会网络数据对机器学习性能的影响程度还有待综合评估。此外,研究界没有这样的数据集来进行基准测试。这项研究是弥合如此重要的研究差距的首批尝试之一。具体来说,在这项工作中,我们通过应用一种称为“PERS”的新型多视图融合框架来推断 Myers-Briggs 人格类型指标,并不仅比较跨数据模式的性能结果,还比较不同社会网络数据源的性能结果.我们的实验结果证明了 PERS 通过有效利用来自不同社交多媒体源的显著不同数据来学习多视图数据进行个性分析的能力。我们还发现,在选择社会网络数据源时,机器学习方法的选择至关重要,而且人们倾向于在不同的社交媒体渠道中揭示其个性的多个方面。我们发布的社交多媒体数据集有助于未来对这个方向的研究。
用于测量隔离的整体行为指数 (OBI)
原文标题: Overall Behavioural Index (OBI) For Measuring Segregation
地址: http://arxiv.org/abs/2106.10676
作者: Rahul Goel, Rajesh Sharma, Anto Aasa
摘要: 隔离,定义为两个或多个人口群体之间的分离程度,有助于理解复杂的社会环境,并随后为公共政策干预提供基础。为了衡量隔离,过去的工作经常提出被批评过度简化和过度减少的指标。换句话说,这些指标使用高度聚合的信息来衡量隔离。在本文中,我们提出了三个衡量隔离的新指标,即:(i)个体隔离指数(ISI),(ii)个体倾向指数(III)和(iii)整体行为指数(OBI)。 ISI 指数衡量个体的隔离程度,III 指数报告个体对其他人群的倾向。 OBI 指数同时使用 III 和 ISI 指数计算,是非简化的,不仅可以识别个人的连通性行为,还可以识别群体的连通性行为分布。通过考虑常用的弗里曼分离和同质性指数作为基线指标,我们比较了爱沙尼亚真实通话数据记录(CDR)数据集上的 OBI 指数,以表明所提出的指数的有效性。
动态组测试以控制和监测人群中的疾病进展
原文标题: Dynamic group testing to control and monitor disease progression in a population
地址: http://arxiv.org/abs/2106.10765
作者: Sundara Rajan Srinivasavaradhan, Pavlos Nikolopoulos, Christina Fragouli, Suhas Diggavi
摘要: 在 COVID-19 等大流行的背景下,在大多数人接种疫苗之前,主动检测和干预已被证明是遏制疾病传播的唯一手段。最近的学术工作在这方面提供了重要的证据,但一个关键问题仍然悬而未决:我们能否准确地识别每天发生的所有新感染,而不需要昂贵的代价,即只使用一小部分测试所需的测试每个人每天(完整测试)?组测试提供了一个强大的工具集来最小化测试数量,但它没有考虑感染背后的时间动态。此外,它通常假设人们是独立感染的,而感染是由社区传播控制的。另一方面,流行病学确实通过完善的连续时间 SIR 随机网络模型探索时间动态和社区相关性,但标准模型不包含离散时间测试和干预。在本文中,我们引入了“离散时间 SIR 随机块模型”,该模型还允许每天进行小组测试和干预。我们的模型可以被视为连续时间 SIR 随机网络模型的离散版本,该模型在特定类型的加权图上刻画了底层社区结构。我们分析该模型 w.r.t.每天所需的最少组测试次数,以识别具有消失错误概率的所有感染。我们发现,人们可以利用社区和模型的知识来通知顺序最优的非自适应组测试算法,从而使用更少的测试实现与完整测试相同的性能。
通过多态q投票模型中的淬灭无序促进不连续相变
原文标题: Promoting discontinuous phase transitions by the quenched disorder within the multistate $q$-voter model
地址: http://arxiv.org/abs/2106.11238
作者: Bartłomiej Nowak, Katarzyna Sznajd-Weron
摘要: 我们研究了具有反一致性的 q-voter 模型的广义版本,其中主体可以处于 sgeqslant 2 状态之一。与对应于 s=2 的原始模型一样,一致的 q 主体组可以影响选择的选民(从众),或者他可以采用与他们的值不同的值之一(反从众)。在我们的概括中,我们考虑两种类型的无序:(1)退火,其中选民作为反墨守成规者,概率为 p,互补概率为 1-p所有选民都是永远的反墨守成规的人,其余的都是墨守成规的人。我们通过分析和蒙特卡罗求和在完整图上分析模型。我们表明,与常识相反,具有淬灭随机性的模型可以表达 q>1 的不连续相变,而退火方案仅显示连续相变。
说出他们的名字:乔治·弗洛伊德死后,对警察暴力致死的黑人受害者的集体关注重新抬头
原文标题: Say Their Names: Resurgence in the collective attention toward Black victims of fatal police violence following the death of George Floyd
地址: http://arxiv.org/abs/2106.10281
作者: Henry H. Wu, Ryan J. Gallagher, Thayer Alshaabi, Jane L. Adams, Joshua R. Minot, Michael V. Arnold, Brooke Foucault Welles, Randall Harp, Peter Sheridan Dodds, Christopher M. Danforth
摘要: 2020 年 5 月乔治·弗洛伊德被警察谋杀引发了国际抗议,并重新引起了黑人的命也是命运动的关注。在这里,我们描述了乔治·弗洛伊德 (George Floyd) 死后在线活动的数量和强度无与伦比的方式,包括在 Twitter 上创下活动记录、引发该平台历史上最悲伤的一天以及导致乔治·弗洛伊德 (George Floyd) 的名字出现在最一天中经常使用的短语,他是唯一一个在同一周早些时候不为公众所知的受到这种关注的人。此外,我们发现这种关注超出了乔治·弗洛伊德 (George Floyd) 的范围,而且与黑人生命问题历史上的其他过去时刻相比,在他死后,更多的黑人警察暴力受害者受到了关注。我们通过展示过去 12 年来如何在 Twitter 上取消和纪念警察暴力的黑人受害者的名字,将这种关注置于先前在线种族正义激进主义的背景下。我们的研究结果表明,2020 年对“黑人的命也是命”运动的关注浪潮以前所未有的方式集中在过去的警察暴力事件上,展示了该运动“说出他们的名字”的修辞策略的影响。
使用考虑乘客流动的模型确定航班上 COVID-19 超级传播的缓解策略
原文标题: Identifying Mitigation Strategies for COVID-19 Superspreading on Flights using Models that Account for Passenger Movement
地址: http://arxiv.org/abs/2106.10313
作者: Sirish Namilae, Yuxuan Wu, Anuj Mubayi, Ashok Srinivasan, Matthew Scotch
摘要: 尽管商业航空公司强制要求戴口罩,但仍有多个记录在案的 COVID-19 在航班上传播的事件。我们使用了来自三个航班的可用数据,包括受感染和未受感染乘客的机舱布局和座位位置,以建议采取干预措施以减轻航空旅行期间的 COVID-19 超级传播事件。具体来说,我们研究了:1)伦敦到河内,201名乘客,其中13名乘客继发感染; 2)新加坡至杭州载客321人,其中继发感染12至14人; 3)日本一架私人飞机上的非超级传播事件,有9名乘客,没有继发感染。我们表明,与传统模型相比,纳入乘客流动可以更好地解释感染传播模式。我们还发现,使用 FFP2/N95 口罩可将感染率降低 95-100%,而布口罩仅可降低 40-80%。这表明需要制定更严格的指导方针,以减少与航空相关的 COVID-19 超级传播事件。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在公众号“网络科学研究速递”(netsci)和个人博客进行同步更新。