手机位置数据揭示了社交距离对COVID-19流行病传播的影响和地理变化
原文标题: Mobile phone location data reveal the effect and geographic variation of social distancing on the spread of the COVID-19 epidemic
地址: http://arxiv.org/abs/2004.11430
作者: Song Gao, Jinmeng Rao, Yuhao Kang, Yunlei Liang, Jake Kruse, Doerte Doepfer, Ajay K. Sethi, Juan Francisco Mandujano Reyes, Jonathan Patz, Brian S. Yandell
摘要: SARS-CoV-2冠状病毒感染性疾病(COVID-19)已成为大流行病。社会(身体)距离疏远是降低SARS-COV-2传播率的关键非药物控制措施,但需要高度的依从性。使用由Descartes Labs和SafeGraph提供的大规模匿名移动电话位置数据得出的每日旅行距离和在家停留时间,我们可以量化在美国遵循社交疏散指令的程度及其对COVID-19增长的影响。COVID-19的增长速度与行进距离的衰减率和原点复归时间的相关性分别为-0.586(95%CI:-0.742〜-0.370)和0.526(95%CI:0.293〜0.700)。实施社会疏散命令后,各州总病例的倍增时间增加范围从1.04〜6.86天到3.66〜30.29天,与流行病机理预测模型一致。遵循社会疏远指令可以减少COVID-19的传播。
美国州长和内阁长官之间Twitter叙述的COVID-19动态主题建模
原文标题: Dynamic topic modeling of the COVID-19 Twitter narrative among U.S. governors and cabinet executives
地址: http://arxiv.org/abs/2004.11692
作者: Hao Sha, Mohammad Al Hasan, George Mohler, P. Jeffrey Brantingham
摘要: 联邦和州级决策的结合已经决定了美国对COVID-19的反应。在本文中,我们通过将动态主题模型应用于美国州长和总统内阁成员与COVID-19相关的推文,来分析有关此决策的Twitter叙述。我们使用网络霍克斯二项式主题模型来跟踪围绕风险、测试和治疗的不断发展的子主题。我们还使用从网络霍克斯过程中推断出的格兰杰因果关系在政府官员中构建影响力网络。
调查高速公路追尾事故发生率与宏观反应时间之间的关系
原文标题: Investigating the Relationship between Freeway Rear-end Crash Rates and Macroscopically Modelled Reaction Time
地址: http://arxiv.org/abs/2004.11422
作者: Ishtiak Ahmed, Billy Williams, M. Shoaib Samandar, Gyounghoon Chun
摘要: 这项研究探索了一种假设,即基于宏观的Gazis,Herman和Rothery(GHR)模型,通过分析得出的渐近稳定所需驾驶员反应时间的估计值可以作为交通流量对后方行驶影响的有效指标。崩溃。如果单独的GHR模型不连续地适用于未拥塞和拥塞的方案,则还可以估计两种方案之间所需反应时间的局部下降。这项研究评估了高速公路追尾事故率与驾驶员反应时间下降之间的关系。一年中收集的来自28个传感器的交通数据用于校准两制度GHR模型。传感器位置周围部分的后端崩溃率是使用四年来已归档的崩溃数据估算的。在拥挤状态的密度-断裂点,后端碰撞率与反应时间下降呈强正相关。线性表格模型在R平方,标准误差和均方差方面提供了最佳拟合。这些结果激发了后续研究,将宏观得出的反应时间纳入道路安全规划。更广泛地说,该研究表明了不连续宏观交通模型的有用应用。
标签战争:让新标签成为趋势以取代社交媒体中的关键主题
原文标题: War of the Hashtags: Trending New Hashtags to Override Critical Topics in Social Media
地址: http://arxiv.org/abs/2004.11451
作者: Debashmita Poddar
摘要: 话题标签在社交媒体上的主题分类中起着主要作用。代表特定主题的某些主题标签的使用突然激增,引起了热门话题。热门话题可能会非常有用,因为它可以引发有关特定主题的讨论。但是,它也可以用来抑制正在进行的关键事项。本文讨论了如何通过引发当前的热门话题来掩盖重大的经济危机。在过去两个月中,对印度政治案例进行了研究。分析表明,通货膨胀问题是如何通过对媒体实施新的宪法来解决的。用于讨论主题的主题标签受到了仔细审查,我们注意到较新主题的急剧上升,并且与上一期通货膨胀问题的讨论最终减少了。可以采用平衡标签对社交媒体的影响的方法。但是,这同样具有挑战性,因为应该将表示小时主题需要的一些标签更加重视,并且评估此类问题可能很困难。
在多语言社会网络上表征用户内容
原文标题: Characterising User Content on a Multi-lingual Social Network
地址: http://arxiv.org/abs/2004.11480
作者: Pushkal Agarwal, Kiran Garimella, Sagar Joglekar, Nishanth Sastry, Gareth Tyson
摘要: 社交媒体一直是21世纪政治信息传播的先锋。大多数研究虚假信息,政治影响力和虚假新闻的研究都集中在主流社交媒体平台上。这不可避免地使英语成为我们目前对社交媒体上政治活动的理解的重要因素。结果,对世界大部分地区的研究很少,其中包括最大的,使用多种语言和多种文化的民主国家:印度。在本文中,我们介绍了在印度称为ShareChat的多语言社会网络的特征。我们在2019年印度大选之前和期间的72周内收集了14种语言的详尽数据集。我们通过将视觉相似的图像聚集在一起,并研究它们如何跨越语言障碍来研究跨语言动态。我们发现泰卢固语,马拉雅拉姆语,泰米尔语和卡纳达语语言在征求政治图像(通常称为模因)中占主导地位,而印地语的帖子在ShareChat中的跨语言传播最大(以及包含英文文本的图像) 。对于包含跨越语言障碍的文本的图像,我们看到语言翻译被用来扩大可访问性。就是说,我们发现相同图像与非常不同的文本(因此含义)相关联的情况。这种最初的特征为更高级的渠道理解多语言和非文本环境中的假冒和政治内容的发展铺平了道路。
Chronnet:用于时空数据分析的基于网络的模型
原文标题: Chronnet: a network-based model for spatiotemporal data analysis
地址: http://arxiv.org/abs/2004.11483
作者: Leonardo N. Ferreira, Didier A. Vega-Oliveros, Moshe Cotacallapa, Manoel F. Cardoso, Marcos G. Quiles, Liang Zhao, Elbert E. N. Macau
摘要: 近年来,来自不同领域的时空数据集的数量和规模一直在迅速增长,这要求开发强大,快速的方法来分析和提取它们的信息。在本文中,我们提出了一种基于网络的时空数据分析模型,称为chronnet。它包括将几何空间划分为网格,这些网格由按时间顺序连接的节点表示。该模型的主要目标是表示网络中具有强链接的单元之间的连续重复事件。这种表示允许使用网络科学和图挖掘工具从时空数据中提取信息。 chronnet的构建过程很快,因此适用于大型数据集。在本文中,我们描述了如何在考虑人工和真实数据的情况下使用我们的模型。为此,我们提出了一个人为的时空数据集生成器,以显示计时器不仅捕获简单的统计信息,而且捕获频繁的模式,空间变化,离群值和时空集群。此外,我们分析了由全球火灾探测组成的真实数据集,其中我们使用单个计时器描述了火灾事件的发生频率,离群火灾探测和季节性活动。
协同移动众包系统的最佳团队招募策略
原文标题: Optimal Team Recruitment Strategies for Collaborative Mobile Crowdsourcing Systems
地址: http://arxiv.org/abs/2004.11512
作者: Aymen Hamrouni, Hakim Ghazzai, Turki Alelyani, Yehia Massoud
摘要: 移动设备的广泛普及使得一种称为移动众包(MCS)的创新创新范式得以实现,其概念是允许个体(例如个人或地方政府)等实体聘请工人从联网人群中寻求帮助,以执行任务或服务。一些复杂的任务需要多个工作人员的协作才能确保成功完成。在这种情况下,任务请求者需要雇用一组社交联系和协作的工人,这些工人同时具有足够的技能来完成任务。在本文中,我们为协作MCS框架开发了两种招聘策略,其中,虚拟团队根据四个不同的标准组成:专业水平,社交关系强度,招聘成本和招聘者的信任度。首先提出的策略是一种基于平台的方法,该方法利用平台知识来组成团队。第二种是基于领导者的方法,该方法使用团队成员关于其社会网络(SN)邻居的知识来指定招募其合适团队的团队领导者。两种方法都被建模为整数线性程序,从而形成了最佳的团队组成。实验结果表明,当改变成员的SN边度时,这两个虚拟团队分组策略之间的性能折衷。与基于领导者的策略相比,基于平台的策略招募了一支技能更高的团队,但SN关系较低且成本较高。
利用公司间的影响传播高效能源技术:基于主体的模型
原文标题: Leveraging inter-firm influence in the diffusion of energy efficiency technologies: An agent-based model
地址: http://arxiv.org/abs/2004.11536
作者: Yingying Shi, Yongchao Zeng, Jean Engo, Botang Han, Yang Li, Ralph T Muehleisen
摘要: 能源效率技术(EET)对于节省能源和减少二氧化碳排放至关重要。但是,EET在中小企业中的扩散相当缓慢。文献表明,创新采用者和潜在采用者之间的相互作用对创新扩散具有重大影响。企业缺乏共享信息的动力,而EET通常缺乏可观察性,从而抑制了企业间的影响。因此,一个信息平台,加上鼓励或强迫企业披露与EET相关的信息的适当政策,应有助于利用公司间的影响力来加速EET的扩散。为了探讨这种信息平台是否以及如何影响中小企业中的EET扩散,本研究建立了一个基于主体的模型来模拟EET扩散过程。在一系列受控数值实验的基础上,发现并解释了一些反直觉的现象。结果表明,该信息平台是一把双刃剑,可以显著地促进EET的扩散约47%,但也可以促进负面信息传播甚至更快,并延迟EET的大规模采用。增加网络密度和公司间影响的强度可以有效地加速EET的扩散,但是当达到某些临界值(分别为0.05和0.15)后,它们的影响会急剧减小,并最终损害系统的稳定性。因此,调查结果表明,EET供应商应谨慎推出其有前途但不成熟的产品。可以降低企业感知风险的政策以及维护信息量大而不是判断力强的信息平台的政策可以显著缓解信息流动性高带来的负面影响。
模拟和评估无基座自行车共享系统的平衡策略
原文标题: Simulating and Evaluating Rebalancing Strategies for Dockless Bike-Sharing Systems
地址: http://arxiv.org/abs/2004.11565
作者: Damian Barabonkov, Samantha D’Alonzo, Joseph Pierre, Daniel Kondor, Xiaohu Zhang, Mai Anh Tien
摘要: 随着基于码头的自行车共享系统作为一种环保型城市交通解决方案的发展,无码头系统正在为市场带来革命性,从而为用户提供了更大的灵活性。自行车重新分配是改善服务的一种常用方法,并且存在广泛的研究,其中考虑了基于坞站的系统的静态和动态重新平衡策略。我们通过从行程起点和终点位置频率定义抽象站点来解决无船坞问题。本文提供了一个优化的混合整数程序框架,以对无坞站系统的各种自行车重新定位策略的效果进行建模。自2017年9月起,我们将处理30天的新加坡无轮毂自行车数据,以提取行程。通过将混合整数程序与根据处理后的数据构建的需求模型配对,我们揭示了机队规模,需求损失和适合所采用的重新定位策略的重新定位幅度之间的趋势。我们还表明,增加重新定位的潜力并不总是可以提高服务性能。
社交互动还是业务交易?客户评论对Airbnb市场的披露
原文标题: Social Interactions or Business Transactions? What customer reviews disclose about Airbnb marketplace
地址: http://arxiv.org/abs/2004.11604
作者: Giovanni Quattrone, Antonino Nocera, Licia Capra, Daniele Quercia
摘要: Airbnb是共享经济市场最成功的例子之一。随着全球市场的迅速普及,了解其吸引力和不断发展的增长机会对于计划业务决策至关重要。例如,关于共享住宿的经济宣言最初是否表明,Airbnb是否是一种促进主人与客人之间的社交交流的好客服务,或者它是否(或正在演变为)一个纯粹的商业交易平台,一直在争论中,酒店传统上运作的方式。为了回答这些问题,我们提出了一种利用客户评论的新颖的市场分析方法。该方法的关键是一种将主题分析和机器学习相结合的方法,以归纳方式开发出用于评论客人的自定义词典。然后,基于此词典,我们对在6个不同城市中收集到的320万条评论进行定量语言分析,并说明了如何在时间,主题,用户和空间粒度等精细级别上回答各种市场研究问题,例如(i)这些年来,业务与社会二分法的发展趋势;(ii)这些顶级类别中的确切词语正在演变;(iii)这些趋势在不同的用户群之间是否变化;以及(iv)在不同的社区中。
通过突出ExTrA的专家来提高建议的多样性
原文标题: Improving Recommendation Diversity by Highlighting the ExTrA Fabricated Experts
地址: http://arxiv.org/abs/2004.11662
作者: Ya-Hui An, Qiang Dong, Quan Yuan, Chao Wang
摘要: 如今,推荐系统(RSes)对个人用户和企业营销越来越重要,尤其是在在线电子商务场景中。但是,尽管文献中提出的大多数推荐算法都将精力集中在提高预测准确性上,但是推荐质量的其他重要方面(例如,推荐的多样性)或多或少被忽略了。在最近的十年中,推荐多样性已经引起了更多的研究关注,尤其是在基于用户项双向网络的模型中。在本文中,我们介绍了一种从RSes用户中提取伪造专家的方法,称为专家跟踪方法(简称ExTrA),并通过在建议书中突出显示这些伪造专家改善推荐多样性的能力。众所周知的基于二方网络的方法,称为质量扩散(简称MD)模型。在推荐准确性和多样性方面,将这些基于ExTrA的模型与两个最新的MD改进的HHP和BHC模型进行了比较。在三个真实世界数据集MovieLens,Netflix和RYM上的综合经验结果表明,我们提出的基于ExTrA的模型可以实现显著的多样性增益,同时保持可比较水平的推荐准确性。
在复杂的连续流交叉口评估行人和自行车的处理方式
原文标题: Assessing Pedestrian and Bicycle Treatments at Complex Continuous Flow Intersections
地址: http://arxiv.org/abs/2004.11683
作者: Ishtiak Ahmed, Shannon Warchol, Chris Cunningham, Nagui Rouphail
摘要: 这项研究评估了连续流交叉路口(CFI)上人行自行车交叉口替代方案的性能。此外,还对CFI交叉类型与设计为提供等效体积/容量比的标准交叉口进行了比较。测试了三个CFI交叉口替代方案,即传统,偏移和中块交叉口。通过合并两种自行车路径类型和两种右转控制类型,总共生成了12种替代方案。在停止延迟和停止次数的基础上,通过微观仿真对这些情况进行了分析。仿真结果表明,对于所有用户类别(包括机动交通),Offset Crossing替代方案的停车延迟最少。对于大多数路线类型,传统交叉路口产生的停靠站数量最少。根据交叉点的特定原点-目的地模式,可以将“中间街区”交叉视为“偏移”或“传统”交叉的补充。在大多数情况下,专用自行车道的性能要优于共享自行车道。与等效的标准交叉路口相比,汇总结果显示,所有CFI交叉路口类型在停车延误方面都有显著改善,但对于大多数调查的路线,标准交叉路口的停车点数量均相同或更少。关于对车辆运动的影响,主要交叉口的容积通行率是通过偏移量交叉口产生的。未来的研究包括结合行人自行车的安全性,舒适性以及这些交叉口替代方案对其他车辆性能指标的相对影响。
TeleCrowd:创建非正式到正式文本语料库的众包方法
原文标题: TeleCrowd: A Crowdsourcing Approach to Create Informal to Formal Text Corpora
地址: http://arxiv.org/abs/2004.11771
作者: Vahid Masoumi, Mostafa Salehi, Hadi Veisi, Golnoush Haddadian, Vahid Ranjbar, Mahsa Sahebdel
摘要: 众包最近已被广泛用作传统注解的替代方法,后者成本高昂,通常由专家来完成。但是,众包任务本身并不有趣,因此,将任务与博弈相结合将增加参与者的动力和参与度。在本文中,我们提出了一个基于Telegram Messenger的博弈化众包平台,称为TeleCrowd,以其社会力量作为完成众包项目的基础平台和促进者。此外,为了评估所提议平台的性能,我们运行了一个实验性众包项目,该项目由500个非正式的波斯语句子组成,参与者应提供与句子形式相当的候选词,或者通过对其进行投票或否决来使其他候选者合格。在这项研究中,参与者提交了2700个候选人和21000票,并使用具有最高分数,其赞成和反对的总和的候选人作为平行数据集,建立了最佳候选人。作为评估,在收集的数据集上BLEU得分为0.54,这表明我们提出的平台可用于创建大型语料库。而且,与其他相关工作相比,该平台在时间段和成本价格方面非常高效,因为该项目的整个工期为28天,成本为40美元。
基于移动云的电子健康计划
原文标题: A Mobile Cloud-Based eHealth Scheme
地址: http://arxiv.org/abs/2004.11842
作者: Yihe Liu, Aaqif Afzaal Abbasi, Atefeh Aghaei, Almas Abbasi, Amir Mosavi, Shahab Shamshirband, Mohammed A. A. Al-qaness
摘要: 移动云计算是一个新兴领域,正在迅速地跨界普及。同样,健康信息学领域也被认为是极其重要的领域。这项工作观察了这两个领域之间的协作,以解决传统的从跟踪报告中提取心电图信号然后进行分析的问题。开发的系统具有两个前端,第一个专用于用户执行跟踪报告的拍照。拍摄完成后,将使用移动计算来提取信号。提取信号后,将其上传到服务器,并对云中的信号进行进一步分析。完成此操作后,旨在供医生使用的第二个界面可以从云下载并查看跟踪。使用基于密码的身份验证方法安全地保存数据。此处介绍的系统是交付整体解决方案的首批尝试之一,在进一步升级后,将有可能在商业环境中部署该系统。
同配约束随机块模型
原文标题: Assortative-Constrained Stochastic Block Models
地址: http://arxiv.org/abs/2004.11890
作者: Daniel Gribel, Thibaut Vidal, Michel Gendreau
摘要: 随机块模型(SBM)通常用于查找网络中的分类社区结构,以使社区内部建立联系的可能性高于社区之间的联系。但是,经典的SBM不限于分类结构。在这项研究中,我们讨论了这种固有的对分类或不分类的漠不关心的含义,并表明此特征可能导致预先分类但包含较少信息的网络导致不良结果。为了规避此问题,我们引入了强约束同配约束的约束SBM,以及解决该问题的有效算法。这些限制大大提高了在接近信息论阈值的情况下的社区恢复能力。他们还允许在代表大脑皮层活动区域的网络中识别结构不同的社区。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在公众号“网络科学研究速递”和个人博客进行同步更新。