2020年09月09日

分类: 记录

这份GitHub 2.3k星的ML论文清单拿好，工作用得上

鱼羊发自凹非寺
量子位报道 | 公众号 QbitAI

工欲善其事，必先利其器。

在工作中动手实施自己的ML项目之前，了解领域里的前沿进展，吸收前人的经验，是很有必要的。

不过，现在arXiv上每天都有成百篇新论文冒头，哪些值得看？

为此，亚马逊工程师Eugene Yan等人打造了一个论文合集，在这个GitHub项目中，持续共享Google、亚马逊、Facebook等等大公司在数据科学和机器学习方面的论文和博客文章。

这些论文/文章涵盖24种不同分类，从搜索排名到NLP、CV，都能在这里找到：

数据质量

数据工程

数据挖掘

分类

回归

推荐算法

搜索排名

嵌入

自然语言处理

序列建模

预测

计算机视觉

强化学习

异常检测

图形

优化

信息提取

弱监督

生成

效率

验证和A/B测试

伦理道德

实践

失败

目前标星2.3k。

以推荐算法为例。

对于不同的行业，业务差别很大。即使算法基础框架大同小异，想要训练出精准的推荐模型，细节上还是有许多不同之处。

而这份清单，收集了电商、视频、音乐、课程种种不同业务的推荐算法技术博客/论文。

比如阿里的《Behavior Sequence Transformer for E-commerce Recommendation in Alibaba》。

论文介绍了行为序列Transformer在阿里电子商务推荐系统中的应用。

研究人员提出，利用Transformer模型来捕捉用户行为序列背后的顺序信号，以增强个性化推荐的有效性，提升点击量。经过实验验证后，他们将该模型部署在了淘宝线上，证明与基线相比，该方法能显著提高在线点击率。

论文链接：
https://arxiv.org/abs/1905.06874

在视频个性化推荐方面，YouTube、网飞、TikTok的技术方案都有收录。

比如YouTube这篇引用次数达到1039次的《Deep Neural Networks for YouTube Recommendations》。

论文重点介绍了深度学习给YouTube推荐系统带来的巨大性能提升。首先，研究人员详细介绍了深度候选征程模型和深度排名模型。而后，研究人员还在论文中分享了从设计、迭代到维护一个拥有海量用户的大规模推荐系统这个过程中，获得的实践经验和启示。

论文地址：
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf

另外，比较有趣的是，这份论文/文章列表还收录了一些失败的经验。

比如Google Photos在给照片打标签时，曾经严重翻车：把黑人标记成了“大猩猩”。

最近大火的GPT-3，则没有解决前代GPT-2的“偏见”问题，在生成的文字中，总是将穆斯林和暴力、死亡联系在一起。

关于作者

这一项目的主要维护者，是亚马逊应用科学家Eugene Yan。

他本科毕业于新加坡管理大学，专业是心理学和人力资源管理，后于佐治亚理工学院获计算机科学硕士学位。

现在的主要工作是利用消费者数据，构建机器学习系统以提升用户体验。

传送门

项目地址：
https://github.com/eugeneyan/applied-ml

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

新冠疫情驱动的转型加速物联网普及应用

若美联储真的开启宽松周期市场将会走向何方？

外盘头条：瑞信暴跌全球风险资产哀鸿遍野油价跌至15个月低点美债市场流动性恶化高盛下调美国GDP预期
全球财经媒体昨夜今晨共同关注的头条新闻主要有：全球风险资产哀鸿遍野瑞信暴跌开始向瑞士央行求救美国地区性银行倒闭掀起的风暴过去才不到几天，瑞信带来的新一轮动荡又引得全球市场风声鹤唳。瑞信股价暴跌30%点燃了金融股的抛售狂潮，就连摩根大通、富国银行、花旗集团等银行巨头也未能幸免。标普500指数超过90...
交易员持续押注日本央行将调整政策十年期日债收益率再度突破0.5%
智通财经APP获悉，在全球债券遭遇抛售、以及交易员权衡日本央行新任行长提名人选植田和男(KazuoUeda)即将到来的发言之际，日本十年期国债收益率连续两天突破0.5%的目标区间上限。数据显示，日本十年期国债收益率上升0.5个基点，至0.505%。与此同时，日本央行宣布了一项计划外的债券购买操作，以遏制该收益率的涨势。日...
日本央行连续第四天额外购债国债收益率仍处高位
智通财经APP获悉，周三，日本央行连续第四天进行了计划外的债券购买，试图重申其对超宽松货币政策的承诺。日本央行此前决定将10年期国债收益率上限提高一倍，意在改善市场运作，但此举刺激了更多关于它将进一步提高上限或完全取消上限的赌注，从而引发了市场对国债的抛售，预计未来日本央行将进行更多的债券购买，并有可能...
热议的“蓝色大潮”没来债市的“大空头情形”落空
原以为美国大选会为美国国债下跌铺平道路，没想到，依然胶着的选情带来了相反的效果。美国国债携手美元和其他多数主要国债上涨，因为截至目前，计票结果动摇了对大量发债、刺激经济的押注。美国10年期国债收益率一度下跌近14个基点，至0.76%，为七个月来最大单日跌幅，因特朗普的宣称胜选加剧了人们选举结果争议的担忧...
给一条鱼做整形手术的亚洲富人
"龙鱼"有着世界上最贵观赏鱼的称号OREHUIYINGFORTHENEWYORKTIM 新加坡首屈一指的亚洲龙鱼整形医生尤金·黄(EugeneNg)，用他短粗的手指指向了一条全身披着大片亮闪闪的金色鳞片的鱼，"那条鱼的眼睛看起来有点耷拉下来。"尤金·黄说。几分钟后，这条鱼被打晕了，做了个眼睛提拉术。这种手术在尤金·黄的工作中已经是家常便饭...