X

干货|100个免费在线数据科学资源和工具!(上)

点击上方关注,All in AI中国

无论您是刚开始从事数据科学,还是准备攻读数据科学或商业分析硕士学位,都需要学习更多内容。本指南为所有阶段的学习者收集了2018年网络上的顶级数据科学资源。

目录

  • 在线课程和教程
  • 研究
  • 博客
  • 电子书
  • 社区
  • 学位
  • 用R和Python编码
  • 简讯
  • 免费数据科学工具

在线课程和教程

Dataquest - 那些对数据科学家,数据分析师或数据工程师感兴趣的人可以通过交互式编码挑战来学习。学生可以处理问题并接触到真正的数据科学项目。

(https://www.dataquest.io)

Udemy - 被称为世界上最大的在线学习市场,Udemy提供任何主题的数字自定进度课程。他们的数据科学选择涵盖从机器学习到数据可视化到Python编程的所有内容。

(https://www.udemy.com/courses/search/?q=data%20science&src=ukw)

Coursera - Coursera与世界各地的大学和机构合作,提供在线课程。注册人可以访问录制的视频讲座,自动评分和同行评审作业以及社区讨论论坛。

(https://www.coursera.org/browse/data-science)

DataCamp - 对于希望提高技能的初学者和经验丰富的专家来说,这个网站是一个很好的资源。DataCamp拥有与数据科学、统计学和机器学习相关的交互式R和Python课程。

(https://www.datacamp.com)

Udacity - 在数据分析中获得纳米级数据,从而开始数据科学的职业生涯。Udacity通过其课程提供测验、视频和动手实践课程等互动内容。

(https://cn.udacity.com/dand)

EdX - 该网站提供免费的在线数据科学课程,以培养您的技能并提升您的知识。通过edX上的顶尖大学和全球合作伙伴的课程学习数据科学、统计和商业智能。

(https://www.edx.org/course/subject/data-science)

Cognitive Class - 通过练习实验室和视频学习数据科学、人工智能、大数据和区块链的技能。认知课程还为国际用户提供日语、西班牙语和俄语课程。

(https://cognitiveclass.ai)

Springboard - 这个在线Bootcamp涵盖了数据科学过程,从统计学到机器学习和用数据讲故事。您可以专注于机器学习或NLP这样的领域,并通过投资组合研究该计划,以便进行面试。

(https://www.springboard.com/workshops/data-science-career-track?afmc=2h)

Data School(YouTube)- 此YouTube频道属于Kevin Markham,一位位于华盛顿特区的全职数据科学教育工作者。他的视频涵盖了一系列数据科学主题,如使用开源工具,Python和R。

(https://www.youtube.com/user/dataschool/featured)

Siraj Raval(YouTube)- Siraj Raval的YouTube频道提供视频,鼓励和教育开发人员构建人工智能。他创建了引人入胜的视频,教导观众如何使用AI制作游戏、音乐、聊天机器人、艺术等。

(https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A/featured)

IntelliPaat - IntelliPaat教程涵盖大数据、商业智能和数据库等主题。您可以向行业专家学习,并在成功完成课程后获得认证。

(https://intellipaat.com/tutorials/)

Lynda - 通过个人、企业、学术和政府订阅,会员可以观看Lynda在该领域的思想领袖教授的高质量视频课程。您可以选择课程持续时间和技能水平,以满足您的专业需求。

(https://www.lynda.com/search?q=data+science)

Kaggle - Kaggle非常适合想要在众多数据科学专业中脱颖而出的初学者。您可以选择机器学习、pandas、数据可视化、R、SQL或深度学习中的轨道。

(https://www.kaggle.com/learn/overview)

TensorFlow - TensorFlow是一款开源机器学习软件。它的网站包含几个关于如何将该程序用于几个基本用途的深入教程。

(https://www.tensorflow.org/tutorials/estimators/cnn)

数据科学研究

社会福利数据科学- 该网站由芝加哥大学数据科学与公共政策中心管理。它突出了非营利组织、政府组织和社会组织的社会有益数据科学项目。

(https://dssg.uchicago.edu/projects/)

国际数据科学与分析杂志- 该在线期刊欢迎数据科学和高级分析中的实验和理论发现及其实际应用。这是数据科学和分析领域的第一本科学期刊。

(https://link.springer.com/journal/volumesAndIssues/41060)

CODATA数据科学期刊- 该在线期刊是开放获取的,包括有关数据系统描述,实施及其出版物、应用程序等的论文。它特别关注开放数据的原则、政策和实践。

(https://datascience.codata.org)

数据科学基础白皮书- 数据科学基金会提供由基金会成员撰写的白皮书,并可供其他成员进行同行评审。阅读有关该领域思想领袖的最新发现和观点。利用免费的个人会员资格并参与社区活动。

(https://datascience.foundation/sciencewhitepaper)

IMB大数据和分析中心- 这些白皮书遵循行业中大数据的最新趋势。读者可以订阅在收件箱中的新报告和白皮书。

(https://www.ibmbigdatahub.com/whitepapers)

数据科学研究所- 伯克利数据科学研究所的研究员分享了当今主要问题的数据密集型研究成果。该研究所有6个工作组,涉及工作文化和教育等主题。

(https://bids.berkeley.edu/research)

EPSRC博士培训中心- 该网站重点介绍了该中心目前的博士数据科学研究。学院致力于数据科学领域的研究,将理论与应用相结合。

(http://datascience.inf.ed.ac.uk/research/)

数据科学博客

Edwin Chen的博客 – Edwin在麻省理工学院学习数学和语言学,并在Clarium进行量化交易,在Twitter上做广告,在Dropbox进行数据科学,在Google上进行统计/ ML。他的博客提供有关人工智能、人工计算和数据的深刻信息。

(http://blog.echen.me)

DataScience.com

- DataScience.com博客的文章适合数据科学、业务和IT团队。专家们还有机会与成千上万的网站读者分享他们的见解。

(https://www.datascience.com/blog)

数据科学101 - Ryan Swanstrom拥有博士学位。专攻计算科学与统计学,自2012年以来一直在他的博客上发表、分享有关数据科学的资源、新闻和研究。

(http://101.datascience.community)

The Shape of Data - 虽然现在是谷歌的软件工程师,杰西约翰逊开始担任数学教授。他的博客探索并解释了现代数据分析的基本思想。

(https://shapeofdata.wordpress.com/about/)

Planet Big Data - Planet Big Data汇集了有关大数据,Hadoop和相关主题的博客。它涵盖了全球博主的帖子。

(http://planetbigdata.com)

大数据博客- 会议本身介绍了大数据、可操作的见解和展示最佳实践的最新发现。在博客上,您可以找到有关这些主题的文章,这些文章可以节省您的会议之旅。

(http://blog.bigdataweek.com)

Chris Ablon的博客- Chris Ablon是一位数据科学家和政治学家,在统计、人工智能和软件工程方面拥有超过10年的经验。他擅长政治、社会和人道主义工作,并就这些主题分享了数百个笔记。

(https://chrisalbon.com)

纽约数据学院博客- 这个博客有关于R、网络抓取、机器学习和meetup的文章。它还概述了参与培训计划的一些顶级项目。

(https://nycdatascience.com/blog/)

DBMS2-此博客面向对数据库和分析技术感兴趣的人,并提供行业专业人士的评论。其作者Curt Monash已经关注该行业超过30年。

(http://www.dbms2.com)

Data36 - Tomi Mester的博客深入了解了在线数据分析师的最佳实践。您将找到有关数据分析、AB测试、研究和数据科学的文章、在线课程和视频。

(https://data36.com)

操作数据库管理系统- 该站点是大数据、新数据管理技术和数据科学的资源门户。该编辑是法兰克福大学数据库和信息系统教授。

(http://www.odbms.org)

Yanir Seroussi的博客- Yanir Seoussi是一位经验丰富的数据科学家和软件工程师,在编程、计算机科学、机器学习和统计方面拥有丰富的背景。他的博客包括从孤立数据问题到构建生产系统等主题的想法。

(https://yanirseroussi.com)

简单统计- 本博客由三位生物统计学教授撰写:Jeff Leek,Roger Peng和Rafa Irizarry。他们发表意见,为科学/流行写作的讨论做贡献,链接到文章,并与崭露头角的统计学家分享建议。

(https://simplystatistics.org)

什么是大数据?- Gil Press经营自己的咨询业务gPress,提供写作、研究和营销服务。他的博客探讨了大数据对信息技术、商业世界、政府机构和我们生活的影响。

(https://whatsthebigdata.com)

走向数据科学- 这个博客是成千上万人交流思想和扩展我们对数据科学的理解的平台。您可以从不同专业的数据科学家那里阅读各种各样的想法。

(https://towardsdatascience.com)

Alexis Perrier的博客- Alexis Perrier是一名数据科学顾问,帮助大大小小的公司从机器学习中获益。作为一名数据科学讲师,他在博客上分享了他对线性回归等重点知识的深入学习。

(https://alexisperrier.com)

Algobeans - Algobeans由数据科学爱好者,剑桥大学的Annalyn和斯坦福大学的Kenneth创建。他们创建了该网站,以简化的方式让每个人都能访问数据科学。

(https://algobeans.com)

Ben Frederickson的博客- Ben Frederickson是一位位于加拿大温哥华的软件开发人员。他在博客上分享了软件开发和数据科学的项目和发现。

(http://www.benfrederickson.com/blog/)

Daniel Nee的博客- Daniel Nee拥有机器学习和计算机科学的背景,并担任数据科学家。他的博客上有关于他的经验、有用的工具和技术以及其他兴趣的帖子。

(http://danielnee.com)

数据博客- 这个博客整齐地按类别组织其帖子,如技术、自己动手和数据科学。还有一个问答部分,因此您可以询问您可能遇到的任何数据科学问题。

(https://www.data-blogger.com/category/data-science/)

数据挖掘研究- Sandro Saitta在瑞士读博士时开始写这个博客。博客开始讨论数据挖掘的研究问题。现在帖子讨论研究问题,最近的应用,重要的事件,对主要演员的采访,当前的趋势,书评和更多。

(http://www.dataminingblog.com)

Data Double Confirm - Hui Xiang Chua在新加坡担任研究分析师时,她不在博客上分享知识。Data Double Confirm记录了她在数据科学中的学习历程,是数据收集、数据准备、数据可视化和基本统计​​分析的重要资源。

(https://projectosyo.wixsite.com/datadoubleconfirm)

Data Meets Media - 这个独特的博客融合了电视、电影和数据科学。 帖子分别涵盖了两个主题,并找到了所有主题之间的交集。

(http://datameetsmedia.com)

DataAspirant - Saimadhu Polamuri是一位自学成才的数据科学家,数据科学教育家,也是DataAspirant的创始人。 此博客是初学者的数据科学资源。

(https://dataaspirant.com)

数据科学电子书

数据科学家之旅采访超过20位令人惊叹的数据科学家- 当作者Kate Strachnyi想要了解更多关于数据科学的知识时,她直接找到了源头。在一系列20多次采访中,她向领先的数据科学家询问有关该领域的起点和行业未来的问题。

(https://www.amazon.com/Journey-Data-Scientist-Interviews-Scientists/dp/1548984248)

以艰难的方式学习Python - 最新的Python 3更新,这是初学者最终学习如何编码,尽管原始但仍然是最流行的方式。学习Python艰难的方法将你从绝对零到能够阅读和编写基本的Python,然后了解其他关于Python的书籍。

(https://learnpythonthehardway.org)

O'Reilly免费数据科学图书馆-该图书馆汇集了O'Reilly编辑、作者和Strata演讲者在一个地方的最佳数据见解,因此您可以深入了解数据科学和大数据中发生的最新动态。

(https://www.oreilly.com/data/free/)

贝叶斯推理和机器学习- 本书面向具有计算机科学、工程、应用统计学、物理学和生物信息学背景的学生,他们希望获得机器学习知识。作者使用外行人的术语和低水平的代数和微积分来介绍推理的基本概念。

(http://web4.cs.ucl.ac.uk/staff/D.Barber/textbook/091117.pdf)

数据挖掘指南- 这本免费的书采用边做边学的方法来解释基本的数据挖掘技术。数据挖掘指南介绍了实用的数据挖掘、集体智慧和建立推荐系统。

(http://guidetodatamining.com)

可解释的机器学习- 这本在线书籍是关于使机器学习模型及其决策可解释的。它适用于机器学习从业者、数据科学家、统计学家和任何其他有兴趣使机器决策更具人性的人。

(https://christophm.github.io/interpretable-ml-book/)

数据科学手册- 数据科学手册汇集了25位有成就的数据科学家对他们的见解、故事和建议的深入访谈。虽然本书不是数据科学主题的教程,但它为各行各业提供了实用的职业洞察力。

(http://www.thedatasciencehandbook.com)

数据科学的艺术- 本书描述了分析数据的过程。作者开发了管理数据分析师以及进行自己的数据分析的背景。

(https://leanpub.com/artofdatascience)

数据分析手册- 本手册通过访问数据科学行业最前沿的数据科学家、数据分析师、CEO、经理和研究人员,深入了解数据科学行业。

(https://www.teamleada.com/handbook)

Numsense!Layman的数据科学:没有添加数学- 正如标题所暗示的那样,本书为所有背景的人打破了数据科学,省略了数学术语。有抱负的学生,有进取心的商业专业人士或其他渴望学习的人都可以找到教程和易于理解的解释。

(https://www.amazon.com/Numsense-Data-Science-Layman-Added-ebook/dp/B01N29ZEM6)

D3提示和技巧v4.x - 本书包含使用d3.js(第4版)的提示和技巧,d3.js是网络领先的数据可视化工具之一。它旨在让您开始并向迈进。

(https://leanpub.com/d3-t-and-t-v4)

R中的数据挖掘算法- 那些了解编程语言R并希望了解有关数据挖掘的更多信息的人将受益于此WikiBook。了解算法如何工作将有助于增加您对数据挖掘的理解。

(https://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R)

数据挖掘技术:用于营销、销售和客户关系管理,第3版- 学习将数据挖掘用于营销或销售目的。您将获得有关提高直接营销活动响应率,识别新客户群和评估信用风险的建议。

(https://www.wiley.com/en-us/Data+Mining+Techniques%3A+For+Marketing%2C+Sales%2C+and+Customer+Relationship+Management%2C+3rd+Edition-p-9780470650936)

未完待续!