X

数据可视化分析,Python制作新冠疫情世界地图

本文作者:merlin

本文链接:https://www.cnblogs.com/cherish-hao/p/12793525.html

目录

pyecharts模块

简介

Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。

如果想要掌握pyecharts,可以阅读 pyecharts中文文档 ,里面的图表类型和配置项写的非常详细,我就不过多的赘述了

安装pyecharts

安装的命令也非常简单:

pip install pyecharts

安装成功:

测试pyecharts模块

我们可以尝试运行官方文档所给出的几个小例子来测试一下pyecharts模块是否成功安装

打开编辑器,输入并运行以下代码:

from pyecharts.charts import Barfrom pyecharts import options as opts# 内置主题类型可查看 pyecharts.globals.ThemeTypefrom pyecharts.globals import ThemeTypebar = ( Bar(init_opts=opts.InitOpts(theme=ThemeType.LIGHT)) .add_xaxis(["衬衫", "羊毛衫", "雪纺衫", "裤子", "高跟鞋", "袜子"]) .add_yaxis("商家A", [5, 20, 36, 10, 75, 90]) .add_yaxis("商家B", [15, 6, 45, 20, 35, 66]) .set_global_opts(title_opts=opts.TitleOpts(title="主标题", subtitle="副标题")))bar.render() #保存为html文件

若此时在当前目录下生成了一个名为render.html的文件

打开此文件,看到如下的图片则证明安装模块成功

pyecharts实战:绘制新冠肺炎疫情地图

需求分析

想要制作全球疫情的地图(空气质量图,人口分布图也是同理),首先需要的就是每个国家的疫情数据,比如人数,治愈数,增长数...... 那么我们该如何获取到这些信息呢?

请求数据

我们发现很多app和网页上都会有最新的疫情信息公布,我选取的数据来源是腾讯地图。

首先打开 腾讯地图的疫情信息页 ,可以发现疫情的信息展现在这一页中

获取这些信息的方法有很多种,可以使用表达式提取,也可以抓包分析,我更喜欢的一种方法是抓包分析。

右击《检查》,点击《network》选项卡并刷新界面,看到加载出来很多数据包,找到里面最像列表的一个list数据包

此时发现,这个list数据包正式我们要提取的数据列表,里面的每个键值对都代表着相应的数据,提取到这些键值对就可以获取到所有的数据信息了,再次回到headers,选项卡下面对应的网址就是我们即将请求的网址,这里我们需要注意的是,这个网址对应的请求是post而不是我们经常使用的get

向网页请求数据:

import requestsurl = 'https://api.inews.qq.com/newsqa/v1/automation/foreign/country/ranklist'response = requests.post(url).textprint(response)

可以看到这个网页并没有设置反爬虫,可以轻松的获取到数据

提取数据

我们刚刚请求到的数据格式是字符格式,并不能被我们直接提取到,必须先将字符格式的数据转换为字典格式才可以开始下一步的提取

resp = json.loads(response) #使用变量resp来接收字典格式的数据

将变量转化为字典格式后,就要开始提取数据了 提取json类型的数据可以使用取出列表元素的方法来提取,即先遍历列表将每个国家的信息提取出来,再分别从这些条信息中提取到我们想要的数据

提取数据:

import jsonresp = json.loads(response) #使用变量resp来接收字典格式的数据for data in resp['data']: #遍历提取每个国家的疫情数据 name = data['name'] #国家名 confirm = data['confirm'] #该国家疫情人数 print(name,confirm)

打印数据:

处理数据

在得到了国家和人数信息之后,还需要将数据存储到字典中才能传入图表中,这就需要我们手动的转换数据,并储存到字典中

map_version = {} #定义空字典for data in resp['data']: #遍历提取每个国家的疫情数据 name = data['name'] #国家名 confirm = data['confirm'] #该国家疫情人数 map_version[name] = int(confirm) #将国家和人数以键值对的形式传入字典

输出字典:

此时打印出来的字典是标准的字典格式,但是这种格式并不是pyecharts所要求的格式,所以还需要一行代码来进行转换

element = list(map_version.items())

然后就可以输出传入数据的标准格式:

制作可视化地图

在将数据爬取、变换、整理后,所有准备工作都已经做完,下面我们来调用数据实现数据可视化

先写出一个初步的框架来接收内容

from pyecharts.charts import Map,Geomap = Map().add(series_name="世界疫情分布图", #名称 data_pair=element, #传入数据 maptype='world', #地图类型 )map.render('map.html') #命名并保存

运行代码,发现当前文件夹下出现了一个map.html文件,双击运行

看到这个图表之后,发现代码的运行并没有问题,但是数据却没有传到地图中,这是由于pyecharts默认的世界地图中的国家名是英文,所以我们就要传入一个字典来替代掉这些英文

设置可视化地图

生成了地图之后,接下来就是要保证地图的正确性和美观,所以我们要来设置世界地图

地图上显示国家名太多,影响可读性,所以设置为不显示国家名

from pyecharts import optionsmap.set_series_opts(label_opts=options.LabelOpts(is_show=False)) #不显示国家名

按照感染人数的不同,给地图添加不同的颜色

#设置全局配置项map.set_global_opts(visualmap_opts=options.VisualMapOpts(max_=1100000,is_piecewise=True,pieces=[ {"min": 500000}, {"min": 200000, "max": 499999}, {"min": 100000, "max": 199999}, {"min": 50000, "max": 99999}, {"min": 10000, "max": 49999}, {"max": 9999},]))

代表国家首都的圆点不美观,去掉红点:

map = Map().add( is_map_symbol_show=False, #不显示标记 )

设置背景颜色并为网页取名:

map = Map(options.InitOpts(bg_color="#87CEFA",page_title='世界疫情分布')).add()

到了现在所有的配置已经完成,但是图表要想显示数据还需要传入一个字典来替换掉默认的英文名,具体实现请看下面的完整代码。

完整代码

import requestsimport jsonfrom pyecharts.charts import Mapfrom pyecharts import optionsurl = 'https://api.inews.qq.com/newsqa/v1/automation/foreign/country/ranklist'response = requests.post(url).textresp = json.loads(response) #使用变量resp来接收字典格式的数据map_version = {} #定义空字典for data in resp['data']: #遍历提取每个国家的疫情数据 name = data['name'] #国家名 confirm = data['confirm'] #该国家疫情人数 map_version[name] = int(confirm) #将国家和人数以键值对的形式传入字典element = list(map_version.items()) #将字典值调整为可以传入地图的格式name_map = { 'Singapore Rep.': '新加坡', 'Dominican Rep.': '多米尼加', 'Palestine': '巴勒斯坦', 'Bahamas': '巴哈马', 'Timor-Leste': '东帝汶', 'Afghanistan': '阿富汗', 'Guinea-Bissau': '几内亚比绍', "Côte d'Ivoire": '科特迪瓦', 'Siachen Glacier': '锡亚琴冰川', "Br. Indian Ocean Ter.": '英属印度洋领土', 'Angola': '安哥拉', 'Albania': '阿尔巴尼亚', 'United Arab Emirates': '阿联酋', 'Argentina': '阿根廷', 'Armenia': '亚美尼亚', 'French Southern and Antarctic Lands': '法属南半球和南极领地', 'Australia': '澳大利亚', 'Austria': '奥地利', 'Azerbaijan': '阿塞拜疆', 'Burundi': '布隆迪', 'Belgium': '比利时', 'Benin': '贝宁', 'Burkina Faso': '布基纳法索', 'Bangladesh': '孟加拉国', 'Bulgaria': '保加利亚', 'The Bahamas': '巴哈马', 'Bosnia and Herz.': '波斯尼亚和黑塞哥维那', 'Belarus': '白俄罗斯', 'Belize': '伯利兹', 'Bermuda': '百慕大', 'Bolivia': '玻利维亚', 'Brazil': '巴西', 'Brunei': '文莱', 'Bhutan': '不丹', 'Botswana': '博茨瓦纳', 'Central African Rep.': '中非', 'Canada': '加拿大', 'Switzerland': '瑞士', 'Chile': '智利', 'China': '中国', 'Ivory Coast': '象牙海岸', 'Cameroon': '喀麦隆', 'Dem. Rep. Congo': '刚果民主共和国', 'Congo': '刚果', 'Colombia': '哥伦比亚', 'Costa Rica': '哥斯达黎加', 'Cuba': '古巴', 'N. Cyprus': '北塞浦路斯', 'Cyprus': '塞浦路斯', 'Czech Rep.': '捷克', 'Germany': '德国', 'Djibouti': '吉布提', 'Denmark': '丹麦', 'Algeria': '阿尔及利亚', 'Ecuador': '厄瓜多尔', 'Egypt': '埃及', 'Eritrea': '厄立特里亚', 'Spain': '西班牙', 'Estonia': '爱沙尼亚', 'Ethiopia': '埃塞俄比亚', 'Finland': '芬兰', 'Fiji': '斐', 'Falkland Islands': '福克兰群岛', 'France': '法国', 'Gabon': '加蓬', 'United Kingdom': '英国', 'Georgia': '格鲁吉亚', 'Ghana': '加纳', 'Guinea': '几内亚', 'Gambia': '冈比亚', 'Guinea Bissau': '几内亚比绍', 'Eq. Guinea': '赤道几内亚', 'Greece': '希腊', 'Greenland': '格陵兰', 'Guatemala': '危地马拉', 'French Guiana': '法属圭亚那', 'Guyana': '圭亚那', 'Honduras': '洪都拉斯', 'Croatia': '克罗地亚', 'Haiti': '海地', 'Hungary': '匈牙利', 'Indonesia': '印度尼西亚', 'India': '印度', 'Ireland': '爱尔兰', 'Iran': '伊朗', 'Iraq': '伊拉克', 'Iceland': '冰岛', 'Israel': '以色列', 'Italy': '意大利', 'Jamaica': '牙买加', 'Jordan': '约旦', 'Japan': '日本', 'Kazakhstan': '哈萨克斯坦', 'Kenya': '肯尼亚', 'Kyrgyzstan': '吉尔吉斯斯坦', 'Cambodia': '柬埔寨', 'Korea': '韩国', 'Kosovo': '科索沃', 'Kuwait': '科威特', 'Lao PDR': '老挝', 'Lebanon': '黎巴嫩', 'Liberia': '利比里亚', 'Libya': '利比亚', 'Sri Lanka': '斯里兰卡', 'Lesotho': '莱索托', 'Lithuania': '立陶宛', 'Luxembourg': '卢森堡', 'Latvia': '拉脱维亚', 'Morocco': '摩洛哥', 'Moldova': '摩尔多瓦', 'Madagascar': '马达加斯加', 'Mexico': '墨西哥', 'Macedonia': '马其顿', 'Mali': '马里', 'Myanmar': '缅甸', 'Montenegro': '黑山', 'Mongolia': '蒙古', 'Mozambique': '莫桑比克', 'Mauritania': '毛里塔尼亚', 'Malawi': '马拉维', 'Malaysia': '马来西亚', 'Namibia': '纳米比亚', 'New Caledonia': '新喀里多尼亚', 'Niger': '尼日尔', 'Nigeria': '尼日利亚', 'Nicaragua': '尼加拉瓜', 'Netherlands': '荷兰', 'Norway': '挪威', 'Nepal': '尼泊尔', 'New Zealand': '新西兰', 'Oman': '阿曼', 'Pakistan': '巴基斯坦', 'Panama': '巴拿马', 'Peru': '秘鲁', 'Philippines': '菲律宾', 'Papua New Guinea': '巴布亚新几内亚', 'Poland': '波兰', 'Puerto Rico': '波多黎各', 'Dem. Rep. Korea': '朝鲜', 'Portugal': '葡萄牙', 'Paraguay': '巴拉圭', 'Qatar': '卡塔尔', 'Romania': '罗马尼亚', 'Russia': '俄罗斯', 'Rwanda': '卢旺达', 'W. Sahara': '西撒哈拉', 'Saudi Arabia': '沙特阿拉伯', 'Sudan': '苏丹', 'S. Sudan': '南苏丹', 'Senegal': '塞内加尔', 'Solomon Is.': '所罗门群岛', 'Sierra Leone': '塞拉利昂', 'El Salvador': '萨尔瓦多', 'Somaliland': '索马里兰', 'Somalia': '索马里', 'Serbia': '塞尔维亚', 'Suriname': '苏里南', 'Slovakia': '斯洛伐克', 'Slovenia': '斯洛文尼亚', 'Sweden': '瑞典', 'Swaziland': '斯威士兰', 'Syria': '叙利亚', 'Chad': '乍得', 'Togo': '多哥', 'Thailand': '泰国', 'Tajikistan': '塔吉克斯坦', 'Turkmenistan': '土库曼斯坦', 'East Timor': '东帝汶', 'Trinidad and Tobago': '特里尼达和多巴哥', 'Tunisia': '突尼斯', 'Turkey': '土耳其', 'Tanzania': '坦桑尼亚', 'Uganda': '乌干达', 'Ukraine': '乌克兰', 'Uruguay': '乌拉圭', 'United States': '美国', 'Uzbekistan': '乌兹别克斯坦', 'Venezuela': '委内瑞拉', 'Vietnam': '越南', 'Vanuatu': '瓦努阿图', 'West Bank': '西岸', 'Yemen': '也门', 'South Africa': '南非', 'Zambia': '赞比亚', 'Zimbabwe': '津巴布韦', 'Comoros': '科摩罗'}map = Map(options.InitOpts(bg_color="#87CEFA",page_title='世界疫情分布')).\ add(series_name="世界疫情分布图", #名称 data_pair=element, #传入数据 is_map_symbol_show=False, #不显示标记 maptype='world', #地图类型 name_map=name_map, )#设置全局配置项map.set_global_opts(visualmap_opts=options.VisualMapOpts(max_=1100000,is_piecewise=True,pieces=[ {"min": 500000}, {"min": 200000, "max": 499999}, {"min": 100000, "max": 199999}, {"min": 50000, "max": 99999}, {"min": 10000, "max": 49999}, {"max": 9999},]))#设置系列配置项map.set_series_opts(label_opts=options.LabelOpts(is_show=False)) #不显示国家名map.render('map.html') #命名并保存

实现结果

这个结果可以动态的显示在网页中,可以根据人数来筛选地图的板块,而且方便缩放