王者荣耀英雄分析之统计分析,聚类分析
在了解了如何绘制饼图和雷达图之后,我们就可以正式的对王者荣耀数据进行分析了。 首先来看看这个数据集吧 包含的内容还是挺多的,有69个英雄,还有他们的一些属性。因为我不会玩王者荣耀,所以对这些信息也不是很了解,接下来有可能分析的不到位,还请大家多多包涵。 我还是选择的使用python来分析,因为简单嘛,然后平台的话还是选择aistudio真的很好用,强烈推荐,一些使用方法可以查看我之前写的博客。 链接:https://blog.csdn.net/weixin_46570668/article/details/115438389.
关联性分析
首先当然是关联性分析,先配置好字体,导入我们需要的包
import pandas as pd
import numpy as np
from matplotlib import pyplot
from matplotlib import font_manager
font = font_manager.FontProperties(fname='font/simhei.ttf')
plt.rcParams['axes.unicode_minus']=False # 用来正常显示负号
# 用热力图呈现 features_mean 字段之间的相关性
corr = data[features].corr()
plt.figure(figsize=(14,14))
# annot=True 显示每个方格的数据
sns.heatmap(corr, annot=True)
plt.xticks(range(0, 18),fontproperties=font)
plt.yticks(range(0, 18),fontproperties=font)
plt.show()
统计分析
首先我们来统计一下主要定位
dd=data1[u'主要定位'].value_counts()
# 生成画布
plt.figure(figsize=(10, 6), dpi=80)
labels =list(dd.index)
sizes = list(dd)
explode = [0.05,0.05,0.05,0.05,0.05,0.05]
plt.pie(sizes, explode=explode, labels=labels, autopct='%1.1f%%', shadow=False, startangle=-45, textprops={
'fontproperties':font})
plt.title("主要定位统计分析", fontproperties=font)
plt.legend(loc='right', bbox_to_anchor=[0.75, 0.4, 0.5, 0.5], prop=font)
plt.show()
接着我们来统计一下攻击范围
dd=data1[u'攻击范围'].value_counts()
# 生成画布
plt.figure(figsize=(10, 6), dpi=80)
labels =list(dd.index)
sizes = list(dd)
explode = [0.05,0.05]
plt.pie(sizes, explode=explode, labels=labels, autopct='%1.1f%%', shadow=False, startangle=-45, textprops={
'fontproperties':font})
plt.title("攻击范围统计分析", fontproperties=font)
plt.legend(loc='right', bbox_to_anchor=[0.75, 0.4, 0.5, 0.5], prop=font)
plt.show()
以此类推,大家想统计什么只需要修改一下这句话的参数就可以了 dd=data1[u’攻击范围’].value_counts()
接下来我们查看一下前三的最大生命
ddg=data1[['英雄','最大生命','最大法力','最高物攻','最大物防','最大每5秒回血','最大每5秒回蓝','最大攻速','主要定位']].sort_values(by='最大生命',ascending=False)
ddg[:3]
分别把他们画在雷达图上面
s=