大家好,最近分享了一些关于数据分析可视化相关的内容,其实在数据分析过程中,基本就是数据采集与处理,再通过描述性分析来探索数据,最后建模预测,而在数据探索部分这一环节你会通过各种图表来对数据进行描述,找到数据的趋势为后续建模做准备,这也是一份数据分析报告中较为吸引眼球的一部分,如果图表做的简陋或不明确,那么自然就没有往下读的兴趣。


于是就诞生了这个专题怎样绘制漂亮的统计图表』,我们将在公众号『早起python』与可乐的数据分析之路』中发布每期的数据,感兴趣的读者可以下载数据,使用任何你想用的编程语言:Python、Echarts、Matlab、R、SPSS、EXCEL、bootstrap等(当然,以Python为主)进行数据可视化,最后将你绘制的图表发送至公众号后台,在下一期的推送中我会挑出部分作品进行讲解。通过这种形式,我想我们是真的在学习Python,学习数据分析可视化,而不是读完一篇文章后放入收藏夹冷藏。也希望我们能够真正输出一点有价值的内容本文为第一期,简单说一下我对漂亮的图表的理解,那就是要满足正确+充分+美化所谓正确,就是你能为你要描述的数据选择恰当的图表,比如对于离散型变量就需要选择饼图、柱状图等,对于连续性变量就可以画折线图、密度分布图、箱线图等,对于时间序列数据就需要绘制时序图,如果都不能选择正确的图再高大上的绘图方式都是没有意义的。
所谓充分,就是你的图能够尽可能多的传递信息,比如在前天的文章中我们比较数据分析师与算法工程师的薪资水平,如果我们这样画

选择密度曲线来描述确实没有错,但是除了能看到几个峰值得到这两个岗位的薪资挺高的嘛之外并不能传递更多信息,还是同样的数据,如果这么画

你看,将两个岗位的薪资分布区分开,是不是立刻就能得到更多的信息,算法工程师的薪资明显高于数据分析师。接下来就到了我说的美观,这个密度曲线确实做出来了但是整个图的右边太空洞,x轴最大值达到了400000!整体不够协调,所以我们美化一下,再把两个岗位的均值线添加进去

是不是立刻就舒服了很多,我瞅这个图我就快乐。但是美观有点因人而异,不过至少要满足:简洁明了、配色协调,大小合适,这些我们会在之后慢慢讲。

最后说一下下期数据集获取方式:在早起python公众号内回复【数据集1】然后根据数据进行绘图,最后将你的图表截图发送至微信后台即可。
下一期我们会对部分提交的作品进行点评,还请感兴趣的读者大胆参与提交,我们将在这个专题下对所有常见的统计图表进行讲解,全程参与的读者会有赠书哦~


©著作权归作者所有:来自51CTO博客作者mb5fe18e32e4691的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 不能再简单了|手把手教你爬取美国疫情实时数据
  2. 数据分析师还是算法工程师|用数据多角度解读如何选择
  3. 使用Python进行数据降维|线性降维
  4. 快速提高Python数据分析速度的八个技巧
  5. python数据分析——如何用python连接远程数据库
  6. 更高级的数据可视化,使用pyecharts制作精美图表
  7. 技术解析:如何获取全球疫情历史数据并处理
  8. 疫情数据哪里找,看这篇就够了
  9. python数据分析万字干货!一个数据集全方位解读pandas

随机推荐

  1. 触发具有相同类的另一个对象以使用计时器
  2. 关于制作EPG界面的光标聚焦问题(我制作的
  3. Jquery 传json格式数据到后台,后台反序列
  4. 在asp.net中使用JavaScript的下拉菜单[复
  5. jqueryui autocomplete 插件 点击 显示选
  6. ajax回调json数组对象,jquery中$.each()循
  7. 获取背景图像的最终大小
  8. 推荐一款好用的jquery弹出层插件——wbox
  9. 更改粘性标题航点或偏移的位置。
  10. jquery 如何获取json指定键为指定值的另