本文2200字建议阅读8分钟。
本文将介绍实现数据可视化的软件包
这学期(2018学年春季学期)我教授了一门关于数据可视化的数据科学硕士课程。我们的数据科学硕士项目是┅个为期15个月的强化项目这个项目已经成功地培养了许多优秀的数据科学家。
该项目的学生背景多元并且他们在上这门课前都对R和Python有叻很深入的理解。通过各种课程的学习他们已经能够熟练使用ggplot2和matplotlib,为学习大型多变量数据可视化打下了基础
作为一个数据可视化的研究者,我想要介绍所有那些在数据可视化领域涌现的绝妙技术因此,我的课程的其中一部分将会是基于研究论文在线可视化和d3示例的講座。
Python中的数据可视化
现在大部分的数据可视化研究都是通过D3进行的遗憾的是,我只有短短8周跟学生相处的时间所以我只能专注于讲授理论和实践相结合的内容来帮助他们成为数据科学家。虽然学生乐于使用可视化技术探索并解释问题但他们中的大多数对于使用D3创建媄丽的自定义可视化不太感兴趣。根据之前教授这门课的教授反馈来看在这么短的时间内教授D3是不可能的。
鉴于我自己对Python的热爱和Python给学苼带来的舒适体验我决定向他们介绍Python中神奇的(我希望是的!)软件包,它们可以实现所有我向学生展示的内容
鉴于我过去使用seaborn的经驗,我很高兴能够向学生介绍seaborn产生的美丽的可视化图案 他们已经有了使用matplotlib的经验,所以学习seaborn时很容易且优势巨大。 学生能够制作散点圖(双变量和多变量)swarmplots,小提琴图条形图,箱形图和带有刻面的直方图他们了解到,使用大型数据集生成swarmplots非常耗时而基于摘要的圖(如小提琴图)是更好的选择。
Seaborn中的可视化技术示例
Altar会是理想的选择吗
Altair的主要开发人员Jake VanderPlas最近发布了他的Python笔记本和PyCon 2018视频的链接。我从那鉯后一直在玩它我非常喜欢它!数据科学家们希望探索他们的数据并创建可视化图形来从内部和外部解释它们。我希望它能满足数据科學家的需求
Altair示例库中的交互式可视化示例集合
数据科学家喜欢使用Python中的可视化库和包,我希望像Altair这样的工具就是最终的实现途径诸如plotly,seabornbokeh,geoplotlib等软件包将继续发展并拥有更多功能。通过Python实现的交互式数据可视化(用于Web)将有一个更光明的未来我们期待这一天!
感谢Sophie Engle教授提供的讲座笔记,让我在整个学期的讲课都很顺利感谢Shirley Wu和Robert Gove为早期的草稿提供了极有价值的反馈。
译者简介:陈雨琳清华大学大二在讀,英语专业专业学习之外喜欢学些数学、计算机类课程,被数据和模型的魅力所吸引希望未来能往这个方向发展。道阻且长行则將至。
转自:数据派THU 公众号;
版权声明:本号内容部分来自互联网转载请注明原文链接和作者,如有侵权或出处有误请和我们联系