审视了我的可视化汇总内容,基础图形的完善工作显得尤为迫切。今天,我将着手填补这些空白,尽快将常见基础图形在多个软件中的细节处理妥当。
一切从分类开始,从一维数据处理起步。我筛选了一下,目前确定四类数据是初步关注的重点,那便从最精简的直方图开始着手。
直方图的主要作用在于展示数据的分布情况,其中正态分布最为常见。除了正态分布外,均匀分布、二项分布、泊松分布以及指数分布等也是常见的分布类型。为了全面理解和展示,我们将逐一应用这些分布。
数据是作图的基础。我选用最常用的Excel工具来拟合生成各类分布数据,每类生成2048条记录。下面提供了Excel的公式,直接复制到单元格即可操作。
其中,前三种分布可以通过简单的公式在单元格中拖拽生成。而后两种分布则需要借助Excel的数据分析工具进行实现,具体步骤如下所述。
打开Excel的“数据”选项卡。
在“数据分析”组中,选择并点击“数据分析”。
在弹出的对话框中,选择“随机数生成器”并确定下一步。
在“随机数生成器”对话框中,选择所需的“分布类型”,即可生成所需数据。
对于最后两种分布,我们选择使用Python进行数据模拟,这种方法既简便又快捷,下面提供了相应的代码。
[Excel制图]
拥有了数据后,我们的重点转移到直方图的绘制上。以第一列数据为例进行演示。
接下来的步骤就相对简单了。根据之前提到的数据图表的构成要素,我们进行相应的设置和美化。特别需要注意的是直方图的核心调整参数,即bin的设置。通过调整bin的数量和宽度,可以展示不同的柱状效果。
这里展示了左边设置为50bin、右边为20bin的例子,实际操作中可根据需求进行调整。当需要绘制多个相似图形时,我们可以保存当前图形为模板,后续直接使用,无需重复设置各种参数。
[PowerBI实现]
在PowerBI中操作也相对简单,但需要注意的是默认的视觉对象中不包含直方图选项,需要到市场搜索Histogram组件。
尝试了几个视觉对象,但发现可调节的参数有限,部分如二项分布和泊松分布在实现过程现了问题。
[Python中实现]
在Python里绘制直方图就变得简单多了,直接使用matplotlib库中的hist函数即可完成,只需简单添加对应参数。
若需一次性绘制多个图形,可使用以下代码将图形放置在同一张画布上展示。
[R语言中实现]
在R语言中,常规图像建议使用ggplot进行绘制。下面是绘制直方图的代码示例。
同样地,可以将六列数据绘制在同一张画布上,代码如下所示。
以下链接是我使用PowerBI整合的历史文章分类链接,可根据需求查询:
Microsoft Power BI
End
