用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。
散点图用来研究变量之间的关系。
1、用于表示数据项少于2000的数据的关系。最常用的散点图,常用来判断变量之间的关联。
上图展示了折扣和销售量之间的关系,随着折扣增加,销售量增加,呈正相关关系。
2、用于表示数据项大于2000的数据的关系。通常用来研究区间分布模式。下图为大数据散点图。
上图是模拟三角函数(正弦sin)的图像显示,体现周期性特点。
优势:研究两变量之间的关系,或区间分布模式。
劣势:适用范围较窄。
数据要求:一个或两个维度,两个度量;分类字段,散点图通常用于比较跨类别的聚合数据。
适用场景:销售量和折扣之间的关系;收入和消费之间的关系;三角函数关系;社会现象关系的研究等 。
我们在业务分析中,经常会对研究对象进行对比分析。散点图主要有如下两个应用情景:
研究对象对比需求 | 分析 | 效果 |
---|---|---|
情景1:研究促销活动销售量和折扣之间的关系。(数据量小于2000) | 该需求的研究对象对比分析,想要研究变量关系且数据小于2000,建议通过线散点图实现。 1、分类轴上显示折扣 2、指标轴上分布销售量 3、把产品名称拖动到颜色标记区以实现数据点的区分。 该情景详细的实现说明请参见情景1。 | ![]() |
情景2:三角函数图像的研究。(数据量大于2000) | 该需求的研究对象对比分析,研究图像分布,数据量大于2000,建议通过大数据散点图实现。 1、分类轴上显示c_x 2、指标轴上分布sin 该情景详细的实现说明请参见情景2。 | ![]() |
业务情景描述:研究促销活动销售量和折扣之间的关系。(数据量小于2000)
普通散点图
定制要点:
双击“折扣”和“销售量”字段,系统自动把第一个度量分配到“列区”,把第二个度量分配到“行区”。
对于度量值,系统默认合计,此时只有一个数据点,需要把该度量改为维度,数据才会表示原数据点;
或者拖拽“折扣”字段到“列区”,“销售量”字段到“行区”。
上图表示销售量与折扣之间的关系,随着折扣增加,销售量增加。
泡泡图
当需要清楚了解具体那一类产品的折扣对销售量影响更大时,用大小标记加以显示,形成泡泡图。
定制要点:
在普通散点图的基础上把“销售量”字段拖动到大小标记区;或者双击销售量,系统自动把第三个度量分配到大小标记区。
上图表示销售量与折扣之间的关系,随着折扣增加,销售量增加。点大的表示数量大,折扣对其销售量的影响更大。
业务情景描述:三角函数图像的研究。(数据量大于2000)
定制要点:
在标记区点击 三角 下拉按钮,切换为大数据散点图,如下:
双击“x”和“sin”字段,由系统自动分配第一个度量值到“列区”、第二个度量值“行区”。
对于度量值,系统默认合计,此时只有一个数据点,需要把该度量改为维度,数据才会表示原数据点;
或者拖拽“x”字段到“列区”,“sin”字段到“行区”。
散点图支持两种不同的子图,散点图和大数据散点图,其适用场景不一样。具体展现如下图: