概要说明

用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。

散点图用来研究变量之间的关系。

1、用于表示数据项少于2000的数据的关系。最常用的散点图,常用来判断变量之间的关联。

上图展示了折扣和销售量之间的关系,随着折扣增加,销售量增加,呈正相关关系。

2、用于表示数据项大于2000的数据的关系。通常用来研究区间分布模式。下图为大数据散点图。

图是模拟三角函数(正弦sin)的图像显示,体现周期性特点。

优势:研究两变量之间的关系,或区间分布模式。

劣势:适用范围较窄。

数据要求:一个或两个维度,两个度量;分类字段,散点图通常用于比较跨类别的聚合数据。 

适用场景:销售量和折扣之间的关系;收入和消费之间的关系;三角函数关系;社会现象关系的研究等

业务情景

我们在业务分析中,经常会对研究对象进行对比分析。散点图主要有如下两个应用情景:

研究对象对比需求分析效果
情景1:研究促销活动销售量和折扣之间的关系。(数据量小于2000)该需求的研究对象对比分析,想要研究变量关系且数据小于2000,建议通过线散点图实现。

1、分类轴上显示折扣

2、指标轴上分布销售量

3、把产品名称拖动到颜色标记区以实现数据点的区分。

该情景详细的实现说明请参见情景1 

情景2:三角函数图像的研究。(数据量大于2000)该需求的研究对象对比分析,研究图像分布,数据量大于2000,建议通过大数据散点图实现。

1、分类轴上显示c_x

2、指标轴上分布sin

该情景详细的实现说明请参见情景2

实现方案

情景1

业务情景描述:研究促销活动销售量和折扣之间的关系。(数据量小于2000)

普通散点图

定制要点:

双击“折扣”和“销售量”字段,系统自动把第一个度量分配到“列区”,把第二个度量分配到“行区”。

对于度量值,系统默认合计,此时只有一个数据点,需要把该度量改为维度,数据才会表示原数据点;

或者拖拽“折扣”字段到“列区”,“销售量”字段到“行区”。

上图表示销售量与折扣之间的关系,随着折扣增加,销售量增加。

泡泡图

当需要清楚了解具体那一类产品的折扣对销售量影响更大时,用大小标记加以显示,形成泡泡图。

定制要点:

在普通散点图的基础上把“销售量”字段拖动到大小标记区;或者双击销售量,系统自动把第三个度量分配到大小标记区。

上图表示销售量与折扣之间的关系,随着折扣增加,销售量增加。点大的表示数量大,折扣对其销售量的影响更大。

情景2

业务情景描述:三角函数图像的研究。(数据量大于2000)

定制要点:

在标记区点击 三角 下拉按钮,切换为大数据散点图,如下:

双击“x”和“sin”字段,由系统自动分配第一个度量值到“列区”、第二个度量值“行区”。

对于度量值,系统默认合计,此时只有一个数据点,需要把该度量改为维度,数据才会表示原数据点;

或者拖拽“x”字段到“列区”,“sin”字段到“行区”。

 

子图列表

散点图支持两种不同的子图,散点图和大数据散点图,其适用场景不一样。具体展现如下图: