版本比较
标识
- 该行被添加。
- 该行被删除。
- 格式已经改变。
概要说明
词云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据,能快速感知最突出的文字。
如下词云图可以清晰看出在众多产品中销售额前几的有绿茶、鸭肉、苏澳奶酪、猪肉干和花奶酪。其中绿茶销售额最高。 如下是热门搜索城市词云图。
Image Removed
Image Added
优势:酷炫、直观的图表,可以从大量的词中一眼抓住关键词。
劣势:使用场景单一,一般用来做词频。
数据要求:一个或两个维度+一个度量。一个或两个维度,一个度量。所需数据量需要稍大些,数据的区分度也需要比较大,否则效果不明显,并且不适合要求准确的分析。
适用场景:显示词频,可以用来做一些用户画像、用户标签的工作。可以用来分析话题热度,如微博热搜榜,或者产品比较多的公司分析其产品销售情况。显示词频,可以用来做一些用户画像、用户标签的工作。可以用来分析话题热度,如微博热搜榜。
不适用场景:除词频外的其他分析。
实现方案
业务情景描述:想要了解公司众多的产品中,哪些属于热卖产品。业务情景描述:查看热门搜索城市。
数据分析:
一个或两个维度+一个度量。
维度:默认添加的第一个维度作为标签标记项,第二个维度作为颜色标记项。(第二个维度可选)
度量:作为大小标识。
步骤:
没有颜色标记项:
双击“产品名称”、“销售额”字段,由系统自动分配到“标签”标记项、“大小”标记项;
或者拖拽“产品名称”字段到“标签”标记项,“销售额”字段到“大小”标记项。
Image Removed
有颜色标记项:
双击“产品名称”、“销售额”、“产品名称”字段,由系统自动分配到“标签”标记项、“大小”标记项、“颜色'标记项;
或者拖拽“产品名称”字段到“标签”标记项,“销售额”字段到“大小”标记项,“产品名称”字段到“颜色”标记项。
Image Removed
borderColor | #FFFFFF |
---|---|
bgColor | #F0F0F0 |
borderWidth | 1 |
borderStyle | solid |
数据结构
以上业务情景的数据来源如下:
Image Added
我们的基础数据以明细表的形式存储,以上“权重”是通过输入的数据系统自动汇总统计的得出的。
定制要点
1、双击“城市”、“权重”字段,由系统自动分配维度到“标签”标记项、分配度量到“大小”标记项,得到如下词云图:
Image Added
2、添加“颜色”标记项(可选,建议执行此操作,图表示内容更清晰),拖拽“城市”字段到“颜色”标记项,系统以颜色区分话题。
Image Added
从上图可以看出深圳、广州、上海搜索热度最高。