页面树结构
转至元数据结尾
转至元数据起始


自助数据集是一类基于个性化需求的数据集,它面向各阶层用户提供数据查询和抽取服务。

用户可以根据业务要求,通过可视化的方式,使用跨数据库、多表关联、数据转换、复杂逻辑关系计算、数据抽取ETL等功能,将数据提取到自助数据集,这些自助数据集允许被自助仪表盘、透视分析和电子表格进行数据分析应用。

自助数据集的定义流程如下:

新建自助数据集

1.  在系统快捷下拉菜单选择 自助数据集

2.  在“数据集”界面新建自助数据集:

 1)进入“数据集”界面的入口:

入口1:在系统快捷菜单选择“数据准备”的 数据集。

 入口2:在系统导航栏选择 数据准备 ,选择“数据准备”界面主菜单 数据集。


2)新建自助数据集的入口:

入口1:在“数据集”界面点击 新建数据集 > 自助数据集。


 入口2:在“数据集”界面的表格树目录区,在现有文件夹的更多操作,选择 新建数据集 > 自助数据集。


选择数据来源

自助数据集的数据来源可以来自数据源,也可以是数据集。

来自数据源来自数据集

详情请参考 自助数据集-数据来源

定义表集合

定义表集合包含两部分内容:

  • 从数据源中拖拽表或者拖拽数据集到“表集合区”。
  • 在“表集合区”定义表关系,系统会根据表间相同别名的字段创建表关系,若无法自动创建需要用户手动创建表关系。

“表集合区”中的表从“数据区”中拖拽而来:

“表集合区”中手动创建表关系的方法:

1、单击表间连接点,如下图所示:

2、弹出“设置表连接”窗口,如下图所示:

  • 选择连接方式:内连接、左连接、右连接、全连接。
  • 确定表间连接字段。

同步:原表或原数据集字段增加或删除时,自助数据集利用同步功能更新。

数据来源
操作
关系数据源/高速缓存库

自助数据集引用的表字段增加、删除时,实现同步更新,需要进行如下两个步骤:

1、数据库某表字段增加、删除时,在数据源节点下,选中该表,更多操作 > 同步表 ,如图:

2、在自助数据集选中该表,右键 > 同步 ,如图:

 数据集

选中有字段变更的数据集,右键 > 同步 ,如图:

注:目前暂不支持字段类型更改的同步。

       使用“同步”功能需保存,再次打开自助数据集才生效。

筛选器:当数据集数据量比较大时,可添加筛选器,对数据集的数据进行筛选过滤,以便得到用户真正所需的数据。

详情请参考 自助数据集-筛选器

规范字段

自助数据集的“表属性区”对应有维度和度量,系统支持对表和字段进行重新组织、分类、设计等规范化设置操作:修改别名修改数据类型设置可见性拖拽表和字段新建目录新建层次新建计算字段创建时间维标记地理维删除。详细说明如下:

功能说明示例效果
修改别名修改表或字段别名。

手动输入别名,修改“customers”的别名为“顾客表”,如图:

修改数据类型修改字段的数据类型。

选择字段的数据类型,如图:

设置可见性

设置表或字段为“可见”或“不可见”。

  • 为了快速查找表或字段,可将自助数据集在特定场景中不需要用到的表或字段设置为“不可见”。
  • 将表设置为“不可见”时,表的所有字段都为“不可见”。

点击可见性的图标切换为“可见”或“不可见”:

拖拽表和字段

拖拽表或字段移动其位置。

拖拽字段改变字段所属的表,将“产品目录表”的“产品类别”拖拽到“产品表”,如图:

新建目录用于在“维度”或“度量”中新建目录。

任意区域右键菜单选择 新建目录 ,新建一个“订单表”目录,如图:

新建层次用于新建层次目录,存储层次字段,这些层次字段主要实现自动下钻应用,例如:功能示例-时间层次维下钻功能示例-地理层次维下钻功能示例-自定义层次维下钻自助仪表盘-展开/收缩等。

任意区域右键菜单选择 新建层次 ,新建“新建地理层次”层次,按层次顺序将字段拖拽到“新建地理层次”下。如图:

新建计算字段

新建一个计算字段。

计算字段的数据类型决定了新建的计算字段位于维度或度量。

  • 维度:字符串、日期数据、以ID结尾的字段。
  • 度量:数值型数据。

应用详情请参考 自助数据集-计算字段 章节。


任意区域或字段右键菜单选择 新建计算字段 ,新建“销售额”计算字段,如图:

创建时间维

用于以维层次的形式标识日期信息字段。

入口:日期信息字段的右键菜单选择 创建时间维度

创建时间维度后会自动生成一个“时间维度”的层次目录。

应用详情请参考 功能示例-时间层次维下钻 章节。

标记地理维

用于以维层次的形式标识地理信息字段。

入口:地理信息字段的右键菜单选择 标记地理维度

已标记地理维度的字段必须存储在层次目录下,才能保证地理维层次字段的下钻效果实现。

应用详情请参考 功能示例-地理层次维下钻 章节。

删除

用于删除表。

保存自助数据集

保存当前自助数据集到指定目录。

数据抽取

将当前自助数据集的数据从原始数据库中抽到到高速缓存库。详情请参见 数据抽取 章节。

  • 无标签