版本比较
标识
- 该行被添加。
- 该行被删除。
- 格式已经改变。
概述
数据抽取是指从源数据源抽取原始数据,以视图的形式存放在高速缓存库下,
后续在创建组合分析、透视分析、可视化查询、SQL查询等时高速缓存库可以当作一般数据源使用,后续在创建组合分析、可视化查询、SQL查询等时高速缓存库可以当作一般数据源使用,以保证秒级获取大级别量的数据结果,提高系统性能。
目前系统中支持数据抽取的有:自助数据集、可视化查询、SQL查询、原生SQL查询、存储过程查询、Java查询、组合分析、透视分析、加载Excel数据。
系统支持通过数据行权限控制,保证所有用户抽取到其权限内的数据的有:可视化查询、组合分析、自助数据集。
注:1.数据抽取功能必须要在当前数据集保存的前提下才能被激活使用。
2. V8.0及之前版本只有自助数据集可以做数据抽取,V8.5版本中,SQL查询等非自助数据集以及加载Excel数据支持数据抽取到高速缓存库。
界面介绍
新建自助数据集并 保存,点击工具栏上的抽取图标后点击 设置 按钮,在弹出的界面中选择抽取方式,默认为全量抽取,界面如下:
抽取界面介绍如下:
界面介绍 | 分类 | 功能说明 |
---|---|---|
抽取方式 | 实时 | 表示不抽取。 |
全量抽取(默认) | 类似于数据迁移或数据复制,它将当前数据集的全部数据从数据库中抽取出来。 | |
增量抽取 | 指抽取自上次抽取以来抽取的数据集中新增、修改、删除的数据。 | |
异常处理 | 回滚(默认) | 表示返回到数据抽取前的状态。 |
继续 | 表示抽取数据出错时会继续抽取下一条数据,并将这条错误数据写入异常日志,供后面下载查看异常原因。 | |
执行用户
| 资源创建者 管理员 (默认) | 系统管理员可以抽取系统的所有数据。抽取资源创建者数据权限内的数据。 |
特定用户 | 设置用户名和密码,指定用户抽取权限内的数据。相关权限控制可参考用户管理设置用户名和密码,抽取特定用户数据权限内的数据。相关权限控制可参考数据权限。 | |
抽取时间 | 立即抽取 | 表示将数据立即抽取到高速缓存库中。 |
定时抽取 | 表示将数据定时抽取到高速缓存中,其中定时抽取是通过定制计划 任务表示将数据定时抽取到高速缓存中,其中定时抽取是通过定时任务实现。 |
注:执行用户这里是指数据行权限控制。例如:某用户做为华北区的一名销售主管,那么我们应该只允许他通过自助数据集查询和抽取到的数据只能是华北区的销售部门的数据,而不能跨权限查询到其它区域或者其它部门的数据。
选择增量抽取时,界面介绍如下:
上图红框标识框为增量抽取设置的核心内容,各设置项说明如下:
设置项 | 说明 |
---|---|
增加字段设置 | 若当前数据集是跨数据源的,则允许通过“![]() |
增量字段 | 表示从业务库中获取增量数据的匹配字段,通过该字段在高速缓存库中与业务库进行比对之后,获取增量数据。 该字段通常以时间字段为准。 |
忽略抽取当天数据 | 表示除掉当天数据之外的增量数据。 |
时间格式 | 若时间字段为DATE或DATETIME类型时,时间格式不可选。若时间字段为非DATE或DATETIME类型时,需要设置时间格式。 |
覆盖最后抽取的N天数据 | 表示根据时间戳,重新抽取高速缓存库中已抽取的数据表中的最后N天数据。 |
操作步骤
全量抽取
1.新建自助数据集并保存。
2.点击工具栏上的抽取图标后如图:
点击 设置 按钮,在弹出的界面中选择抽取方式,默认为全量抽取。执行用户选择系统默认管理员。
这里执行用户可根据需要添加用户权限。
3.选择“立即抽取”,抽取完成后在右上角会显示“同步完成”。
4.抽取出的数据会以视图形式存放在高速缓存库下下。高速缓存库入口:左侧资源树找到数据管理-》数据源-》高速缓存库,点开可以找到抽取的数据。
增量抽取
前两个步骤与全量抽取相同。
3 下面删除某些字段后再抽取数据。
将度量区所有字段和维度中的“发货日期”设为不可见:
4 抽取方式选择“增量抽取按时间戳”,界面如下:
设置增量字段为订单表中的发货日期:
注:当选择的增量字段为时间类型DATE或DATETIME时,时间格式不可选。
“忽略抽取当天数据”和“覆盖最后抽取的 N天数据”默认不勾选,可根据实际情况勾选。
5.抽取完成后可在SmartbiMpp数据源下找到视图。若抽取的数据集进行过全量抽取,已经生成了视图,则再进行增量抽取后数据会直接在视图里更新。
面板 | ||||||||
---|---|---|---|---|---|---|---|---|
| ||||||||
文档目录:
|