概述说明
自助数据集支持跨库查询,当用户查询数据的范围比较广,并不限于一个数据库时,可以跨多个数据库进行查询。
当不同数据库创建的数据源被关联在跨库联合数据源中时,可以直接在自助数据集做关联查询。两个数据源是在不同数据库下创建即可以进行跨库查询,如两个MySQL数据库创建的两个数据源,MySQL数据库和Oracle数据库创建的两个数据源。
目前支持做跨库的数据源类型包括:高速缓存库、Hadoop_Hive、星环、Vertica、CH、Greenplum、Infobright、Oracle、DB2 V9、MySQL、MS SQL Server、Spark SQL、Teradata_v12、Informix、IMPALA、PostgreSQL。
示例分析
业务需求描述
某企业的销售部门和生产部门由于分属两个机构,销售和库存数据分别存储在不同的数据库中。年底公司需要结合销售数据和库存数据创建仪表盘进行综合数据分析。具体需求有:
1、各个地区的销售情况,主要通过销售额的数据体现,并且能够下钻查看下级省份和城市的销售情况。
2、不同类别的产品的销售情况,主要通过销售额的数据体现,可以通过产品类别选择查看所属产品的销售情况。
3、不同类别的产品的库存情况。
4、不同类别的产品在各个地区的订购量情况。
业务需求及数据分析
由于销售部门和生产部门分属两个机构,库存数据存储在基于Oracle数据库创建的“Stock”数据源中,销售数据存储在基于MySQL数据库创建的“Sales”数据源中。
由于数据分析需要结合销售数据和库存数据,因此需要创建一个跨库数据集。