9.2版本于2020年2月发布,新特性列表中:+表示新增 ;^表示增强。
数据连接 | |
---|---|
数据准备 | |
数据挖掘 | |
分析展现 | |
其它 |
{html}<h1 >数据连接</h1>{html} |
技术人员在数据库中设计表字段时,通常在注释中备注字段的业务含义,系统为了简化用户的库表连接操作,自动将这些注释作为字段别名加载,因此为了解决库表注释相同而导致字段别名重名的问题,系统在新版本中实现:自动为同名的字段别名添加上数字序列号后缀以示区别。
V9.2及之后版本添加库表,该库表下出现字段别名重名时,自动在别名后面添加序号后缀,命名为:别名1、别名2。
如下图,对于两个相同字段“column1”,系统自动在第二个字段别名后面添加序号“1”,全别名为“column11”。
通过Excel、CSV、TXT等文件导入数据后,若有新的数据,可以通过“添加到已有表”的功能实现数据的追加。如下图所示:
增量字段的数据类型必须和原表字段保持一致。
“添加到已有表”功能详情请参见 文件。
通过加载文件数据功能导入系统中的数据表,会自动在对应的库中生成一张物理表,当用户在系统中删除该数据表时,对应的物理表将同时被删除,这样可以避免数据库中的冗余数据表。
如下图,一张Excel加载的数据表“销售数据“,我们通过更多菜单 删除 按钮删除。
用数据库前端工具登录到该高速缓存库中查看,发现其对应的物理表也被删除了。
删除前 | 删除后 |
---|---|
![]() | ![]() |
V9.2版本之前加载本地的数据文件,对日期及日期时间字段的格式有要求,通常造成用户使用该功能的不便,因此新版本进行功能优化后,系统将自动兼容所有日期字段格式。
下面演示了导入Excel文件的数据内容及加载该文件后的数据内容对比:
原数据文件 | 加载后数据浏览 |
---|---|
![]() | ![]() |
导入该Excel文件时,“日期”字段格式是“日期时间”类型,系统自动将“2019年12月1日”转化成“2019-12-01 00:00:00”。
{html}<h1 >数据准备</h1>{html} |
数据分析初期,我们经常会从不同角度去解读数据,为了简化用户数据预处理过程中的操作步骤,V9.2及之后版本增加“行转列”和“列转行”两个功能。
操作入口:自助ETL和数据挖掘的实验管理的入口都在“数据预处理“目录下:
{html}<h1 >数据挖掘</h1>{html} |
日常数据处理中,经常会遇到以特殊符号作为分隔符存储的数据,实际在做实验的过程中,需要对这部分数据进行预处理,为了方便用户在含有分隔符的数据上进行下一步处理,V9.2及之后版本提供列节点【分列】给用户自定义分隔符。
将“分列”节点拖拽到画布区,在“参数面板”中选择拆分的列,选择或输入分隔符。
支持所有分隔符,目前可供选择的分隔符有:逗号、分号、空格和tab;若分隔符不在选择项中,直接在框中输入分隔符即可。
随着数据挖掘地不断深入,我们会在现有特征基础上生成新的特征,构成特征组合。为了满足不同用户需要,产品提供“全局特征组合”和“搜索特征组合”。其中,“全局特征组合”对全部特征做笛卡尔积;“搜索特征组合”是为了解决特征的数量呈指数形式增加,存在大量冗余特征等问题,实现以最少的代价获得最优解。
“自动特征组合”节点拖拽到画布区,在“参数面板”中进行相关设置。
{html}<h1 >分析展现</h1>{html} |
基于数据源或业务主题创建查询时,如果没有设置表关系,则进行笛卡尔积查询。在实际查询中,则要求表与表之间需设置关系,因此V9.2及之后版本我们增加了表关系的验证,确保查询结果符合用户的实际需要。
V9.2及之后版本基于数据源或业务主题创建查询时,无表关系的表之间不能进行关联查询。
例如:在基于数据源mysql创建的即席查询中,1游戏分组表和9主流热销私家车表两张表之间不存在表关系,若勾选两个表的字段进想要行关联查询时,会弹出提示框禁止关联查询。
自助仪表盘定制时,实现了拖动资源任意位置都可以移动,使定制工作更加灵活便捷。
定制自助仪表盘实现布局处理时,将鼠标放置在资源上拖动即可,鼠标状态是呈可拖动状态。如下图所示:
自助仪表盘在自由布局模式下设计资源组件时,可以通过标尺线来保证组件的完美对齐。
自由布局模式下定制自助仪表盘,将鼠标放在资源组件上拖动,左上角即显示标尺,通过标尺可以轻松保证组件的对齐效果。
标尺即下图红框所标识处:
1、 标尺显示需要满足的条件有:
1) 当前自助仪表盘处于自由布局模式且编辑状态下;
2) 设备为“电脑/平板”。
2、 TAB组件中的资源不支持标尺功能。
优化仪表盘主题选择控件,新版本修改成下拉框式选择,满足了美观和方便选择的要求。
仪表盘主题下拉框式效果如下:
从风格统一的角度,将即席查询的“字段选择”Tab和“条件选择”Tab合并在同一资源树下,与透视分析的布局保持一致。
“字段选择”和“条件选择”统一到同资源树后,按照如下方法设置字段和条件:
基于Teradata数据库的数据源下表的预览、即席查询的查询性能进行改造,添加了TopN方式取数,明显地提升了查询速度。
V9.2及之后版本的查询逻辑如下:
1、数据源下表的预览直接使用TopN方式取数,不使用rownumber分页;
2、即席查询没有设置排序的情况下,第一页使用TopN方式取数,后面的使用Top2N+rownumber分页;
3、即席查询设置排序,使用Top2N+rownumber分页;
4、即席查询的参数备选值默认排序,使用Top2N+rownumber分页。
V9.2版本之前,电子表格的分页是全局性的,针对当前电子表格的所有sheet页,新版本对分页功能进行了增强,实现了基于sheet页的局部分页设置,满足了用户对同一电子表格不同sheet页是否分页的需求。
功能入口:在sheet页的右键菜单中选择 Sheet分页设置。
Sheet分页设置窗口只需要勾选或勾除是否分页即可。
某项目提出:在电子表格设计器中执行预览、执行、发布、报表宏、图形、引用参数、参数排版、回写规则、填报列表按钮操作,以及在表格中双击弹出单元格属性窗口时都会出现卡顿的现象。
通过减少了非必要的遍历次数解决,将全量扫描变为局部扫描。由于预览、执行、发布等功能必须要进行全量扫描,因此只针对可以支持局部扫描的功能进行了调优,主要对以下功能进行了逻辑处理:
1、 双击打开单元格属性:不勾选监听时,只扫描当前单元格属性。
2、 图形:不勾选监听时,Echarts图形只扫描所选中区域。
3、 回写规则:不勾选监听时,只扫描当前sheet页。
4、 填写列表:不勾选监听时,只扫描选中区域单元格。
设置功能是否监听的入口:
监听设置一旦不勾选,当电子表格行列变化比较多时,会影响单元格的动态获取,此时对于自定义数据区域、父格等功能需要按照新的行列手动设置单元格。
为了方便用户在Word和PPT中能快速搜索出需要的资源,新版本实现了支持Word和PPT搜索的功能。
在Word和PPT的资源面板和“打开文档”界面增加搜索框,可输入资源的ID、全名、别名直接进行搜索或者输入关键词进行模糊搜索。
V9.2及之后版本对报表刷新的处理逻辑重新进行了整理和规划,增加了报表字段变更的“立即刷新”功能。
立即刷新,控制的是编辑报表时是否立即自动刷新。该按钮处于报表工具栏的最尾处,呈蓝色状态表示启用,反之则表示未启用。
不同类型的报表“立即刷新”按钮是否默认启用原则如下:
1、“立即刷新”区别于“浏览自动刷新”功能:
2、报表保存后,“立即刷新”的状态即为私有,再次打开报表,“立即刷新”使用上次的保存值。
3、启用“立即刷新”,无论是否设置了切换参数后自动刷新报表,切参都会刷新;不启用“立即刷新”,如果设置了切换参数后自动刷新报表,则切参(切参包括切换过滤器和条件)会立即刷新,否则不会。
4、启用“立即刷新”,涉及到改变数据的操作都会刷新。但工具栏的某些设置项是不会触发刷新,如:保存,收藏,参数布局,视图,查看SQL,不会刷新;添加图形、修改图形)只局部刷新。
5、翻页,设置每页行数不受“立即刷新”控制。
6、自助仪表盘的定时刷新的优先级更高。
7、即席查询直接拖拽表头的顺序,不会触发刷新,它与工具栏字段设置-多重表头中改变表头的逻辑(改变表头,清空数据)不同。
{html}<h1 >其它</h1>{html} |
新版本在系统各类资源打开和编辑的响应时间上都进行了优化处理,下表列出了各种测试场景下,100个用户的平均响应时间对比情况,针对新版本第一轮、第二轮与V8.5.6和V7.2版本的响应速度对比数据: