升级内容
数据挖掘组件 | V9.5版本 | V9.7版本 | 更新内容 |
---|---|---|---|
实验引擎 | √ | √ | 数据挖掘引擎版本更新 |
服务引擎 | √ | √ | 数据挖掘引擎版本更新 |
Spark | √ | √ | Spark版本由2.4升级到3.0版本 |
Python执行节点 | √ | √ | 数据挖掘引擎版本更新,新增代理程序启动用户。 |
Hadoop | × | √ | 新增Hadoop组件,用于节点中间数据存储。 |
Spark版本升级
V9.7版本中Spark版本从2.4升级到了3.0版本,Spark添加了密钥认证方式,数据挖掘中添加了Spark的密钥认证,提高了安全性。
手工部署Spark2.4到3.0的升级参考文档:数据挖掘引擎V95升级Beta版本
高性能版本部署Spark升级参考文档:高性能版本-数据挖掘V95升级Beta版本
存储挖掘实验的节点中间数据
V9.7版本修改了实验节点中间数据的存储逻辑,实现了对于任何节点,只要它上游节点执行完成,都可以从该节点执行,不需要从头开始执行。由于使用HDFS存储节点数据,因此V9.7升级需要在默认部署环境中增加HDFS的部署。
HDFS的部署方法请参考文档:数据挖掘引擎V95升级Beta版本
高性能版本HDFS的部署方法参考文档:高性能版本-数据挖掘V95升级Beta版本
实验引擎跟Python执行节点的交互,使用RESTful方式
在V9.5版本中,实验引擎跟Python执行节点交互是使用ssh方式;基于安全跟系统扩展性考虑,V9.7版本实验引擎跟Python执行节点交互是使用RESTful方式。
因此V9.7版本Python计算节点升级参考文档:数据挖掘引擎V95升级Beta版本
高性能版本Python计算节点升级参考文档:高性能版本-数据挖掘V95升级Beta版本
UI调整
1、数据源按照以下顺序排序:
- “全部”标签页中,数据库分为“常用数据库”与“所有数据库”:常用数据库:按数据库的新建次数由高到低排序;所有数据库:按照字母顺序排序。
- “本地数据库、关系数据库、多维数据库、NoSQL数据库”页签中,所有数据库按照字母顺序排序。
- Other数据源不按字母排序,位置在所有数据库和关系数据库最后。
2、在系统设置页面右上角增加麦粉社区的链接,链接到麦粉社区首页。
在系统选项的高级设置中,设置项“SMARTBI_SURPPORT_URL_DISPLAY”控制是否显示麦粉社区的入口(默认为否)。
功能变更
1、自助仪表盘组件联动
删除筛选器应用于组件的“高级设置”选项、“合并参数”选项,所有的联动关系都在全局的联动设置中设置。
2、删除自助数据集新建自助ETL、数据挖掘实验的入口,不再支持在自助数据集中新建自助ETL、数据挖掘实验。