企业SaaS应用-数据分析仪:数据准备

时间:2025-02-12 15:02:06

数据准备

背景介绍:在分析仪中,数据资产需要经过数据准备才能被分析仪直接使用。

  • 功能区选项卡
  • 字段栏,选择图表展示字段
  • 数据标记,辅助图表分析
  • 图表展示区
  • 图表数据预览区
  • 配置栏,包含「样式」和「功能」配置

添加数据:系统提供两种添加数据的方式:

  • 通过菜单 文件 - 打开 直接导入 Excel 或 CS V 表格文件资产进行分析。
    图3 添加数据1
  • 单击选中左侧数据图书馆中的数据资产。
    图4 添加数据2

导入表格文件进行分析

选择菜单“文件-打开”:

单击或拖拽选择文件,页面上可以看到数据预览:

打开“第一行是否作为列名称”选项,否则第一行会被当成数据行进行处理。如果导入的文件是 CSV 文件时,还需要指定“字段分隔符”,“编码格式”,“引用字符”信息。如果导入时存在乱码,请选择正确的编码格式,也可自行转换 CSV 文件的编码格式后再导入, 推荐转换为 UTF-8 编码格式,

注意:单个 Excel 文件大小限制为10M,CSV 文件大小限制为20M。如果数据量超过限制,请通过数据资产的方式导入。

注意:列名称(标题行)不可包含空格、/等字符,否则在导入时会提示“存在非法字符”。

注意:通过文件方式导入的数据,所有字段会默认被当成字符串处理,需要通过“字段类型修改”功能,根据实际情况手工调整字段类型为数字或日期。日期字段请按格式 YYYY-MM-DD 准备数据,否则在后续字段处理时无法正确识别日期。

单击列名上的 A 图标,即可调整字段类型:

选择数据资产进行分析

单击选择左侧数据图书馆中的数据资产添加到编辑区。

添加第一个资产时,此资产就作为当前分析仪的主资产。如果再次点选另外一个资产时,就会以关联资产的形式添加到编辑区。也可以通过系统自动推荐的方式选择可能的关联资产。

关联方式原理同数据库的内连接、左连接、右连接、外连接。

手动关联资产:可以通过手动选择多个关联资产,配置关联关系:

  • 单击选择左侧数据图书馆中的关联资产添加到编辑区。
  • 单击关联符号,在弹窗中选择关联关系(内部、左侧、右侧、完全外部)。
    图5 关联符号
    • 内部 INNER JOIN:查询出两个表对应的数据,取交集。
    • 左侧(LEFT JOIN:以左表为基准,查询出左表所有的数据和右表中连接字段相等的记录,如果右表中没有对应数据,则在左表记录后显示空值(NULL)。
    • 右侧(RIGHT JOIN:以右表为基准,查询出右表所有的数据和左表中连接字段相等的记录,如果左表中没有对应数据,则在右表记录后显示空值(NULL)。
    • 完全外部(FULL JOIN:将两个表的数据全部查出来,返回左右表中所有的记录和左右表中连接字段相等的记录,如果把两个表分别看成一个集合的话,全外连接的结果即为两个表的并集。
  • 配置两个表中用来关联的两个字段:
    图6 应用
  • 单击“应用”,完成关联配置操作

自动关联资产:关联关系自动推荐

除了手动关联资产,系统还提供的潜在关系自识别功能。对于表数量众多的系统,或者是针对于不同部门不同系统中对于同一概念的命名规范不同的情况,数据汇集之后,很难直接通过列名称判断关联关系。对于命名混乱的系统甚至还会出现无法通过表名判断数据含意的情况。

这个时候通过关联关系自动推荐,可以有效提升数据准备阶段的工作效率。

  • 选择主资产后,系统自动在右侧的“关联推荐”推荐关联资产。
  • 在“关联推荐”中选择关联图表,单击“查看相关性”。

关联推荐中颜色深浅表明了关联关系的强弱,关联推荐最多推荐5个关联数据。

  • 在智能推荐的关联字段中单击“应用”自动生成关联关系。
  • 单击关联符号,在弹窗中选择关联关系(内部、左侧、右侧、完全外部)。
  • 单击“重置”可清除当前配置的关联关系。

移除所选资产:如果需要重新选择资产,或者移除所选资产,可以单击资产右上角的 X 图标,如下所示:

图7 移除所选资产

在数据准备阶段进行字段操作:添加了数据资产后,如果资产的数据还要进行简单运算和处理形成新的一列,可以直接在分析仪中进行,而不需要专门配置数据交换机。数据分析仪中对资产的处理只是在分析仪内部生效,并不会对数据图书馆中的数据资产做变更。

图8 数据分析

字段操作说明:数据准备过程中,可对资产现有列进行运算和处理形成新的一列,单击上图 ③ 区的字段操作功能来使用。

support.huaweicloud.com/nscf-saasapp/nscf_21.html