创建数据集-华为云

智能数据洞察 DATAARTS INSIGHT-可视化创建数据集:可视化配置（可选）

可视化配置（可选） DataArts Insight提供的数据集的可视化配置功能，帮助您更加便捷地配置数据集字段，提供了多种参数设置，包括字段名称、字段类型、默认聚合方式、数值展示格式、字段描述、是否允许搜索以及分析优先级等。单击“可视化配置”，进入可视化配置页面。选择需要修改的字段，并按需编辑字段，参数说明如表2所示。单击可批量配置字段，当前支持批量转换为维度或度量，支持批量设置隐藏、取消隐藏，支持批量删除字段。图3 可视化配置页面表2 可视化配置参数说明参数名称说明字段名称|物理字段字段名称，在该页面支持自定义，字段名称会显示在仪表板和大屏制作的图表中。物理字段不支持修改。字段类型字段支持的类型，包括日期、文本、数字。其中日期支持多种格式设置。默认聚合维度字段不支持设置，仅度量字段支持设置聚合方式。支持以下设置：无聚合、求和、平均值、计数、去重计数、最大值、最小值、总体标准差、样本标准差、总体标方差、样本方差、区间起始值、区间结束值。说明：区间起始值、区间结束值只支持单项设置，不支持同时设置。数值展示格式无格式、数值、货币、对象量词、长度、重量、能量、容量、时间、百分比。字段描述对字段的相关信息的描述。允许搜索是否允许搜索枚举值，用于标记字段的枚举值在训练时是否允许被搜索，当前仅能提取最多1000个枚举值。说明：仅支持文本类型。分析优先级用于确定智能分析助手中的自动见解功能从数据集选用字段分析时的优先级，最多支持配置10个高分析优先级字段。操作支持对字段的删除和隐藏，此处可对已隐藏的字段进行取消隐藏。说明：删除数据集中的字段时要检查该字段是否在大屏、报表和权限配置中有使用。

智能数据洞察 DATAARTS INSIGHT 创建数据集

智能数据洞察 DATAARTS INSIGHT-可视化创建数据集:字段配置

字段配置通过字段配置，您可以按需配置数据集的字段信息，包括编辑、克隆隐藏、复制为指标、转化为维度/度量、默认聚合方式、数值展示格式、删除等操作。预览数据表时只支持预览前100条数据，数据不足100条则显示全部数据。当字段被用于计算字段、分组维度、过滤条件中，不支持修改字段类型、维度或度量转换、删除。暂不支持复制日期字段，您可以将日期字段转成文本类型后，再复制字段。进入字段配置的页面，字段配置的入口如下所示：在字段列表区，单击字段后的配置字段。在数据预览区，单击字段后的配置字段。图2 配置字段填入字段配置的参数，参数说明如表1所示。表1 配置项说明功能名说明编辑对字段的名称和描述内容进行编辑。字段原名：可对字段原名进行编辑，输入不能为空，且名称只能由中英文、数字、英文括号、斜杠（/）、反斜杠（\）、下划线（_）及中划线（-）组成且不超过512个字符。物理字段：物理表对应的字段名，不支持修改。字段描述：补充字段描述信息。绑定条件：当且仅当用户使用这个维度时，才会应用此维度的绑定条件。编辑条件请参见添加条件。默认筛选：设置默认筛选器。编辑条件请参见添加条件。默认过滤器规则：如果对某个字段配置了默认过滤器，如省份 =“上海”。如果报表或者问答中未出现关于省份字段的过滤器，则最终的过滤器条件会追加省份 =“上海”字段。如果报表或者问答中出现了关于省份字段的过滤器，则最终的过滤器条件会忽略省份 =“上海”字段。添加条件：单击“添加条件”。选择筛选字段、筛选方式、固定值筛选条件和取值。筛选字段：筛选需要设置规则的数据集的字段，支持筛选维度和度量字段，不支持多选，如需对其他字段配置规则请重复添加条件。筛选方式：支持“条件筛选”、“枚举筛选”、“表达式筛选”。说明：只有维度支持枚举值筛选方式。固定值条件：条件筛选时需要选择固定值条件，例如等于、不等于、大于、大于等于、小于、小于等于等规则。固定值：输入筛选条件的取值，如果是枚举筛选，在下拉框中勾选字段值。如需继续为其他字段设置规则，可单击“添加规则”。多条件规则时，需要设置规则的关系：且：用户可查看同时满足规则A和规则B的字段值、即规则A和规则B的交集。或：用户可以查看满足规则A或规则B的字段值、即规则A和规则B的并集。如需添加与规则A和规则B并列的规则，可以单击“添加关系”。即新建了规则组C。规则组C与规则A和规则B同一级别。克隆该功能用于快速复制某字段，生成的新字段会带上副本标识。单击数据预览页面下需要修改字段右侧的，在弹出页面单击“克隆”。单击克隆之后生成的新字段会带上副本标识。且字段的物理字段名不会发生变化字段原名会发生变化。例如product_name，克隆后字段为product_name1。隐藏将字段进行隐藏。隐藏字段后，使用这个数据集制作仪表板、大屏等时，不会出现这个字段。默认聚合方式包含无聚合、求和、平均值、计数、去重计数、最大值、最小值、总体标准差、样本标准差、总体方差、样本方差、区间起始值、区间结束值。说明：区间起始值、区间结束值只支持单项设置，不支持同时设置。数值展示格式无格式、数值、货币、对象量词、长度、重量、能量、容量、时间、百分比。转换为度量/转换为维度将字段的类型进行转换，支持维度和度量的相互转换。维度类型转换可将字段维度或度量的类型转换成其他类型，支持转换为数字、日期、文本。且日期字段支持配置数据格式。说明：日期增加了秒和毫秒的时间戳。维度支持时间戳格式转换时间。移动到此功能在新建层次结构/数据集为表格视图时才可使用，请参见新建层次结构。删除删除字段。删除字段后，当您需要找回该字段时，可以单击画布中的表，在右侧面板中选择并添加该字段即可。

智能数据洞察 DATAARTS INSIGHT 创建数据集

应用与数据集成平台 ROMA CONNECT-配置SQL Server CDC:后续操作

后续操作如果系统表结构发生了变化或者有表级别调整，则需要重新开启CDC配置，配置步骤如下：先关闭CDC配置，请根据实际情况填写schema和name。 EXEC sys.sp_cdc_disable_table @source_schema = N'dbo', @source_name = 'baris', @capture_instance ='all' 重新开启CDC配置，请根据实际情况填写schema和name。开启表级别配置。 IF EXISTS(SELECT 1 FROM sys.tables WHERE name='baris' AND is_tracked_by_cdc = 0) BEGIN EXEC sys.sp_cdc_enable_table @source_schema = 'dbo', -- source_schema @source_name = 'baris', -- table_name @capture_instance = NULL, -- capture_instance @supports_net_changes = 1, -- supports_net_changes @role_name = NULL -- role_name END

应用与数据集成平台 ROMA CONNECT 创建数据集成任务（组合任务）

智能数据洞察 DATAARTS INSIGHT-自定义SQL创建数据集:修改SQL代码

修改SQL代码根据分析场景的改变，存在需要对SQL代码进行修改。登录智能数据洞察控制台。单击管理控制台左上角的，选择区域。单击左下角的企业项目选择企业项目。选择项目，单击项目名称进入项目。在项目中选择数据集。在数据集列表选择由自定义SQL创建的数据集，单击操作列的“编辑”进入数据编辑页面。由自定义SQL创建的数据集，在数据集页面名称列，数据集名称后会有“SQL”字样。单击“SQL编辑”，在SQL编辑页可以对SQL语句进行编辑修改。 SQL编辑器提供了格式化工具，可以对您输入的SQL语句格式化。支持设置SQL参数，参数说明请参考设置SQL参数。图2 配置字段单击“运行”，测试运行成功后，您可以在运行页签看到运行后的数据。单击“完成并退出”，保存修改后的数据集。

智能数据洞察 DATAARTS INSIGHT 创建数据集

应用与数据集成平台 ROMA CONNECT-配置目标端数据信息:自定义数据源

自定义数据源返回页首任务的“集成模式”为“定时”时，可以选择自定义数据源作为目标端数据源。在创建任务页面中配置目标端信息。表29 目标端自定义数据源信息参数配置说明目标端实例配置为当前正在使用的ROMA Connect实例，源端实例配置后目标端自动关联，无需配置。目标端集成应用选择自定义数据源所属的集成应用，在接入数据源时已配置。目标数据类型选择具体自定义数据源类型。数据源名称选择接入数据源中已配置的自定义数据源。元数据定义写入到目标端的JSON格式数据中，每一个底层key-value型数据元素。源端有多少个字段需要集成，则目标端需要定义相同个数的元数据。别名：对元数据的自定义名称。类型：元数据的数据类型，需要与源端数据中对应字段的数据类型一致。除了以上参数外，不同自定义数据源会定义不同的写端参数，请按照连接器原始定义规范填写。您可以在ROMA Connect控制台的“资产管理”页面中找到自定义数据源所使用的连接器，查看连接器的“写端参数定义”信息。以一个发送邮件的自定义数据源为例，目标端为自定义数据源的配置示例如下图所示。其中receiver和title参数为连接器中定义的目标端参数，id、name和info为要写入到自定义数据源的数据字段。图13 自定义数据源配置示例完成目标端信息配置后，继续进行下一部分配置，配置数据映射规则。