搜索_华为云

解绑/绑定CDM集群的EIP - 数据治理中心 DataArts Studio

解绑/绑定CDM集群的EIP 操作场景 CDM集群创建完成后，支持解绑或绑定EIP。EIP即弹性公网IP，由虚拟私有云（Virtual Private Cloud，简称VPC）负责其计费。如果CDM需要访问本地数据源、Internet的数据源，或者跨VPC的云服务，则必须要为C

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
配置HDFS源端参数 - 数据治理中心 DataArts Studio

Parquet格式：以Parquet格式解析源文件，用于HDFS数据导到表的场景。 CSV格式列表文件当“文件格式”选择为“二进制格式”时，才有该参数。打开列表文件功能时，支持读取OBS桶中文件（如txt文件）的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径（不支持目录），文件内容示例如下：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

Each循环执行的节点，让CDM子作业循环执行，并配置节点属性参数。配置MRS Spark SQL节点的属性参数，并关联已创建的脚本maxtime。图3 配置MRS Spark SQL节点属性参数配置For Each节点的属性参数，并关联已创建的CDM子作业。图4 配置For

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
新建实时集成作业 - 数据治理中心 DataArts Studio

作业开发”。新建集成作业的方式有如下两种：方式一：在“作业开发”界面中，单击“新建集成作业”。图1 新建集成作业（方式一）方式二：在作业目录中，右键单击目录名称，选择“新建集成作业”。图2 新建集成作业（方式二）在弹出的“新建集成作业”页面，配置如表1所示的参数。表1 作业参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
诊断数据安全风险 - 数据治理中心 DataArts Studio

使用过程的安全可靠。另外，中风险及高风险等级的风险问题属于潜在的安全隐患，建议您尽快处理。下图以敏感数据保护为例查看该检查项目前的风险等级及诊断结果。图3 安全诊断结果父主题：数据安全运营

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 数据安全运营
配置HDFS源端参数 - 数据治理中心 DataArts Studio

Parquet格式：以Parquet格式解析源文件，用于HDFS数据导到表的场景。 CSV格式列表文件当“文件格式”选择为“二进制格式”时，才有该参数。打开列表文件功能时，支持读取OBS桶中文件（如txt文件）的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径（不支持目录），文件内容示例如下：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
新建离线处理集成作业 - 数据治理中心 DataArts Studio

”。图2 新建集成作业（方式二）在弹出的“新建集成作业”页面，配置如表1所示的参数。图3 配置集成作业参数表1 作业参数参数说明作业名称自定义作业的名称，只能包含英文字母、数字、中文、“-”、“_”、“.”，且长度为1～128个字符。作业类型选择作业的类型，须选择离线处理。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
原子指标 - 数据治理中心 DataArts Studio

需要在创建一个销售额。图4 新建原子指标2（配置基本信息、配置数据对象）图5 新建原子指标2（配置表达式）原子指标创建完成后，如下图所示：管理原子指标在数据指标控制台，单击左侧导航树中的“指标开发”，选择“原子指标”页签，进入原子指标页面。图6 管理原子指标您可以根据实际需要选择如下操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标 > 指标开发
新建作业 - 数据治理中心 DataArts Studio

填写该作业的责任人。作业优先级选择作业的优先级，提供高、中、低三个等级。说明：作业优先级是作业的一个标签属性，不影响作业的实际调度执行的先后顺序。委托配置配置委托后，作业执行过程中，以委托的身份与其他服务交互。若该工作空间已配置过委托，参见配置公共委托，则新建的作业默认

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
提交版本 - 数据治理中心 DataArts Studio

在页面右侧单击“版本”，查看版本提交记录，找到需要回滚的版本单击“回滚”即可。如果当前有开发态的编辑内容没有提交，将会被覆盖。回滚之后需要重新提交才能生效，调度默认使用最新提交的版本进行调度。图2 版本回滚版本对比支持对比两个不同版本的脚本内容。如果只勾选一个版本，则对比该版本和开发态的脚本内容；如果勾选两

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发
基线运维约束限制 - 数据治理中心 DataArts Studio

要想hive的优先级生效，请联系运维工程师打开MRS Hive优先级配置项的开关。使用基线运维之前，需要在MRS服务创建Topic，具体操作请参见KafkaUI创建Topic。 DLI约束限制： DLI提供的设置作业优先级功能，当资源不充足时，可以优先满足优先级较高的作业的计算资源。DLI优先级功能包含DLI

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
运维概览 - 数据治理中心 DataArts Studio

支持查看昨天/今天/7天历史平均的运行成功的作业的全部节点算子的任务完成情况的曲线图。支持查看昨天/今天/7天历史平均的运行成功的作业的不同类型节点算子的任务完成情况的曲线图。基线看板可以查看基线破线的数据。支持查看今日破线的基线实例数量。当到达基线承诺时间时，基线上任务仍处于未完成状态时，基线将处于破线状态。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
管理动态脱敏策略 - 数据治理中心 DataArts Studio

*集群名称无需选择，自动匹配数据连接中的数据源集群。 *数据库选择敏感数据所在的数据库。 *数据表选择敏感数据所在的数据表。 *数据列您需要勾选一个或多个待脱敏列，并根据不同数据列的数据类型，选择合适的脱敏规则。各类数据源中不同数据类型支持的脱敏规则不同，详见参考：动态脱敏规则介绍。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 动态脱敏任务
配置实时集成作业 - 数据治理中心 DataArts Studio

实例下的单张表。整库支持将源端一个实例下多个库的多张表批量实时同步到目的端一个实例下的多个库表，一个任务中最多支持200张目标表。分库分表支持将源端多个实例下多个分库的多张分表同步到目的端一个实例下的单个库表。图2 选择集成作业类型配置网络资源。选择已创建的源端、目

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
新建维度 - 数据治理中心 DataArts Studio

义相同的字段，单击或按钮增加或删除JOIN条件。JOIN条件之间是and的关系。单击“确定”完成设置。设置JOIN后，如果想删除JOIN表，单击所需删除的表名后的按钮就可以删除该JOIN表。图4 JOIN条件字段映射为来源于当前映射的字段，依次选择一个含义相同的源字段。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
新建事实表 - 数据治理中心 DataArts Studio

单击“事实表”页签，进入事实表页面。在事实表列表中，单击需要关联数据标准的事实表名称。在事实表的详情页的表字段列表中，查找需要关联数据标准的字段，单击其所属的，配置单个表字段关联数据标准。数据标准的来源请参考新建数据标准图9 事实表字段关联数据标准配置完成后，单击“确定”，完成事实表

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
配置资源权限 - 数据治理中心 DataArts Studio

止访问的用户和用户组。用户：MRS服务的用户。角色：MRS服务的角色。用户组：MRS服务的用户组。权限：定义用户禁止的权限类型。权限和用户允许同时为空值，或者同时不为空值。服务相关权限详情请参考表1。委托用户：当勾选此项时，管理权限将分配给适用的用户和组。受委托的管理员

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > Ranger权限访问控制
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

_cr，该示例表示配置了MRS集群的指定队列。同时在MRS集群的作业管理下，在操作的“更多 > 查看详情”里面可以查看该作业的详细信息。说明：为本次执行的作业配置相关优化参数（例如线程、内存、CPU核数等），用于优化资源使用效率，提升作业的执行性能。Spark代理连接不支持该配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
开发SQL脚本 - 数据治理中心 DataArts Studio

选择DLI的数据目录。在DLI默认的数据目录dli。在DLI所绑定的LakeFormation已创建元数据catalog。数据库选择数据库。 DLI数据目录如果选择DLI默认的数据目录dli，表示为DLI的数据库和数据表。 DLI数据目录如果选择DLI所绑定的LakeFo

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
开发一个Python作业 - 数据治理中心 DataArts Studio

主机的登录方式为密码时，填写主机的登录密码。主机连接描述否主机连接的描述信息。图1 新建主机连接关键参数说明：主机地址：已开通ECS主机中开通的ECS主机的IP地址。绑定Agent：已开通批量数据迁移增量包中开通的CDM集群。单击“测试”，测试数据连接的连通性。如果无法连通，数据连接将无法创建。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程

总条数： 201

上一页
1
...
6
7
8
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

解绑/绑定CDM集群的EIP - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

新建实时集成作业 - 数据治理中心 DataArts Studio

诊断数据安全风险 - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

新建离线处理集成作业 - 数据治理中心 DataArts Studio

原子指标 - 数据治理中心 DataArts Studio

新建作业 - 数据治理中心 DataArts Studio

提交版本 - 数据治理中心 DataArts Studio

基线运维约束限制 - 数据治理中心 DataArts Studio

运维概览 - 数据治理中心 DataArts Studio

管理动态脱敏策略 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

新建维度 - 数据治理中心 DataArts Studio

新建事实表 - 数据治理中心 DataArts Studio

配置资源权限 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

开发一个Python作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线