搜索_华为云

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

Spark_Python”。图2 新建作业进入到作业开发页面，拖动“MRS Spark Python”节点到画布中并单击，配置节点的属性。图3 配置MRS Spark Python节点属性参数设置说明： --master yarn --deploy-mode cluster

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
管理样本库 - 数据治理中心 DataArts Studio

样本时，默认填充分类为左侧选中的分类。图3 新建样本在弹出的新建窗口中填写样本信息，参考表1完成配置。配置完成后单击“确定”即可。图4 新建样本窗口表1 新建样本参数配置参数参数描述 *名称样本名称，只能包含英文字母、数字、“_”，且长度不能超过64个字符，超出部分将被截断。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
数仓规划 - 数据治理中心 DataArts Studio

物理模型、维度模型、数据集市，都是模型，在数仓规划进行统一管理。数仓规划支持细粒度权限管控，在数据安全模块对数据架构模型目录权限管控策略进行配置。新建数仓分层数仓分层支持用户根据实际业务场景进行自定义。具体操作如下：进入数据架构主页面。在数据架构控制台，单击左侧导航树中的“模型设计

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
解锁作业 - 数据治理中心 DataArts Studio

在更新后默认为解除锁定状态。您需要通过“抢锁”功能获取锁定后，才能继续编辑、保存或提交。抢锁的操作依赖于软硬锁的处理策略。配置软硬锁的策略请参见配置默认项。软锁：忽略当前作业或脚本是否被他人锁定，可以进行抢锁或解锁。硬锁：若作业或脚本被他人锁定，则需锁定的用户解锁之后，当前使用人方可抢锁，空间管理员或DAYU

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

创建一个数据开发模块空作业，作业名称为“job_MRS_Flink”。图1 新建作业进入到作业开发页面，拖动“MRS Flink”节点到画布中并单击，配置节点的属性。图2 配置MRS Flink节点属性参数设置说明： --Flink作业名称 wordcount --MRS集群名称选择一个MRS集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
常用EL表达式样例合集 - 数据治理中心 DataArts Studio

注意此方法只能直接获取当前作业里配置的参数值，并不能获取到父作业传递过来的参数值，也不能获取到工作空间里面配置的全局变量，作用域仅为本作业。这种情况下建议使用表达式${job_param_name}，既可以获取到父作业传递过来的参数值，也可以获取到全局配置的变量。获取参数test的值：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
数据目录支持采集哪些对象的资产？ - 数据治理中心 DataArts Studio

对象存储服务OBS MRS Hudi组件（MRS Hudi作为一种数据格式，元数据存放在Hive中，操作通过Spark进行。在Hudi表开启“同步hive表配置”后，可通过采集MRS Hive元数据的方式采集Hudi表的元数据）详情请参见支持的数据源。父主题：数据目录

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据目录
提交版本 - 数据治理中心 DataArts Studio

于个人调试开发。在开发态下，可以随意编辑、保存、运行脚本/作业，不会影响调度中的脚本/作业；另外在作业关联脚本、配置作业依赖时，被关联的脚本/作业均会读取开发态的配置。生产态：提交后版本的脚本/作业为生产态，用于正式调度。在正式调度中，调用脚本、实例重跑、作业依赖、补数据等场景均是关联脚本/作业最新的已提交版本。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发
数据集成操作列表 - 数据治理中心 DataArts Studio

操作名称资源类型事件名称创建集群 cluster createCluster 删除集群 cluster deleteCluster 修改集群配置 cluster modifyCluster 开机 cluster startCluster 重启 cluster restartCluster

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 审计日志 > 支持云审计的关键操作
复制脚本 - 数据治理中心 DataArts Studio

在数据开发主界面的左侧导航栏，选择“数据开发 > 脚本开发”。在脚本目录中选择需要复制的脚本，右键单击脚本名称，选择“拷贝另存为”。图1 复制脚本在弹出的“另存为”页面，配置如表1所示的参数。表1 脚本目录参数参数说明脚本名称脚本的名称，只能包含字符：英文字母、数字、中文、中划线、下划线和点号，且长度小于等于128个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > （可选）管理脚本
使用CDM迁移数据由于字段类型映射不匹配导致报错怎么处理？ - 数据治理中心 DataArts Studio

g转bigint，bigint转int。解决方案根据报错信息找到哪个字段映射有问题，找DBA修改表结构。如果只有极少数据有问题，可以配置脏数据策略解决。父主题：数据集成

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
MySQL迁移时报错：invalid input syntax for integer: "true" - 数据治理中心 DataArts Studio

"true" Where: COPY sd_mask_ext, line 1, column mask_type. 原因分析 MySQL默认开启配置tinyInt1isBit=true，会将TINYINT(1)当作BIT也就是Types.BOOLEAN来处理，将1或0读取为true或false。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
创建脚本 - 数据治理中心 DataArts Studio

为空。 configuration 否 map <String,Object> 用户定义适用于此作业的配置参数，当type参数值为DLI SQL时，才支持此参数。当前支持的配置项列表请参考 conf参数说明。默认值为空。 description 否 String 描述，长度不能超过255个字符。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 脚本开发API
指定文件名迁移 - 数据治理中心 DataArts Studio

名（最多50个），文件名之间默认使用“|”分隔，您也可以自定义文件分隔符，从而实现文件列表迁移。迁移文件或对象时支持文件级增量迁移（通过配置跳过重复文件实现），但不支持断点续传。例如要迁移3个文件，第2个文件迁移到一半时由于网络原因失败，再次启动迁移任务时，会跳过第1个文件，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
复制作业 - 数据治理中心 DataArts Studio

在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发”。在作业目录中选择需要复制的作业，右键单击作业名称，选择“拷贝另存为”。图1 复制作业在弹出的“另存为”页面，配置如表1所示的参数。表1 作业目录参数参数说明作业名称自定义作业的名称，只能包含英文字母、数字、中文、“-”、“_”、“.”，且长度为1～128个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
新建数据质量规则 - 数据治理中心 DataArts Studio

”生成，${Schema_Table1} 通过单击“添加库表参数”生成。单击，开启“添加输入参数”，可以在SQL语句中灵活配置输入参数。例如字段匹配配置表中的行数，输入select count(1) from ${Schema_Table1} where ${Column1}

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
Job内嵌对象 - 数据治理中心 DataArts Studio

注意此方法只能直接获取当前作业里配置的参数值，并不能获取到父作业传递过来的参数值，也不能获取到工作空间里面配置的全局变量，作用域仅为本作业。这种情况下建议使用表达式${job_param_name}，既可以获取到父作业传递过来的参数值，也可以获取到全局配置的变量。获取参数test的值：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
示例场景说明 - 数据治理中心 DataArts Studio

数据开发，包含创建DLI SQL脚本和开发作业。分析10大用户关注最多的产品分析10大用户评价最差的商品开发并调度作业，通过编排作业和配置作业调度策略，定期执行作业，使得用户可以每天获取到最新的数据分析结果。服务退订，如果不再使用DataArts Studio相关服务，请及时进行退订和资源删除。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
移动脚本/脚本目录 - 数据治理中心 DataArts Studio

在脚本目录中选择需要移动的脚本或脚本文件夹，右键单击脚本或脚本文件夹名称，选择“移动”。图1 移动在弹出的“移动脚本”或“移动目录”页面，配置如表1所示的参数。图2 移动脚本图3 移动目录表1 移动脚本/移动目录参数参数说明选择目录选择脚本或脚本目录要移动到的目录，父级目录默认为根目录。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > （可选）管理脚本
指定文件名迁移 - 数据治理中心 DataArts Studio

名（最多50个），文件名之间默认使用“|”分隔，您也可以自定义文件分隔符，从而实现文件列表迁移。迁移文件或对象时支持文件级增量迁移（通过配置跳过重复文件实现），但不支持断点续传。例如要迁移3个文件，第2个文件迁移到一半时由于网络原因失败，再次启动迁移任务时，会跳过第1个文件，

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践

总条数： 1068

上一页
1
...
47
48
49
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

管理样本库 - 数据治理中心 DataArts Studio

数仓规划 - 数据治理中心 DataArts Studio

解锁作业 - 数据治理中心 DataArts Studio

开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

常用EL表达式样例合集 - 数据治理中心 DataArts Studio

数据目录支持采集哪些对象的资产？ - 数据治理中心 DataArts Studio

提交版本 - 数据治理中心 DataArts Studio

数据集成操作列表 - 数据治理中心 DataArts Studio

复制脚本 - 数据治理中心 DataArts Studio

使用CDM迁移数据由于字段类型映射不匹配导致报错怎么处理？ - 数据治理中心 DataArts Studio

MySQL迁移时报错：invalid input syntax for integer: "true" - 数据治理中心 DataArts Studio

创建脚本 - 数据治理中心 DataArts Studio

指定文件名迁移 - 数据治理中心 DataArts Studio

复制作业 - 数据治理中心 DataArts Studio

新建数据质量规则 - 数据治理中心 DataArts Studio

Job内嵌对象 - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

移动脚本/脚本目录 - 数据治理中心 DataArts Studio

指定文件名迁移 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线