搜索_华为云

DataArts Studio使用流程 - 数据治理中心 DataArts Studio

新建数据质量作业新建数据对账作业数据目录（数据地图与数据权限）在DataArts Studio数据目录模块中，您可以查看数据地图，还可以进行数据权限管理。数据地图查看工作空间内的数据资产数据权限数据权限简介数据安全数据安全为数据湖提供数据生命周期内统一的数据使用保护能力。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

性可以考虑设置为false关闭compaction操作，将Hudi Compaction单独拆成Spark作业交由MRS执行，具体可以参考如何配置Hudi Compaction的Spark周期任务？。 compaction.delta_commits int 40 实时处理集成生成compaction

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
导入连接（待下线） - 数据治理中心 DataArts Studio

连接参数，参数名称请参考每种类型的连接配置项说明，默认值为空。响应参数参数名是否必选参数类型说明 taskId 是 String 任务ID，请调用查询系统任务接口获取导入状态。请求示例 POST /v1/b384b9e9ab9b4ee8994c8633aabc9505/connections/import

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
开发并调度Import GES作业 - 数据治理中心 DataArts Studio

动运行，每日数据将自动导入到GES图中。您如果需要及时了解作业的执行结果是成功还是失败，可以通过数据开发的运维调度界面进行查看，如图9所示。图9 查看作业执行情况父主题：图数据自动化构建与分析

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
API编排典型配置 - 数据治理中心 DataArts Studio

编辑API工作流：在API工作流列表页面，单击对应工作流操作栏中的“编辑”，即可进入API工作流编排页面，重新进行工作流编排或修改。查看API工作流授权：在API工作流列表页面，单击对应工作流操作栏中的“查看授权”，即可进入API完整信息界面，并对工作流进行授权。注意，当入口API的安全认证方式为APP认证

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
上传CDM连接驱动 - 数据治理中心 DataArts Studio

已创建集群。已参见表1下载对应的驱动。已参见FTP/SFTP连接参数说明创建SFTP连接并将对应的驱动上传至线下文件服务器（可选）。如何获取驱动不同类型的关系数据库，需要适配不同类型的驱动。注意，上传的驱动版本不必与待连接的数据库版本相匹配，直接参考表1获取建议版本的JDK8

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
配置HBase 源端参数 - 数据治理中心 DataArts Studio

02:00:00" 或 "${dateformat(yyyy-MM-dd HH:mm:ss, -1, DAY)}" 开始 RowKey 填写需要查询的RowKey。否 0001 结束 RowKey 填写需要结束的RowKey。否 0100 父主题：配置作业源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
隐私数据保护简介 - 数据治理中心 DataArts Studio

）注入暗水印，水印内容不可见，需要进行水印提取。对非结构化数据文件（docx、pptx、xlsx和pdf）注入明水印，可在本地打开文件，查看水印内容。动态水印在数据安全组件开启数据开发动态水印功能并创建动态水印策略后，当策略中指定的用户组或角色在数据开发组件中转储或下载敏感

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护
配置Hive目的端参数 - 数据治理中心 DataArts Studio

当换行符处理方式选择为替换时，指定替换的字符串。 - 执行Analyze语句数据全部写入完成后会异步执行ANALYZE TABLE语句，用于优化Hive表查询速度，执行的SQL如下：非分区表：ANALYZE TABLE tablename COMPUTE STATISTICS 分区表：ANALYZE

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

导入完成后，界面会显示导入情况。如果存在导入失败的情况，请您根据系统报错原因提示，调整后重新导入。搬迁后验证在新空间的作业和连接导入完成后，您可以在新空间查看并验证作业和连接是否与旧空间一致，以确保导入成功。父主题： DataArts Studio配置数据搬迁实践

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
Open/Close Resource - 数据治理中心 DataArts Studio

选择需要开机/关机的具体对象，例如开启某个CDM集群。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据血缘方案简介 - 数据治理中心 DataArts Studio

首先在数据目录组件完成元数据采集任务，当数据开发作业满足自动血缘解析要求或已手动配置血缘，然后成功完成作业调度后，则可以在数据目录模块可视化查看数据血缘关系。父主题：节点数据血缘

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
MRS Hudi连接参数说明 - 数据治理中心 DataArts Studio

单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：每个用户仅允许新增两个访问密钥。为保证访问密钥的安

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
逆向数据库（维度建模） - 数据治理中心 DataArts Studio

选择“全部”时，将数据库中的所有的表都导入。选择“部分”时，请选择需要导入的表。单击“确定”开始执行逆向数据库操作。等待操作执行完成，即可在“上次逆向”中查看结果或者执行重新逆向操作。父主题：通用操作

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
离散小时调度与作业最近依赖调度逻辑 - 数据治理中心 DataArts Studio

实例时，需要向后找，向后查找时，只依赖最近的一个实例。通过图表进一步进行原理解释： “先向前找上游依赖实例，依赖上游一整个区间内的实例” 解释如下：图1 先向前找上游依赖实例，依赖上游一整个区间内的实例 “向前未找到依赖的实例时，需要向后找，向后查找时，只依赖最近的一个实例”

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

OBS上存储脏数据的目录，只有在配置了脏数据目录的情况下才会记录脏数据。用户可以进入脏数据目录，查看作业执行过程中处理失败的数据或者被清洗过滤掉的数据，针对该数据可以查看源数据中哪些数据不符合转换、清洗规则。 /user/dirtydir 单个分片的最大错误记录数当“是否写入脏数据”为“是”才显示该参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
Data Migration - 数据治理中心 DataArts Studio

节点名称，可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符，长度为1～128个字符。 CDM集群名称是选择CDM集群。如需查看集群列表，请单击下拉框右侧的。系统最多允许选择16个集群。 CDM作业消息体是输入CDM作业消息体，作业消息体内容为JSON格式。消息体JSON内容获取方法如下：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
RDS SQL - 数据治理中心 DataArts Studio

解析您输入SQL语句中携带的参数。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据集成概述 - 数据治理中心 DataArts Studio

校验结果。脏数据归档支持将迁移过程中处理失败的、被清洗过滤掉的、不符合字段转换或者不符合清洗规则的数据单独归档到脏数据日志中，便于用户查看。并支持设置脏数据比例阈值，来决定任务是否成功。 CDM迁移原理用户使用CDM服务时，CDM管理系统在用户VPC中发放全托管的CDM实例。此实例仅提供控制台和Rest

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
批量管理CDM作业 - 数据治理中心 DataArts Studio

进入CDM主界面，单击左侧导航上的“集群管理”，选择集群后的“作业管理”。单击“表/文件迁移”显示作业列表，提供以下批量操作：作业分组 CDM支持对分组进行新增、修改、查找、删除。删除分组时，会将组内的所有作业都删除。创建作业的任务配置中，如果已经将作业分配到了不同的分组中，则这里可以按分组显示作业、按分组批量启动作业、按分组导出作业等操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业

总条数： 1193

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DataArts Studio使用流程 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

导入连接（待下线） - 数据治理中心 DataArts Studio

开发并调度Import GES作业 - 数据治理中心 DataArts Studio

API编排典型配置 - 数据治理中心 DataArts Studio

上传CDM连接驱动 - 数据治理中心 DataArts Studio

配置HBase 源端参数 - 数据治理中心 DataArts Studio

隐私数据保护简介 - 数据治理中心 DataArts Studio

配置Hive目的端参数 - 数据治理中心 DataArts Studio

数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

Open/Close Resource - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

MRS Hudi连接参数说明 - 数据治理中心 DataArts Studio

逆向数据库（维度建模） - 数据治理中心 DataArts Studio

离散小时调度与作业最近依赖调度逻辑 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

Data Migration - 数据治理中心 DataArts Studio

RDS SQL - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

批量管理CDM作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线