搜索_华为云

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。图2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
补数据场景使用介绍 - 数据治理中心 DataArts Studio

M-dd格式的时间。配置补数据作业的调度周期。单击界面右侧的调度配置，配置补数据作业的调度周期，该使用指导配置周期设置为天。图3 配置调度周期作业调度周期设置为天，每天会进行作业调度，并生成一个调度实例。您可以在“实例监控”页面中，查看补数据实例的运行状态。用户可以在该页面

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置环境变量 - 数据治理中心 DataArts Studio

只支持英文字母、数字、“-”、“_”，最大长度为64字符，且参数名称不允许重名。参数名称需根据脚本变量定义中设置的格式来命名。例如，脚本变量定义中设置的格式为${dlf.}，参数名称需要设置为dlf.xxx。参数值是参数值当前支持常量和EL表达式，不支持系统函数。例如支持123，ab

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
导出作业 - 数据治理中心 DataArts Studio

/v1/b384b9e9ab9b4ee8994c8633aabc9505/jobs/myJob/export 响应示例成功响应 HTTP状态码 200 导出文件名为DLF_myJob.zip，解压后文件结构如下： jobs ├─myJob.job scripts ├─CS_PROCESS_TRIP

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
创建补数据实例 - 数据治理中心 DataArts Studio

59:59 +08" parallel 是 int 补数据实例的并行周期数，取值范围[1,5]。设置同时执行的补数据实例数量，最多可同时执行5个实例。 depend_jobs 否 List<JobDTO> 参考表3。 is_day_granularity 否 Boolean

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
MySQL整库迁移到RDS服务 - 数据治理中心 DataArts Studio

ava-5.1.48.jar，然后进行上传。 - 单击“保存”回到连接管理界面。如果保存时出错，一般是由于MySQL数据库的安全设置问题，需要设置允许CDM集群的EIP访问MySQL数据库。创建RDS连接单击CDM集群后的“作业管理”，进入作业管理界面，再选择“连接管理 >

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
补数据场景使用介绍 - 数据治理中心 DataArts Studio

M-dd格式的时间。配置补数据作业的调度周期。单击界面右侧的调度配置，配置补数据作业的调度周期，该使用指导配置周期设置为天。图3 配置调度周期作业调度周期设置为天，每天会进行作业调度，并生成一个调度实例。您可以在“实例监控”页面中，查看补数据实例的运行状态。用户可以在该页面

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
配置OBS目的端参数 - 数据治理中心 DataArts Studio

配置OBS目的端参数支持使用CSV、CarbonData或二进制格式批量传输大量文件到OBS。表1 OBS作为目的端时的作业参数参数类型参数名说明取值样例基本参数桶名写入数据的OBS桶名。 bucket_2 写入目录写入数据到OBS服务器的目录，目录前面不加“/”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
DLI Flink Job - 数据治理中心 DataArts Studio

的资源配置。管理节点CU数量是设置管理单元的CU数，支持设置1~4个CU数，默认值为1个CU。并发数是并发数是指同时运行Flink SQL作业的任务数。说明：并发数不能大于计算单元（CUs-1）的4倍。异常自动启动否设置是否启动异常自动重启功能，当作业异常时将自动重启并恢复作业。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
查询实时作业运行状态 - 数据治理中心 DataArts Studio

Job：创建CloudStream作业，并启动作业 CloudTableManager节点：CloudTable表管理，参考创建和删除表。 OBSManager： OBS路径管理，包括创建和删除路径 RESTAPI： REST API请求 SMN：发送短信或邮件 MRS Spark：执行MRS服务的Spark作业

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
创建数据集成作业 - 数据治理中心 DataArts Studio

Hive开启LDAP认证时配置的密码。 - OBS支持需服务端支持OBS存储。在创建Hive表时，您可以指定将表存储在OBS中。否访问标识(AK) 当“OBS支持”参数选择为“是”时，此参数是必选项。请注意，此处AK/SK对应的账号应具备OBS Buckets Viewer系统权限，否则会无法访问OBS并报“403

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
数据集成概述 - 数据治理中心 DataArts Studio

脏数据归档支持将迁移过程中处理失败的、被清洗过滤掉的、不符合字段转换或者不符合清洗规则的数据单独归档到脏数据日志中，便于用户查看。并支持设置脏数据比例阈值，来决定任务是否成功。 CDM迁移原理用户使用CDM服务时，CDM管理系统在用户VPC中发放全托管的CDM实例。此实例仅提供控制台和Rest

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
（可选）购买规格增量包 - 数据治理中心 DataArts Studio

“操作 > 配额使用量”，查看每个工作空间的配额使用量。设置配额使用量阈值告警购买规格增量包前，您可以设置配额使用量阈值告警。当触发告警时，表明您应当购买规格增量包，否则随着业务量增长，您的业务可能会受到影响。设置配额使用量阈值告警的操作方法如下所示：在DataArts Studio实例卡片上，单击选择“更多

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
MRS MapReduce - 数据治理中心 DataArts Studio

否选择输出数据存储的路径。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
通过目录ID获取路径对象 - 数据治理中心 DataArts Studio

通过目录ID获取路径对象功能介绍通过目录id获取路径对象。通过目录id获取从根目录至当前目录链路上每一层的路径信息。调用方法请参见如何调用API。 URI GET /v1/{project_id}/service/servicecatalogs/{catalog_id}/layerpaths

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 服务目录管理接口
创建并管理工作空间 - 数据治理中心 DataArts Studio

单击“请选择”按钮，您可以选择一个已创建的OBS桶和对象，系统将基于工作空间全局配置作业日志OBS桶。如果不配置该参数，DataArts Studio数据开发的作业日志默认存储在以“dlf-log-{projectId}”命名的OBS桶中。{projectId}即项目ID，您可以参考获取项目ID和账号ID进行获取。

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 管理工作空间
新建一个对账作业实例 - 数据治理中心 DataArts Studio

下图所示。需要分别配置源端和目的端的信息。配置源端连接请参见DWS数据连接参数说明，配置目的端连接请参见DLI数据连接参数说明。配置告警条件，其中单击左侧的表行数（${1_1}）表示左侧源端选中表的行数，单击右侧表行数（${2_1}）表示目的端表行数。此处配置告警条件为${1_1}

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 使用教程
配置条件分支算子 - 数据治理中心 DataArts Studio

API支持定义变量，条件分支、并行处理和输出处理暂不支持。表达式标准写法为：${节点编码|变量名}，定义方法如表2所示。节点编码：由系统动态分配，不可改动。您可以在API编排的画布中，单击节点后在节点详情中查看节点编码，并支持通过复制节点编码。图1 查看节点编码变量名：支持

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
Import GES - 数据治理中心 DataArts Studio

Hive中的点表和边表，并填写元数据输出的OBS路径，单击生成元数据，系统会自动生成xml格式的元数据文件并回填到OBS路径。其中MRS Hive中的点表和边表，即为按GES图数据格式要求标准化后的边数据集和点数据集，需要与“边数据集”和“点数据集”参数所选的OBS桶中边数据集和点数据集保持一致。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
如何在IAM中创建细粒度权限策略？ - 数据治理中心 DataArts Studio

发责任人、运维管理员设置为管理员角色。开发者：开发者拥有工作空间内创建、管理工作项的业务操作权限。建议将任务开发、任务处理的用户设置为开发者。运维者：运维者具备工作空间内运维调度等业务的操作权限，但无法更改工作项及配置。建议将运维管理、状态监控的用户设置为运维者。访客：访客

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费

总条数： 965

上一页
1
...
27
28
29
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

配置环境变量 - 数据治理中心 DataArts Studio

导出作业 - 数据治理中心 DataArts Studio

创建补数据实例 - 数据治理中心 DataArts Studio

MySQL整库迁移到RDS服务 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

查询实时作业运行状态 - 数据治理中心 DataArts Studio

创建数据集成作业 - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

（可选）购买规格增量包 - 数据治理中心 DataArts Studio

MRS MapReduce - 数据治理中心 DataArts Studio

通过目录ID获取路径对象 - 数据治理中心 DataArts Studio

创建并管理工作空间 - 数据治理中心 DataArts Studio

新建一个对账作业实例 - 数据治理中心 DataArts Studio

配置条件分支算子 - 数据治理中心 DataArts Studio

Import GES - 数据治理中心 DataArts Studio

如何在IAM中创建细粒度权限策略？ - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线