搜索_华为云

配置Hive目的端参数 - 数据治理中心 DataArts Studio

间-偏移量”。 TBL_X hive写入模式选择hive的写入模式。 TRUNCATE+LOAD：TRUNCATE模式只清理分区下的数据文件，不删除分区。 LOAD：写入前不做任何处理。 LOAD_OVERWRITE：将生成一个临时目录，目录名为:表名_UUID，使用hive的load

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

结果。系统支持可以预览所调试的SQL信息。 Flink SQL作业调试仅支持MRS集群，进行调试前请先选择MRS集群。OBS桶必须选择并行文件桶，可以在工作空间进行默认配置，请参见Flink调试OBS桶，支持在Flink SQL作业调试时修改。查看脚本执行结果时，双击任意一行的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
数据库部署在其他云 - 数据治理中心 DataArts Studio

为网络连接绑定资源组，实际上是通过资源组网段与中转VPC之间的对等连接连通网络，因此绑定资源组时会在此路由表中添加一条指向资源组VPC网段的路由。为实时网络连接（对等连接）添加数据源网段路由。单击步骤7所创建实时网络连接的“路由信息”，单击“添加路由”，输入本地IDC自建数据库的私有网络地址。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通
重启CDM集群 - 数据治理中心 DataArts Studio

您可以选择重启CDM服务进程或重启集群VM，选择完成并单击确认后即可完成集群重启操作。重启CDM服务进程：只重启CDM服务的进程，不会重启集群虚拟机。重启集群VM：业务进程会中断，并重启集群的虚拟机。父主题：创建并管理CDM集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
Data Migration - 数据治理中心 DataArts Studio

节点执行失败后，是否重新执行节点。是：重新执行节点，请配置以下参数。最大重试次数重试间隔时间（秒）否：默认值，不重新执行节点。说明：建议仅对文件类作业或启用了导入阶段表的数据库作业配置自动重试，避免自动重试重复写入数据导致数据不一致。如果作业节点配置了重试，并且配置了超时时间，该节点执行超时后，系统支持再重试。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
处理消息 - 数据治理中心 DataArts Studio

action 否 Integer 执行动作。0=立刻执行, 1=定期执行。 time 否 String 使用截止时间。仅定期执行需要此参数，默认服务器当前时间三天后。响应参数状态码： 400 表4 响应Body参数参数参数类型描述 error_code String 错误码。 error_msg

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 消息管理接口
查询作业详情 - 数据治理中心 DataArts Studio

variable 表6 Location数据结构说明参数名是否必选参数类型说明 x 是 Int 节点在作业画布上的横轴位置 y 是 Int 节点在作业画布上的纵轴位置表7 condition数据结构说明参数名是否必选参数类型说明 preNodeName 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
DataArts Studio数据开发作业告警最佳实践 - 数据治理中心 DataArts Studio

单击作业目录中的，选择“显示复选框”。图1 显示作业复选框勾选需要配置失败重试的作业，单击 > 作业配置，进入作业配置窗口。对于CDM Job作业，建议仅选择文件类的CDM Job作业或启用了导入阶段表的数据类CDM Job作业。未启用导入阶段表的数据类CDM Job作业可能因作业失败重试引起数据重复写入，导致迁移前后的数据不一致。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
性能调优 - 数据治理中心 DataArts Studio

32GB 32 cdm.4xlarge 64核 128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
创建并管理工作空间 - 数据治理中心 DataArts Studio

目管理云资源的方式，具体请参见《企业管理用户指南》。如果已经创建了企业项目，这里才可以选择。当DataArts Studio实例需连接云上服务（如DWS、MRS、RDS等），还必须确保DataArts Studio工作空间的企业项目与该云服务实例的企业项目相同。一个企业项目下只能购买一个DataArts

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 管理工作空间
购买数据集成资源组增量包 - 数据治理中心 DataArts Studio

购买数据集成资源组增量包数据集成资源组增量包对应数据集成实时作业所需的资源组。数据集成资源组提供数据上云和数据入湖出湖的集成能力，全向导式配置和管理，支持单表、整库、分库分表、全量+增量及增量同步等不同场景的数据迁移。通过购买一个按需计费方式的数据集成资源组增量包，系统会按照

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
MRS Hetu数据连接参数说明 - 数据治理中心 DataArts Studio

WebUI界面，给计算实例添加如下自定义参数：参数名为“protocol.v1.alternate-header-name”，值为“Presto”，参数文件为“coordinator.config.properties”和“worker.config.properties”。注意，通过输入框

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
新建离线处理集成作业 - 数据治理中心 DataArts Studio

设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试如果作业执行失败，可选择自动重试三次或者不重试。推荐值：不重试。建议仅对文件类作业或启用了导入阶段表的数据库作业配置自动重试，避免自动重试重复写入数据导致数据不一致。说明：如果通过DataArts Studio

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
创建集群 - 数据治理中心 DataArts Studio

f6：表示cdm.small规格，2核CPU、4G内存的虚拟机。适合PoC验证和开发测试。 fb8fe666-6734-4b11-bc6c-43d11db3c745：表示cdm.medium规格，4核CPU、8G内存的虚拟机适合单张表规模<1000万条的场景。 5ddb1071-

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
管理动态水印策略 - 数据治理中心 DataArts Studio

选择敏感数据所在的数据库。 *数据表选择敏感数据所在的数据表。单击“确定”，完成动态水印策略创建。相关操作水印提取：获得从数据开发下载的动态水印CSV数据文件后，参考水印提取进行水印溯源。配置策略：在动态水印页面，单击对应任务操作栏中的“配置”，即可配置动态水印策略。编辑策略状态：新增的水印

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

分区表桶数 = MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
修改作业 - 数据治理中心 DataArts Studio

variable 表7 Location数据结构说明参数名是否必选参数类型说明 x 是 Int 节点在作业画布上的横轴位置。 y 是 Int 节点在作业画布上的纵轴位置。表8 condition数据结构说明参数名是否必选参数类型说明 preNodeName 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
创建DataArts Studio数据连接 - 数据治理中心 DataArts Studio

M集群均能访问公网，并且防火墙规则已开放连接端口。如果数据湖为云上服务（如DWS、MRS等），则网络互通需满足如下条件： CDM集群与云上服务处于不同区域的情况下，需要通过公网或者专线打通网络。 CDM集群与云上服务同区域情况下，同虚拟私有云、同子网、同安全组的不同实例默认网络

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

分区表桶数 = MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
配置资源权限 - 数据治理中心 DataArts Studio

Storm Storm的Topology权限： Submit Topology：提交拓扑 File Upload：上传文件 File DownLoad：下载文件 Kill Topology：删除拓扑 Rebalance：Rebalance权限 Activate：激活权限 Deactivate：去激活权限

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > Ranger权限访问控制

总条数： 484

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Hive目的端参数 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

数据库部署在其他云 - 数据治理中心 DataArts Studio

重启CDM集群 - 数据治理中心 DataArts Studio

Data Migration - 数据治理中心 DataArts Studio

处理消息 - 数据治理中心 DataArts Studio

查询作业详情 - 数据治理中心 DataArts Studio

DataArts Studio数据开发作业告警最佳实践 - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

创建并管理工作空间 - 数据治理中心 DataArts Studio

购买数据集成资源组增量包 - 数据治理中心 DataArts Studio

MRS Hetu数据连接参数说明 - 数据治理中心 DataArts Studio

新建离线处理集成作业 - 数据治理中心 DataArts Studio

创建集群 - 数据治理中心 DataArts Studio

管理动态水印策略 - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

修改作业 - 数据治理中心 DataArts Studio

创建DataArts Studio数据连接 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

配置资源权限 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线