搜索_华为云

责任共担 - 数据治理中心 DataArts Studio

营安全，以及更广义的安全合规遵从。租户：负责云服务内部的安全，安全地使用云。华为云租户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 安全
查询作业详情 - 数据治理中心 DataArts Studio

选择对应的连接名称与topic，当有新的kafka消息时将会触发作业运行一次配置为：KAFKA 事件类型，当前只支持监听DIS通道的新上报数据事件，每上报一条数据，触发作业运行一次。配置为：DIS 选择要监听的OBS路径，如果该路径下有新增文件，则触发调度；新增的文件的路径名，可以通过变量Job

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

Microsoft SQL Server PostgreSQL 支持从云端的数据库服务导出数据。这些非云服务的数据库，既可以是用户在本地数据中心自建的数据库，也可以是用户在ECS上部署的，还可以是第三方云上的数据库服务。从这些数据源导出数据时，CDM使用JDBC接口抽取数据，源

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
修改作业 - 数据治理中心 DataArts Studio

是 List<String> 依赖的作业名称列表，必须依赖已存在的作业。 dependPeriod 否 String 依赖周期: SAME_PERIOD :依赖被依赖作业的同周期任务的执行结果。 PRE_PERIOD :依赖被依赖作业的前一周期任务的执行结果。默认值 : SAME_PERIOD

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
创建作业 - 数据治理中心 DataArts Studio

是 List<String> 依赖的作业名称列表，必须依赖已存在的作业。 dependPeriod 否 String 依赖周期: SAME_PERIOD :依赖被依赖作业的同周期任务的执行结果。 PRE_PERIOD :依赖被依赖作业的前一周期任务的执行结果。默认值 : SAME_PERIOD

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

端所使用的数据库账号需要满足以下权限要求，才能启动实时同步任务。不同类型的同步任务，需要的账号权限也不同，详细可参考下表进行赋权。表2 数据库账号权限类型名称权限要求源数据库连接账号数据库的CONNECT权限，模式的USAGE权限，表的SELECT权限，序列的SELEC

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
日志提示解析日期格式失败时怎么处理？ - 数据治理中心 DataArts Studio

转换器，将日期字段的格式转换为云搜索服务的目的端格式。解决方案编辑作业，进入作业的字段映射步骤，在源端的时间格式字段后面，选择新建转换器，如图3所示。图3 新建转换器转换器类型选择“表达式转换”，目前表达式转换支持字符串和日期类型的函数，语法和Java的字符串和时间格式函

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
创建集群 - 数据治理中心 DataArts Studio

large规格，8核CPU、16G内存的虚拟机。适合单张表规模≥1000万条的场景。 6ddb1072-c5d7-40e0-a874-8a032e81a698：表示cdm.xlarge规格，16核CPU、32G内存的虚拟机。需要10GE高速带宽进行TB以上的数据量迁移时使用。 type 是

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
数据服务SDK概述 - 数据治理中心 DataArts Studio

Studio数据服务创建的数据API封装的SDK包。通过调用此SDK包提供的代码样例，即可进行数据服务中数据API的调用，帮助开发者简单、快速地通过数据API获取到开放数据。数据服务SDK使用场景数据API是否必须通过数据服务SDK代码才能调用，与数据API的认证方式有关。只有当

 帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考
管理员操作 - 数据治理中心 DataArts Studio

开发和生产环境：对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS），DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发和生产流程中自动切换对应的数据湖。因此您需要准备两套数据湖服务（即两个集

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
Doris数据连接参数说明 - 数据治理中心 DataArts Studio

页面提示完成用户的创建。 MRS 3.1.0及之后版本集群，所创建的用户至少需具备Manager_viewer的角色权限才能在管理中心创建连接；如果需要对应组件的进行库、表、数据的操作，还需要添加对应组件的用户组权限。 MRS 3.1.0版本之前的集群，所创建的用户需要具备Man

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

关系到表的性能，需要格外引起注意。非分区表桶数 = MAX(单表数据量大小(G)/2G*2，再向上取整，4) 分区表桶数 = MAX(单分区数据量大小(G)/2G*2，再后向上取整，1) 其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
Oracle同步到DWS作业配置 - 数据治理中心 DataArts Studio

管理中心对应的连接信息，避免任务连接失败后自动重试，导致数据库账号被锁定影响使用。支持的同步对象范围在使用Migration进行同步时，不同类型的链路，支持的同步对象范围不同，详细情况可参考下表。表3 同步对象范围类型名称使用须知同步对象范围支持同步的DML：包括I

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

常时，会发送短信或邮件通知用户。该功能产生的消息通知不会计入收费项。用户隔离：控制其他用户是否能够查看、操作该集群中的迁移作业和连接。开启该功能时，该集群中的迁移作业、连接会被隔离，华为账号下的其他IAM用户无法查看、操作该集群中的迁移作业和连接。按组批量启动作业会运行组内

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

关系到表的性能，需要格外引起注意。非分区表桶数 = MAX(单表数据量大小(G)/2G*2，再向上取整，4) 分区表桶数 = MAX(单分区数据量大小(G)/2G*2，再后向上取整，1) 其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
MySQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

各同步场景下选择需要同步库表的方式请参考下表。表5 选择需要同步的库表同步场景配置方式整库选择同步对象。表级同步：支持选择Mysql实例下多个库中的多张表进行同步。库级同步：支持选择Mysql实例下的多个库，对库中的所有表进行同步。选择需要迁移的MySQL库表。图4 选择库表

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

_cr，该示例表示配置了MRS集群的指定队列。同时在MRS集群的作业管理下，在操作的“更多 > 查看详情”里面可以查看该作业的详细信息。说明：为本次执行的作业配置相关优化参数（例如线程、内存、CPU核数等），用于优化资源使用效率，提升作业的执行性能。Spark代理连接不支持该配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
开发Shell脚本 - 数据治理中心 DataArts Studio

Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。当前用户已锁定该脚本，否则需要通过“抢锁

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
重启集群 - 数据治理中心 DataArts Studio

SOFTLY：一般重启。默认值为“IMMEDIATELY”。强制重启业务进程会中断，并重启集群的虚拟机。 restartLevel 否 String 重启级别： SERVICE：重启服务。 VM：重启虚拟机。默认值为“SERVICE”。 type 是 String 集群节点类型，只支持“cdm”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
Open/Close Resource - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考

总条数： 295

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

责任共担 - 数据治理中心 DataArts Studio

查询作业详情 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

修改作业 - 数据治理中心 DataArts Studio

创建作业 - 数据治理中心 DataArts Studio

PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

日志提示解析日期格式失败时怎么处理？ - 数据治理中心 DataArts Studio

创建集群 - 数据治理中心 DataArts Studio

数据服务SDK概述 - 数据治理中心 DataArts Studio

管理员操作 - 数据治理中心 DataArts Studio

Doris数据连接参数说明 - 数据治理中心 DataArts Studio

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

Oracle同步到DWS作业配置 - 数据治理中心 DataArts Studio

查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MySQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

重启集群 - 数据治理中心 DataArts Studio

Open/Close Resource - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线