搜索_华为云

Shell - 数据治理中心 DataArts Studio

Shell节点运行的输出结果不能大于30M，大于30M会报错。主机连接是选择执行Shell脚本的主机。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
通过浏览器调用无认证方式的API - 数据治理中心 DataArts Studio

通过浏览器调用无认证方式的API 当无认证方式的API入参位置在Query或Path时，支持直接通过浏览器调用。无认证方式建议仅在测试接口时使用，不推荐正式使用。若调用方为不可信任用户，则存在数据库安全风险（如数据泄露、数据库高并发访问导致宕机、SQL注入等风险）。本章节以C

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

创建一个数据开发批处理作业，作业名称为“BI_analysis”。图7 新建作业图8 配置作业然后进入到作业开发页面，拖动两个Dummy节点和两个DLI SQL节点到画布中，选中连线图标并拖动，编排图9所示的作业。图9 连接和配置节点属性关键节点说明： Begin（Du

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
支持的数据源 - 数据治理中心 DataArts Studio

分库分表同步适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于多库多表同步场景。支持分库分表同步的数据源如下所示：源端为RDS(MySQL)时支持分库分表同步。整库同步支持的数据源类型整库同步适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

选择操作列中的“更多 > 重启”。图5 重启集群重启CDM服务进程：只重启CDM服务的进程，不会重启集群虚拟机。重启集群VM：业务进程会中断，并重启集群的虚拟机。选择“重启集群VM”后单击“确定”。父主题：创建并管理CDM集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
新建整库迁移作业 - 数据治理中心 DataArts Studio

选择是否记录脏数据，默认不记录脏数据。是脏数据写入连接当“是否写入脏数据”为“是”才显示该参数。脏数据要写入的连接，目前只支持写入到OBS连接。 obs_link OBS桶当“脏数据写入连接”为OBS类型的连接时，才显示该参数。写入脏数据的OBS桶的名称。 dirtydata

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

不归档：不对脏数据进行存储，仅记录到任务日志中。归档到OBS：将脏数据存储到OBS中，并打印到任务日志中。不归档脏数据写入连接 “脏数据策略”选择归档到OBS时显示该参数。脏数据要写入的连接，目前只支持写入到OBS连接。 - 脏数据目录脏数据写入的OBS目录。 - 脏数据阈值

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
导出导入作业 - 数据治理中心 DataArts Studio

导出导入作业导出作业，均是导出开发态的最新的已保存内容。导入作业，会覆盖开发态的内容并自动提交一个新版本。数据开发在跨时区导出导入作业时，需要手动修改expressionTimeZone字段为目标时区。导出作业参考访问DataArts Studio实例控制台，登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

不归档：不对脏数据进行存储，仅记录到任务日志中。归档到OBS：将脏数据存储到OBS中，并打印到任务日志中。不归档脏数据写入连接 “脏数据策略”选择归档到OBS时显示该参数。脏数据要写入的连接，目前只支持写入到OBS连接。 - 脏数据目录脏数据写入的OBS目录。 - 脏数据阈值

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
责任共担 - 数据治理中心 DataArts Studio

户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 安全
创建集群 - 数据治理中心 DataArts Studio

f6：表示cdm.small规格，2核CPU、4G内存的虚拟机。适合PoC验证和开发测试。 fb8fe666-6734-4b11-bc6c-43d11db3c745：表示cdm.medium规格，4核CPU、8G内存的虚拟机适合单张表规模<1000万条的场景。 5ddb1071-

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
管理员操作 - 数据治理中心 DataArts Studio

和开发环境的两套数据湖服务，用于隔离开发和生产环境：对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS），DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发和生产流程中自动切换对应的数据湖。因

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
认证鉴权 - 数据治理中心 DataArts Studio

认证鉴权调用接口有如下两种认证方式，您可以选择其中一种进行认证鉴权。 Token认证：通过Token认证通用请求。 AK/SK认证：通过AK（Access Key ID）/SK（Secret Access Key）加密调用请求。仅当创建IAM用户时的访问方式勾选“编程访问”后

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 如何调用API
步骤1：数据准备 - 数据治理中心 DataArts Studio

Studio企业版）、创建工作空间等一系列操作。然后进入到对应的工作空间，即可开始使用DataArts Studio。数据源准备本入门示例以某电商商城的BI报表数据为例，分析用户和商品的各种数据特征。为方便演示，本示例提供了用于模拟原始数据的部分数据。为了方便将源数据集成到云上，我们需要先将样例数据存

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
字段转换器配置指导 - 数据治理中心 DataArts Studio

se/CloudTable/MongoDB导出数据时，CDM有较大概率无法获得所有列），则可以单击后选择“添加新字段”来手动增加，确保导入到目的端的数据完整。关系数据库、Hive、MRS Hudi及DLI做源端时，不支持获取样值功能。 SQLServer作为目的端数据源时，不支

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
字段转换器配置指导 - 数据治理中心 DataArts Studio

se/CloudTable/MongoDB导出数据时，CDM有较大概率无法获得所有列），则可以单击后选择“添加新字段”来手动增加，确保导入到目的端的数据完整。关系数据库、Hive、MRS Hudi及DLI做源端时，不支持获取样值功能。 SQLServer作为目的端数据源时，不支

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
字段转换器配置指导 - 数据治理中心 DataArts Studio

se/CloudTable/MongoDB导出数据时，CDM有较大概率无法获得所有列），则可以单击后选择“添加新字段”来手动增加，确保导入到目的端的数据完整。关系数据库、Hive、MRS Hudi及DLI做源端时，不支持获取样值功能。 SQLServer作为目的端数据源时，不支

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
Open/Close Resource - 数据治理中心 DataArts Studio

节点名称，可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符，长度为1～128个字符。服务是选择需要开机/关机的服务： ECS CDM 开关机设置是选择开关机类型：开关开关机对象是选择需要开机/关机的具体对象，例如开启某个CDM集群。表2 高级参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
购买批量数据迁移增量包 - 数据治理中心 DataArts Studio

目前数据集成集群支持以下部分规格供用户选择： cdm.large：大规格，8核CPU、16G内存的虚拟机，最大带宽/基准带宽为3/0.8 Gbps，集群作业并发数上限为16。 cdm.xlarge：超大规格，16核CPU、32G内存的虚拟机，最大带宽/基准带宽为10/4 Gbps，集群作业并发数上限为32，适

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
Kafka连接参数说明 - 数据治理中心 DataArts Studio

于不再需要的属性，可单击属性后的“删除”按钮进行删除。 Apache Kafka Apache Kafka连接适用于用户在本地数据中心或ECS上自建的第三方Kafka，其中本地数据中心的Kafka需通过专线连接。连接Apache Hadoop上的Kafka数据源时，相关参数如表2所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数

总条数： 249

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Shell - 数据治理中心 DataArts Studio

通过浏览器调用无认证方式的API - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

支持的数据源 - 数据治理中心 DataArts Studio

查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

新建整库迁移作业 - 数据治理中心 DataArts Studio

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

导出导入作业 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

责任共担 - 数据治理中心 DataArts Studio

创建集群 - 数据治理中心 DataArts Studio

管理员操作 - 数据治理中心 DataArts Studio

认证鉴权 - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

Open/Close Resource - 数据治理中心 DataArts Studio

购买批量数据迁移增量包 - 数据治理中心 DataArts Studio

Kafka连接参数说明 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线