搜索_华为云

Hive连接 - 数据治理中心 DataArts Studio

登录Manager平台的用户名，使用集群配置时不用配置 linkConfig.password 否 String 登录Manager平台的密码，使用集群配置时不用配置 linkConfig.uri 否 String 连接Apache Hadoop时的Namenode URI地址，格式为“ip:port”

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
CDM与其他数据迁移服务有什么区别，如何选择？ - 数据治理中心 DataArts Studio

Migration，简称CDM）是一种高效、易用的数据集成服务。CDM围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。更多详情请参见云数据迁移服务。 CDM进行数

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
CDM有哪些优势？ - 数据治理中心 DataArts Studio

并行化处理技术，使用CDM迁移数据的优势如表1所示。表1 CDM优势优势项用户自行开发 CDM 易使用自行准备服务器资源，安装配置必要的软件并进行配置，等待时间长。程序在读写两端会根据数据源类型，使用不同的访问接口，一般是数据源提供的对外接口，例如JDBC、原生API等

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置OBS目的端参数 - 数据治理中心 DataArts Studio

数如表1所示。高级属性里的参数为可选参数，默认隐藏，单击界面上的“显示高级属性”后显示。表1 OBS作为目的端时的作业参数参数类型参数名说明取值样例基本参数桶名写入数据的OBS桶名。 bucket_2 写入目录写入数据到OBS服务器的目录，目录前面不加“/”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

Microsoft SQL Server PostgreSQL 支持从云端的数据库服务导出数据。这些非云服务的数据库，既可以是用户在本地数据中心自建的数据库，也可以是用户在ECS上部署的，还可以是第三方云上的数据库服务。从这些数据源导出数据时，CDM使用JDBC接口抽取数据，源

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

在数据开发主界面，单击左侧导航上的“脚本开发”，进入脚本目录。单击脚本目录中的，选择“显示复选框”。勾选需要导出的脚本，单击 > 导出脚本。导出完成后，即可通过浏览器下载地址，获取到导出的zip文件。图1 选择并导出脚本在弹出的“导出脚本”界面，选择需要导出的脚本的状态，单击“确定”。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
配置OBS目的端参数 - 数据治理中心 DataArts Studio

在迁移表到CSV文件时，CDM默认是不迁移表的标题行，如果该参数选择“是”，CDM在才会将表的标题行数据写入文件。否校验MD5值计算源文件的MD5值，并与OBS返回的MD5值进行校验。 “文件格式”为“二进制格式”时，才有该参数。如果源端已经存在MD5文件，则直接读取源端的MD5文件与OBS返回的MD5值进行校验。例如：否

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

是：开启后如果出现HBase服务器宕机，则可以从WAL中回放执行之前没有完成的操作。否：关闭时能提升写入性能，但如果HBase服务器宕机可能会造成数据丢失。否匹配数据类型是：源端数据库中的Short、Int、Long、Float、Double、Decimal类型列的数据，会转换为By

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
ORACLE数据连接参数说明 - 数据治理中心 DataArts Studio

支持人员。基础与网络连通配置 IP或域名是待连接的数据库的访问地址，可填写为IP或域名，其中公网IP和内网IP地址均支持。端口是待连接的数据库端口。 KMS密钥是通过KMS加解密数据源认证信息，选择KMS中的任一默认密钥或自定义密钥即可。说明：第一次通过DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
Rest Client数据连接参数说明 - 数据治理中心 DataArts Studio

数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称，只能包含中文、英文字母、数字和下划线，不能以下划线开头，且长度不能超过100个字符。适用组件是选择此连接适用的组件。勾选组件后，才能在相应组件内使用本连接。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
处理消息 - 数据治理中心 DataArts Studio

用户Token，使用Token认证时必选。通过调用IAM服务的“获取用户Token”接口获取响应消息头中X-Subject-Token的值。 workspace 是 String 工作空间ID，获取方法请参见实例ID和工作空间ID。 Dlm-Type 否 String 数据服务的版本类型，指定SHARED共享版或EXCLUSIVE专享版。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 消息管理接口
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

和跨表的分析。DQC支持数据的标准化，能够根据数据标准自动生成标准化的质量规则。支持周期性的监控。数据质量监控查看质量评分质量评分为5分制，是以表关联的规则为基础进行评分的。而表、业务对象、主题域等不同维度的评分，本质上是基于规则评分在不同维度下的加权平均值进行计算的。您

 帮助中心 > 数据治理中心 DataArts Studio > 功能总览
LTS数据连接参数说明 - 数据治理中心 DataArts Studio

Studio与非全托管服务通信的代理，所以创建LTS数据连接时，请选择一个CDM集群。如果没有可用的CDM集群，请参考创建CDM集群进行创建。数据集成配置域名是表示通过内部网络访问集群数据库的访问地址，可填写域名。内网访问域名地址在创建集群时自动生成，您可以通过管理控制台获取访问地址：根据注册的账号登录DWS云服务管理控制台。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
创建连接（待下线） - 数据治理中心 DataArts Studio

HOST类型的连接配置项说明参数名是否必选参数类型说明 ip 是 String 主机的地址 port 是 String 主机的SSH端口号 userName 是 String 主机的登录用户名 password 是 String 主机的登录方式为密码时，填写主机的登录密码。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll.records int 500 消费者每次poll时返回的最大消息条数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Shell/Python节点执行失败，后台报错session is down - 数据治理中心 DataArts Studio

execute failed. Please contact ECS Service. 确认其ECS的sshd_config参数如下。原因分析：由于ssh session超时断开了，因此Shell节点失败。解决办法编辑ECS的/etc/ssh/sshd_config文件，添加或者更新如下两个值。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll.records int 500 消费者每次poll时返回的最大消息条数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
导出导入脚本 - 数据治理中心 DataArts Studio

在数据开发主界面的左侧导航栏，选择“数据开发 > 脚本开发”。单击脚本目录中的，选择“显示复选框”。勾选需要导出的脚本，单击 > 导出脚本。导出完成后，即可通过浏览器下载地址，获取到导出的zip文件。图1 选择并导出脚本在弹出的“导出脚本”界面，选择需要导出的脚本的状态，单击“确定”。图2 导出脚本导入脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > （可选）管理脚本
创建集群 - 数据治理中心 DataArts Studio

large规格，8核CPU、16G内存的虚拟机。适合单张表规模≥1000万条的场景。 6ddb1072-c5d7-40e0-a874-8a032e81a698：表示cdm.xlarge规格，16核CPU、32G内存的虚拟机。需要10GE高速带宽进行TB以上的数据量迁移时使用。 type 是

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
数据质量配置数据搬迁 - 数据治理中心 DataArts Studio

导出成功后，在导出记录中单击“下载”，即可通过浏览器下载地址，获取到导出的xlsx文件。图6 获取质量作业导出结果导出对账作业单击左侧导航上的“对账作业”，进入对账作业列表。在对账作业列表，选择需要迁移的对账作业，然后单击“导出”。图7 批量导出对账作业在弹出的导出窗口中，确认选择无误后单击“导出”，导出对账作业。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践

总条数： 256

上一页
1
...
7
8
9
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive连接 - 数据治理中心 DataArts Studio

CDM与其他数据迁移服务有什么区别，如何选择？ - 数据治理中心 DataArts Studio

CDM有哪些优势？ - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

ORACLE数据连接参数说明 - 数据治理中心 DataArts Studio

Rest Client数据连接参数说明 - 数据治理中心 DataArts Studio

处理消息 - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

LTS数据连接参数说明 - 数据治理中心 DataArts Studio

创建连接（待下线） - 数据治理中心 DataArts Studio

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

Shell/Python节点执行失败，后台报错session is down - 数据治理中心 DataArts Studio

DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

导出导入脚本 - 数据治理中心 DataArts Studio

创建集群 - 数据治理中心 DataArts Studio

数据质量配置数据搬迁 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线