搜索_华为云

新建Hadoop集群配置 - 数据治理中心 DataArts Studio

以简化复杂的连接参数配置。前提条件已创建集群。已参见表1获取相应Hadoop集群配置文件和Keytab文件。获取集群配置文件和Keytab文件不同Hadoop类型的集群配置文件和Keytab文件获取方式有所不同，请参见表1获取相应Hadoop集群配置文件和Keytab文件。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
数据集成概述 - 数据治理中心 DataArts Studio

DataArts Studio数据集成是一种高效、易用的数据集成服务，围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。数据集成即云数据迁移（Cloud Data

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
OpenSource ClickHouse数据连接参数说明 - 数据治理中心 DataArts Studio

数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称，只能包含中文、英文字母、数字和下划线，不能以下划线开头，且长度不能超过100个字符。适用组件是选择此连接适用的组件。勾选组件后，才能在相应组件内使用本连接。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
数据服务配置数据搬迁 - 数据治理中心 DataArts Studio

如果存在同名API，则按照导入的API更新API定义。导入文件待导入的API文件可以是从其他项目直接导出的API文件，也可以是通过模板填写的Excel文件，需要确保符合模板规范要求。图3 导入API 导入成功后，即可在API列表中查看导入的API。父主题： DataArts

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
新建DataArts Studio与DWS数据湖的连接 - 数据治理中心 DataArts Studio

此外，您还必须确保该云服务的实例与DataArts Studio工作空间所属的企业项目必须相同，如果不同，您需要修改工作空间的企业项目。如果使用企业模式，您还需要注意以下事项：由于企业模式下需要区分开发环境和生产环境，因此您需要分别准备对应生产环境和开发环境的两套数据湖服务，用于隔离开发和生产环境：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
目的端为HBase/CloudTable - 数据治理中心 DataArts Studio

当选取多个列做rowkey时，连接多列的分隔符，例如：“|”。 toJobConfig.isRowkeyRedundancy 否 Boolean 是否将选做Rowkey的数据同时写入HBase的列。 toJobConfig.algorithm 否枚举创建新HBase表时采用的压缩算法，支持SNAPPY和GZ算法，默认为“NONE”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
主机连接参数说明 - 数据治理中心 DataArts Studio

主机的登录方式为密码时，填写主机的登录密码。主机连接描述否主机连接的描述信息。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
Shell/Python节点执行失败，后台报错session is down - 数据治理中心 DataArts Studio

execute failed. Please contact ECS Service. 确认其ECS的sshd_config参数如下。原因分析：由于ssh session超时断开了，因此Shell节点失败。解决办法编辑ECS的/etc/ssh/sshd_config文件，添加或者更新如下两个值。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
通过数据质量对比数据迁移前后结果 - 数据治理中心 DataArts Studio

通过数据质量对比数据迁移前后结果数据对账对数据迁移流程中的数据一致性至关重要，数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。本章以DWS数据迁移到MRS Hive分区表为例，介绍如何通过DataArts Studio中的数据质量模块实现数据迁移前后的一致性校验。前提条件已在数据仓

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
CDM有哪些优势？ - 数据治理中心 DataArts Studio

因此在开发脚本时需要依赖大量的库、SDK等，开发管理成本较高。 CDM提供了Web化的管理控制台，通过Web页实时开通服务。用户只需要通过可视化界面对数据源和迁移任务进行配置，服务会对数据源和任务进行全面的管理和维护，用户只需关注数据迁移的具体逻辑，而不用关心环境等问题，极大降低了开发维护成本。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

名称：用户自定义连接名称，例如“oracle_link”。数据库服务器地址、端口：配置为Oracle服务器的地址、端口。数据库名称：选择要导出数据的Oracle数据库名称。用户名、密码：Oracle数据库的登录用户名和密码，该用户需要拥有Oracle元数据的读取权限。单击“保存”回到连接管理界面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
管理资产标签 - 数据治理中心 DataArts Studio

标签是用来标识数据的业务含义，是相关性很强的关键字，可以帮助您对资产进行分类和描述，以便于检索。为方便管理技术资产，可以从业务角度定义标签，并与技术资产关联，比如标识某个表是SDI贴源数据层、DWI数据整合层等。标签和分类 “标签”是相关性很强的关键字，帮助用户对资产进行分类和描述，以便于检索。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 查看工作空间数据地图
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

、跨列、跨行和跨表的分析。DQC支持数据的标准化，能够根据数据标准自动生成标准化的质量规则。支持周期性的监控。数据质量监控查看质量评分质量评分为5分制，是以表关联的规则为基础进行评分的。而表、业务对象、主题域等不同维度的评分，本质上是基于规则评分在不同维度下的加权平均值进行计算的。

帮助中心 > 数据治理中心 DataArts Studio > 功能总览
配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

是：开启后如果出现HBase服务器宕机，则可以从WAL中回放执行之前没有完成的操作。否：关闭时能提升写入性能，但如果HBase服务器宕机可能会造成数据丢失。否匹配数据类型是：源端数据库中的Short、Int、Long、Float、Double、Decimal类型列的数据，会转换为By

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
数据开发概述 - 数据治理中心 DataArts Studio

或多个业务相关的作业，一个作业可以被多个解决方案复用。作业：作业由一个或多个节点组成，执行作业可以完成对数据的一系列操作。脚本：脚本（Script）是一种批处理文件的延伸，是一种纯文本保存的程序，一般来说的计算机脚本程序是确定的一系列控制计算机进行运算操作动作的组合，在其中可以实现一定的逻辑分支等。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll.records int 500 消费者每次poll时返回的最大消息条数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
（可选）购买DataArts Studio功能增量包 - 数据治理中心 DataArts Studio

要取决于您对容灾能力和网络时延的要求。如果您的应用需要较高的容灾能力，建议您将资源部署在同一区域的不同可用区内。如果您的应用要求实例之间的网络延时较低，则建议您将资源创建在同一可用区内。详情请参见什么是可用区。工作空间选择需要使用批量数据迁移增量包的工作空间。只有在关联

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
可以免费试用DataArts Studio吗？ - 数据治理中心 DataArts Studio

关于CDM服务的计费详情可参见CDM用户指南。免费版不支持购买增量包，例如无法购买批量数据迁移增量包或作业节点调度次数/天增量包。免费版数据开发组件的脚本数和作业数的配额限制分别为20。免费版仅用于试用场景，在业务负荷大的场景下，无法保证免费版实例上业务的正常运行。免费

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
访问DataArts Studio实例控制台 - 数据治理中心 DataArts Studio

Studio控制台首页。 DataArts Studio新版控制台首页已经上线，您可以通过单击页面上方banner中的“立即体验”进入。新版控制台首页，从功能组件入口升级为集任务处理、资源监控和场景学习于一体的一站式数据工作台，全面为您提升生产效率。图2 旧版控制台首页图3 新版控制台首页

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作
Oracle数据迁移到DWS - 数据治理中心 DataArts Studio

dwslink 数据库服务器 DWS数据库的IP地址或域名。 192.168.0.3 端口 DWS数据库的端口。 8000 数据库名称 DWS数据库的名称。 db_demo 用户名拥有DWS数据库的读、写和删除权限的用户。 dbadmin 密码用户的密码。 - 使用Agent Agent功能待下线，无需配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程

总条数： 910

上一页
1
...
4
5
6
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建Hadoop集群配置 - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

OpenSource ClickHouse数据连接参数说明 - 数据治理中心 DataArts Studio

数据服务配置数据搬迁 - 数据治理中心 DataArts Studio

新建DataArts Studio与DWS数据湖的连接 - 数据治理中心 DataArts Studio

目的端为HBase/CloudTable - 数据治理中心 DataArts Studio

主机连接参数说明 - 数据治理中心 DataArts Studio

Shell/Python节点执行失败，后台报错session is down - 数据治理中心 DataArts Studio

通过数据质量对比数据迁移前后结果 - 数据治理中心 DataArts Studio

CDM有哪些优势？ - 数据治理中心 DataArts Studio

Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

管理资产标签 - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

数据开发概述 - 数据治理中心 DataArts Studio

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

（可选）购买DataArts Studio功能增量包 - 数据治理中心 DataArts Studio

可以免费试用DataArts Studio吗？ - 数据治理中心 DataArts Studio

访问DataArts Studio实例控制台 - 数据治理中心 DataArts Studio

Oracle数据迁移到DWS - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线