搜索_华为云

查看数据血缘 - 数据治理中心 DataArts Studio

查看数据血缘首先在数据目录组件完成元数据采集任务，当数据开发作业满足自动血缘解析要求或已手动配置血缘，然后成功完成作业调度后，则可以在数据目录模块可视化查看数据血缘关系。约束限制数据血缘关系更新依赖于作业调度，数据血缘关系是基于最新的作业调度实例产生的。对于同一版本的数据

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
CDM与其他数据迁移服务有什么区别，如何选择？ - 数据治理中心 DataArts Studio

6物理服务器或者私有云、公有云平台上的虚拟机迁移到华为云弹性云服务器上，从而帮助您轻松地把服务器上的应用和数据迁移到华为云。更多详情请参见主机迁移服务。主机迁移服务 SMS 是一种P2V/V2V迁移服务，可以把X86物理服务器、私有云或公有云平台上的虚拟机迁移到华为ECS上。什么是数据库和应用迁移(UGO)？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
Hive连接参数说明 - 数据治理中心 DataArts Studio

时间卡住，可自定义operation超时时间（单位ms）。 Apache Hive Apache Hive连接适用于用户在本地数据中心或ECS上自建的第三方Hadoop，其中本地数据中心的Hadoop需通过专线连接。 Apache Hive的连接参数如表3所示。表3 Apache

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
查看数据血缘 - 数据治理中心 DataArts Studio

查看数据血缘首先在数据目录组件完成元数据采集任务，当数据开发作业满足自动血缘解析要求或已手动配置血缘，然后成功完成作业调度后，则可以在数据目录模块可视化查看数据血缘关系。约束限制数据血缘关系更新依赖于作业调度，数据血缘关系是基于最新的作业调度实例产生的。对于同一版本的数据

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

数据量，以提高性能。 properties.max.partition.fetch.bytes int 1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
通过数据质量对比数据迁移前后结果 - 数据治理中心 DataArts Studio

通过数据质量对比数据迁移前后结果数据对账对数据迁移流程中的数据一致性至关重要，数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。本章以DWS数据迁移到MRS Hive分区表为例，介绍如何通过DataArts Studio中的数据质量模块实现数据迁移前后的一致性校验。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

选择是否开启HBase的预写日志机制（WAL，Write Ahead Log）。是：开启后如果出现HBase服务器宕机，则可以从WAL中回放执行之前没有完成的操作。否：关闭时能提升写入性能，但如果HBase服务器宕机可能会造成数据丢失。否匹配数据类型是：源端数据库中的Short、Int、Lon

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
新建实时集成作业 - 数据治理中心 DataArts Studio

新建实时集成作业前提条件作业在每个工作空间的最大配额为10000，请确保当前作业的数量未达到最大配额。操作步骤参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
事件管理 - 数据治理中心 DataArts Studio

事件管理基线任务及其上游任务出错，或关键路径上的任务变慢时，将会产生相应的事件，用户可以在事件管理页面查看事件详情。基线运维能够及时捕捉导致任务无法按时完成的异常情况并提前预警，保障复杂依赖场景下重要数据能在预期时间内顺利产出。查看事件列表参考访问DataArts Studio实例控制台，登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

选择操作列中的“更多 > 重启”。图5 重启集群重启CDM服务进程：只重启CDM服务的进程，不会重启集群虚拟机。重启集群VM：业务进程会中断，并重启集群的虚拟机。选择“重启集群VM”后单击“确定”。父主题：创建并管理CDM集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
管理静态脱敏任务 - 数据治理中心 DataArts Studio

选择“委托”，在委托列表中查找MRS预置的MRS_ECS_DEFAULT_AGENCY委托，并单击“授权”。如果未找到MRS预置的MRS_ECS_DEFAULT_AGENCY委托，则可以通过自定义购买方式来购买MRS集群，在高级配置中选择绑定MRS_ECS_DEFAULT_AGENCY委托。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
原子指标 - 数据治理中心 DataArts Studio

原子指标原子指标是对指标统计逻辑、具体算法的一个抽象。为了从根源上解决定义、研发不一致的问题，指标定义明确设计统计逻辑（即计算逻辑），不需要二次或者重复研发，从而提升了研发效率，也保证了统计结果的一致性。原子指标中仅含有唯一度量，所含其它所有与该度量、该业务对象相关的属性，旨在用于支撑指标的敏捷自助消费。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标 > 指标开发
DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

数据量，以提高性能。 properties.max.partition.fetch.bytes int 1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.poll

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

连接器类型选择“Oracle”后单击“下一步”，配置Oracle连接参数：名称：用户自定义连接名称，例如“oracle_link”。数据库服务器地址、端口：配置为Oracle服务器的地址、端口。数据库名称：选择要导出数据的Oracle数据库名称。用户名、密码：Oracle数据库的登录用户名和密码

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
CloudTable OpenTSDB连接参数说明 - 数据治理中心 DataArts Studio

CloudTable OpenTSDB连接参数说明连接CloudTable OpenTSDB时，相关参数如表1所示。表1 CloudTable OpenTSDB连接参数参数名说明取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 TSDB_link

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
支持的数据源 - 数据治理中心 DataArts Studio

分库分表同步适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于多库多表同步场景。支持分库分表同步的数据源如下所示：源端为RDS(MySQL)时支持分库分表同步。整库同步支持的数据源类型整库同步适用于将本地数据中心或在ECS上自建的数据库，同步到云

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
新建数据分类 - 数据治理中心 DataArts Studio

新建数据分类本章主要介绍如何创建数据分类规则。只有在创建数据分类规则之后，您才可以创建数据脱敏策略进行数据脱敏。前提条件数据密级定义已完成，请参见新建数据密级。新建分类规则在DataArts Studio控制台首页，选择实例，单击“进入控制台”，选择对应工作空间的“数据目录”模块，进入数据目录页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 配置数据安全策略（待下线）
步骤7：数据质量监控 - 数据治理中心 DataArts Studio

步骤7：数据质量监控数据质量监控DQC（Data Quality Control）模块是对数据库里的数据质量进行质量管理的工具。您可从完整性、有效性、及时性、一致性、准确性、唯一性六个维度进行单列、跨列、跨行和跨表的分析。在DataArts Studio数据质量模块中，可以对业务指标和数据质量进行监控。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
API版本管理 - 数据治理中心 DataArts Studio

API版本管理操作场景数据服务专享版支持将API按照不同版本进行管理，可根据不同的API版本，分别进行调测、发布。您也可以根据API版本追踪API的变更情况，支持版本对比。系统最多保留最近10条的版本记录，更早的版本记录会被删除。前提条件仅专享版支持API版本管理。 A

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 管理API
OBS连接 - 数据治理中心 DataArts Studio

桶类型分为对象桶和并行文件系统，对象桶过滤文件会比较慢，建议客户使用并行文件桶。 linkConfig.server 是 String OBS服务器的终端节点（Endpoint）。 linkConfig.port 是 String 数据传输协议端口，https是443，http是80。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明

总条数： 255

上一页
1
...
4
5
6
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看数据血缘 - 数据治理中心 DataArts Studio

CDM与其他数据迁移服务有什么区别，如何选择？ - 数据治理中心 DataArts Studio

Hive连接参数说明 - 数据治理中心 DataArts Studio

查看数据血缘 - 数据治理中心 DataArts Studio

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

通过数据质量对比数据迁移前后结果 - 数据治理中心 DataArts Studio

配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

新建实时集成作业 - 数据治理中心 DataArts Studio

事件管理 - 数据治理中心 DataArts Studio

查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

管理静态脱敏任务 - 数据治理中心 DataArts Studio

原子指标 - 数据治理中心 DataArts Studio

DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

CloudTable OpenTSDB连接参数说明 - 数据治理中心 DataArts Studio

支持的数据源 - 数据治理中心 DataArts Studio

新建数据分类 - 数据治理中心 DataArts Studio

步骤7：数据质量监控 - 数据治理中心 DataArts Studio

API版本管理 - 数据治理中心 DataArts Studio

OBS连接 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线