搜索_华为云

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？问题描述 CDM迁移数据到DWS时如何选取分布列？解决方案在使用CDM迁移数据到数据仓库服务（DWS）或者FusionInsight LibrA，且CDM在DWS端自动创建一个新表时，在创建作业的字段映射界面，需要选择分布列，如图1所示。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
MongoDB连接参数说明 - 数据治理中心 DataArts Studio

MongoDB连接参数说明 MongoDB连接适用于第三方云MongoDB服务，以及用户在本地数据中心或ECS上自建的MongoDB，常用于从MongoDB同步数据到大数据平台。连接本地MongoDB数据库时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
SDK使用前准备 - 数据治理中心 DataArts Studio

SDK使用前准备下载SDK，并导入对应SDK到本地开发工具。登录DataArts Studio控制台。单击“数据服务”模块。单击左侧菜单“共享版 > SDK”或“专享版 > SDK”。单击SDK使用引导区域里对应语言的SDK，下载SDK包到本地。进行SDK包完整性校验

 帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考
DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

DMS Kafka连接参数说明连接DMS的Kafka队列时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。表1 DMS Kafka连接参数参数名说明取值样例名称连接的名称，根据连接的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
配置条件分支算子 - 数据治理中心 DataArts Studio

配置条件分支算子条件分支算子通过获取上游算子的请求参数或结果集进行条件判断，根据定义的表达式来确定下一步执行的分支。注意，多个分支满足条件时仅执行第一个满足条件的分支。表1 条件分支算子参数说明分支1 条件类型选择条件类型。满足当前条件时：表示传入“条件分支”的数据满足指定的表达式时，将执行该分支。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
启用细粒度认证 - 数据治理中心 DataArts Studio

启用细粒度认证在DataArts Studio数据开发组件执行脚本、测试运行作业时，数据源会使用数据连接上的账号进行认证鉴权。因此，即使已通过配置角色/权限集对用户进行权限管控，当用户在数据开发时，权限管控依然无法生效。而在配置细粒度认证后，在DataArts Studio数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
同步IAM用户到数据源 - 数据治理中心 DataArts Studio

同步IAM用户到数据源默认情况下，用户通过DataArts Studio数据连接访问数据源（此处指MRS/DWS数据源）时，使用数据连接中的账号密码进行认证。为实现不同用户访问数据源时，能够根据其自身用户信息管控用户访问数据的权限，需要先将IAM上的用户信息同步到数据源上，然后

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理
配置Rest Client源端参数 - 数据治理中心 DataArts Studio

配置Rest Client源端参数表1 Rest Client作为源端时的作业参数参数说明取值样例数据请求地址数据请求的地址。 /data/query 请求方法请求方法，GET/POST。 GET 每次拉取的数量每次拉取的数量。 1000 分页大小参数名称分页大

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
配置MRS ClickHouse目的端参数 - 数据治理中心 DataArts Studio

配置MRS ClickHouse目的端参数作业中目的连接为MRS ClickHouse连接时，目的端作业参数如表1所示。当作业源端为MRS ClickHouse、DWS及Hive时：若int及float类型字段为null时，创建MRS ClickHouse表格时字段类型需设

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
目的端为关系数据库 - 数据治理中心 DataArts Studio

目的端为关系数据库 JSON样例 "to-config-values": { "configs": [ { "inputs": [ { "name": "toJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
DLI连接参数说明 - 数据治理中心 DataArts Studio

DLI连接参数说明连接数据湖探索（DLI）服务时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。迁移数据到DLI时，DLI要在OBS的dli-trans*内部临时桶生成数据文件，因此在需要赋予

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
DateUtil内嵌对象 - 数据治理中心 DataArts Studio

DateUtil内嵌对象 DateUtil内嵌对象提供了一系列时间格式化、时间计算方法。方法表1 方法说明方法描述示例 String format(Date date, String pattern) 将Date类型时间按指定pattern格式为字符串。将作业调度计划的时间，转换为毫秒格式。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

开发一个MRS Spark Python作业本章节介绍如何在数据开发模块上进行MRS Spark Python作业开发。案例一：通过MRS Spark Python作业实现统计单词的个数前提条件：开发者具有OBS相关路径的访问权限。数据准备：准备脚本文件"wordcount

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
步骤3：数据集成入湖 - 数据治理中心 DataArts Studio

步骤3：数据集成入湖本章节将介绍如何使用DataArts Studio数据集成将源数据批量迁移到云上。创建集群批量数据迁移集群提供数据上云和数据入湖的集成能力，全向导式配置和管理，支持单表、整库、增量、周期性数据集成。DataArts Studio基础包中已经包含一个数据集

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

通过CDM节点批量创建分表迁移作业适用场景业务系统中，数据源往往会采用分表的形式，以减少单表大小，支持复杂的业务应用场景。在这种情况下，通过CDM进行数据集成时，需要针对每张表创建一个数据迁移作业。您可以参考本教程，通过数据开发模块的For Each节点和CDM节点，配合作业参数，实现批量创建分表迁移作业。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
新建Hadoop集群配置 - 数据治理中心 DataArts Studio

新建Hadoop集群配置集群配置管理支持新建、编辑或删除Hadoop集群配置。 Hadoop集群配置主要用于新建Hadoop类型连接时，能够简化复杂的连接参数配置，如图1所示。图1 使用集群配置前后对比 CDM支持的Hadoop类型连接主要包括以下几类： MRS集群：MRS HDFS，MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接
配置源端和目标端参数 - 数据治理中心 DataArts Studio

配置源端和目标端参数源端为MySQL，目的端为MRS Hudi 源端为MySQL，目的端为DMS Kafka 源端为MySQL，目的端为DWS 源端为Apache Kafka，目的端为MRS Kafka 源端为DMS Kafka，目的端为OBS 源端为Oracle，目的端为DWS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发
配置调度身份 - 数据治理中心 DataArts Studio

配置调度身份数据开发模块的作业执行中会遇到如下问题：数据开发模块的作业执行机制是以启动作业的用户身份执行该作业。对于按照周期调度方式执行的作业，当启动该作业的IAM账号在调度周期内被停用或删除后，系统无法获取用户身份认证信息，导致作业执行失败。如果作业被低权限的用户启动，也会因为权限不足导致作业执行失败。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
新建整库迁移作业 - 数据治理中心 DataArts Studio

新建整库迁移作业操作场景 CDM支持在同构、异构数据源之间进行整库迁移，迁移原理与新建表/文件迁移作业相同，关系型数据库的每张表、Redis的每个键前缀、Elasticsearch的每个类型、MongoDB的每个集合都会作为一个子任务并发执行。整库迁移作业每次运行，会根据整库

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业
目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

目的端为Elasticsearch/云搜索服务 JSON样例 "to-config-values": { "configs": [ { "inputs": [

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明

总条数： 810

上一页
1
...
30
31
32
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

MongoDB连接参数说明 - 数据治理中心 DataArts Studio

SDK使用前准备 - 数据治理中心 DataArts Studio

DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

配置条件分支算子 - 数据治理中心 DataArts Studio

启用细粒度认证 - 数据治理中心 DataArts Studio

同步IAM用户到数据源 - 数据治理中心 DataArts Studio

配置Rest Client源端参数 - 数据治理中心 DataArts Studio

配置MRS ClickHouse目的端参数 - 数据治理中心 DataArts Studio

目的端为关系数据库 - 数据治理中心 DataArts Studio

DLI连接参数说明 - 数据治理中心 DataArts Studio

DateUtil内嵌对象 - 数据治理中心 DataArts Studio

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

步骤3：数据集成入湖 - 数据治理中心 DataArts Studio

通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

新建Hadoop集群配置 - 数据治理中心 DataArts Studio

配置源端和目标端参数 - 数据治理中心 DataArts Studio

配置调度身份 - 数据治理中心 DataArts Studio

新建整库迁移作业 - 数据治理中心 DataArts Studio

目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线