搜索_华为云

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。因此，在单表或整库导入到DWS/FusionInsight LibrA时，建议您在此处手动选择分布列，如果您没有选择，CDM会自动选择一个分布列。关于分布列的更多信息，请参见数据仓库服务。 DWS主

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
什么是数据治理中心DataArts Studio - 数据治理中心 DataArts Studio

开发、治理等能力。DataArts Studio支持对接所有华为云的数据湖与数据库云服务作为数据底座，例如MRS Hive、数据仓库服务DWS等，也支持对接企业传统数据仓库，例如Oracle、MySQL等。 DataArts Studio包含如下功能组件：管理中心提供DataArts

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
新增字段操作指导 - 数据治理中心 DataArts Studio

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。如CDM不支持源端迁

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
新建码表 - 数据治理中心 DataArts Studio

通过逆向数据库导入码表通过逆向数据库，您可以从其他数据源中将一个或多个已创建的数据库表导入到码表目录中，使其变成码表。在数据架构控制台，单击左侧导航树中的“码表管理”，进入码表管理页面。在左侧的码表目录树中，选中一个目录，然后在码表列表上方，单击“逆向数据库”。在“逆

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 标准设计
配置分库源端参数 - 数据治理中心 DataArts Studio

DAY)}' 选择源连接名称为分库连接对应的后端连接时，此作业即为普通的MySQL作业。新建源端为分库连接的作业时，在字段映射阶段，可以在源字段新增样值为“${custom(host)}”样式的自定义字段，用于在多个数据库中的多张表迁移到同一张表后，查看表的数据来源。支持的样值包括： ${custom(host)}

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
获取SQL节点的输出结果值 - 数据治理中心 DataArts Studio

个节点的名称。子作业参数：子作业参数是子作业中定义的参数名，然后在主作业中定义的参数值，传递到子作业以供使用。此处子作业参数名定义为name和score，其值为分别为数据集中的第一列和第二列数值，使用EL表达式#{Loop.current[0]}和#{Loop.current[1]}。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
开发并调度Import GES作业 - 数据治理中心 DataArts Studio

ertex_user_rds2obs”。 edge_friends_rds2hive（CDM Job节点）：在节点属性中，选择创建数据集成作业中的CDM集群，并关联CDM作业“edge_friends_rds2hive”。 edge_friends_rds2obs（CDM Job

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
上传CDM连接驱动 - 数据治理中心 DataArts Studio

不同类型的关系数据库，需要适配不同类型的驱动。注意，上传的驱动版本不必与待连接的数据库版本相匹配，直接参考表1获取建议版本的JDK8 .jar格式驱动即可。表1 获取驱动关系数据库类型驱动名称获取地址建议版本云数据库 MySQL MySQL MYSQL https://downloads

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
DataArts Studio支持连接哪些数据源？ - 数据治理中心 DataArts Studio

Studio支持连接哪些数据源？ DataArts Studio支持对接如DLI、DWS、MRS Hive等云服务，也支持对接如MySQL、Oracle等传统数据库，支持程度各有不同，详情请参见DataArts Studio支持的数据源章节。 DataArts Studio对接数据源，

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 管理中心
获取SQL节点的输出结果值 - 数据治理中心 DataArts Studio

个节点的名称。子作业参数：子作业参数是子作业中定义的参数名，然后在主作业中定义的参数值，传递到子作业以供使用。此处子作业参数名定义为name和score，其值为分别为数据集中的第一列和第二列数值，使用EL表达式#{Loop.current[0]}和#{Loop.current[1]}。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
For Each节点使用介绍 - 数据治理中心 DataArts Studio

每次运行中会将参数值传递到子作业以供使用。例如参数值填写为：#{Loop.current[0]}，即将数据集中每行数据的第一个数值遍历传递给子作业。 For Each节点举例如图1所示。从图中可以看出，子作业“foreach”中的参数名为“result”，参数值为一维数组数据集“[['1']

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
For Each节点使用介绍 - 数据治理中心 DataArts Studio

每次运行中会将参数值传递到子作业以供使用。例如参数值填写为：#{Loop.current[0]}，即将数据集中每行数据的第一个数值遍历传递给子作业。 For Each节点举例如图1所示。从图中可以看出，子作业“foreach”中的参数名为“result”，参数值为一维数组数据集“[['1']

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
数据开发概述 - 数据治理中心 DataArts Studio

个解决方案复用。作业：作业由一个或多个节点组成，执行作业可以完成对数据的一系列操作。脚本：脚本（Script）是一种批处理文件的延伸，是一种纯文本保存的程序，一般来说的计算机脚本程序是确定的一系列控制计算机进行运算操作动作的组合，在其中可以实现一定的逻辑分支等。节点：定义对数据执行的操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
查询API信息 - 数据治理中心 DataArts Studio

CONDITION_TYPE_EQ：等于 CONDITION_TYPE_NE：不等于 CONDITION_TYPE_GT：大于 CONDITION_TYPE_GE：大于等于 CONDITION_TYPE_LT：小于 CONDITION_TYPE_LE：小于等于 CONDITION_TYPE_LIKE：模糊查询如:%like%

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > API管理接口
管理员操作 - 数据治理中心 DataArts Studio

射的DB数据库映射关系进行开发生产环境隔离。数据准备与同步：数据湖服务创建完成后，您需要按照项目规划（例如数据开发需要操作的库表等），分别在开发和生产环境的数据湖服务中，新建数据库、数据库模式（仅DWS需要）、数据表等。对于集群化的数据源（例如MRS、DWS、RDS、MyS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
Env内嵌对象 - 数据治理中心 DataArts Studio

String get(String name) 获取指定名称环境变量值。获取环境变量名称为test的参数值： #{Env.get("test")} 举例获取环境变量名称为test的参数值，EL表达式如下： #{Env.get("test")} 父主题： EL表达式参考

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
IF条件判断教程 - 数据治理中心 DataArts Studio

因为此表达式只能直接获取当前作业里配置的参数的value，并不能获取到父作业传递过来的参数值，也不能获取到工作空间里面配置的全局变量，作用域仅为本作业。而表达式${job_param_name}，既可以获取到父作业传递过来的参数值，也可以获取到全局配置的变量。配置方法开发子作业登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
DWS SQL - 数据治理中心 DataArts Studio

数据连接是默认选择SQL脚本中设置的数据连接，支持修改。数据库是默认选择SQL脚本中设置的数据库，支持修改。脚本参数否关联的SQL脚本如果使用了参数，此处显示参数名称，请在参数名称后的输入框配置参数值。参数值支持使用EL表达式。若关联的SQL脚本，脚本参数发生变化，可单击刷新按钮同步。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
新建规则 - 数据治理中心 DataArts Studio

新建规则管理所有业务规则，规则定义了指标间或者指标和数值间的关系，使用目录维护业务规则。前提条件已在DataArts Studio控制台的“实例 > 进入控制台 > 空间管理 > 数据质量 > 业务指标监控 > 规则管理”页面创建归属目录。基于指标创建业务规则，需要选择规则归属目录，请参见图1创建归属目录。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 业务指标监控（待下线）
表达式概述 - 数据治理中心 DataArts Studio

表达式概述数据开发模块作业中的节点参数可以使用表达式语言（Expression Language，简称EL），根据运行环境动态生成参数值。可以根据Pipeline输入参数、上游节点输出等决定是否执行此节点。数据开发模块EL表达式使用简单的算术和逻辑计算，引用内嵌对象，包括作业对象和一些工具类对象。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考

总条数： 1073

上一页
1
2
3
4
5
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

什么是数据治理中心DataArts Studio - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新建码表 - 数据治理中心 DataArts Studio

配置分库源端参数 - 数据治理中心 DataArts Studio

获取SQL节点的输出结果值 - 数据治理中心 DataArts Studio

开发并调度Import GES作业 - 数据治理中心 DataArts Studio

上传CDM连接驱动 - 数据治理中心 DataArts Studio

DataArts Studio支持连接哪些数据源？ - 数据治理中心 DataArts Studio

获取SQL节点的输出结果值 - 数据治理中心 DataArts Studio

For Each节点使用介绍 - 数据治理中心 DataArts Studio

For Each节点使用介绍 - 数据治理中心 DataArts Studio

数据开发概述 - 数据治理中心 DataArts Studio

查询API信息 - 数据治理中心 DataArts Studio

管理员操作 - 数据治理中心 DataArts Studio

Env内嵌对象 - 数据治理中心 DataArts Studio

IF条件判断教程 - 数据治理中心 DataArts Studio

DWS SQL - 数据治理中心 DataArts Studio

新建规则 - 数据治理中心 DataArts Studio

表达式概述 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线