搜索_华为云

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

选择连接器类型选择“云数据库 MySQL”后单击“下一步”，配置云数据库 MySQL连接的参数。图4 创建MySQL连接单击“显示高级属性”可查看更多可选参数，具体请参见配置云数据库MySQL/MySQL数据库连接。这里保持默认，必填参数如表1所示。表1 MySQL连接参数参数名

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
MRS Flink Job - 数据治理中心 DataArts Studio

MRS Flink Job 功能通过MRS Flink Job节点执行数据开发模块中预先定义的Flink SQL脚本和Flink作业。 MRS Flink Job节点的具体使用教程，请参见开发一个MRS Flink作业。参数用户可参考表1和表2配置MRS Flink节点的参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MRS Hive SQL - 数据治理中心 DataArts Studio

MRS Hive SQL 功能通过MRS Hive SQL节点执行数据开发模块中预先定义的Hive SQL脚本。 MRS Hive SQL节点的具体使用教程，请参见开发一个Hive SQL作业。 MRS Hive SQL节点不支持Hive的事务表。参数用户可参考表1，表2和表3配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
Hive连接 - 数据治理中心 DataArts Studio

径，您也可以联系管理员获取此文件。使用集群配置前需在集群配置管理中配置此参数。 linkConfig.hiveVersion 是枚举 Hive版本： HIVE_1_X HIVE_3_X linkConfig.user 否 String 登录Manager平台的用户名，使用集群配置时不用配置

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

S集群保持一致，确保网络互通。建立Hive的数据连接开发Hive SQL前，我们需要在“管理中心 > 数据连接”模块中建立一个到MRS Hive的连接，数据连接名称为“hive1009”。创建MRS Hive连接的操作请参见MRS Hive数据连接参数说明。关键参数说明：集群名：已创建的MRS集群。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
DLI Flink Job - 数据治理中心 DataArts Studio

参数 DLI Flink Job的参数配置，请参考以下内容：属性参数：当作业类型为“Flink SQL作业”、“Flink OpenSource SQL作业”或“Flink自定义作业”时，系统会根据在节点中配置的作业情况，进行创建和启动作业。选择已存在的Flink作业：请参见表1。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

创建一个数据开发模块空作业，作业名称为“job_MRS_Flink”。图1 新建作业进入到作业开发页面，拖动“MRS Flink”节点到画布中并单击，配置节点的属性。图2 配置MRS Flink节点属性参数设置说明： --Flink作业名称 wordcount --MRS集群名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置Hive源端参数 - 数据治理中心 DataArts Studio

配置Hive源端参数支持从Hive导出数据，使用JDBC接口抽取数据。 Hive作为数据源，CDM自动使用Hive数据分片文件进行数据分区。表1 Hive作为源端时的作业参数参数类型参数名说明取值样例基本参数读取方式包括HDFS和JDBC两种读取方式。默认为HD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置Hive源端参数 - 数据治理中心 DataArts Studio

配置Hive源端参数作业中源连接为Hive连接时，源端作业参数如表1所示。表1 Hive作为源端时的作业参数参数类型参数名说明取值样例基本参数数据库名称输入或选择数据库名称。单击输入框后面的按钮可进入数据库选择界面。 default 表名输入或选择Hive表名

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置Hive目的端参数 - 数据治理中心 DataArts Studio

配置Hive目的端参数作业中目的连接为Hive连接时，目的端作业参数如表1所示。表1 Hive作为目的端时的作业参数参数名说明取值样例数据库名称输入或选择写入数据的数据库名称。单击输入框后面的按钮可进入数据库选择界面。 default 表名输入或选择写入数据的目标

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置Hive目的端参数 - 数据治理中心 DataArts Studio

TBL_X hive写入模式选择hive的写入模式。 TRUNCATE+LOAD：TRUNCATE模式只清理分区下的数据文件，不删除分区。 LOAD：写入前不做任何处理。 LOAD_OVERWRITE：将生成一个临时目录，目录名为:表名_UUID，使用hive的load ov

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
Hive连接参数说明 - 数据治理中心 DataArts Studio

Hive连接参数说明目前CDM支持连接的Hive数据源有以下几种： MRS Hive FusionInsight Hive Apache Hive 作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。 MRS Hive 用户具有MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
源端为Hive - 数据治理中心 DataArts Studio

] } 参数说明参数是否必选类型说明 fromJobConfig.hive 否 String 待抽取数据的数据源，作业源端为Hive时，这里为“hive”。 fromJobConfig.database 否 String 待抽取数据的数据库，例如“default”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

中已配置的标签。作业描述作业的描述信息。表2 实时处理单任务MRS Flink SQL作业属性信息属性说明 Flink SQL属性 Flink作业名称输入Flink作业名称。系统支持Flink作业名称按照工作空间-作业名称格式自动填入。说明：只能包含英文字母、数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
同步MRS Hive和Hetu权限 - 数据治理中心 DataArts Studio

当前仅支持Hive权限同步至同一MRS集群的Hetu。 Hetu权限同步策略需要配置Hive和Hetu catalog的对应关系。对于一个Hive源对接多个Hetu catalog场景，需要配置多个同步策略。 Hetu权限同步策略创建后，不会自动将已有Hive权限同步至Het

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

任务-Flink JAR”。其他参数按照实际进行配置即可。单击“确定”，进入作业画布界面。配置Flink JAR作业相关参数。表1 配置MRS Flink Jar作业属性参数参数是否必选说明 Flink作业名称是输入Flink作业名称。系统支持Flink作业名称按照工作空间-作业名称格式自动填入。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
目的端为Hive - 数据治理中心 DataArts Studio

类型说明 toJobConfig.hive 否 String 写入数据的数据源。 toJobConfig.database 否 String 写入数据的数据库名称，例如：“default”。 toJobConfig.table 是 String 写入数据的表名。 toJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
创建脚本 - 数据治理中心 DataArts Studio

创建脚本功能介绍创建一个新脚本，当前支持的脚本类型有DLI SQL、Flink SQL、RDS SQL、Spark SQL、Hive SQL、DWS SQL、Shell、Presto SQL、ClickHouse SQL、HetuEngine SQL、Python、Spark

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 脚本开发API
步骤6：数据开发处理 - 数据治理中心 DataArts Studio

历史数据到源数据表，使用数据集成将历史数据从OBS导入到SDI贴源层的原始数据表。历史数据清洗，使用数据开发的MRS Hive SQL脚本将源数据表清洗之后导入DWI层的标准出行数据表。将基础数据插入维度表中。将DWI层的标准出行数据导入DWR层的事实表中。数据汇总，通过Hive SQL将出

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
配置模板 - 数据治理中心 DataArts Studio

Job节点可以使用引入了脚本模板的Flink SQL脚本，同时在MRS Flink Job节点的“运行程序参数”里面可以引用参数模板。在Flink SQL单任务作业中引用脚本模板。在Flink Jar单任务作业中使用参数模板。 Spark SQL和Hive SQL脚本及单任务作业支持引用

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置

总条数： 834

上一页
1
2
3
4
5
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

MRS Flink Job - 数据治理中心 DataArts Studio

MRS Hive SQL - 数据治理中心 DataArts Studio

Hive连接 - 数据治理中心 DataArts Studio

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

配置Hive目的端参数 - 数据治理中心 DataArts Studio

配置Hive目的端参数 - 数据治理中心 DataArts Studio

Hive连接参数说明 - 数据治理中心 DataArts Studio

源端为Hive - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

同步MRS Hive和Hetu权限 - 数据治理中心 DataArts Studio

Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

目的端为Hive - 数据治理中心 DataArts Studio

创建脚本 - 数据治理中心 DataArts Studio

步骤6：数据开发处理 - 数据治理中心 DataArts Studio

配置模板 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线