搜索_华为云

创建MRS Hive连接器 - 数据治理中心 DataArts Studio

SIMPLE：非安全模式选择Simple鉴权。 KERBEROS：安全模式选择Kerberos鉴权。 SIMPLE Hive版本 Hive的版本。根据服务端Hive版本设置。 HIVE_3_X 用户名选择KERBEROS鉴权时，需要配置MRS Manager的用户名和密码。从HDFS导出目录时，如果需要创建

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
步骤3：数据集成 - 数据治理中心 DataArts Studio

系统提供了默认值，请根据实际业务数据的格式设置各项参数。在本示例中，根据准备数据源中的样例数据格式，需注意以下参数的设置，其他参数经过一一确认均保留默认值即可。字段分隔符：默认值为逗号，本示例保留默认值即可。前N行为标题行：设置为“是”，本示例首行是标题行。标题行数：配置为1。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
步骤6：数据开发处理 - 数据治理中心 DataArts Studio

t_type_开头，命名规则为“数据库名称_汇总表编码”）中复制的，复制节点后需手动配置该节点的“数据连接”和“数据库”参数，“数据库”需设置为事实表所在的数据库。数据开发作业自动生成功能需在管理配置中心中勾选“创建数据开发作业”实现。图14 按付款方式汇总统计节点属性按费率汇总统计节点：为MRS

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
配置行级访问控制 - 数据治理中心 DataArts Studio

配置行级访问控制在业务开发过程中，存在多个开发者共同访问和维护同一张DWS表的场景，需要针对不同开发者设置不同行数据的访问权限。在这种场景下，您可以配置行级访问控制策略，为不同开发者按照行数据进行授权。在数据安全组件新建行级访问控制策略后，通过策略同步，会将行级访问控制策略同

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
IF条件判断教程 - 数据治理中心 DataArts Studio

节点和两个Dummy节点，选中连线图标并拖动，编排图1所示的作业。其中CDM节点的失败策略需要设置为“继续执行下一节点”。图2 配置CDM节点的失败策略右键单击连线，选择“设置条件”，在弹出的“编辑EL表达式”文本框中输入IF条件。每一个条件分支都需要填写IF条件，IF条

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置离线处理集成作业 - 数据治理中心 DataArts Studio

运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度。作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
数据开发 - 数据治理中心 DataArts Studio

月周期的作业依赖天周期的作业，为什么天周期作业还未跑完，月周期的作业已经开始运行？执行DLI脚本，报Invalid authentication怎么办？创建数据连接时，在代理模式下为什么选不到需要的CDM集群？作业配置了每日调度，但是实例没有作业运行调度记录？查看作业日志，但是日志中没有内容？创建了2个作业，但是为什么无法建立依赖关系？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题
业务指标 - 数据治理中心 DataArts Studio

选择指标所属的业务流程。如果您还未创建业务流程，请参见流程设计进行创建。 *设置目的描述设置该指标的目的。 *指标定义需准确描述指标的定义。备注备注信息。自定义指标如果在配置中心的指标配置页面设置了自定义指标，页面中会显示自定义指标参数。创建流程请参见指标配置。配置指标数据信息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计
开发SQL脚本 - 数据治理中心 DataArts Studio

SQL脚本支持配置指定参数和参数值。代理连接不支持。单击右上角的，设置相关脚本的环境变量。举例如下所示：设置Hive SQL脚本的环境变量： --hiveconf hive.merge.mapfiles=true; --hiveconf mapred.job.queue.name=queue1 设置Spark

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
Sub Job - 数据治理中心 DataArts Studio

父作业的环境变量读取替换。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
购买批量数据迁移增量包 - 数据治理中心 DataArts Studio

数据集成CDM集群可用于如下场景：用于创建并运行数据迁移作业，提供数据上云和数据入湖的集成能力。作为在管理中心创建连接时的Agent代理，为DataArts Studio实例和数据源直接提供网络通道。 DataArts Studio实例中已经包含一个仅用于测试、试用等非正式业务场景的CDM集群（试用版除外）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
如何选择版本 - 数据治理中心 DataArts Studio

DataArts Studio数据集成集群：DataArts Studio实例赠送的数据集成集群，推荐作为管理中心数据连接的Agent代理使用，不建议同时作为Agent代理和运行数据迁移作业使用。用于运行数据迁移作业的其他规格数据集成集群推荐通过“批量数据迁移增量包”进行购买（免费版需通过“云数据迁移

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

ava-5.1.48.jar，然后进行上传。 - 单击“保存”回到连接管理界面。如果保存时出错，一般是由于MySQL数据库的安全设置问题，需要设置允许CDM集群的EIP访问MySQL数据库。创建Hive连接单击CDM集群后的“作业管理”，进入作业管理界面，再选择“连接管理 >

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

创建集群连接管理连接管理实现的能力如下：支持DLI、MRS Hive、Spark SQL、DWS、MySQL、主机等连接管理。支持代理连接、直连、MRS API等连接方式。创建连接作业管理作业管理可以实现在同构、异构数据源之间进行表或文件级别的数据迁移，支持表/文件迁移的数据源请参见支持的数据源。

帮助中心 > 数据治理中心 DataArts Studio > 功能总览
实时报警平台搭建 - 数据治理中心 DataArts Studio

d@@,-24*60*60)”。脚本调试无误后，我们需要保存该脚本，脚本名称为“dli_partition_count”。在后续的作业中设置为定期执行该脚本（使用DLF作业开发和作业调度每天定时输出告警统计报表），实现定期输出告警统计报表。创建CDM作业方案的最后一步需要将OBS中的告警统计报表迁移到RDS

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
步骤2：数据准备 - 数据治理中心 DataArts Studio

绑定Agent：需选择一个数据集成集群作为连接代理，该集群和MRS集群必须处于相同的区域、可用区、VPC和子网，并且安全组规则允许两者网络互通。本示例可选择创建DataArts Studio实例时自动创建的数据集成集群。如需连接MRS 2.x版本的集群，请选择2.x版本的数据集成集群作为Agent代理。用户名：

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
批量配置作业 - 数据治理中心 DataArts Studio

策略。责任人设置所选作业的责任人，只能从当前工作空间中的用户选择。如果设置为保持不变，则各作业保持原来的责任人。周期作业实例并发数设置所选作业并行处理的数量。如果设置为保持不变，则保持原来的周期作业实例并发数。是否清理超期等待运行的作业实例如果设置为取消运行，需要

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
通知周期概览 - 数据治理中心 DataArts Studio

才需要配置。设置通知发送的具体日期。当调度周期为周时，可设置为一周中星期一至星期日的某一天或某几天。当调度周期为月时，可设置为一月中每月1号至每月31号的某一天或某几天。具体时间是设置通知发送的具体时间点，可以精确设置到小时和分钟。选择主题是设置通知发送的主题。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理
购买DataArts Studio实例 - 数据治理中心 DataArts Studio

Studio版本，版本差异请参见版本规格说明。说明：购买非免费版DataArts Studio实例时，会默认包含一个数据集成CDM集群，此集群规格建议用于作为连接代理。如需用于数据迁移作业，请购买更高规格的批量数据迁移增量包，详情请参考购买批量数据迁移增量包。计费方式包年包月当前DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio
购买DataArts Studio基础包 - 数据治理中心 DataArts Studio

Studio版本，版本差异请参见版本规格说明。说明：购买非免费版DataArts Studio实例时，会默认包含1个数据集成CDM集群，此集群规格建议用于作为连接代理。如需用于数据迁移作业，请购买更高规格的批量数据迁移增量包，详情请参考购买批量数据迁移增量包。计费方式包年包月当前DataArts

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例

总条数： 472

上一页
1
...
6
7
8
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建MRS Hive连接器 - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

步骤6：数据开发处理 - 数据治理中心 DataArts Studio

配置行级访问控制 - 数据治理中心 DataArts Studio

IF条件判断教程 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

数据开发 - 数据治理中心 DataArts Studio

业务指标 - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

Sub Job - 数据治理中心 DataArts Studio

购买批量数据迁移增量包 - 数据治理中心 DataArts Studio

如何选择版本 - 数据治理中心 DataArts Studio

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

步骤2：数据准备 - 数据治理中心 DataArts Studio

批量配置作业 - 数据治理中心 DataArts Studio

通知周期概览 - 数据治理中心 DataArts Studio

购买DataArts Studio实例 - 数据治理中心 DataArts Studio

购买DataArts Studio基础包 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线