搜索_华为云

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

创建一个数据开发模块空作业，作业名称为“job_hive_sql”。图2 创建job_hive_sql作业然后进入到作业开发页面，拖动MRS Hive SQL节点到画布中并单击，配置节点的属性。图3 配置MRS Hive SQL节点属性关键属性说明：节点名称：默认显示为SQ

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
迁移准备 - 数据治理中心 DataArts Studio

校验文件个数以及文件大小。在MRS中恢复HBase表并验证。准备数据项目数据项说明取值示例 DES盒子挂载地址 DES盒子在客户的虚拟机挂载的地址。 //虚拟机IP/huawei 存储管理系统 DES盒子的存储管理系统，与管理IP相关。 https://管理IP:8088/device

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
约束与限制 - 数据治理中心 DataArts Studio

用户在CDM上配置的连接和作业支持导出到本地保存，考虑到密码的安全性，CDM不会将对应数据源的连接密码导出。因此在将作业配置重新导入到CDM前，需要手工编辑导出的JSON文件补充密码或在导入窗口配置密码。不支持集群自动升级到新版本，需要用户通过作业的导出和导入功能，实现升级到新版本。在无OBS的场景下

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
查询连接 - 数据治理中心 DataArts Studio

查询连接功能介绍查询连接接口。调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/clusters/{cluster_id}/cdm/link/{link_name} 表1 路径参数参数是否必选参数类型描述 project_id 是

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 连接管理
Hive连接 - 数据治理中心 DataArts Studio

Hive连接介绍通过Hive连接，可以对MRS的Hive数据源进行抽取、加载数据。连接样例本示例为连接样例消息体。在实际使用中，AK（accessKey）和SK（securityKey）建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 { "links":

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
实时报警平台搭建 - 数据治理中心 DataArts Studio

00440124 8 00440126 0 创建DIS通道我们需要在DIS服务控制台创建两个DIS通道，分别用于实时数据导入到DLI、实时数据导出到OBS。创建实时数据导入到DLI的通道，通道名称为“dis-alarm-input”。图2 创建input通道创建实时数据导出到OBS的

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

SQL脚本构建一个周期执行的作业，使得该脚本能定期执行。创建一个批处理作业，作业名称为“job_dws_sql”。然后进入到作业开发页面，拖动DWS SQL节点到画布中并单击，配置节点的属性。图2 配置DWS SQL节点属性关键属性说明： SQL脚本：关联开发DWS SQL脚本中开发完成的DWS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置实时集成作业 - 数据治理中心 DataArts Studio

不归档：不对脏数据进行存储，仅记录到任务日志中。归档到OBS：将脏数据存储到OBS中，并打印到任务日志中。不归档脏数据写入连接 “脏数据策略”选择归档到OBS时显示该参数。脏数据要写入的连接，目前只支持写入到OBS连接。 - 脏数据目录脏数据写入的OBS目录。 - 脏数据阈值

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
发现敏感数据 - 数据治理中心 DataArts Studio

GB输入值必须在0到16之间，MB输入值必须在0到16,384之间。注意，如申请资源大于可用资源，任务可能失败。 Executor CPU核数用于设置作业申请的每个Executor的CPU核数，决定每个Executor并行执行Task的能力。输入值必须在0到4之间。注意，如申请资源大于可用资源，任务可能失败。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

对象存储：对象存储服务（OBS）文件系统不支持作为目的端。 FTP/SFTP到搜索的迁移仅支持如CSV等文本文件，不支持二进制文件。 FTP/SFTP到OBS的迁移仅支持二进制文件。 HTTP到OBS的迁移推荐使用obsutil工具，请参见obsutil简介。 SFTP HTTP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
新建数据表 - 数据治理中心 DataArts Studio

新建数据表您可以通过可视化模式、DDL模式或SQL脚本方式新建数据表。（推荐）可视化模式：您可以直接在DataArts Studio数据开发模块通过No Code方式，新建数据表。（推荐）DDL模式：您可以在DataArts Studio数据开发模块，通过选择DDL方式，使用SQL语句新建数据表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 数据管理
支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

公测中：云搜索服务（CSS），表格存储服务（CloudTable）文件系统不支持作为目的端。 FTP/SFTP到搜索的迁移仅支持如CSV等文本文件，不支持二进制文件。 FTP/SFTP到OBS的迁移仅支持二进制文件。 HTTP到OBS的迁移推荐使用obsutil工具，请参见obsutil简介。 SFTP HTTP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
MRS Spark数据连接参数说明 - 数据治理中心 DataArts Studio

MRS Spark数据连接参数说明表1 MRS Spark数据连接参数是否必选说明数据连接类型是 MRS Spark连接固定选择为MapReduce服务（MRS Spark）。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

启用SSL认证后，Kafka会将Kafka Broker连接地址视做域名不断进行解析，导致性能消耗。建议修改CDM集群对应的ECS主机（通过集群IP查找对应的ECS主机）中的“/etc/hosts”文件，为其添加Broker连接地址的自映射，以便客户端能够快速解析实例的Broker。例如Kafka

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
查询支持的版本 - 数据治理中心 DataArts Studio

服务ID，用于区分不同服务。 links Array of ClusterLinks objects 链接信息。表6 ClusterLinks 参数参数类型描述 rel String 关系。 href String 链接地址。请求示例 GET /v1.1/1551c7f6c808414d8e9f

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
配置队列权限 - 数据治理中心 DataArts Studio

Ranger）类型的数据连接，请参考创建DataArts Studio数据连接。配置MRS Yarn队列权限前，需要参考同步IAM用户到数据源将IAM上的用户信息同步到数据源上。 MRS Yarn队列权限的策略生效，需要配置YARN严格权限控制，即设置参数“yarn.acl.enable”为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 服务资源访问控制
修改连接 - 数据治理中心 DataArts Studio

修改连接功能介绍修改连接接口。调用方法请参见如何调用API。 URI PUT /v1.1/{project_id}/clusters/{cluster_id}/cdm/link/{link_name} 表1 路径参数参数是否必选参数类型描述 project_id 是

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 连接管理
最小化权限授权实践 - 数据治理中心 DataArts Studio

"ecs:servers:get", "ecs:servers:list", "ecs:servers:stop", "ecs:servers:start", "ecs:flavors:get"

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
创建连接 - 数据治理中心 DataArts Studio

创建连接功能介绍创建连接接口。调用方法请参见如何调用API。 URI POST /v1.1/{project_id}/clusters/{cluster_id}/cdm/link 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 连接管理
Python - 数据治理中心 DataArts Studio

选择执行Python语句的主机。需确认该主机配有用于执行Python脚本的环境。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考

总条数： 249

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

迁移准备 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

查询连接 - 数据治理中心 DataArts Studio

Hive连接 - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

发现敏感数据 - 数据治理中心 DataArts Studio

支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

新建数据表 - 数据治理中心 DataArts Studio

支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

MRS Spark数据连接参数说明 - 数据治理中心 DataArts Studio

DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

查询支持的版本 - 数据治理中心 DataArts Studio

配置队列权限 - 数据治理中心 DataArts Studio

修改连接 - 数据治理中心 DataArts Studio

最小化权限授权实践 - 数据治理中心 DataArts Studio

创建连接 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线