搜索_华为云

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

开发一个Hive SQL作业本章节介绍如何在数据开发模块上进行Hive SQL开发。场景说明数据开发模块作为一站式大数据开发平台，支持多种大数据工具的开发。Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能；可以将S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
数据集成应用示例 - 数据治理中心 DataArts Studio

cdm_endpoint MySQL数据库 IP地址本地的MySQL数据库的IP地址，且该地址允许CDM通过公网IP访问。 1xx.120.85.24 端口 MySQL数据库的端口。 3306 数据库名称待导出数据的MySQL数据库名称。 DB_name 用户名访问MySQL数据库的用户，该用户

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 应用示例
如何使用Java调用CDM的Rest API创建数据迁移作业？ - 数据治理中心 DataArts Studio

如何使用Java调用CDM的Rest API创建数据迁移作业？ CDM提供了Rest API，可以通过程序调用实现自动化的作业创建或执行控制。这里以CDM迁移MySQL数据库的表city1的数据到DWS的表city2为例，介绍如何使用Java调用CDM服务的REST API创建、启动、查询、删除该CDM作业。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
计费说明 - 数据治理中心 DataArts Studio

套餐包计费情况以实际费用为准。数据服务专享集群增量包数据服务专享集群增量包对应数据服务专享版集群。数据服务定位于标准化的数据服务平台，提供一站式数据服务开发、测试部署能力，实现数据服务敏捷响应，降低数据获取难度，提升数据消费体验和效率，最终实现数据资产的变现。数据服务当前提供共享版与专

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
返回结果 - 数据治理中心 DataArts Studio

响应消息体通常以结构化格式（如JSON或XML）返回，与响应消息头中Content-Type对应，传递除响应消息头之外的内容。对于管理员创建IAM用户接口，返回如下消息体。为篇幅起见，这里只展示部分内容。 { "user": { "id": "c131886aec...",

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 如何调用API
源端为DIS - 数据治理中心 DataArts Studio

BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。 fromJobConfig.separator 否 String 字段分隔符。 fromJobConfig.appName 否 String 用户数据消费程序的唯一标识符。父主题：源端作业参数说明

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
通过API工具调用APP认证方式的API - 数据治理中心 DataArts Studio

开关，则当API对应的数据表数据量较大时，获取数据总条数将会比较耗时。此时，如果需要在调用时不计算并返回数据总条数，可以修改use_total_num参数。use_total_num参数用于控制是否计算并返回数据总条数，值为1返回数据总条数，值非1不返回数据总条数。图9 “返回总条数”参数配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
迁移作业原理 - 数据治理中心 DataArts Studio

迁移作业原理数据迁移模型 CDM数据迁移时，简化的迁移模型如图1所示。图1 CDM数据迁移模型 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
HDFS连接 - 数据治理中心 DataArts Studio

配置此参数。 linkConfig.keytab 否 FileContent Kerveros认证所需的keytab文件的本地绝对路径，您也可以联系管理员获取此文件。使用集群配置前需在集群配置管理中配置此参数。 linkConfig.runMode 否枚举选择HDFS连接的运行模式：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
源端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

是否必选类型说明 fromJobConfig.index 是 String 抽取数据的索引，类似关系数据库中的数据库名称。 fromJobConfig.type 是 String 抽取数据的类型，类似关系数据库中的表名。 fromJobConfig.columnList 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
JavaScript - 数据治理中心 DataArts Studio

cn-north-1.huaweicloud.com/app1?a=1"); r.body = '{"a":1}' 给请求添加header头，内容为具体参数数据。如有需要，添加需要签名的其他头域。 1 r.headers = { "x-stage":"RELEASE", "name":"value"}

帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考 > 使用APP认证调用API
导入模型，关系建模，维度建模，码表，业务指标以及流程架构 - 数据治理中心 DataArts Studio

描述 data Object 返回的数据信息。状态码：401 表8 响应Body参数参数参数类型描述 data Object 返回的数据信息。状态码：403 表9 响应Body参数参数参数类型描述 data Object 返回的数据信息。请求示例上传模型exce

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 导入导出接口
数据集成API错误码 - 数据治理中心 DataArts Studio

400 连接到文件服务器时出错。连接到文件服务器时出错。请联系客服或技术支持人员协助解决。 Cdm.0413 400 向文件服务器传输数据时出错。向文件服务器传输数据时出错。请联系客服或技术支持人员协助解决。 Cdm.0415 400 从文件服务器下载文件出错。从文件服务器下载文件出错。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录 > 错误码
获取质量报告子规则字段评分 - 数据治理中心 DataArts Studio

响应Body参数参数参数类型描述 header Array of strings 表头内容。 rows Array<Array<String>> 表行内容。 count Integer 数据总行数，用于分页。状态码： 400 表5 响应Body参数参数参数类型描述 error_code

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量报告接口
监控安全风险 - 数据治理中心 DataArts Studio

Studio数据集成模块中的CDM集群，执行自动实时监控、告警和通知操作。用户可以实时掌握集群运行中所产生的网络流入速率、网络流出速率、CPU使用率、内存使用率、磁盘利用率、失败作业率等信息。关于DataArts Studio支持的监控指标，以及如何创建监控告警规则等内容，请参见查看监控指标。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 安全
FTP/SFTP连接 - 数据治理中心 DataArts Studio

FTP/SFTP连接介绍通过FTP或SFTP连接，可以对FTP或SFTP服务器抽取或加载文件，支持CSV、二进制和JSON格式。连接样例 { "links": [ { "link-config-values": {

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
约束与限制 - 数据治理中心 DataArts Studio

迁移文件或对象时支持文件级增量迁移（通过配置跳过重复文件实现），但不支持断点续传。例如要迁移3个文件，第2个文件迁移到一半时由于网络原因失败，再次启动迁移任务时，会跳过第1个文件，从第2个文件开始重新传，但不能从第2个文件失败的位置重新传。文件迁移时，单个任务支持千万数量的文件，如果待迁移目录下文件过多，建议拆分到不同目录并创建多个任务。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
步骤6：数据开发处理 - 数据治理中心 DataArts Studio

成整个数据的处理分析流程。在DataArts Studio数据开发模块中，您将完成以下步骤：数据管理脚本开发作业开发历史数据到源数据表，使用数据集成将历史数据从OBS导入到SDI贴源层的原始数据表。历史数据清洗，使用数据开发的MRS Hive SQL脚本将源数据表清洗之后导入DWI层的标准出行数据表。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
CDM作业配置管理 - 数据治理中心 DataArts Studio

同步，在任意一处修改即可生效。 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某些作业可能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
导入作业 - 数据治理中心 DataArts Studio

导入作业功能介绍将存放在OBS桶的作业文件导入到DLF，一次可以导入一个或多个作业。执行本接口之前，需要将作业文件放到OBS的桶中。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。 URI URI格式 POST /v1/{project_id}/jobs/import

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API

总条数： 1666

上一页
1
...
12
13
14
...
84
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

数据集成应用示例 - 数据治理中心 DataArts Studio

如何使用Java调用CDM的Rest API创建数据迁移作业？ - 数据治理中心 DataArts Studio

计费说明 - 数据治理中心 DataArts Studio

返回结果 - 数据治理中心 DataArts Studio

源端为DIS - 数据治理中心 DataArts Studio

通过API工具调用APP认证方式的API - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

HDFS连接 - 数据治理中心 DataArts Studio

源端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

JavaScript - 数据治理中心 DataArts Studio

导入模型，关系建模，维度建模，码表，业务指标以及流程架构 - 数据治理中心 DataArts Studio

数据集成API错误码 - 数据治理中心 DataArts Studio

获取质量报告子规则字段评分 - 数据治理中心 DataArts Studio

监控安全风险 - 数据治理中心 DataArts Studio

FTP/SFTP连接 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

步骤6：数据开发处理 - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

导入作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线