搜索_华为云

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

开发一个Hive SQL作业本章节介绍如何在数据开发模块上进行Hive SQL开发。场景说明数据开发模块作为一站式大数据开发平台，支持多种大数据工具的开发。Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能；可

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

步骤2：数据开发处理本步骤通过BI报表原始数据，分析10大用户关注最多的产品和10大用户评价最差的商品，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。分析10大用户关注最多的产品在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
Hive连接 - 数据治理中心 DataArts Studio

Hive连接介绍通过Hive连接，可以对MRS的Hive数据源进行抽取、加载数据。连接样例本示例为连接样例消息体。在实际使用中，AK（accessKey）和SK（securityKey）建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 { "links":

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

开发一个DWS SQL作业介绍如何在数据开发模块上通过DWS SQL节点进行作业开发。场景说明本教程通过开发一个DWS作业来统计某门店的前一天销售额。环境准备已开通DWS服务，并创建DWS集群，为DWS SQL提供运行环境。已开通CDM增量包，并创建CDM集群。 CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
CDM Job - 数据治理中心 DataArts Studio

存在的作业”，且确保两个集群下分别存在该作业。您可以在其中一个集群新建CDM作业并导出，然后再导入作业到另一个集群，实现作业同步，具体操作方法请参见导出导入CDM作业。 CDM作业类型是选择已存在的作业。创建新作业。说明：如果作业类型为“选择已存在的作业”，当CDM作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置实时集成作业 - 数据治理中心 DataArts Studio

配置实时集成作业完成数据连接、网络、资源组等准备工作的配置后，您可创建并配置实时集成作业，将多种输入及输出数据源搭配组成同步链路，进行数据的实时同步。前提条件已开通华为账号，并授权使用实时数据集成服务，详情请参考注册华为账号并开通华为云和授权使用实时数据集成。已购买资源组，详情请参见购买数据集成资源组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
数据库部署在其他云 - 数据治理中心 DataArts Studio

其他云数据库添加白名单及安全组规则。其他云数据库需要添加Migration资源组VPC网段访问数据库的权限。各厂商云数据库添加白名单的方法不同，请参考各数据库官方文档进行操作。同时，其他云数据库若配置了安全组，则还需要增加入方向规则，放通Migration资源组VPC网段，使其可以访问数据库监听端口。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
查询发布包列表 - 数据治理中心 DataArts Studio

packages 参数说明表1 URI参数说明参数名是否必选参数类型说明 project_id 是 String 项目编号，获取方法请参见项目ID和账号ID。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
配置CDM作业字段映射 - 数据治理中心 DataArts Studio

配置CDM作业字段映射操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段，也可单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
创建API - 数据治理中心 DataArts Studio

创建API 功能介绍创建API。调用方法请参见如何调用API。 URI POST /v1/{project_id}/service/apis 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。请求参数

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > API管理接口
配置OBS源端参数 - 数据治理中心 DataArts Studio

务会立即失败。单位：秒。 10 过滤类型满足过滤条件的路径或文件会被传输，该参数有“无”、“通配符”和“正则表达式”三种选择。具体使用方法可参见文件增量迁移。通配符目录过滤器 “过滤类型”选择“通配符”、“正则表达式”时，用通配符过滤目录，符合过滤器规则的目录，允许进行迁移。支持配置多个路径，中间使用“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
MRS Spark数据连接参数说明 - 数据治理中心 DataArts Studio

MRS Spark数据连接参数说明表1 MRS Spark数据连接参数是否必选说明数据连接类型是 MRS Spark连接固定选择为MapReduce服务（MRS Spark）。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
步骤1：数据准备 - 数据治理中心 DataArts Studio

步骤1：数据准备使用DataArts Studio前的准备如果您是第一次使用DataArts Studio，请参考购买并配置DataArts Studio章节完成注册华为账号、购买DataArts Studio实例（DataArts Studio企业版）、创建工作空间等一系列

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业前提条件参见新建作业创建一个实时处理的单任务DLI Spark作业。配置DLI Spark作业表1 配置属性参数参数是否必选说明作业名称是输入DLI Spark作业名称。作业名称只能包含英文字母、数字、下划线和中划线，且长度为1~64个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
获取主题树信息 - 数据治理中心 DataArts Studio

获取数据资产主题树信息l1，l2，l3。调用方法请参见如何调用API。 URI GET /v2/{project_id}/design/subjects/business 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 主题管理接口
配置OBS源端参数 - 数据治理中心 DataArts Studio

符来区分各个文件，默认为|。 | 过滤类型满足过滤条件的路径或文件会被传输，该参数有“无”、“通配符”和“正则表达式”三种选择。具体使用方法可参见文件增量迁移。通配符目录过滤器 “过滤类型”选择“通配符”、“正则表达式”时，用通配符过滤目录，符合过滤器规则的目录，允许进行迁移。支持配置多个路径，中间使用“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业前提条件参见新建作业创建一个实时处理的单任务Flink Jar作业。配置MRS Flink Jar作业表1 配置MRS Flink Jar作业属性参数参数是否必选说明 Flink作业名称是输入Flink作业名称。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发

总条数： 824

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

Hive连接 - 数据治理中心 DataArts Studio

开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

CDM Job - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

数据库部署在其他云 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

查询发布包列表 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

配置CDM作业字段映射 - 数据治理中心 DataArts Studio

创建API - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

MRS Spark数据连接参数说明 - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

获取主题树信息 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线