搜索_华为云

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业在本章节您可以学习到数据开发模块资源管理、作业编辑等功能。场景说明用户在使用DLI服务时，大部分时间会使用SQL对数据进行分析处理，有时候处理的逻辑特别复杂，无法通过SQL处理，那么可以通过Spark作业进行分析处理。本章节通过一个例子演示如何

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
curl - 数据治理中心 DataArts Studio

curl 操作场景使用curl命令调用APP认证的API时，您需要先下载JavaScript SDK生成curl命令，然后将curl命令复制到命令行调用API。前提条件已获取API的域名、请求url、请求方法、AppKey和AppSecret等信息，具体参见认证前准备。获取SDK

帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考 > 使用APP认证调用API
查询资源详情 - 数据治理中心 DataArts Studio

查询资源详情功能介绍查询资源详情，一个资源包含jar、zip、properties等文件，已经创建的资源在DLI Spark、MRS Spark等作业节点中使用。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。 URI URI格式 GET /v1/{p

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 资源管理API
源端为DIS - 数据治理中心 DataArts Studio

源端为DIS JSON样例 "from-config-values": { "configs": [ { "inputs": [ {

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
通知周期概览 - 数据治理中心 DataArts Studio

通知周期概览操作场景用户可以按照天/周/月为调度周期配置通知任务，向相关人员发送通知。让相关人员可以定期跟踪作业的调度情况（作业调度成功数量，作业调度失败异常数量以及作业失败详情）。约束限制该功能依赖于OBS服务。前提条件已开通消息通知服务并配置主题，为主题添加订阅。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理
DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

DMS Kafka连接参数说明连接DMS的Kafka队列时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。表1 DMS Kafka连接参数参数名说明取值样例名称连接的名称，根据连接的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
HBase连接 - 数据治理中心 DataArts Studio

HBase连接介绍通过HBase连接，可以对MRS、FusionInsight HD、Apache Hadoop的HBase抽取、加载数据。连接样例 { "links": [ { "link-config-values": { "configs":

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
开发Shell脚本 - 数据治理中心 DataArts Studio

开发Shell脚本数据开发支持对Shell脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。前提条件已新增Shell脚本，请参见新建脚本。已新建主机连接，该Linux主机用于执行Shell脚本，请参见主机连接参数说明。连

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
创建简单模式工作空间 - 数据治理中心 DataArts Studio

创建简单模式工作空间购买DataArts Studio实例的用户，系统将默认为其创建一个默认的工作空间“default”，并赋予该用户为管理员角色。您可以使用默认的工作空间，也可以参考本章节的内容创建一个新的工作空间。 DataArts Studio实例内的工作空间作为成员管理

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 创建并配置简单模式工作空间
贯标与评估流程 - 数据治理中心 DataArts Studio

贯标与评估流程贯标流程 DCMM贯标流程主要分为三个阶段：差距分析：贯标启动，进行差距分析。能力提升：建立数据管理组织，完善制度，内部运行并开展自评估。评估确认：组建评估队伍，开展第三方评估，获取评估报告和能力证书。图1 DCMM贯标流程评估流程 DCMM评估流程分为如下步骤：

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍 > 数据治理解决方案 > 数据管理能力成熟度模型DCMM
数据开发错误码 - 数据治理中心 DataArts Studio

数据开发错误码错误响应消息格式如下： { "error_code":"DLF.0100", "error_msg":"The job not found" } 错误码如表1所示。表1 错误码状态码错误码错误信息描述处理措施 400 DLF.0100 The job does

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录 > 错误码
Kafka连接参数说明 - 数据治理中心 DataArts Studio

Kafka连接参数说明 MRS Kafka 连接MRS上的Kafka数据源时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。表1 MRS Kafka连接参数参数名说明取值样例名称连接的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
新建原子指标 - 数据治理中心 DataArts Studio

新建原子指标原子指标是对指标统计逻辑、具体算法的一个抽象。为了从根源上解决定义、研发不一致的问题，指标定义明确设计统计逻辑（即计算逻辑），不需要ETL二次或者重复研发，从而提升了研发效率，也保证了统计结果的一致性。原子指标：原子指标中的度量和属性来源于多维模型中的维度表和事实

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本在创建表/文件迁移作业时，对简单CSV格式的文件，CDM可以使用字段分隔符进行字段分隔。但是对于一些复杂的半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
下载中心 - 数据治理中心 DataArts Studio

下载中心数据开发模块对于SQL脚本执行的结果支持直接下载和转储。SQL执行结果进行下载和转储后，可以通过下载中心查看下载和转储的结果。约束与限制仅SQL脚本和单任务SQL作业运行完成并且返回结果后，执行下载和转储，在下载中心生成记录，可以查看下载和转储的结果。下载中心下

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业前提条件参见新建作业创建一个实时处理的单任务DLI Spark作业。配置DLI Spark作业表1 配置属性参数参数是否必选说明作业名称是输入DLI Spark作业名称。作业名称只能包含英文字母、数字、下划线和中划线，且长度为1~64个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
打不开作业日志，返回404报错？ - 数据治理中心 DataArts Studio

打不开作业日志，返回404报错？可能原因作业日志打不开，可能权限不足。解决方案作业日志在OBS桶中存储，您需要先在工作空间中配置作业日志的桶目录，然后确认当前账户是否具有OBS读权限（可以通过检查IAM中OBS权限、OBS桶策略来确认）。 OBS路径仅支持OBS桶，不支持并行文件系统。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
新建衍生指标 - 数据治理中心 DataArts Studio

新建衍生指标衍生指标是原子指标通过添加限定、维度卷积而成，限定、维度均来源于原子指标中的属性。发布衍生指标时，会自动生成一张汇总表，可在“汇总表-自动汇聚”下查看。衍生指标=原子指标+统计维度+时间限定+通用限定。原子指标：明确统计口径，即计算逻辑。统计维度：用于观察和分

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
DIS Dump - 数据治理中心 DataArts Studio

DIS Dump 功能通过DIS Dump节点配置DIS的数据转储任务。参数用户可参考表1和表2配置DIS Dump节点的参数。表1 属性参数参数是否必选说明节点名称是节点名称，可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符，长度为1～128个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
新建复合指标 - 数据治理中心 DataArts Studio

新建复合指标复合指标是由一个或多个衍生指标叠加计算而成，其中的维度、限定均继承于衍生指标。注意，不能脱离衍生指标、维度和限定的范围，去产生新的维度和限定。约束与限制单工作空间允许创建的复合指标个数最多5000个。前提条件您已新建衍生指标，并且衍生指标已通过审核，具体操作请参见新建衍生指标。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标

总条数： 705

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

curl - 数据治理中心 DataArts Studio

查询资源详情 - 数据治理中心 DataArts Studio

源端为DIS - 数据治理中心 DataArts Studio

通知周期概览 - 数据治理中心 DataArts Studio

DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

HBase连接 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

创建简单模式工作空间 - 数据治理中心 DataArts Studio

贯标与评估流程 - 数据治理中心 DataArts Studio

数据开发错误码 - 数据治理中心 DataArts Studio

Kafka连接参数说明 - 数据治理中心 DataArts Studio

新建原子指标 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

下载中心 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

打不开作业日志，返回404报错？ - 数据治理中心 DataArts Studio

新建衍生指标 - 数据治理中心 DataArts Studio

DIS Dump - 数据治理中心 DataArts Studio

新建复合指标 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线