搜索_华为云

DLI作业开发流程 - 数据湖探索 DLI

DLI作业开发流程本节内容为您介绍DLI作业开发流程。创建IAM用户并授权使用DLI 如果您是企业用户，并计划使用IAM对您所拥有的DLI资源进行精细的权限管理，请创建IAM用户并授权使用DLI。具体操作请参考创建IAM用户并授权使用DLI。首次使用DLI您需要根据控制台的引导更新DL

帮助中心 > 数据湖探索 DLI > 用户指南
在Spark SQL作业中使用UDF - 数据湖探索 DLI

新建Maven工程，配置pom文件 IntelliJ IDEA 参考操作步骤说明，编写UDF函数代码。 2 编写UDF函数代码 3 调试，编译代码并导出Jar包 4 上传Jar包到OBS OBS控制台将生成的UDF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDF函数 DLI控制台

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

spark.sql(sql).show() } spark.close() } } Python样例代码 #!/usr/bin/python # -*- coding: UTF-8 -*- from __future__ import print_function

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

[asc|desc]...]: 指定排序列，不同列的排序方向可以不一样。 WHERE rownum <= N: Flink 需要 rownum <= N 才能识别一个查询是否为 Top-N 查询。其中， N 代表最大或最小的 N 条记录会被保留。 [AND conditions]: 在 where

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

[asc|desc]...]: 指定排序列，不同列的排序方向可以不一样。 WHERE rownum <= N: Flink 需要 rownum <= N 才能识别一个查询是否为 Top-N 查询。其中， N 代表最大或最小的 N 条记录会被保留。 [AND conditions]: 在 where

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

[asc|desc]...]: 指定排序列，不同列的排序方向可以不一样。 WHERE rownum <= N: Flink 需要 rownum <= N 才能识别一个查询是否为 Top-N 查询。其中， N 代表最大或最小的 N 条记录会被保留。 [AND conditions]: 在 where

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
Spark作业开发类 - 数据湖探索 DLI

如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
pyspark样例代码 - 数据湖探索 DLI

stripMargin).collect().foreach(println) 提交Spark作业将写好的python代码文件上传至OBS桶中。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
（推荐）DLI SDK V3 - 数据湖探索 DLI

huaweicloud-sdk-java-v3 Java SDK使用指导 Java SDK视频指导 Python huaweicloud-sdk-python-v3 Python SDK使用指导 Python SDK视频指导 PHP huaweicloud-sdk-php-v3 PHP SDK使用指导

 帮助中心 > 数据湖探索 DLI > SDK参考
pyspark样例代码 - 数据湖探索 DLI

dli_to_rds") jdbcDF_after.show() 操作结果提交Spark作业将写好的python代码文件上传至OBS桶中。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。创建Spark作业完成后，在控制台单击右上角“执行”提交作业，页面显示“

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
原生数据类型 - 数据湖探索 DLI

回空。 cast(date as timestamp) 根据本地时区生成并返回对应DATE的年/月/日零点的TIMESTAMP值。 cast(date as string) 根据DATE的年/月/日值生成并返回“yyyy-MM-dd”格式的字符串。父主题：数据类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

包文件的OBS路径，格式为：obs://桶名/文件夹路径名/包名。依赖python文件（--py-files）运行spark作业依赖的py-files。可以输入Python文件名称，也可以输入Python文件对应的OBS路径，格式为：obs://桶名/文件夹路径名/文件名。其他依赖文件（--files）

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

见表1。 # 以下参数均支持在提交作业时覆盖。 spark.yarn.isPython=true spark.pyspark.python=python3 # 当前参数值为生产环境web地址 spark.dli.user.uiBaseAddress=https://console

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

据流管道，主要解决云服务外的数据实时传输到云服务内的问题。数据接入服务每小时可从数十万种数据源（如IoT数据采集、日志和定位追踪事件、网站点击流、社交媒体源等）中连续捕获、传送和存储数TB数据。DIS的更多信息，请参见《数据接入服务用户指南》。语法格式 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DLI API类 - 数据湖探索 DLI
DLI API类 - 数据湖探索 DLI

提交SQL作业时，返回“unsupported media Type”信息创建SQL作业的API执行超过时间限制，运行超时报错 API接口返回的中文字符为乱码，如何解决？

帮助中心 > 数据湖探索 DLI > 常见问题
Flink作业常用操作 - 数据湖探索 DLI

否从保存点恢复。勾选“触发保存点”表示创建保存点。不勾选“触发保存点”表示不创建保存点。默认不创建保存点。保存点的生命周期从触发保存点并停止作业开始，重启作业后结束。保存点在重启作业后自动删除，不会一直保存。停止作业过程中，在作业列表的“状态”列中将显示作业状态，说明如下：

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建增强型跨源连接 - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。请求消息表2 请求参数参数名称是否必选参数类型说明 name 是 String 连接名称。名称只能包含数字、英文字母、下划线。不能为空。输入长度不能超过64个字符。 dest_vpc_id 是 String 对应服务的vpc的ID。具体请参考《虚拟私有云API参考》。

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
DLI SDK与API的对应关系 - 数据湖探索 DLI

SDK与API的对应关系 OBS授权表1 OBS授权相关API&SDK的对应关系表 Class Method Java Method Python Method API Authorize OBS授权 authorizeBucket - POST /v1.0/{project_i

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其2019.1往后的版本。安装Maven 开发环境的基本配置（下载并安装 Maven）。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDAF函数开发流程参考如下：图1 UDAF开发流程表2 开发流程说明

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

自研SDK的使用方法。相关开发包请从华为云DLI 开发工具包（SDK）获取。 Java SDK操作指导请参考Java SDK Python SDK操作指导请参考Python SDK DLI SDK调用接口使用https进行访问，有服务端使用证书。

帮助中心 > 数据湖探索 DLI > SDK参考

总条数： 209

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI作业开发流程 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

原生数据类型 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

DLI API类 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线