搜索_华为云

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何呢？其实PySpark本身就已经考虑到这一点了，那就是基于PyFiles来指定依赖，在DLI Spark作业页面中可以直接选取存放在OBS上的Python第三方程序库（支持zip、egg等）。图1 Spark作业编辑页面对于依赖的这个Python第三方库的压缩包有一定的结

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
pyspark样例代码 - 数据湖探索 DLI

show() id、location、city：限定了长度，插入数据时须按长度给定数据值，否则查询时会发生编码格式错误。操作结果；提交Spark作业将写好的python代码文件上传至OBS桶中。如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
比较函数和运算符 - 数据湖探索 DLI

dis_tab(col int); --插入数据 insert into dis_tab values (2),(3),(5),(null); --查询 select col from dis_tab where col is distinct from null; col ---- 2

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
自定义函数参数传递 - 数据湖探索 DLI

自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource SQL编辑页面右侧自定义配置中添加参数pipeline.g

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource SQL编辑页面右侧自定义配置中添加参数pipeline.g

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

json_string STRING 需要解析的JSON对象，使用字符串表示。 json_path STRING 解析JSON的路径表达式，使用字符串表示。目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式表达式说明 $ 根对象 [] 数组下标 * 数组通配符 .

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通操作场景公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
重启/扩容/缩容队列 - 数据湖探索 DLI

"message": "Submit restart job success, it need some time to cancel jobs, please wait for a while and check job status", "job_id": "d9039

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

json_string STRING 需要解析的JSON对象，使用字符串表示。 json_path STRING 解析JSON的路径表达式，使用字符串表示。目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式表达式说明 $ 根对象 [] 数组下标 * 数组通配符 .

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
字符串函数概览 - 数据湖探索 DLI

BIGINT 查找字符串str1在以逗号（,）分隔的字符串str2中的位置，从1开始计数。 get_json_object get_json_object(string <json>, string <path>) STRING 根据所给路径对json对象进行解析，当json对象非法时将返回NULL。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
实时任务接入 - 数据湖探索 DLI

//指定写入的是Hudi表 'path' = 'obs://bucket/path/hudi_sink_table', //指定Hudi表的存储路径

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Spark3.3.1版本（Spark通用队列场景）使用委托授权访问临时凭证：在创建作业时，请配置作业使用Spark3

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

json_string STRING 需要解析的JSON对象，使用字符串表示。 json_path STRING 解析JSON的路径表达式，使用字符串表示。目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式表达式说明 $ 根对象 [] 数组下标 * 数组通配符 .

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

userDefined源表功能描述您可通过编写代码实现从云生态或者开源生态获取数据，再把获取到的数据作为Flink作业的输入数据。前提条件自定义source类需要继承类RichParallelSourceFunction，并指定数据类型为Row。例如自定义类MySource：public

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

fileName为需要访问的文件名。本节示例适用于Flink 1.12版本。Flink 1.15版本的Jar作业开发指导请参考Flink Jar写入数据到OBS开发指南。配置文件使用方法方案一：直接在main函数里面加载文件内容到内存，然后广播到各个taskmanager，这种方式适合那种需要提前加载的少量变量。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

创建队列功能介绍该API用于创建队列，该队列将会绑定用户指定的计算资源。新队列第一次运行作业时，需要一定的时间，通常为5~15分钟。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1.0/{project_id}/queues 参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

format("redis").options(map).load().show(); 操作结果提交Spark作业将写好的java代码文件上传至OBS桶中。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
userDefined结果表 - 数据湖探索 DLI

userDefined结果表功能描述您可通过编写代码实现将DLI处理之后的数据写入到指定的云生态或者开源生态。前提条件已编写代码实现自定义sink类：自定义sink类需要继承Flink开源类：RichSinkFunction，并指定数据类型为：Tuple2<Boolean

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Flink1.15版本使用委托授权访问临时凭证：在创建作业时，请配置作业使用Flink1.15版本已在作业中配

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？问题现象跨源连接创建对等连接失败，报错信息如下： Failed to get subnet 2c2bd2ed-7296-4c64-9b60-ca25b5eee8fe. Response code : 404, message : {"code":"VPC

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类

总条数： 1081

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

比较函数和运算符 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

重启/扩容/缩容队列 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线