搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
pyspark样例代码 - 数据湖探索 DLI

test_dds").show() 提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
自定义函数参数传递 - 数据湖探索 DLI

可以在Flink OpenSource SQL编辑页面，自定义配置中配置参数pipeline.global-job-parameters，在UDF代码中获取该参数并使用。如需修改参数值，直接在FlinkOpenSource SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

可以在Flink OpenSource SQL编辑页面，自定义配置中配置参数pipeline.global-job-parameters，在UDF代码中获取该参数并使用。如需修改参数值，直接在FlinkOpenSource SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

创建Spark作业 Spark作业编辑页面支持执行Spark作业，为用户提供全托管式的Spark计算服务。在总览页面，单击Spark作业右上角的“创建作业”，或在Spark作业管理页面，单击右上角的“创建作业”，均可进入Spark作业编辑页面。进入Spark作业编辑页面，页面会提示系统将

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
levenshtein - 数据湖探索 DLI
levenshtein - 数据湖探索 DLI

离，如levenshtein('kitten','sitting') =3。 Levenshtein距离，是编辑距离的一种。指两个字串之间，由一个转成另一个所需的最少编辑操作次数。命令格式 levenshtein(string A, string B) 参数说明表1 参数说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业登录DLI管理控制台，选择“SQL编辑器”首进入提交SQL作业的界面。提交SQL作业时需要选择支持Hudi的Spark SQL队列。创建一张Hudi表：将如下的建表语句粘贴至DLI SQL编辑器的输入区域，修改 LOCATION，执行引擎选择Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
在DLI控制台预览表数据 - 数据湖探索 DLI

“SQL编辑器”页面。在“数据管理”页面预览数据。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需导出数据对应数据库名称，进入该数据库“表管理”页面。单击目标表“操作”栏中的“更多”，选择“表属性”。单击“预览”页签，即可预览该表数据。在“SQL编辑器”页面预览数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

后自动重启。操作步骤登录DLI控制台，选择“作业管理”>“Flink作业”。在Flink作业编辑页面，勾选“异常自动重启”。例如，图1所示。图1 Flink SQL作业编辑界面父主题： Flink作业咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
Delta常见配置参数 - 数据湖探索 DLI

Delta常见配置参数提交DLI Spark SQL作业时，在“SQL编辑器”界面右上角的“设置 > 参数设置”中配置Delta参数。表1 Delta常见配置项参数描述默认值 spark.databricks.delta.retentionDurationCheck.enabled

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

提交日志：查看提交作业的日志。 Driver日志：查看运行作业的日志。重新执行作业在“Spark作业”页面，单击对应作业“操作”列中的“编辑”，跳转至“Spark作业编辑”页面，可根据需要修改参数，执行作业。查找作业在“Spark作业”页面，选择“状态”或“队列”。系统将根据设置的过滤条件，在作业列表显示符合对应条件的作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI程序包标签管理 - 数据湖探索 DLI

程序包管理”。选择程序包，单击操作列的“更多 > 标签”，显示当前程序包组或程序包的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框。在“添加/编辑标签”对话框中配置标签参数。表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
错误码 - 数据湖探索 DLI
错误码 - 数据湖探索 DLI

I对应的错误码来定位错误原因。当调用出错时，HTTP 请求返回一个 4xx 或 5xx 的 HTTP 状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时，可以联系企业技术人员，并提供错误码，以便我们尽快帮您解决问题。错误响应Body体格式说明当接口调

 帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
Flink Jar作业开发基础样例 - 数据湖探索 DLI

Kafka、HBase、Hive、HDFS，DWS，DCS等数据源的交互。本章节以通过自定义作业与MRS进行交互为例进行说明。更多样例代码请通过DLI样例代码获取。环境准备登录MRS管理控制台，创建MRS集群，选择“开启kerberos”，勾选“Kafka”, “HBase”, “

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
userDefined结果表 - 数据湖探索 DLI

userDefined结果表功能描述您可通过编写代码实现将DLI处理之后的数据写入到指定的云生态或者开源生态。前提条件已编写代码实现自定义sink类：自定义sink类需要继承Flink开源类：RichSinkFunction，并指定数据类型为：Tuple2<Boolean

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

warehouse.dir”。 3 新建Maven工程，配置pom文件 IntelliJ IDEA 参考样例代码说明，编写程序代码创建DLI表或OBS表。 4 编写程序代码 5 调试，编译代码并导出Jar包 6 上传Jar包到OBS和DLI OBS控制台 DLI控制台将生成的Spark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
字符串函数和运算符 - 数据湖探索 DLI

code代码点。不会显式检查UTF-8数据是否有效，对于无效的UTF-8数据，函数可能会返回错误的结果。可以使用from_utf8来更正无效的UTF-8数据。此外，这些函数对Unicode代码点进行运算，而不是对用户可见的字符（或字形群集）进行运算。某些语言将多个代码点组合成单

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

（可选）配置Notebook访问LakeFormation元数据在JupyterLab中编写和调试代码。进入JupyterLab主页后，可在“Notebook”区域下编辑和调试代码。步骤8：使用Notebook实例编写和调试代码。约束限制使用Notebook实例提交DLI作业必须使用弹性资源池下的通用队列。

帮助中心 > 数据湖探索 DLI > 用户指南
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

将测试数据上传到OBS桶下。 3 新建Maven工程，配置pom文件 IntelliJ IDEA 参考样例代码说明，编写程序代码读取OBS数据。 4 编写程序代码 5 调试，编译代码并导出Jar包 6 上传Jar包到OBS和DLI OBS控制台 DLI控制台将生成的Spark Ja

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hudi常见配置参数 - 数据湖探索 DLI

di.apache.org/cn/docs/0.11.0/configurations/。提交DLI Spark SQL作业时，在SQL编辑器界面右上角的”设置”->”参数设置”中可以配置Hudi参数。提交DLI Spark jar作业时，Hudi参数可以通过Spark datasource

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考

总条数： 464

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

levenshtein - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

在DLI控制台预览表数据 - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

Delta常见配置参数 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

DLI程序包标签管理 - 数据湖探索 DLI

错误码 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线