搜索_华为云

插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

partition(part1='v1', part2='v2') select * from ... 在“数据湖探索管理控制台>SQL编辑器”页面，单击编辑窗口右上角“设置”，可配置参数。通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
pyspark样例代码 - 数据湖探索 DLI

将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

conf和user.keytab文件添加到作业的依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：图1 添加依赖文件在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
使用DLI分析账单消费数据 - 数据湖探索 DLI

在DLI上进行消费明细分析。将1下载的消费明细数据上传到已建好的OBS桶中。在数据湖探索服务中创建表。登录DLI控制台，左侧导航栏单击“SQL编辑器”，执行引擎选择“spark”，选择执行的队列和数据库。本次演示队列和数据库选择“default”。下载的文件中包含时间用量等，按表头意

 帮助中心 > 数据湖探索 DLI > 最佳实践
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

续识别和管理程序包。单击“确定”，完成创建程序包。图11 创建程序包创建DLI的UDTF函数。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。图12 选择队列和数据库在SQL编辑区域输入实际上传Jar包的路径创建UDTF函数，单击“执行”提交创建。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

单击“确定”，完成创建程序包。创建UDAF函数。登录登录DLI管理控制台，创建SQL队列和数据库。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。在SQL编辑区域输入下列命令创建UDAF函数，单击“执行”提交创建。如

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

1访问元数据，则必须新建队列。不支持的场景：在SQL作业中创建了数据库（database），编写程序代码指定在该数据库下创建表。例如在DLI的SQL编辑器中的某SQL队列下，创建了数据库testdb。后续通过编写程序代码在testdb下创建表testTable，编译打包后提交的Spark Jar作业则会运行失败。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。 API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代

 帮助中心 > 数据湖探索 DLI > 用户指南
pyspark样例代码 - 数据湖探索 DLI

conf和user.keytab文件添加到作业的其他依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：图1 添加依赖文件在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

表示永久不失效。 compaction.async.enabled 否 false Boolean 是否开启在线压缩。 true：开启 false：关闭建议关闭在线压缩，提升性能。但是调度compaction.schedule.enabled仍然建议开启，之后可通过离线异步压缩，执行阶段性生成的压缩plan。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
DLI对接LakeFormation - 数据湖探索 DLI

catalogA。创建成功后，在同一个项目空间下，不能再创建到catalogA的映射。登录DLI管理控制台。选择“SQL编辑器 ”。在SQL编辑器页面，选择“数据目录”。单击创建数据目录。配置数据目录相关信息。表2 数据目录配置信息参数名称是否必填说明外部数据目录名称

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

conf和user.keytab文件添加到作业的其他依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：图1 添加依赖文件在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
DWS Connector概述 - 数据湖探索 DLI

DWS Connector概述数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQ

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DLI作业开发流程 - 数据湖探索 DLI

详细操作请参考创建并提交SQL作业。适用于数据仓库查询、报表生成、OLAP（在线分析处理）等场景。 Flink作业专为实时数据流处理设计，适用于低时延、需要快速响应的场景。适用于实时监控、在线分析等场景。 Flink OpenSource作业：DLI提供了标准的连接器（co

帮助中心 > 数据湖探索 DLI > 用户指南

总条数： 125

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

插入数据 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线