搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keytab文件添加到作业的其他

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Flink作业性能调优 - 数据湖探索 DLI

发现这类算子存在性能瓶颈，可以尝试优化状态操作的性能。主要可以尝试通过如下方式优化：增加状态操作内存，降低磁盘IO 增加单slot cu资源数配置优化参数： taskmanager.memory.managed.fraction=xx state.backend.rocksdb

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
导出查询结果 - 数据湖探索 DLI

t-result 参数说明表1 URI 参数参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 job_id 是 String 作业ID。请求消息表2 请求参数参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

MySQL数据库中读取数据，并写入到Print结果表中。参考增强型跨源连接，根据RDS MySQL所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置RDS MySQL的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根RDS的地址测试队列连通性。如果能连

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

Kafka数据源中读取数据，并写入到Print结果表中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据Kafka的地址测试队列连通性。如果能连通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

结果表中。参考增强型跨源连接，在DLI上根据Doris所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。参考“修改主机信息”章节描述，在增强型跨源中增加MRS的主机信息。设置Doris的安全组，添加入向规则使其对Flink的队列网段放通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

提交Spark作业将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
查询作业执行进度信息 - 数据湖探索 DLI

progress 参数说明表1 URI 参数参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 job_id 是 String 作业ID。请求消息无请求参数。响应消息表2 响应参数参数名称

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

角色”，单击“ 添加角色 ”，在添加角色页面分别配置参数。角色名称：输入自定义的“角色名称”，例如当前输入为：hivetestrole。配置资源权限：选择“当前MRS集群的名称 > hive”，勾选“Hive管理员权限”。图1 Manager创建Hive的角色更多MRS创建角色

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

参考增强型跨源连接，在DLI上根据ClickHouse和Kafka集群所在的虚拟私有云和子网分别创建跨源连接，并绑定所要使用的Flink弹性资源池。设置ClickHouse和Kafka集群安全组的入向规则，使其对当前将要使用的Flink作业队列网段放通。参考测试地址连通性根据Cl

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

提交Spark作业将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Doris维表 - 数据湖探索 DLI
Doris维表 - 数据湖探索 DLI

connector。参考增强型跨源连接，在DLI上根据Doris所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。参考“修改主机信息”章节描述，在增强型跨源中增加MRS的主机信息。设置Doris和kafka的安全组，添加入向规则使其对Flink的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

提交Spark作业将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keytab文件添加到作业的其他

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用DLI进行电商BI报表分析 - 数据湖探索 DLI

本案例以某商城真实的用户、商品、评论数据（脱敏后）为基础，利用华为云数据湖探索、数据仓库服务以及永洪BI来分析用户和商品的各种数据特征，可为营销决策、广告推荐、信用评级、品牌监控、用户行为预测提供高质量的信息。流程指导使用DLI进行电商数据分析的操作过程主要包括以下步骤：步骤1：上传数据。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

connector。参考增强型跨源连接，在DLI上根据Doris所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。参考“修改主机信息”章节描述，在增强型跨源中增加MRS的主机信息。设置Doris的安全组，添加入向规则使其对Flink的队列网段放通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

导致功能相互冲突，影响作业执行。如需使用UDF热加载功能请提交工单开通白名单。关键字 USING <resources>：需要加载的资源。可以是JAR、文件或者URI的列表。 OR REPLACE：支持自定义函数热加载功能。如果创建自定义函数时不携带OR REPLACE，则需要注意以下场景：

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 自定义函数
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

导致功能相互冲突，影响作业执行。如需使用UDF热加载功能请提交工单开通白名单。关键字 USING <resources>：需要加载的资源。可以是JAR、文件或者URI的列表。 OR REPLACE：支持自定义函数热加载功能。如果创建自定义函数时不携带OR REPLACE，则需要注意以下场景：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

1/MyUDTF-1.0-SNAPSHOT.jar'; 重启原有SQL队列，使得创建的UDTF函数生效。登录数据湖探索管理控制台，选择“资源管理 > 队列管理”，在对应“SQL队列”类型作业的“操作”列，单击“重启”。在“重启队列”界面，选择“确定”完成队列重启。验证和使用创建的UDTF函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用DataSource语法创建DLI表 - 数据湖探索 DLI

读取该表路径中所有文件，包含子目录中的文件。 false compression 否指定压缩格式。一般为parquet格式时指定该参数，推荐使用'zstd'压缩格式。 - 示例1：创建DLI非分区表示例说明：创建名为table1的DLI非分区表，使用USING关键字指定该表的存储格式为orc格式。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 创建DLI表
使用DataSource语法创建DLI表 - 数据湖探索 DLI

读取该表路径中所有文件，包含子目录中的文件。 false compression 否指定压缩格式。一般为parquet格式时指定该参数，推荐使用'zstd'压缩格式。 - 示例1：创建DLI非分区表示例说明：创建名为table1的DLI非分区表，使用USING关键字指定该表的存储格式为orc格式。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表

总条数： 639

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

Doris结果表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Doris维表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用DLI进行电商BI报表分析 - 数据湖探索 DLI

Doris源表 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线