搜索_华为云

初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下：前提条件已参考Java SDK概述配置Java SDK环境。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
跨源认证概述 - 数据湖探索 DLI

相应的认证类型。 CSS类型跨源认证：适用于“6.5.4”及以上版本的CSS集群且集群已开启安全模式。配置时需指定集群的用户名、密码、认证证书，通过跨源认证将以上信息存储到DLI服务中，便于DLI安全访问CSS数据源。详细操作请参考创建CSS类型跨源认证。 Kerberos类型的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

</dependency> 注意事项暂不支持通过python写UDF、UDTF、UDAF自定义函数。如果使用IntelliJ IDEA工具对创建的自定义函数进行调试，则需要在IDEA上勾选：include dependencies with "Provided" scope，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
迁移数据场景概述 - 数据湖探索 DLI

迁移数据场景概述为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
离线Compaction配置 - 数据湖探索 DLI

e作为一个任务分别配置不同的资源执行来节省资源使用。执行资源 Compaction调度的间隔应小于Compaction计划生成的间隔，例如1小时左右生成一个Compaction计划的话，执行Compaction计划的调度任务应该至少半小时调度一次。 Compaction作业配置

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

CSV Format 功能描述 CSV Format 允许我们基于CSV schema 进行解析和生成CSV 数据。目前的CSV schema 是基于table schema 推导出来的。更多具体使用可参考开源社区文档：CSV Format。支持的Connector Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

双击IntelliJ IDEA工具右侧的“Maven”，参考下图分别双击“clean”、“compile”对代码进行编译。编译成功后，双击“package”对代码进行打包。图9 编译打包打包成功后，生成的Jar包会放到target目录下，以备后用。本示例将会生成到：“D:\DLITe

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
数据迁移与传输方式概述 - 数据湖探索 DLI

导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
使用DLI分析电商BI报表 - 数据湖探索 DLI

Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录两种登录方式。登录步骤请参考《对象存储服务工具指南》。通过OBS Browser+上传数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

GROUPING SETS 功能描述 GROUPING SETS生成交叉表格行，可以实现GROUP BY字段的交叉统计。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
实时任务接入 - 数据湖探索 DLI

实时任务接入实时作业一般由Flink Sql或Sparkstreaming来完成，流式实时任务通常配置同步生成compaction计划，异步执行计划。 Flink SQL作业中sink端Hudi表相关配置如下： create table hudi_sink_table ( //

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
SQL作业使用咨询 - 数据湖探索 DLI

timeout（单位是秒）参数配置超时时间。 DLI支撑本地测试Spark作业吗? DLI暂不支持本地测试Spark作业，您可以安装DLI Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark Jar作业。 DLI 表(OBS表 / DLI 表 )数据支持删除某行数据吗？

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hudi Compaction操作说明 - 数据湖探索 DLI

Compaction用于合并mor表Base和Log文件，Compaction包含两个过程Schedule和Run。Schedule过程会在TimeLine里生成一个Compaction Plan，这个Compaction Plan会记录哪些parquet文件将会与哪些log文件进行合并，但是仅仅是

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

k作业后，再次启动该Flink作业怎样从指定Checkpoint恢复。解决方案由于Flink Checkpoint和Savepoint生成机制及格式一致，因此可以通过Flink作业列表“操作”列中的“更多 > 导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
查询资源实例数量 - 数据湖探索 DLI

查询资源实例数量功能介绍查询资源实例数量。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v3/{project_id}/{resource_type}/res

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
导入Flink作业保存点 - 数据湖探索 DLI

功能介绍导入Flink作业保存点。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v1.0/{project_id}/streaming/jobs/{j

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API
查询指定资源实例的标签信息 - 数据湖探索 DLI

功能介绍查询指定资源实例的标签信息。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v3/{project_id}/{resource_type}/{resource_id}/tags

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
ROLLUP - 数据湖探索 DLI
ROLLUP - 数据湖探索 DLI

ROLLUP 功能描述 ROLLUP生成聚合行、超聚合行和总计行。可以实现从右到左递减多级的统计，显示统计某一层次结构的聚合。语法格式 1 2 3 SELECT attr_expr_list FROM table_reference GROUP BY col_name_list

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
触发Flink作业保存点 - 数据湖探索 DLI

功能介绍触发Flink作业保存点。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v1.0/{project_id}/streaming/jobs/{job_id}/savepoint

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API

总条数： 211

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

初始化DLI客户端 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

GROUPING SETS - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

查询资源实例数量 - 数据湖探索 DLI

导入Flink作业保存点 - 数据湖探索 DLI

查询指定资源实例的标签信息 - 数据湖探索 DLI

ROLLUP - 数据湖探索 DLI

触发Flink作业保存点 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线