搜索_华为云

Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建OBS的桶。具体OBS操作可以

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接操作场景使用DLI访问其他数据源的数据前，首先要通过建立增强型跨源连接打通DLI和数据源之间的网络，DLI才能够访问、导入、查询、分析其他数据源的数据。例如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和对应数据源VPC之间的网络，才能实现数据互通。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI Python SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下。完整样例代码和依赖包说明请参考：Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

"xxxxxxxxxxxxxxxxxx" } } } } 到这里为止这个请求需要的内容就具备齐全了，您可以使用curl、Postman或直接编写代码等方式发送请求调用API。对于IAM获取用户Token接口，返回的响应消息头中“x-subject-token”就是需要

 帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下：前提条件已参考Java SDK概述配置Java SDK环境。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark Jar作业读取和查询OBS数据。配置S

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
使用DLI分析电商BI报表 - 数据湖探索 DLI

Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录两种登录方式。登录步骤请参考《对象存储服务工具指南》。通过OBS Browser+上传数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

略进行分时弹性扩缩容，满足不同的业务需求。 DLI存储资源 DLI存储资源是DLI服务内部存储的资源，用于存储数据库和DLI表，是向DLI导入数据的必备条件，体现用户数据存储在DLI中的数据量。弹性资源池的实际CUs、已使用CUs、CU范围、规格（包周期CU）实际CUs：弹性资源池当前分配的可用CUs。

帮助中心 > 数据湖探索 DLI > 产品介绍
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

INSERT INTO命令和INSERT OVERWRITE命令同时执行，其结果是未知的。在从源表插入数据到目标表的过程中，无法在源表中导入或更新数据。对于Hive分区表的动态INSERT OVERWRITE，支持覆盖涉及到的分区数据，不支持覆盖整表数据。如果需要覆盖Dat

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
查询作业详细信息 - 数据湖探索 DLI

with_column_header 否 Boolean 导入作业时，导入的数据是否包括列名。 delimiter 否 String 导入作业时，用户自定义数据分隔符。 quote_char 否 String 导入作业时，用户自定义引用字符。 escape_char 否 String 导入作业时，用户自定义转义字符。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
数据保护技术 - 数据湖探索 DLI

ssl.keystore keystore的存放路径，“flink.keystore”表示用户通过generate_keystore.sh*工具生成的keystore文件名称。是 /opt/flink/usrlib/userData/flink.keystore security

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

</dependency> 注意事项暂不支持通过python写UDF、UDTF、UDAF自定义函数。如果使用IntelliJ IDEA工具对创建的自定义函数进行调试，则需要在IDEA上勾选：include dependencies with "Provided" scope，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
迁移数据场景概述 - 数据湖探索 DLI

迁移数据场景概述为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
认证证书 - 数据湖探索 DLI
认证证书 - 数据湖探索 DLI

认证证书合规证书华为云服务及平台通过了多项国内外权威机构（ISO/SOC/PCI等）的安全合规认证，用户可自行申请下载合规资质证书。图1 合规证书下载资源中心华为云还提供以下资源来帮助用户满足合规性要求，具体请查看资源中心。图2 资源中心销售许可证&软件著作权证书

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
DLI数据库和表类 - 数据湖探索 DLI

OBS表压缩率较高怎么办？字符码不一致导致数据乱码怎么办？删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ join表时

 帮助中心 > 数据湖探索 DLI > 常见问题
数据相关 - 数据湖探索 DLI
数据相关 - 数据湖探索 DLI

数据相关导入数据插入数据清空数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Flink作业管理相关API - 数据湖探索 DLI

Flink作业管理相关API 触发Flink作业保存点导入Flink作业保存点

 帮助中心 > 数据湖探索 DLI > API参考
使用CTS审计DLI服务 - 数据湖探索 DLI

alterDatabaseOwner 创建表 table createTable 删除表 table deleteTable 导出表数据 table exportData 导入表数据 table importData 修改表的所有者 table alterTableOwner 创建队列 queue createQueue

帮助中心 > 数据湖探索 DLI > 用户指南

总条数： 208

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表初始化 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

查询作业详细信息 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

认证证书 - 数据湖探索 DLI

DLI数据库和表类 - 数据湖探索 DLI

数据相关 - 数据湖探索 DLI

Flink作业管理相关API - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线