搜索_华为云

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
数据迁移与传输方式概述 - 数据湖探索 DLI

CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。图1 迁移数据至DLI 配置DLI读写外部数据源如果您不想将数据导入OBS或DLI的数据表中，DLI提供的跨源访问

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

jar作业可以通过两种方式来读取Hudi表：Spark datasource API 或者通过 SparkSession 提交 SQL。配置项 hoodie.datasource.query.type 需要配置为 snapshot（snapshot同时也是默认值，因此可以缺省）。 object HudiDemoScala

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码中“pom文件配置”说明。 pom文件配置中依赖包 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
在Spark SQL作业中使用UDF - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hudi表使用约束 - 数据湖探索 DLI

删除。在提交Spark SQL或Flink SQL作业时，无需手动配置Hudi的 hoodie.write.lock.provider 配置项，但在提交Spark jar作业时必须手动配置，请见 Hudi锁配置说明一节。 Hudi和队列计算引擎的版本对应关系为：计算引擎版本

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

3.1基础镜像内置了3.1.62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 pom文件配置中依赖包 <dependency> <groupId>com.huaweicloud.sdk</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

设置和传入任意的Kafka原生配置文件。注意： “properties.”中的后缀名必须是Apache Kafka中的配置键。例如关闭自动创建topic：'properties.allow.auto.create.topics' = 'false'。存在一些配置不支持配置，如'key.deserializer'和'value

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
禁止或恢复表的生命周期 - 数据湖探索 DLI

恢复表或指定分区的生命周期功能表及其分区重新参与生命周期回收，默认使用当前表及分区上的生命周期配置。开启表生命周期前可以修改表及分区的生命周期配置，防止开启表生命周期后因使用之前的配置导致数据被误回收。 disable 否禁止表或指定分区的生命周期功能。禁止表本身及其所有分

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

time_zone 的值为非 SYSTEM，比如 +08:00。设置jdbcUrl时带上时区。例如‘jdbc:mysql://localhost:3306/test?serverTimezone=Asia/Shanghai’。父主题： Flink SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
获取跨源认证列表 - 数据湖探索 DLI

String krb5配置文件obs路径。 keytab String keytab配置文件obs路径。 truststore_location String truststore配置文件obs路径。 keystore_location String keystore配置文件obs路径。

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
创建JDBC维表 - 数据湖探索 DLI
创建JDBC维表 - 数据湖探索 DLI

连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否数据库认证用户名，需要和'connector.password'一起配置 connector.password 否数据库认证密码，需要和'connector.username'一起配置 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
创建DWS维表 - 数据湖探索 DLI
创建DWS维表 - 数据湖探索 DLI

username 否数据库认证用户名，需要和'connector.password'一起配置 connector.password 否数据库认证密码，需要和'connector.username'一起配置 connector.read.partition.column 否用于对输入进行分区的列名

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

endianness' 配置。 INT 采用 big-endian （默认）编码的四个字节。字节序可以通过 'raw.endianness' 配置。 BIGINT 采用 big-endian （默认）编码的八个字节。字节序可以通过 'raw.endianness' 配置。 FLOAT 采用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建并提交SQL作业 - 数据湖探索 DLI

如果不创建该桶，将无法查看作业日志。桶名称为系统默认。在OBS管理控制台页面通过配置桶的生命周期规则，可以实现定时删除OBS桶中的对象或者定时转换对象的存储类别。具体操作请参考通过配置生命周期规则。 SQL编辑器页面可以批量执行SQL语句。作业编辑窗口常用语法采用不同颜色突出显示。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询增强型跨源连接列表 - 数据湖探索 DLI

该增强跨源连接如果做过项目赋权，则该字段是“false”，否则为“true”。 create_time 否 Long 创建连接的时间。为UTC的时间戳。 hosts 否 Array of Objects 用户自定义主机信息，详细信息参见表7。 elastic_resource_pools 否 Array

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
获取跨源认证列表（废弃） - 数据湖探索 DLI

String krb5配置文件obs路径。 keytab String keytab配置文件obs路径。 truststore_location String truststore配置文件obs路径。 keystore_location String keystore配置文件obs路径。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
创建并使用跨源链接 - 数据湖探索 DLI

9-f5aab22e1281", "elastic_resource_pools": "elastic_pool_dli", "hosts": [ { "ip":"192.168.0.1", "name":"ecs-97f8-0001"

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark Jar作业读取和查询OBS数据。配置Spark作业：配置Spark作业访问OBS中存储的数据。提交Spark作业：完成作业编写后，提交并执行作业。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

创建自定义镜像以tensorflow为例，说明如何将tensorflow打包进镜像，生成安装了tensorflow的自定义镜像，在DLI作业中使用该镜像运行作业。准备容器环境。请参考安装容器引擎文档中的“安装容器引擎”章节。使用root用户登录1容器镜像环境，执行以下命令获取DLI的基础镜像。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作

总条数： 506

上一页
1
...
14
15
16
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

获取跨源认证列表 - 数据湖探索 DLI

创建JDBC维表 - 数据湖探索 DLI

创建DWS维表 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

查询增强型跨源连接列表 - 数据湖探索 DLI

获取跨源认证列表（废弃） - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线