搜索_华为云

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

数据源的访问凭证确保数据源认证的安全性，便于DLI安全访问数据源。数据加密服务（Data Encryption Workshop, DEW）是一个综合的云上数据加密服务，为您解决数据安全、密钥安全、密钥管理复杂等问题。本节操作介绍使用数据加密服务DEW存储数据源的认证信息的操作步骤。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
创建增强型跨源连接 - 数据湖探索 DLI

ve”。虚拟私有云数据源所使用的虚拟私有云。子网数据源所使用的子网。路由表显示子网实际绑定的路由表。说明：此处的路由表为目的数据源子网关联的路由表，不同于“路由信息”中的路由。“路由信息”中的路由为所绑定的队列下子网关联的路由表中的路由。目的数据源子网与队列所在子网为不同的子网，否则会造成网段冲突。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Upsert Kafka结果表 - 数据湖探索 DLI

流。它会将INSERT/UPDATE_AFTER数据作为正常的Kafka消息写入，并将DELETE数据以value为空的Kafka消息写入（表示对应 key 的消息被删除）。Flink将根据主键列的值对数据进行分区，从而保证主键上的消息有序，因此同一主键上的更新/删除消息将落在同一分区中。前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Spark2.4.x与Spark3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x支持自定义k8s的调度器。升级引擎版本后是否对作业有影响：功能增强，支持自定义调度器管理资源的分配和调度。 Spark将不可为null的模式转换为可空说明：在Spark 2.4.x版本中，当用户指定的schema包含不可为空的字段时，Spark会将这些不可为null的模式转换为可空的。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark2.4.x与Spark3.3.x版本差异对比
创建表时指定表的生命周期 - 数据湖探索 DLI

创建表时指定表的生命周期功能描述 DLI提供了表生命周期管理功能，在创建表时指定表的生命周期。DLI会根据每张表的最后修改时间和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置，避免因误操作丢失数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

他服务间的安全访问。数据源的安全组需放通DLI弹性资源池的网段。 - 设置密码设置实例的登录密码。 - 管理员账号 root root 管理员密码设置管理员密码。 - 参数模板数据库参数模板就像是数据库引擎配置值的容器，参数模板中的参数可应用于一个或多个相同类型的数据库实例。

帮助中心 > 数据湖探索 DLI > 快速入门
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。在安装容器引擎的虚拟机中执行上一步复制的登录指令。创建容器镜像组织。如果已创建组织则本步骤可以忽略。登录SWR管理控制台。选择左侧导航栏的“组织管理”，单击页面右上角的“创建组织”。填写组织名称，单击“确定”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

json数据类型的数据，输出到日志文件中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据Kafka的地址测试队列连通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用DLI分析账单消费数据 - 数据湖探索 DLI

本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：步骤1：获取消费数据。获取账户的实际消费数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
Upsert Kafka源表 - 数据湖探索 DLI

EXCEPT_KEY：记录的value部分包含schema的所有内容，定义为主键的字段除外。 properties.* 否无 String 该选项可以传递任意的Kafka参数。 “properties.”后的后缀名必须匹配定义在 kafka参数文档中的参数名。 Flink会自动移除选项名中的 "properties

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
partition - 数据湖探索 DLI
partition - 数据湖探索 DLI

partition_specs 格式 partition_specs : (partition_col_name = partition_col_value, partition_col_name = partition_col_value, ...); 说明表的分区列表，以key=

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

该示例是从Kafka的一个topic中读取数据，并使用Kafka结果表将数据写入到kafka的另一个topic中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

ARCHIVELOG 命令功能用于根据配置对Timeline上的Instant进行归档，并从Timeline上将已归档的Instant删除，以减少Timeline的操作压力。命令格式 RUN ARCHIVELOG ON tableIdentifier; RUN ARCHIVELOG

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
导入数据（废弃） - 数据湖探索 DLI

不配置表示动态导入整表数据，导入的数据需要包含分区列的数据；如果导入时，配置所有分区信息，则表示导入数据到指定分区，导入的数据不能包含分区列的数据；如果导入时，配置了部分分区信息，而导入的数据必须包含非指定的分区数据，不能包含指定的分区数据，否则数据导入后，非指定的数据分区字段列会存在null值等异常值。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
创建DLI表关联DDS - 数据湖探索 DLI

authSource=admin" database DDS的数据库名，如果在"url"中同时指定了数据库名，则"url"中的数据库名不生效。 collection DDS中的collection名，如果在"url"中同时指定了collection，则"url"中的collection不生效。 user

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

弹性资源池专属的计算资源，不同弹性资源上的计算资源完全隔离，弹性资源池内的不同队列资源可以共享，并可以根据队列资源负载配置策略进行分时弹性扩缩容，满足不同的业务需求。 DLI存储资源 DLI存储资源是DLI服务内部存储的资源，用于存储数据库和DLI表，是向DLI导入数据的必备条件，体现用户数据存储在DLI中的数据量。

帮助中心 > 数据湖探索 DLI > 产品介绍
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询所有队列 - 数据湖探索 DLI

企业项目ID。0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 cidr_in_vpc 否 String 队列的虚拟私有云（VPC）的网段。例如：10.0.0.0/8~24，172

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

基准测试的度量单位是每小时执行的查询数( QphH@size)，其中“H”表示每小时系统执行复杂查询的平均次数，“size”表示数据库规模的大小，能够反映出系统在处理查询时的能力。TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数。总而言之，TPC组织颁布的TPC-H

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板

总条数： 345

上一页
1
...
6
7
8
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Spark2.4.x与Spark3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

partition - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线