搜索_华为云

责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

营安全，以及更广义的安全合规遵从。租户：负责云服务内部的安全，安全地使用云。华为云租户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

在下拉列表中选择要使用的队列。选择Spark版本。在下拉列表中选择支持的Spark版本，推荐使用最新版本。不建议长期混用不同版本的Spark/Flink引擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
配置DLI云服务委托权限 - 数据湖探索 DLI

仅在勾选该权限且更新DLI委托权限后的项目生效。未勾选该权限的项目不具备跨源场景所需权限、和SMN发送通知消息的权限。示例1：在项目A配置DLI的基础使用、跨源场景、运维场景的权限和示例2：在项目B配置DLI的基础使用、跨源场景、运维场景的权限给出了同一个区域的不同项目更新DLI委托带来的委托权限差异。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

table_name Database中的表名，由字母、数字和下划线（_）组成。 columnTypeList 以逗号分隔的带数据类型的列表。列名由字母、数字和下划线（_）组成。 using 参数hudi，定义和创建Hudi table。 table_comment 表的描述信息。 location_path

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

HBase表之前确保HBase的表是存在的。以样例代码为例，具体的流程是：远程登录ECS，通过hbase shell命令查看表信息。其中，“hbtest”是要查询的表名。 describe 'hbtest' （可选）如果不存在对应的HBase表，可以创建该表，具体的命令是： create

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
查询SQL作业日志 - 数据湖探索 DLI

DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
增强型跨源连接标签管理 - 数据湖探索 DLI

操作场景标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。如您的组织已经设定DLI的相关标签策略，则需按照标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

1版本停止服务后，正在使用该版本的作业有哪些影响？在Spark 3.1.1 EOS时间后创建的队列，在执行作业时不支持选择已经EOS的计算引擎。历史创建的队列仍然可以使用Spark 2.3.2执行作业，但作业执行过程中出现的错误，不再提供该版本的任何技术服务支持，请您尽快更换至新版本的计算引擎。 DLI

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
迁移数据场景概述 - 数据湖探索 DLI

为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。图1

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
ClickHouse结果表 - 数据湖探索 DLI

数据库名为ClickHouse集群创建的数据库名称。 connector.table 是要创建的ClickHouse的表名。 connector.driver 否连接数据库所需要的驱动。如果建表时不指定该参数，驱动会自动通过ClickHouse的url提取。如果建表时指定该参数，则该参数值固定为“ru

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
SQL作业运行慢如何定位 - 数据湖探索 DLI

参考图10可以看到数据倾斜时，单个任务的shuffle数据远大于其他Task的数据，导致该任务耗时时间变长。图10 数据倾斜示例图数据倾斜原因和解决： Shuffle的数据倾斜基本是由于join中的key值数量不均衡导致。对join连接条件进行group by 和count，统计每个连接条件的key值的数量。示例如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
查询Spark作业日志 - 数据湖探索 DLI

您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

2版本停止服务后，正在使用该版本的作业有哪些影响？在Spark 2.3.2 EOS时间后创建的队列，在执行作业时不支持选择已经EOS的计算引擎。历史创建的队列仍然可以使用Spark 2.3.2执行作业，但作业执行过程中出现的错误，不再提供该版本的任何技术服务支持，请您尽快更换至新版本的计算引擎。 DLI

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
pyspark样例代码 - 数据湖探索 DLI

指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过DataFrame API 访问认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

'#'号指定的字段类型当“fields.#.kind”字段为：random时有效。表示随机生成器的最小值，'#' 指定的字段仅适用于数字类型。 fields.#.max 否 '#'号指定的字段类型的最大值 '#'号指定的字段类型当“fields.#.kind”字段为：random时有效。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

请参考判断是否经购买了对应的套餐包套餐包额度已用完请参考判断套餐包额度是否超出购买的套餐包没有涵盖到DLI所有计费项请参考判断是否产生了套餐包未涵盖的计费项如果处理完某个可能原因仍未解决问题，请继续排查其他可能原因。判断是否经购买了对应的套餐包目前DLI支持的套餐包类型如表1所示。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
DWS源表（不推荐使用） - 数据湖探索 DLI

'330110'); 参考增强型跨源连接，根据DWS所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置DWS的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据DWS的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

“default”的数据库。示例完整的SQL作业提交流程您可以参考《快速入门》中的《提交SQL作业》等章节描述。队列是使用DLI服务的基础，执行SQL前需要先创建队列。具体可以参考《用户指南》中的“创建队列”章节。在DLI管理控制台，单击左侧导航栏中的“SQL编辑器”，可进入SQL作业“SQL编辑器”页面。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
在DLI控制台创建数据库和表 - 数据湖探索 DLI

在DLI控制台创建数据库和表数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。表是数据库最重要的组成部分之一。表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表

总条数： 423

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

责任共担 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线