搜索_华为云

Spark 2.4.5版本说明 - 数据湖探索 DLI

支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。支持容器集群Spark日志跳转查看需要在容器查看日志。支持动态加载UDF（公测）无需重启队列UDF即可生效。 Spark UI支持火焰图 Spark UI支持绘制火焰图。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Spark 3.3.1版本说明 - 数据湖探索 DLI

支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。支持容器集群Spark日志跳转查看需要在容器查看日志。支持动态加载UDF（公测）无需重启队列UDF即可生效。 Spark UI支持火焰图 Spark UI支持绘制火焰图。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
CLUSTER BY - 数据湖探索 DLI
CLUSTER BY - 数据湖探索 DLI

CLUSTER BY 功能描述按字段实现表的分桶及桶内排序。语法格式 1 2 SELECT attr_expr_list FROM table_reference CLUSTER BY col_name [,col_name ,...]; 关键字 CLUSTER BY：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

华为云数据治理中心DataArts Studio提供了一站式数据治理平台，可以实现与DLI服务的对接，从而提供统一的数据集成、数据开发服务，方便企业对全部数据进行管控。本节操作介绍在DataArts Studio开发DLI SQL作业的操作步骤。开发流程图1 在DataArts Studio开发DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
配置Hudi数据列默认值 - 数据湖探索 DLI

新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。列的默认值设置要与列的类型一致，如不一致会进行类型强转，导致默认值精度丢失或者默认值为NULL。历史数据的默认值与列第一次设

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
手动续费 - 数据湖探索 DLI
手动续费 - 数据湖探索 DLI

择“续费管理”。进入“续费管理”页面。自定义查询条件。可在“手动续费项”、“自动续费项”、“到期转按需项”、“到期不续费项”页签查询全部待续费资源，对资源进行手动续费的操作。图2 续费管理所有需手动续费的资源都可归置到“手动续费项”页签，具体操作请参见如何恢复为手动续费。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Spark作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
创建表（废弃） - 数据湖探索 DLI

新增OBS表数据的存储路径，必须是OBS的路径。说明： OBS表必选参数。 data_path配置的OBS桶路径不建议为根目录，否则清空表数据的时候，就会把根目录内的数据全部清除，导致数据丢失。 with_column_header 否 Boolean OBS表数据是否包含表头。只有CSV类型数据具有该属性。d

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。支持容器集群Spark日志跳转查看需要在容器查看日志。支持动态加载UDF（公测）无需重启队列UDF即可生效。 Spark UI支持火焰图 Spark UI支持绘制火焰图。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。支持容器集群Spark日志跳转查看需要在容器查看日志。支持动态加载UDF（公测）无需重启队列UDF即可生效。 Spark UI支持火焰图 Spark UI支持绘制火焰图。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

用于指定队列，填写已创建DLI的队列名。 spark.dli.user.queueName=XXXX # 提交作业使用的access key。 spark.dli.user.access.key=XXXX # 提交作业使用的secret key。 spark.dli.user.secret.key=XXXX

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
CREATE SCHEMA - 数据湖探索 DLI
CREATE SCHEMA - 数据湖探索 DLI

(property_name=property_value,...)] 描述创建一个空的schema。schema是表、视图以及其他数据库对象的容器。当指定可选参数IF NOT EXISTS时，如果系统已经存在同名的schema，将不会报错。示例创建一个名为web的schema： CREATE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？不存在。 DLI没有启动spark.acls.enable配置项，所以不涉及Apache Spark 命令注入漏洞（CVE-2022-33891）。该漏洞主要影响在启用了ACL（访问控制列表

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
创建表时指定表的生命周期 - 数据湖探索 DLI

被修改的时间（LAST_ACCESS_TIME）判断该分区是否该被回收。分区表的最后一个分区被回收后，该表不会被删除。分区表不支持设置分区级的生命周期，仅支持表级别的生命周期管理。生命周期回收为每天定时启动，扫描全量分区。生命周期回收为每天定时启动，扫描全量分区的最后一次表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
查询队列详情 - 数据湖探索 DLI

开通了企业管理服务的用户可设置该参数绑定指定的项目。 resource_type 否 String 资源类型。 vm：ecf集群 container：容器化集群（k8s） cu_spec 否 Integer 队列的规格大小。对于包周期队列，表示包周期部分的CU值；对于按需队列，表示用户购买队列时的初始值。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
开启Flink作业动态扩缩容 - 数据湖探索 DLI

池中剩余的Pod资源足以支持作业的最小资源需求时，系统将自动减少作业所在节点的数量，确保作业高效运行，同时提高资源的利用效率。当前仅Flink 1.12版本的作业支持开启动态扩缩容。使用须知在Flink作业进行动态扩缩容时如果队列资源被抢占，剩余资源不满足作业启动所需资源则可能存在作业无法正常恢复的情况。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

当前示例为CSS集群上创建索引并导入数据中创建的索引“my_test”。索引名称只能全部小写，不能有大写。类型 Elasticsearch的类型，类似关系数据库中的表名称。类型名称只能全部小写，不能有大写。当前示例为：“_doc”。更多其他参数说明可以参考：CDM配置CSS源端参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
创建Flink Jar作业 - 数据湖探索 DLI

如果未勾选“开启Checkpoint”，需要选择“Checkpoint路径”。单击右上角“保存”，保存作业和相关参数。单击右上角“启动”，进入“启动Flink作业”页面，确认作业规格和费用，单击“立即启动”，启动作业，系统将自动跳转到Flink作业管理页面，新创建的作业将显示在作业列表中，在“状态”列中可以查看作业状态。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

低成本资金成本按照实际扫描数据量或者CU时收费，可变成本，成本可节约50%。长期占用资源，资源浪费严重，成本高。弹性扩缩容能力基于容器化Kubernetes，具有极致的弹性伸缩能力。无。免运维运维成本即开即用，Serverless架构。需要较强的技术能力进行搭建、配置、运维。

帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 924

上一页
1
2
3
4
5
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 2.4.5版本说明 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

CLUSTER BY - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

手动续费 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

CREATE SCHEMA - 数据湖探索 DLI

DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

查询队列详情 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线