搜索_华为云

设置Spark作业优先级 - 数据湖探索 DLI

设置Spark作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
SDK获取与安装 - 数据湖探索 DLI

SDK获取与安装 Python SDK安装方式本节操作介绍安装Python SDK的操作指导。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。 “dli-sdk-python-x.x.x.zip”压缩包，解压后目录结构如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Java开发环境配置 - 数据湖探索 DLI

Java开发环境配置操作场景在安装和使用Java SDK前，确保您已经完成开发环境的基本配置。 Java SDK要求使用JDK1.8或更高版本。考虑到后续版本的兼容性，推荐使用1.8版本。在Java运行环境配置好的情况下，打开windows的命令行，执行命令Java -version，可以检查版本信息。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
弹性资源池的实际CUs、CU范围、规格的含义 - 数据湖探索 DLI

弹性资源池的实际CUs、CU范围、规格的含义实际CUs：弹性资源池当前分配的可用CUs。 CU范围：CU设置主要是为了控制弹性资源池扩缩容的最大最小CU范围，避免无限制的资源扩容风险。弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。弹性资源池中任意一

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
上传jar类型分组资源（废弃） - 数据湖探索 DLI

上传jar类型分组资源（废弃）功能介绍该API用于在project下上传jar类型分组资源。上传同名资源模块时，新模块将会覆盖旧模块。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2.0/{proj

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

上传pyfile类型分组资源（废弃）功能介绍该API用于在project下的上传pyfile类型模块。上传同名pyfile类型模块时，新模块将会覆盖旧模块。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
修改弹性资源池信息 - 数据湖探索 DLI

修改弹性资源池信息功能介绍修改弹性资源池信息。调试您可以在API Explorer中调试该接口。 URI URI格式 PUT /v3/{project_id}/elastic-resource-pools/{elastic_resource_pool_name} 参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
查询指定资源类型的标签信息 - 数据湖探索 DLI

dli_elastic_resource_pool：弹性资源池 dli_enhanced_datasource：增强型跨源连接 dli_database：数据库 dli_package_resource：资源包（不支持指定有Module ID的内置资源包） dli_flink_job：Flink作业

 帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
添加分区（只支持OBS表） - 数据湖探索 DLI

主要有以下两种场景：给OBS分区表插入对应的分区数据，数据插入成功后OBS表才会生成分区元数据信息，后续则可以根据对应分区列进行查询等操作。手工拷贝分区目录和数据到OBS分区表路径下，执行本章节介绍的分区添加命令生成分区元数据信息，后续即可根据对应分区列进行查询等操作。本章节重点介绍使用ALTER

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Quantile digest函数 - 数据湖探索 DLI

Quantile digest（分位数摘要）是存储近似百分位信息的数据草图。HetuEngine中用qdigest表示这种数据结构。函数 merge(qdigest) → qdigest 描述：将所有输入的qdigest数据合并成一个qdigest。 value_at_quantile(qdigest(T)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Sp

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
DROP COLUMN - 数据湖探索 DLI
DROP COLUMN - 数据湖探索 DLI

DROP COLUMN 功能开启配置参数： hoodie.schema.evolution.enable=true 命令功能 ALTER TABLE ... DROP COLUMN语法用于删除列。命令语法 ALTER TABLE tableName DROP COLUMN|COLUMNS

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？场景概述 DLI Flink作业具有高可用保障能力，通过设置“异常自动重启”功能，可在周边服务短时故障恢复后自动重启。操作步骤登录DLI控制台，选择“作业管理”>“Flink作业”。在Flink作业编辑页面，勾选“异常自动重启”。例如，图1所示。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
SQL作业访问报错：File not Found - 数据湖探索 DLI

检查文件的路径是否正确，包括目录名称和文件名。文件被占用文件被占用导致的文件报错找不到，一般是读写冲突产生的，建议查询SQL查询报错表的时候，是否有作业正在覆盖写对应数据。父主题： SQL作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
设置Flink作业优先级 - 数据湖探索 DLI

设置Flink作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Flink作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
使用Hive语法创建DLI表 - 数据湖探索 DLI

col_type 是列字段的数据类型。数据类型为原生类型。请参考原生数据类型。 col_comment 否列字段描述。仅支持字符串常量。 row_format 是行数据格式。row format功能只支持textfile类型的表。 file_format 是 DLI表数据存储格式：支持textfile

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
查询DCS表 - 数据湖探索 DLI
查询DCS表 - 数据湖探索 DLI

SELECT命令用于查询DCS表中的数据。语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。示例查询表test_redis中的数据。 1 SELECT * FROM

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
查询HBase表 - 数据湖探索 DLI
查询HBase表 - 数据湖探索 DLI

通过hbase进行数据过滤，即HBase Client将过滤条件传给HBase服务端进行处理，HBase服务端只返回用户需要的数据，提高了Spark SQL查询的速度。对于HBase不支持的过滤条件，例如组合Rowkey的查询，直接由Spark SQL进行。支持查询下压的场景数据类型场景

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
查询作业结果-方式二（废弃） - 数据湖探索 DLI

目前仅支持查看“QUERY”类型作业的执行结果。 row_count 否 Integer 作业结果总条数。 input_size 否 long 作业执行过程中扫描的数据量。 schema 否 Array of Map 作业结果列名称和类型。 rows 否 Array of objects 作业结果集。示例

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
查询组内资源包（废弃） - 数据湖探索 DLI

查询组内资源包（废弃）功能介绍该API用于查询某个project某个分组下的具体资源信息。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v2.0/{project_id}/resources/{resource_name}

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）

总条数： 1508

上一页
1
...
63
64
65
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

设置Spark作业优先级 - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

Java开发环境配置 - 数据湖探索 DLI

弹性资源池的实际CUs、CU范围、规格的含义 - 数据湖探索 DLI

上传jar类型分组资源（废弃） - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

修改弹性资源池信息 - 数据湖探索 DLI

查询指定资源类型的标签信息 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

Quantile digest函数 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

DROP COLUMN - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

SQL作业访问报错：File not Found - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

查询DCS表 - 数据湖探索 DLI

查询HBase表 - 数据湖探索 DLI

查询作业结果-方式二（废弃） - 数据湖探索 DLI

查询组内资源包（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线