搜索_华为云

Flink Jar作业开发基础样例 - 数据湖探索 DLI

“hbase_admin”权限，下载该用户认证凭据，其中包含“user.keytab” 和 “krb5.conf” 文件。由于人机账号的keytab会随用户密码过期而失效，故建议使用机机账号进行配置。单击“服务管理”，下载客户端，单击“确定”。在MRS节点上下载配置文件，所需集群配置文件包含“hbase-site

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
设置多版本备份数据保留周期 - 数据湖探索 DLI

设置多版本备份数据保留周期功能描述在DLI数据多版本功能开启后，备份数据默认保留7天，您可以通过配置系统参数“dli.multi.version.retention.days”调整保留周期。保留周期外的多版本数据后续在执行insert overwrite或者truncate语

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
ltrim - 数据湖探索 DLI
ltrim - 数据湖探索 DLI

ltrim ltrim函数用于从str的左端去除字符：如果未指定trimChars，则默认去除空格字符。如果指定了trimChars，则以trimChars中包含的字符作为一个集合，从str的左端去除尽可能长的所有字符都在集合trimChars中的子串。相似函数： rtri

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
ORDER BY - 数据湖探索 DLI
ORDER BY - 数据湖探索 DLI

[ASC | DESC] [,col_name [ASC | DESC],...]; 关键字 ASC/DESC：ASC为升序，DESC为降序，默认为ASC。 ORDER BY：对全局进行单列或多列排序。与GROUP BY一起使用时，ORDER BY后面可以跟聚合函数。注意事项所排序的表必须是已经存在的，否则会出错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
WHERE - 数据湖探索 DLI
WHERE - 数据湖探索 DLI

{col_name operator (sub_query) | [NOT] EXISTS sub_query}; 关键字 ALL：返回重复的行。为默认选项。其后只能跟*，否则会出错。 DISTINCT：从结果集移除重复的行。 WHERE：WHERE子句嵌套将利用子查询的结果作为过滤条件。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
UNION - 数据湖探索 DLI
UNION - 数据湖探索 DLI

UNION：集合运算，以一定条件将表首尾相接，其中每一个SELECT语句返回的列数必须相同，列的类型和列名不一定要相同。注意事项 UNION默认是去重的，UNION ALL是不去重的。不能在多个集合运算间（UNION，INTERSECT，EXCEPT）加括号，否则会出错。示例返回“SELECT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
rtrim - 数据湖探索 DLI
rtrim - 数据湖探索 DLI

rtrim rtrim函数用于从str的右端去除字符：如果未指定trimChars，则默认去除空格字符。如果指定了trimChars，则以trimChars中包含的字符作为一个集合，从str的右端去除尽可能长的所有字符都在集合trimChars中的子串。相似函数： ltri

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
trim - 数据湖探索 DLI
trim - 数据湖探索 DLI

trim trim函数用于从str的左右两端去除字符：如果未指定trimChars，则默认去除空格字符。如果指定了trimChars，则以trimChars中包含的字符作为一个集合，从str的左右两端去除尽可能长的所有字符都在集合trimChars中的子串。相似函数： lt

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

具体方法：在submit-job请求体conf字段中配置“dli.sql.files.maxPartitionBytes=33554432”。该配置项默认值为128MB，将其配置成32MB，可以减少单个任务读取的数据量，避免因过高的压缩比，导致解压后单个任务处理的数据量过大。但调整这个参数

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI内置依赖包 - 数据湖探索 DLI

DLI内置依赖包 DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。 Spark 3.1.1 依赖包表1 Spark 3.1.1 依赖包依赖包名称 accessors-smart-1

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
HAVING - 数据湖探索 DLI
HAVING - 数据湖探索 DLI

HAVING aggregate_func(col_name) operator (sub_query); 关键字 ALL：返回重复的行。为默认选项。其后只能跟*，否则会出错。 DISTINCT：从结果集移除重复的行。 groupby_expression：可以是单字段，多字段，也可以是聚合函数，字符串函数等。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
EXCEPT - 数据湖探索 DLI
EXCEPT - 数据湖探索 DLI

select_statement; 关键字 EXCEPT：做集合减法。A EXCEPT B将A中所有和B重合的记录扣除，然后返回去重后的A中剩下的记录，EXCEPT默认不去重。与UNION相同，每一个SELECT语句返回的列数必须相同，列的类型和列名不一定要相同。注意事项不能在多个集合运算间（UNIO

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没有包含分区字段，则系统会默认指定分区值“__HIVE_DEFAULT_PARTITION__”，当前Spark判断分区为空时，则会直接返回null，不返回具体的数据。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

问题描述 Spark3.x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执行注册viewManager时，会校验该数据库在metastore是否存

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
原生数据类型 - 数据湖探索 DLI

有符号整数，存储空间为4字节，-2147483648～2147483647，在NULL情况下，默认值为0。 STRING 字符串类型。 FLOAT 单精度浮点型，存储空间为4字节，在NULL情况下，采用计算值默认值为0。由于浮点类型的数据在计算机中的存储方式的限制，在比较两个浮点类型的数据是

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

VACUUM 命令功能 VACUUM命令用于删除表目录中不由 Delta 管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运行VACUU

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

法返回。默认情况下，该值以STRING类型返回。使用returnType可以选择不同的类型，支持以下类型： VARCHAR / STRING BOOLEAN INTEGER DOUBLE 对于空路径表达式或错误，可以定义为返回null、报错或返回定义的默认值。省略时，默认值为NULL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
批量删除资源标签 - 数据湖探索 DLI

批量删除资源标签功能介绍为指定实例批量删除标签。此接口为幂等接口：删除时，如果删除的标签不存在，默认处理成功。单次最多支持删除20个标签删除时不对标签字符集范围做校验。删除时tags结构体不能缺失，key不能为空，或者空字符串。调试您可以在API Explore

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
集合操作 - 数据湖探索 DLI
集合操作 - 数据湖探索 DLI

注意事项集合运算是以一定条件将表首尾相接，所以其中每一个SELECT语句返回的列数必须相同，列的类型一定要相同，列名不一定要相同。 UNION默认是去重的，UNION ALL是不去重的。示例输出Orders1和Orders2的并集，不包含重复记录。 1 2 insert into

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
集合操作 - 数据湖探索 DLI
集合操作 - 数据湖探索 DLI

注意事项集合运算是以一定条件将表首尾相接，所以其中每一个SELECT语句返回的列数必须相同，列的类型一定要相同，列名不一定要相同。 UNION默认是去重的，UNION ALL是不去重的。示例输出Orders1和Orders2的并集，不包含重复记录。 1 2 insert into

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML

总条数： 450

上一页
1
...
7
8
9
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink Jar作业开发基础样例 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

ltrim - 数据湖探索 DLI

ORDER BY - 数据湖探索 DLI

WHERE - 数据湖探索 DLI

UNION - 数据湖探索 DLI

rtrim - 数据湖探索 DLI

trim - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

HAVING - 数据湖探索 DLI

EXCEPT - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

原生数据类型 - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

批量删除资源标签 - 数据湖探索 DLI

集合操作 - 数据湖探索 DLI

集合操作 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线