搜索_华为云

创建DLI程序包 - 数据湖探索 DLI

支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件 File：用户文件 ModelFile：用户AI模型文件 OBS路径选择对应程序包的OBS路径。说明：程序包需提前上传至OBS服务中保存。只支持选择文件。分组设置可选择“已有分组”，“创建新分组”或“不分组”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSON等）是以UTF-8编码保存的。如果数据源不是UTF-8编码，请在导入前提前转换为UTF-8编码。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
SHOW_COMMIT_FILES - 数据湖探索 DLI
SHOW_COMMIT_FILES - 数据湖探索 DLI

指定的instant所更新或插入的文件位于哪个分区 file_id 指定的instant所更新或插入的文件的ID previous_commit 指定的instant所更新或插入的文件的文件名中的时间戳 total_records_updated 该文件中多少个record被更新 t

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
ARCHIVELOG - 数据湖探索 DLI
ARCHIVELOG - 数据湖探索 DLI

"obs://bucket/path/h1"; 注意事项首先需要执行clean命令，在clean命令清理了历史的数据文件后，Timeline上与清理的数据文件对应的Instant才允许归档。不管是否进行compaction操作，至少会保留hoodie.compact.inline

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

schema_name 描述 DATABASE和SCHEMA在此处是等价的，可互换的，它们有这相同的含义。该语法用于显示SCHEMA的名称、注释、还有它在文件系统上的根路径。可选项EXTENDED可以用来显示SCHEMA的数据库属性。示例 CREATE SCHEMA web; DESCRIBE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
SHOW_HOODIE_PROPERTIES - 数据湖探索 DLI

SHOW_HOODIE_PROPERTIES 命令功能查看指定hudi表的hoodie.properties文件中的配置。命令格式 call show_hoodie_properties(table => '[table_name]'); 参数描述表1 参数描述参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

CLEAN 命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

'obs://....') using json：指定使用 JSON 格式。 options：用于设置表的选项。 path：指定OBS中JSON文件的路径。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

快照查询（Snapshot Queries）可以读到最新的commit/compaction产生的快照。对于MOR表，还会在查询中合并最新的delta log文件的内容，使读取的数据近实时。增量查询增量查询（Incremental Queries）只会查询到给定的commit/compaction之后新增的数据。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
SHOW_INVALID_PARQUET - 数据湖探索 DLI

SHOW_INVALID_PARQUET 命令功能查看执行路径下损坏的parquet文件。命令格式 call show_invalid_parquet(path => 'path') 参数描述表1 参数描述参数描述是否必填 path 需要查询的FS路径是示例 call

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

匹配分区。展示的信息将包括表的基本信息和相关的文件系统信息，其中文件系统信息包括总文件数、总文件大小、最大文件长度、最小文件长度、最后访问时间以及最后更新时间。如果指定了分区，将给出指定分区的文件系统信息，而不是分区所在表的文件系统信息。参数说明 IN | FROM schema_name

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
下载并安装JDBC驱动包 - 数据湖探索 DLI

”和“短息验证码”。单击“确定”，下载证书。下载成功后，在credentials文件中即可获取AK和SK信息。认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。获取Token 当您使用Token

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
TRUNCATE TABLE - 数据湖探索 DLI
TRUNCATE TABLE - 数据湖探索 DLI

TABLE table_name 描述从表或分区中移除所有行。当表属性“auto.purge”采用默认值“false”时，被删除的数据行将保存到文件系统的回收站，否则，当“auto.purge”设置为“true”时，数据行将被直接删除。限制目标表必须是管控表（表属性external=false），否则执行语句将报错。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

使用提供的字符集（‘US-ASCII’，‘ISO-8859-1’，‘UTF-8’，‘UTF-16BE’，‘UTF-16LE’，‘UTF-16’）解码。如果任一参数为空，则结果也将为空。 ENCODE(string1, string2) 使用提供的字符集（‘US-ASCII’，‘ISO-8859-1’，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。对于Hudi的MOR类型和COW类型的表，都需要开启Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_insert：该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高的，但是无法控制小文件，而upser

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
DLI请求条件 - 数据湖探索 DLI
DLI请求条件 - 数据湖探索 DLI

DLI请求条件 DLI条件键类型运算符描述 g:CurrentTime 全局级 Date and time 接收到鉴权请求的时间。说明：以“ISO 8601”格式表示，例如：2012-11-11T23:59:59Z。 g:MFAPresent 全局级 Boolean 用户登录时是否使用了多因素认证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
SQL作业运行慢如何定位 - 数据湖探索 DLI

container_xxx_000001归档日志文件夹示例 Spark Jar作业： Spark Jar作业的归档日志文件夹以“batch”开头。图4 Spark Jar作业归档日志文件夹名示例进入归档日志文件目录，在归档日志文件目录下，下载“gc.log.*”日志。打开已下载的“gc.log.*”日志，搜索“Full

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hudi表索引设计规范 - 数据湖探索 DLI

数据存储文件生成索引信息。用Flink状态索引，Flink写入后，不支持Spark继续写入。 Flink在写Hudi的MOR表只会生成log文件，后续通过compaction操作，将log文件转为parquet文件。Spark在更新Hudi表时严重依赖parquet文件是否存在

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范

总条数： 327

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建DLI程序包 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

SHOW_COMMIT_FILES - 数据湖探索 DLI

ARCHIVELOG - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

SHOW_HOODIE_PROPERTIES - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

SHOW_INVALID_PARQUET - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

TRUNCATE TABLE - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

DLI请求条件 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线