搜索_华为云

资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

kind：资源包类型，当前支持的包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 obs_jar_paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
创建并提交SQL作业 - 数据湖探索 DLI

2c48765f481480c7db940d6409d1/elastic-resource-pools {endpoint}信息请从地区和终端节点获取。 Body： { "elastic_resource_pool_name" : "elastic_pool_dli", "description"

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
了解数据目录、数据库和表 - 数据湖探索 DLI

S桶中，且导出的路径必须指定到文件夹级别。导出文件格式为json格式，且文本格式仅支持UTF-8。支持跨账号导出数据，即B账户对A账户授权后，A账户拥有B账户OBS桶的元数据信息和权限信息的读取权限，以及路径的读写权限，则A账户可将数据导出至B账户的OBS路径中。表管理页面

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
DLI资源 - 数据湖探索 DLI
DLI资源 - 数据湖探索 DLI

DLI资源资源是服务中存在的对象。在DLI中，资源如下，您可以在创建自定义策略时，通过指定资源路径来选择特定资源。表1 DLI的指定资源与对应路径资源类型资源名称资源路径 queue DLI队列 queues.queuename database DLI数据库 databases

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
创建并提交Spark作业 - 数据湖探索 DLI

2c48765f481480c7db940d6409d1/elastic-resource-pools {endpoint}信息请从地区和终端节点获取。 Body： { "elastic_resource_pool_name" : "elastic_pool_dli", "description"

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
DLI的数据可存储在哪些地方 - 数据湖探索 DLI

MRS，RDS等。 DLI表与OBS表有什么区别？ DLI表表示数据存储在本服务内部，用户不感知数据存储路径。 OBS表表示数据存储在用户自己账户的OBS桶中，源数据文件由用户自己管理。 DLI表相较于OBS表提供了更多权限控制和缓存加速的功能，性能相较于外表性能更好，但是会收取存储费用。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Hudi常见配置参数 - 数据湖探索 DLI

置为0，会关闭此功能。由于批处理中分区中插入记录的数量众多，总会出现小文件。Hudi提供了一个选项，可以通过将对该分区中的插入作为对现有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

e: print(e) return print(table) 创建OBS表需要指定OBS路径，且该路径需要提前创建。完整样例代码和依赖包说明请参考：Python SDK概述。删除表 DLI提供删除表的接口。您可以使用该接口删除数据库下的所有表。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
创建并提交Flink作业 - 数据湖探索 DLI

2c48765f481480c7db940d6409d1/elastic-resource-pools {endpoint}信息请从地区和终端节点获取。 Body： { "elastic_resource_pool_name" : "elastic_pool_dli", "description"

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”或“jobmanager”的文件夹进入，下载获取taskmanager.out和jobmanager.out文件查看结果日志。验证跨源是否正确绑定且安全组规则已对该队列开放。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
TRUNCATE TABLE - 数据湖探索 DLI
TRUNCATE TABLE - 数据湖探索 DLI

TABLE table_name 描述从表或分区中移除所有行。当表属性“auto.purge”采用默认值“false”时，被删除的数据行将保存到文件系统的回收站，否则，当“auto.purge”设置为“true”时，数据行将被直接删除。限制目标表必须是管控表（表属性external=false），否则执行语句将报错。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Flink作业常用操作 - 数据湖探索 DLI

SQL作业不支持配置该参数。勾选该参数后，Flinkjar作业还需要选择“Checkpoint路径”。 “Checkpoint路径”：选择checkpoint保存路径。必须和应用程序中配置的Checkpoint地址相对应。且不同作业的路径不可一致，否则无法获取准确的Checkpoint。父主题：管理Flink作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

在日志中搜索“Classpath:”即可查看相关依赖包信息。 Flink 1.15 不再支持DLI程序包管理的功能，依赖包、依赖文件等请在编辑作业时直接选择上传的OBS路径。父主题： Flink Opensource SQL1.15语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
使用DLI分析电商BI报表 - 数据湖探索 DLI

击桶DLI-demo。OBS Browser+提供强大的拖拽上传功能，您可以将本地的一个或多个文件或者文件夹拖拽到对象存储的对象列表或者并行文件系统的对象列表中；同时您也可以将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_04.zi

帮助中心 > 数据湖探索 DLI > 最佳实践
Spark开源命令支持说明 - 数据湖探索 DLI

testDB SET DBPROPERTIES ('Edited-by' = 'John'); 不支持不支持修改数据库在OBS上的文件存放路径 ALTER DATABASE testDB SET LOCATION 'obs://bucketName/filePath'; 不支持

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_insert：该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高的，但是无法控制小文件，而upser

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
Hudi表索引设计规范 - 数据湖探索 DLI

数据存储文件生成索引信息。用Flink状态索引，Flink写入后，不支持Spark继续写入。 Flink在写Hudi的MOR表只会生成log文件，后续通过compaction操作，将log文件转为parquet文件。Spark在更新Hudi表时严重依赖parquet文件是否存在

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
提交SQL作业（推荐） - 数据湖探索 DLI

当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
SQL作业运行慢如何定位 - 数据湖探索 DLI

container_xxx_000001归档日志文件夹示例 Spark Jar作业： Spark Jar作业的归档日志文件夹以“batch”开头。图4 Spark Jar作业归档日志文件夹名示例进入归档日志文件目录，在归档日志文件目录下，下载“gc.log.*”日志。打开已下载的“gc.log.*”日志，搜索“Full

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类

总条数： 457

上一页
1
...
7
8
9
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

资源相关 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

DLI资源 - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

TRUNCATE TABLE - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线