搜索_华为云

查询批处理作业详情 - 数据湖探索 DLI

custom：表示使用用户自定义的Spark镜像。 ai：表示使用DLI提供的AI镜像。 spark_version 否 String 作业使用spark组件的版本号，在“feature”为“basic”或“ai”时填写，若不填写，则使用默认的spark组件版本号2.3.2。 image

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

* 从 Kafka brokers 中的 consumer 组（consumer 属性中的 group.id 设置）提交的偏移量中开始读取分区。 * 如果找不到分区的偏移量，那么将会使用配置中的 auto.offset.reset 设置。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
查询所有作业 - 数据湖探索 DLI

String 记录其操作的表名称。类型为Import和Export作业才有“table_name”属性。 with_column_header 否 Boolean Import类型的作业，记录其导入的数据是否包括列名。 detail 是 String SQL查询的相关列信息的Json字符串。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

附加请求消息头字段，如指定的URI和HTTP方法所要求的字段。例如，定义消息体类型的请求消息头“Content-Type”，请求鉴权信息等。详细的公共请求消息头字段请参见表3。表3 公共请求消息头参数说明是否必选示例 Host 请求的服务器信息，从服务API的URL中获取。值为

 帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
查询分组资源列表（废弃） - 数据湖探索 DLI

Objects 已上传的用户分组资源。 total 是 Integer 资源包返回总数。表4 resources参数参数名称是否必选参数类型说明 create_time 否 Long 资源包上传的unix时间戳。 update_time 否 Long 更新已上传资源包的unix时间戳。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
DLI Delta常见问题 - 数据湖探索 DLI

requirement failed: Are you sure you would like to vacuum files with such a low retention period? 根因分析：RETAIN 保留期过短（少于168小时），需要确认是否能清理该时间前的数据，将无法再

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
Hudi数据表Compaction规范 - 数据湖探索 DLI

新版本的Parquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

uri uri的格式为：mongodb://username:pwd@host:8635/db 其中以下参数需要修改为实际值： “username”为创建的mongo（DDS）数据库用户名。 “pwd”为创建的mongo（DDS）数据库用户名对应的密码。 “host”为创建的mongo（DDS）数据库实例IP。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
查询增强型跨源连接列表 - 数据湖探索 DLI

跨源连接信息列表，详细信息请参考表4。 count 否 Integer 返回的跨源连接个数。表4 connections参数参数名称是否必选参数类型说明 id 否 String 连接ID，用于标识跨源连接的UUID。 name 否 String 创建连接时，用户自定义的连接名称。 status 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
Elasticsearch结果表 - 数据湖探索 DLI

key-delimiter 否 _ String 连接复合主键的拼接符，默认为_。 failure-handler 否 fail String 对Elasticsearch请求失败时的故障处理策略。有效的策略是： fail: 如果请求失败并因此导致作业失败，则抛出异常。 ignore:

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建数据库（废弃） - 数据湖探索 DLI

String 标签的键。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 标签的值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
辅助命令语法 - 数据湖探索 DLI

辅助命令语法 DESCRIBE DESCRIBE FORMATTED COLUMNS DESCRIBE DATABASE| SCHEMA EXPLAIN 父主题： HetuEngine SQL语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
查询作业状态 - 数据湖探索 DLI

作业执行过程中扫描文件的大小，单位字节。 result_count Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name String 记录其操作的表所在的数据库名称。类型为IMPORT、EXPORT和QUERY的作业才有“database_name”属性。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Hudi CALL COMMAND语法说明 - 数据湖探索 DLI

ROLL_BACK CLUSTERING CLEANING COMPACTION SHOW_COMMIT_FILES SHOW_FS_PATH_DETAIL SHOW_LOG_FILE SHOW_INVALID_PARQUET 父主题： DLI Hudi SQL语法参考

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

String 仅读取指定表的 changelog 记录（通过对比 Canal 记录中的 "table" 元数据字段）。支持的Connector Kafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

该示例是从kafka的一个topic中读取数据，并使用kafka sink将数据写入到kafka的另一个topic中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的OpenTSDB和MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
创建表（废弃） - 数据湖探索 DLI

OBS表必选参数。 data_path 否 String 新增OBS表数据的存储路径，必须是OBS的路径。说明： OBS表必选参数。 data_path配置的OBS桶路径不建议为根目录，否则清空表数据的时候，就会把根目录内的数据全部清除，导致数据丢失。 with_column_header

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
查看赋权对象使用者权限信息 - 数据湖探索 DLI

授权对象，和赋权API中的“object”对应。 "jobs.flink.flink作业ID"，查询指定的作业。 "groups.程序包组名"，查询指定的程序包组。 "resources.程序包名"，查询指定程序包。说明：查看分组下的程序包时，“object”的格式为"resources

帮助中心 > 数据湖探索 DLI > API参考 > 权限相关API

总条数： 333

上一页
1
...
11
12
13
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询批处理作业详情 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

DLI Delta常见问题 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

查询增强型跨源连接列表 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

创建数据库（废弃） - 数据湖探索 DLI

辅助命令语法 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Hudi CALL COMMAND语法说明 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

查看赋权对象使用者权限信息 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线