搜索_华为云

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
日期、时间函数及运算符 - 数据湖探索 DLI

- interval '3' year - interval '5' month 2-7 时区转换运算符：AT TIME ZONE，用于设置一个时间戳的时区。 SELECT timestamp '2012-10-31 01:00 UTC';-- 2012-10-31 01:00:00

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用CDM迁移数据至DLI - 数据湖探索 DLI

必填参数如表1所示。表1 MySQL连接参数参数名说明取值样例名称输入便于记忆和区分的连接名称。 mysqllink 数据库服务器 MySQL数据库的IP地址或域名。 - 端口 MySQL数据库的端口。 3306 数据库名称 MySQL数据库的名称。 sqoop 用户名

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.partitions参数值来解决缓冲区不足问题。具体该参数设置步骤如下：登录DLI管理控制台，单击“作业管理 >

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
取消批处理作业 - 数据湖探索 DLI

"msg": "deleted" } 状态码状态码如表3所示。表3 状态码状态码描述 200 删除成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： Spark作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，要与kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
增强型跨源连接绑定队列失败怎么办？ - 数据湖探索 DLI

Administrator权限。客户未给VPC服务授权导致绑定队列失败。处理步骤登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource Connections Agency Access”是跨源场景访问和使用VPC、子网、路由、对等连接的权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
查询SQL作业日志 - 数据湖探索 DLI

避免出现作业结果混乱等问题。 DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
创建增强型跨源连接 - 数据湖探索 DLI

"ip":"192.168.0.1", "name":"ecs-97f8-0001" }, { "ip":"192.168.0.2", "name":"ecs-97f8-0002" } ] } 响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
查询Spark作业日志 - 数据湖探索 DLI

避免出现作业结果混乱等问题。 DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
查询Flink作业日志 - 数据湖探索 DLI

避免出现作业结果混乱等问题。 DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

登录DLI管理控制台，在“SQL编辑器”中，单击“设置”。在参数设置中，添加参数“spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled”，值设置为“false”。图1 参数设置上述步骤参数设置完成后，则可以进行全表查询，不用查询表的时候要包含分区字段。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。解决方案在SQL语句中添加如下参数： connector.properties.flink.partition-discovery

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运行VACUUM，则将无法再回头查看在指定数据保留期之前创建的版本。 Delta Lake 具有一

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
创建Bucket索引表调优 - 数据湖探索 DLI

024 分区表桶数 = 单分区数据量大小(G)/2G，再后向上取整，最小设置1个桶需要使用的是表的总数据大小，而不是压缩以后的文件大小桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。父主题： Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi Clean操作说明 - 数据湖探索 DLI

SparkDataSource（option里设置如下参数，写数据时触发） hoodie.clean.automatic=true hoodie.cleaner.commits.retained=10 // 默认值为10，根据业务场景指定 Flink（with属性里设置如下参数，写数据时触发） clean

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询批处理作业状态 - 数据湖探索 DLI

"state":"Success"} 状态码状态码如表3所示。表3 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： Spark作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API

总条数： 507

上一页
1
...
6
7
8
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

日期、时间函数及运算符 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

取消批处理作业 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

增强型跨源连接绑定队列失败怎么办？ - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

查询批处理作业状态 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线