搜索_华为云

Hudi数据表Clean规范 - 数据湖探索 DLI

MOR表下游采用流式计算，历史版本保留小时级。如果MOR表的下游是流式计算，例如Flink流读，可以按照业务需要保留小时级的历史版本，这样的话近几个小时之内的增量数据可以通过log文件读出，如果保留时长过短，下游flink作业在重启或者异常中断阻塞的情况下，上游增量数据已经Clean掉了，flink需要从par

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

*/”强制做broadcastjoin。如果有，则需要去掉该标识。设置spark.sql.autoBroadcastJoinThreshold=-1，具体操作如下：登录DLI管理控制台，单击“作业管理 > SQL作业”，在对应报错作业的“操作”列，单击“编辑”进入到SQL编辑器页面。单击“设置”，在参数设置中选择“spark

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
执行SQL查询语句报错：DLI.0003: Permission denied for resource.... - 数据湖探索 DLI

columns.col1', User = '{UserName}', Action = 'SELECT'. 解决措施出现该问题的原因是由于当前用户没有该表的查询权限。您可以进入“数据管理 > 库表管理”查找对应库表，查看权限管理，是否配置该账号的查询权限。授权方式请参考资料表权限管理。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

解决方案建议可以尝试调小spark.sql.shuffle.partitions参数值来解决缓冲区不足问题。具体该参数设置步骤如下：登录DLI管理控制台，单击“作业管理 > SQL作业”，对应SQL作业行的操作列，单击“编辑”按钮，跳转到“SQL编辑器”。在“SQL编辑器

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Hudi表分区设计规范 - 数据湖探索 DLI

律的，比如：近一个月的数据更新占比最大，可以按照月份创建分区；近一天内的数据更新占比大，可以按照天进行分区。采用Bucket索引，写入是通过主键Hash打散的，数据会均匀的写入到分区下每个桶。因为各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。Flink Sink写Kafka报错后作业失败： Caused by: org.apache.kafka.common.errors.NetworkException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
查询所有弹性资源池 - 数据湖探索 DLI

表2 Query参数参数是否必选参数类型描述 limit 否 Integer 每页的数量。默认为100。 name 否 String 通过弹性资源池名称进行模糊匹配。 offset 否 Integer 偏移量。默认为0。 status 否 String 弹性资源池状态。具体参数范围如下：

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
查看表属性 - 数据湖探索 DLI
查看表属性 - 数据湖探索 DLI

TBLPROPERTIES table_name [('property_name')]; 关键字 TBLPROPERTIES：TBLPROPERTIES子句允许用户给表添加key/value的属性。参数说明表1 参数说明参数描述 table_name 表名称。 property_name 命令

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
CREATE FUNCTION语句 - 数据湖探索 DLI

EXISTS] function_name AS identifier [LANGUAGE JAVA|SCALA] 功能描述创建一个用户自定义函数语法说明 IF NOT EXISTS 若该函数已经存在，则不会进行任何操作。 LANGUAGE JAVA|SCALA Language

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
费用账单 - 数据湖探索 DLI
费用账单 - 数据湖探索 DLI

查询资源ID。登录管理控制台，选择“大数据 > 数据湖探索 DLI”。选择“资源管理 > 弹性资源池”，在资源列表中查看并记录资源名称。在控制台顶部菜单栏中选择“资源 > 我的资源”。进入我的资源页面。在搜索条件中选择按名称搜索，并输入1.c获取的实例名称，单击图标搜索资源信息。

帮助中心 > 数据湖探索 DLI > 计费说明
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.forcePartitio

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

SELECT COUNT(DISTINCT order_id) FROM Orders GROUPING SETS Grouping Sets 可以通过一个标准的 GROUP BY 语句来描述更复杂的分组操作。数据按每个指定的 Grouping Sets 分别分组，并像简单的 group by

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

需要执行INSERT命令的Hudi表的名称。 select query 查询语句。注意事项写入模式：Hudi对于设置了主键的表支持三种写入模式，用户可以设置参数hoodie.sql.insert.mode来指定Insert模式，默认为upsert。 hoodie.sql.insert.mode

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
CREATE FUNCTION语句 - 数据湖探索 DLI

EXISTS] function_name AS identifier [LANGUAGE JAVA|SCALA] 功能描述创建一个用户自定义函数。如果您需要了解创建自定义函数的步骤请参考自定义函数。语法说明 IF NOT EXISTS 若该函数已经存在，则不会进行任何操作。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
新建模板 - 数据湖探索 DLI
新建模板 - 数据湖探索 DLI

新建模板功能介绍该API在DLI服务中新建一个用户模板，最多100个。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1.0/{project_id}/streaming/job-templates 参数说明表1 URI参数说明参数名称

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业模板相关API
删除全局变量 - 数据湖探索 DLI

删除全局变量功能介绍该API用于删除全局变量。只有创建全局变量的用户才可以删除对应的变量。调试您可以在API Explorer中调试该接口。 URI URI格式 DELETE /v1.0/{project_id}/variables/{var_name} 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
Hudi Archive操作说明 - 数据湖探索 DLI

Hudi Archive操作说明什么是Archive Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

请确认包年/包月资源还未到期。在购买页面开通自动续费您可以在购买页面开通自动续费，如图1所示。图1 自动续费配置在续费管理页面开通自动续费登录管理控制台。单击“控制台”页面上方“费用与成本”，在下拉菜单中选择“续费管理”。进入“续费管理”页面。自定义查询条件。可在“自动续费项”页签查询已经开通自动续费的资源。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费

总条数： 1088

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Clean规范 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

执行SQL查询语句报错：DLI.0003: Permission denied for resource.... - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

查询所有弹性资源池 - 数据湖探索 DLI

查看表属性 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

费用账单 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

新建模板 - 数据湖探索 DLI

删除全局变量 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线