搜索_华为云

Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
SDK的获取与安装 - 数据湖探索 DLI

SDK的获取与安装 Java SDK安装方式您可以通过以下两种方式安装Java SDK。导入Maven依赖，适用于使用Maven管理的Java项目。具体操作请参考方法一：通过Maven安装DLI SDK依赖。在集成开发环境中导入JAR文件，适用于使用Eclipse作为集成开

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
DLI内置依赖包 - 数据湖探索 DLI

commons-beanutils-1.9.4.jar javax.servlet-api-3.1.0.jar opentelemetry-api-1.16.0.jar commons-cli-1.2.jar javax.transaction-api-1.3.jar opentelemetry-context-1

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
开启Flink作业动态扩缩容 - 数据湖探索 DLI

恢复，因此未恢复成功前，作业无法处理数据。因扩缩容过程中需要触发savepoint，因此必须配置obs桶，并保存日志，同时请注意开启checkpoint。扩缩容检测周期不要设置过小，避免频繁启停作业。扩缩容作业恢复过程中的时间长短受savepoint的大小影响，如果保存点较大，可能恢复时间较慢。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
管理Spark作业模板 - 数据湖探索 DLI

可直接将配置完成的作业信息设置为模板。在DLI管理控制台的左侧导航栏中，单击“作业模板”>“Spark模板”，页面跳转至Spark作业页面。参考创建Spark作业配置作业参数。作业编辑完成后，单击“设为模板”。输入模板名称和描述信息。设置模板的分组信息。便于模板的统一管理。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
如何获取项目ID？ - 数据湖探索 DLI

如何获取项目ID？项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
修改表生命周期的时间 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式 ALTER TABLE table_name SET TBLPROPERTIES("dli

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
Hive方言 - 数据湖探索 DLI
Hive方言 - 数据湖探索 DLI

Flink目前支持两种SQL 方言: default 和 hive。您需要先切换到Hive 方言，然后才能使用Hive语法编写。下面介绍如何使用SQL设置方言。您可以为执行的每个语句动态切换方言。无需重新启动会话即可使用其他方言。语法格式 SQL 方言可以通过 table.sql-dialect

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
禁止或恢复表的生命周期 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式该语法在表级别禁止或恢复表的生命周期 1 ALTER TABLE table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

=> 'obs://bucket/path/hudi_mor/dt=2021-08-28/.*?log.*?'); call show_logfile_records(table => 'hudi_mor', log_file_path_pattern => 'obs://bu

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

REGEXP_EXTRACT(string1, string2[, integer]) 将字符串 STRING1 按照 STRING2 正则表达式的规则拆分，返回指定 INTEGER1 处位置的字符串。正则表达式匹配组索引从 1 开始， 0 表示匹配整个正则表达式。此外，正则表达式匹配组索引不应超过定义的组数。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ - 数据湖探索 DLI

表管理”。单击需要设置权限的表所在的数据库名，进入该数据库的“表管理”页面。单击所选表“操作”栏中的“权限管理”，将显示该表对应的权限信息。单击表权限管理页面右上角的“授权”按钮。在弹出的“授权”对话框中选择相应的权限。单击“确定”，完成表权限设置。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
实时任务接入 - 数据湖探索 DLI

//指定写入的是Hudi表 'path' = 'obs://bucket/path/hudi_sink_table', //指定Hudi表的存储路径

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

MRS配置 DLI跨源连接中配置MRS主机信息在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。对接MRS HBase需要在DLI队列的host文件中添加MRS集群节点的/etc/hosts信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理问题1：运行Spark作业，作业运行失败，作业日志中提示java server connection或container启动失败问题现象运行Spark作业，作业运行失败，作业日志中提示java server connection或container启动失败。解决方案

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
SQL作业运行报错：DLI.0002 FileNotFoundException - 数据湖探索 DLI

contact DLI service. DLI.0002: FileNotFoundException: getFileStatus on obs://xxx: status [404] 解决方案请排查在同一时间点是否还有另外作业对当前报错作业操作的表信息有删除操作。 DLI不允许

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

Flink1.7版本停止服务（EOS）公告公告说明华为云于2022年12月31 00:00（北京时间）将DLI Flink 1.7版本停止服务（EOS）。影响 DLI Flink 1.7版本停止服务（EOS）后，不再提供该软件版本相关的任何技术服务支持。建议您在执行作业时选

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

据，同时在表参数中配置hive_sync相关参数，实时同步元数据至由DLI提供的元数据服务。（具体参数详见Flink参数一节）请将作业中sink表的path参数修改为希望保存hudi表的obs路径。 -- 临时表作为source，通过datagen mock数据 create table

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

10、Flink 1.11版本停止服务（EOS）公告公告说明华为云计划于2023年12月31 00:00（北京时间）将DLI Flink 1.10、Flink1.11版本停止服务（EOS）。影响 DLI Flink 1.10、Flink1.11版本停止服务（EOS）后，不再提供该软

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if not exists dimension_hive_table ( product_id

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 1110

上一页
1
...
39
40
41
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表分区设计规范 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

Hive方言 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

SQL作业运行报错：DLI.0002 FileNotFoundException - 数据湖探索 DLI

DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线