搜索_华为云

创建批处理作业 - 数据湖探索 DLI

如果当前Spark组件版本为2.3.2，则不填写该参数。 image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Spark镜像。关

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
创建DLI程序包 - 数据湖探索 DLI

在管理控制台左侧，单击“数据管理”>“程序包管理”。在“程序包管理”页面，单击右上角“创建”可创建程序包。在“创建程序包”对话框，参见表1设置相关参数。图1 创建程序包表1 参数说明参数名称描述包类型支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

LI上创建数据库和表创建的表名，即为“tabletest”。导入前清空数据选择导入前是否清空目的表的数据。当前示例选择为“否”。如果设置为是，任务启动前会清除目标表中数据。详细的参数配置可以参考：CDM配置DLI目的端参数。单击“下一步”，进入到字段映射界面，CDM会自动匹配源和目的字段。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

账号在创建跨源连接访问外部数据时因为权限不足而导致跨源访问失败。解决方案登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource Connections Agency Access”是跨源场景访问和使用VPC、子网、路由、对等连接的权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
查看队列定时扩缩容计划（废弃） - 数据湖探索 DLI

有效期开始时间（13位时间戳）。 valid_date_end 否 Long 有效期结束时间（13位时间戳）。 activate 否 Boolean 当前设置的扩缩容计划是否激活，默认为“true”，表示激活。 last_execute_time 否 Long 当前扩缩容计划最近一次执行的时间。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

"obs://bucket/path/h1"; 注意事项对表执行clean操作时需要表的owner才可以执行。如果需要修改clean默认的参数，需要在执行SQL时，在设置中配置需要保留的commit数量等参数，参见Hudi常见配置参数。使用由DLI提供的元数据服务时，本命令不支持使用OBS路径。系统响应

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
DWS源表（不推荐使用） - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
Hudi Compaction操作说明 - 数据湖探索 DLI

入延迟，因而进行不阻塞摄入的异步Compaction很有意义。如何执行Compaction 仅执行Schedule Spark SQL（设置如下参数，写数据时触发） hoodie.compact.inline=true hoodie.schedule.compact.only.inline=true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

则该行数据将被设置为null。 DROPMALFORMED：选择DROPMALFORMED模式时，如果某一列数据类型与目标表列数据类型不匹配，则不导入该行数据。 FAILFAST：选择FAILFAST模式时，如果某一列类型不匹配，则会抛出异常，导入失败。模式设置可通过在OPTIONS中添加

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

得到错误的结果或意外的异常。因此，在这种情况下，建议将作业配置table.exec.source.cdc-events-duplicate设置为true，并在源表上定义PRIMARY KEY。Framework将生成一个额外的有状态操作符，并使用主键对变更事件进行去重，并生成一个规范化的changelog流。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建DLI表关联DWS - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
BlackHole结果表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table blackhole_table ( attr_name

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
导出DLI表数据至OBS中 - 数据湖探索 DLI

随导出创建指定路径：指定的导出目录必须不存在，如果指定目录已经存在，系统将返回错误信息，无法执行导出操作。覆盖指定路径：在指定目录下新建文件，会删除已有文件。表头:无/有设置导出数据是否含表头。单击“确定”即可导出数据。（可选）您可以在“作业管理”>“SQL作业”页面查看导出作业的“状态”、“执行语句”等信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
修改队列定时扩缩容计划（废弃） - 数据湖探索 DLI

有效期开始时间（13位时间戳）。 valid_date_end 否 Long 有效期结束时间（13位时间戳）。 activate 否 Boolean 当前设置的扩缩容计划是否激活，默认为“true”，表示激活。响应消息表3 响应参数参数名称是否必选参数类型说明 is_success 否

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

drop column后如果查询失败，需要设置Session属性： set session hive.orc_use_column_names=true; 对于parquet格式存储的非分区表，drop column后如果查询失败，需要设置Session属性： set session

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建DLI表关联RDS - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
Hudi Archive操作说明 - 数据湖探索 DLI

多会导致性能问题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发） hoodie.archive.automatic=true hoodie.keep.max.commits=30

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

Flink作业如何进行性能调优？更多 Spark作业相关问题如何查看DLI Spark作业的实际资源使用情况 Spark队列操作OBS表如何设置AK/SK？更多 Flink作业相关问题怎样将OBS表映射为DLI的分区表？更多技术专题技术、观点、课程专题呈现 Cloud Native

帮助中心 > 数据湖探索 DLI > 成长地图
DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

Administrator权限。客户未给VPC服务授权导致DLI跨源连接报错找不到子网。处理步骤登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource Connections Agency Access”是跨源场景访问和使用VPC、子网、路由、对等连接的权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类

总条数： 467

上一页
1
...
10
11
12
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建批处理作业 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

查看队列定时扩缩容计划（废弃） - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

修改队列定时扩缩容计划（废弃） - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线