搜索_华为云

Spark 2.4.5版本说明 - 数据湖探索 DLI

说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

用户可以在DLI管理控制台采用API接口模式设置参数及参数值。商用创建批处理作业API 2020年5月序号功能名称功能描述阶段相关文档 1 支持数据扫描量套餐包 DLI增加数据扫描量套餐包，降低数据扫描量费用。商用产品价格详情 2 支持全局变量功能 DLI支持设置全局变量，用于保护用户关键信息。

帮助中心 > 数据湖探索 DLI > 最新动态
使用DLI提交Spark作业 - 数据湖探索 DLI

使用DLI提交Spark作业创建Spark作业设置Spark作业优先级查询Spark作业日志管理Spark作业管理Spark作业模板

 帮助中心 > 数据湖探索 DLI > 用户指南
Spark on Hudi开发规范 - 数据湖探索 DLI

on Hudi开发规范 SparkSQL建表参数规范 Spark增量读取Hudi参数规范 Spark异步任务执行表compaction参数设置规范 Spark表数据维护规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
使用DLI提交SQL作业 - 数据湖探索 DLI

使用DLI提交SQL作业创建并提交SQL作业导出SQL作业结果配置SQL防御规则设置SQL作业优先级查询SQL作业日志管理SQL作业查看SQL执行计划创建并管理SQL作业模板

 帮助中心 > 数据湖探索 DLI > 用户指南
管理Flink作业 - 数据湖探索 DLI
管理Flink作业 - 数据湖探索 DLI

管理Flink作业查看Flink作业详情设置Flink作业优先级开启Flink作业动态扩缩容查询Flink作业日志 Flink作业常用操作父主题：使用DLI提交Flink作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
多版本备份恢复数据 - 数据湖探索 DLI

多版本备份恢复数据设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据父主题：表相关

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关
跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

TABLE_NAME CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; 参考信息如何确保RDS for MySQL数据库字符集正确父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
创建Hive Catalog - 数据湖探索 DLI

HiveCatalog有两个用途：作为原生Flink元数据的持久化存储，以及作为读写现有Hive元数据的接口。 Flink 的Hive 文档提供了有关设置 HiveCatalog以及访问现有 Hive 元数据的详细信息。详情参考：Apache Flink Hive Catalog HiveC

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU 当前扩缩容策略支持的最大CU数。

帮助中心 > 数据湖探索 DLI > 快速入门
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

false Boolean 是否禁止对引用的值使用引号 (默认是 false). 如果禁止，选项 'csv.quote-character' 不能设置。 csv.quote-character 否 ‘’ String 用于围住字段值的引号字符 (默认"). csv.allow-comments

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
DLI自定义策略 - 数据湖探索 DLI

Resource由<服务名:region:domainId:资源类型:资源路径>5个字段组成，通配符号*表示所有资源。5个字段可以灵活设置，资源路径可以按照场景需要，设置不同级别的权限控制。当需要设置该服务下的所有资源时，可以不指定该字段。Resource定义请参考表3。Resource中的资源类型和资源路径请参考表4。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
导出查询结果 - 数据湖探索 DLI

除已有文件。 with_column_header 否 Boolean 导出csv和json格式数据时，是否导出列名。设置为“true”，表示导出列名。设置为“false”，表示不导出列名。若为空，默认为“false”。 limit_num 否 Integer 需要导出的数据数量，默认值为“0”，表示全部导出。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
管理弹性资源池 - 数据湖探索 DLI

管理弹性资源池查看弹性资源池的基本信息弹性资源池权限管理弹性资源池关联队列弹性资源池CU设置弹性资源池规格变更弹性资源池标签管理调整弹性资源池中队列的扩缩容策略查看弹性资源池扩缩容历史分配弹性资源池至项目父主题：创建弹性资源池和队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

执行语句，运行时长，创建时间，结束时间，参数设置，标签，结果条数，已扫描数据，数据库。查询（select）作业（作业类型：QUERY），包括以下信息：队列，作业ID，用户名，类型，状态，执行语句，运行时长，创建时间，结束时间，参数设置，标签，结果条数（运行成功，可导出结果），已

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

第一行凭据值的键为MySQLUsername，值为RDS实例的用户名。第二行凭据值的键为MySQLPassword，值为RDS实例的密码。图1 设置凭据值按需完成其他参数的配置后，单击“确定”保存凭据。了解更多请参考创建通用凭据。在DLI作业中使用DEW中创建的凭据以Flink作业为例介绍使用DEW凭据的方法。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
提交SQL作业时，返回“unsupported media Type”信息 - 数据湖探索 DLI

0/{project_id}/jobs/submit-job 其“Content-Type”只支持“application/json”，若设置为“text”则会报错，报错信息为“unsupported media Type”。父主题： DLI API类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

升级引擎版本后是否对作业有影响：有影响，需要判断是否使用分区名做业务判断。 eventlog的压缩格式设置为zstd 说明： Spark3.3.x版本中，spark.eventLog.compression.codec的默认值被设置为zstd，Spark在压缩事件日志时将不再支持使用spark.io.compression

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

API以同步模式调用运行时会有两分钟的超时时间限制，如果API调用超过该时间限制则会超时报错。解决方案调用“提交SQL作业”API时可以通过设置“dli.sql.sqlasync.enabled”参数为“true”来异步运行该作业。具体可以参考提交SQL作业API。父主题： DLI

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类

总条数： 485

上一页
1
...
16
17
18
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 2.4.5版本说明 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

使用DLI提交Spark作业 - 数据湖探索 DLI

Spark on Hudi开发规范 - 数据湖探索 DLI

使用DLI提交SQL作业 - 数据湖探索 DLI

管理Flink作业 - 数据湖探索 DLI

多版本备份恢复数据 - 数据湖探索 DLI

跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

管理弹性资源池 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

提交SQL作业时，返回“unsupported media Type”信息 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线