搜索_华为云

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.maxPartitionBytes=33554432”。该配置项默认值为128MB，将其配置成32MB，可以减少单个任务读取的数据量

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

管理”>“Spark作业”，可进入Spark作业管理页面。Spark作业管理页面显示所有的Spark作业，作业数量较多时，系统分页显示，您可以查看任何状态下的作业。表1 作业管理参数参数参数说明作业ID 所提交Spark作业的ID，由系统默认生成。名称所提交Spark作业的名称。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

like.element.col2。 col_type：新增列类型，必须指定。 nullable：新增列是否可以为空，可以缺省。 comment：新增列comment，可以缺省。 col_position：列添加位置包括FIRST、AFTER origin_col两种，指定FIR

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

_FILES_BY_DAYS。 KEEP_ARCHIVED_FILES_BY_SIZE策略可以设置归档文件占用的存储空间大小 KEEP_ARCHIVED_FILES_BY_DAYS策略可以清理超过某个时间点之外的归档文件 hoodie.archive.file.cleaner.size

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
边缘Flink作业状态上报（废弃） - 数据湖探索 DLI

边缘Flink作业状态上报（废弃）功能介绍该API用于处理边缘Flink作业状态上报信息。 DLI不再支持边缘作业场景的API调用。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1/{project_id}/edgesrv/job-report

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > IEF相关API（废弃）
怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

怎样获取DLI作业样例（Demo）为了方便用户更好地使用DLI，DLI服务提供了供作业开发的Demo样例，您可以通过DLI样例代码获取。该样例代码的目录内容介绍如下： dli-flink-demo：开发Flink作业时的样例代码参考。例如，样例代码实现读取Kafka源表数据写

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用CTS审计DLI服务 - 数据湖探索 DLI

使用CTS审计DLI服务通过云审计服务，您可以记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。表1 云审计服务支持的DLI操作列表操作名称资源类型事件名称创建数据库 database createDatabase 删除数据库 database deleteDatabase

帮助中心 > 数据湖探索 DLI > 用户指南
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive作业每天至少执行一次，可以2~4小时执行一次。 Hudi的MOR表和COW表都需要保证每天至少1次Archive，MOR表的Archive可以参考2.2.1.6小节和Compaction放在一起异步去执行。COW的Archive可以在写数据时自动判断是否执行。父主题：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
弹性资源池规格变更 - 数据湖探索 DLI

CU时计费方式计费。为了满足该场景下更优惠的计费，则可以通过规格变更的方式，将弹性资源池的规格扩大到128CU，则规格变更成功后128CU范围内都使用包年包月计费，整体相比原来更优惠。弹性资源池规格不满足当前业务需求时，可以通过“包周期CU变更”功能修改当前弹性资源池的规格。注意事项

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
怎样管理在DLI上运行的作业 - 数据湖探索 DLI

怎样管理在DLI上运行的作业管理大量的DLI作业时您可以采用以下方案：作业分组：将几万个作业根据不同的类型分组，不同类型的作业通过不同的队列运行。创建IAM子用户或者创建IAM子用户，将不同类型的作业通过不同的用户执行。具体请参考《数据湖探索用户指南》。此外DLI还

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
清理多版本数据 - 数据湖探索 DLI

数据在保留周期时间外但是后续该表不会再执行insert overwrite或者truncate语句时，多版本保留周期外的数据不会自动清理。可以通过本章节介绍的SQL命令手动进行多版本数据清理。语法格式清理多版本保留周期外数据。 clear history for table [db_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
删除表 - 数据湖探索 DLI
删除表 - 数据湖探索 DLI

成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。注意事项所要删除的表必须是当前数据库下存在的，否则会出错，可以通过添加IF EXISTS来避免出错。示例参考创建OBS表或者创建DLI表中的示例描述创建对应的表。在当前所在数据库下删除名为test的表。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关
全外连接 - 数据湖探索 DLI
全外连接 - 数据湖探索 DLI

JOIN：根据左表与右表的所有记录进行匹配，没有匹配值的记录返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例利用全外连接可以将两张表中的所有记录返回，没有匹配值的左表及右表记录将返回NULL。 1 2 SELECT student_info.name, course_info

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
表别名 - 数据湖探索 DLI
表别名 - 数据湖探索 DLI

attr_expr_list FROM table_reference [AS] alias; 关键字 table_reference：可以是表，视图或者子查询。 AS：可用于连接table_reference和alias，是否添加此关键字不会影响命令执行结果。注意事项所要查询的表必须是已经存在的，否则会出错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 别名SELECT
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DML语法定义 - 数据湖探索 DLI
DML语法定义 - 数据湖探索 DLI

对于标识符（表、属性、函数名）有类似于 Java 的词法约定: 不管是否引用标识符，都保留标识符的大小写。且标识符需区分大小写。与 Java 不一样的地方在于，通过反引号，可以允许标识符带有非字母的字符（如："SELECT a AS `my field` FROM t"）。字符串文本常量需要被单引号包起来（如 SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义
怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？可以使用OBS跨区域复制功能实现，步骤如下：将区域一中的DLI表数据导出到自定义的OBS桶中。具体请参考《数据湖探索用户指南》。通过OBS跨区域复制功能将数据复制至区域二的OBS桶中。具体请参考跨区域复制。根据需要导入或使用对应的数据。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

enable配置项，所以不涉及Apache Spark 命令注入漏洞（CVE-2022-33891）。该漏洞主要影响在启用了ACL（访问控制列表）时，可以通过提供任意用户名来执行命令导致数据安全受到威胁。 DLI在设计时充分考虑了数据安全和数据隔离，因此没有启用相关的配置项，所以不会受到这个漏洞的影响。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类

总条数： 792

上一页
1
...
32
33
34
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

边缘Flink作业状态上报（废弃） - 数据湖探索 DLI

怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

弹性资源池规格变更 - 数据湖探索 DLI

怎样管理在DLI上运行的作业 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

删除表 - 数据湖探索 DLI

全外连接 - 数据湖探索 DLI

表别名 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

DML语法定义 - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线