搜索_华为云

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shu

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Spark表数据维护规范 - 数据湖探索 DLI

Spark表数据维护规范禁止通过Alter命令修改表关键属性信息：type/primaryKey/preCombineField/hoodie.index.type 错误示例，执行如下语句修改表关键属性： alter table dsrTable set tblproperties('type'='xx');

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
查询HBase表 - 数据湖探索 DLI
查询HBase表 - 数据湖探索 DLI

查询HBase表 SELECT命令用于查询hbase表中的数据。语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则会出错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
查询CSS表 - 数据湖探索 DLI
查询CSS表 - 数据湖探索 DLI

查询CSS表 SELECT命令用于查询CSS表中的数据。语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则会出错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
查询DDS表 - 数据湖探索 DLI
查询DDS表 - 数据湖探索 DLI

查询DDS表 SELECT命令用于查询DDS表中的数据。语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项如果在建表时没有指定schema信息，则查

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
查询作业结果-方式二（废弃） - 数据湖探索 DLI

查询作业结果-方式二（废弃）功能介绍该API用于在执行SQL查询语句的作业完成后，查看该作业执行的结果。目前仅支持查看“QUERY”类型作业的执行结果。该API只能查看前1000条的结果记录，若要查看全部的结果记录，需要先导出查询结果再进行查看，详细请参见导出查询结果。当前接口已废弃，不推荐使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
字符串函数概览 - 数据湖探索 DLI

字符串函数概览 DLI所支持的字符函数如字符串函数所示。表1 字符串函数函数命令格式返回值功能简介 ascii ascii(string <str>) BIGINT 返回字符串中首字符的数字值。 concat concat(array<T> <a>, array<T> <b>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
查询OpenTSDB表 - 数据湖探索 DLI
查询OpenTSDB表 - 数据湖探索 DLI

查询OpenTSDB表 SELECT命令用于查询OpenTSDB表中的数据。若OpenTSDB上不存在metric，查询对应的DLI表会报错。若OpenTSDB开了安全模式，则访问时，需要设置conf:dli.sql.mrs.opentsdb.ssl.enabled=true

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
查询Oracle表 - 数据湖探索 DLI
查询Oracle表 - 数据湖探索 DLI

查询Oracle表功能描述 SELECT命令用于查询Oracle表中的数据。语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项如果在建表时没有指定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接Oracle表
regexp_replace1 - 数据湖探索 DLI
regexp_replace1 - 数据湖探索 DLI

regexp_replace1 regexp_replace1函数用于将source字符串中第occurrence次匹配pattern的子串，替换成指定字符串replace_string后，返回结果字符串。 regexp_replace1函数只适用于Spark 2.4.5及之前的版本。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
数据迁移与传输方式概述 - 数据湖探索 DLI

数据迁移与传输方式概述导入数据至OBS DLI支持在不迁移数据的情况下，直接访问OBS中存储的数据进行查询分析。您只需将本地数据导入OBS即可开始使用DLI进行数据分析。导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
重命名分区（只支持OBS表） - 数据湖探索 DLI

重命名分区（只支持OBS表）功能描述重命名分区。语法格式 1 2 3 ALTER TABLE table_name PARTITION partition_specs RENAME TO PARTITION partition_specs; 关键字 PARTITION：分区。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
插入数据至HBase表 - 数据湖探索 DLI

插入数据至HBase表功能描述 INSERT INTO命令将DLI表中的数据插入到已关联的hbase表中。语法格式将SELECT查询结果插入到表中： 1 2 3 4 5 6 7 INSERT INTO DLI_TABLE SELECT field1,field2...

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
插入数据至CSS表 - 数据湖探索 DLI

插入数据至CSS表功能描述 INSERT INTO命令将DLI表中的数据插入到已关联的指定CSS表中。语法格式将SELECT查询结果插入到表中： 1 2 3 4 5 6 7 INSERT INTO DLI_TABLE SELECT field1,field2... [FROM

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
创建Bucket索引表调优 - 数据湖探索 DLI

创建Bucket索引表调优创建Bucket索引表调优 Bucket索引常用设置参数： Spark： hoodie.index.type=BUCKET hoodie.bucket.index.num.buckets=5 Flink index.type=BUCKET hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。Flink Sink写Kafka报错后作业失败： Caused by: org.apache.kafka.common.errors.NetworkException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
创建增强型跨源连接 - 数据湖探索 DLI

测试DLI队列与数据源的连通性获取数据源的私有内网IP和端口。以RDS数据源为例：在RDS控制台“实例管理”页面，单击对应实例名称，查看“连接信息”>“内网地址”，即可获取RDS内网地址。查看“连接信息”>“数据库端口”，获取RDS数据库实例端口。在DLI管理控制台，单击“资源管理 > 队列管理”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

弹性资源池CU时套餐包的额度按订购周期重置。存储量套餐包按照存储在DLI服务中的数据存储量（单位为“GB”）收取存储费用。适用于在DLI 存储表数据的场景，例如时延敏感类的业务将表存储在DLI，使用存储量套餐包可以节省存储费用。存储套餐的额度每个小时会重置。按订购周期重置：

帮助中心 > 数据湖探索 DLI > 计费说明
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

heckpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类

总条数： 1247

上一页
1
...
54
55
56
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

Spark表数据维护规范 - 数据湖探索 DLI

查询HBase表 - 数据湖探索 DLI

查询CSS表 - 数据湖探索 DLI

查询DDS表 - 数据湖探索 DLI

查询作业结果-方式二（废弃） - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

查询OpenTSDB表 - 数据湖探索 DLI

查询Oracle表 - 数据湖探索 DLI

regexp_replace1 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

重命名分区（只支持OBS表） - 数据湖探索 DLI

插入数据至HBase表 - 数据湖探索 DLI

插入数据至CSS表 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线