搜索_华为云

SparkSQL建表参数规范 - 数据湖探索 DLI

SparkSQL建表参数规范规则建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
提交SQL作业时，返回“unsupported media Type”信息 - 数据湖探索 DLI

提交SQL作业时，返回“unsupported media Type”信息在DLI提供的REST API中，可以在请求URI中附加请求消息头，例如：Content-Type。 “Content-Type”为消息体的类型（格式），默认取值为“application/json”。提交SQL作业的URI为：POST

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi数据表Clean规范 Clean也是Hudi表的维护操作之一，该操作对于MOR表和COW表都需要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Spark表数据维护规范 - 数据湖探索 DLI

Spark表数据维护规范禁止通过Alter命令修改表关键属性信息：type/primaryKey/preCombineField/hoodie.index.type 错误示例，执行如下语句修改表关键属性： alter table dsrTable set tblproperties('type'='xx');

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Hudi锁配置说明 - 数据湖探索 DLI

任何形式的损失或损害承担责任，包括但不限于商业利润损失、业务中断、数据丢失或其他财务损失。父主题： Spark datasource API语法参考

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范写作业未停止情况下，禁止手动执行run schedule命令生成compaction计划。错误示例： run schedule on dsrTable 如果还有别的任务在写这张表，执行该操作会导致数据丢失。执行run

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
使用CDM迁移数据到DLI，迁移作业日志上报UQUERY_CONNECTOR_0001:Invoke DLI service api failed错误 - 数据湖探索 DLI

使用CDM迁移数据到DLI，迁移作业日志上报UQUERY_CONNECTOR_0001:Invoke DLI service api failed错误问题现象在CDM迁移数据到DLI，迁移作业提交后，在CDM作业迁移日志中查看作业执行失败，具体日志有如下报错信息： org.apache

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Hudi开发规范概述 - 数据湖探索 DLI

Hudi开发规范概述范围本节内容介绍DLI-Hudi组件进行湖仓一体、流批一体方案的设计与开发方面的规则，适用于Hudi开发场景的表的设计、管理与作业开发。主要包括以下方面的规范：数据表设计资源配置性能调优常见故障处理常用参数配置术语约定本规范采用以下的术语描述：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
身份认证与访问控制 - 数据湖探索 DLI

用户访问DLI的方式主要有两种，包括DLI Console界面、DLI Open API等，其本质都是通过DLI提供的REST API接口进行请求。 DLI的接口均需要通过认证鉴权才能访问，控制台发送的请求与调用API接口的请求均支持Token认证鉴权。访问控制您可以使用统一身份认证服务（Identity

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。提交作

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
增强型跨源连接概述 - 数据湖探索 DLI

开发不同的作业访问数据源。图1 跨源分析流程相关链接创建方式增强型跨源连接管理控制台操作创建增强型跨源连接 API接口《增强型跨源连接相关API》父主题：配置DLI与数据源网络连通（增强型跨源连接）

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
实时任务接入 - 数据湖探索 DLI

实时任务接入实时作业一般由Flink Sql或Sparkstreaming来完成，流式实时任务通常配置同步生成compaction计划，异步执行计划。 Flink SQL作业中sink端Hudi表相关配置如下： create table hudi_sink_table ( //

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
创建Bucket索引表调优 - 数据湖探索 DLI

创建Bucket索引表调优创建Bucket索引表调优 Bucket索引常用设置参数： Spark： hoodie.index.type=BUCKET hoodie.bucket.index.num.buckets=5 Flink index.type=BUCKET hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

println(result); } 查询作业APIG网关服务访问地址 DLI提供查询Flink作业APIG访问地址的接口。您可以使用该接口查询作业APIG网关服务访问地址。示例代码如下： 1 2 3 4 5 private static void getFlinkApigSinks(DLIClient

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
DLI Delta表概述 - 数据湖探索 DLI

的事务日志扩展了 Parquet 数据文件，可以处理 ACID 事务和可缩放的元数据。 Delta Lake与Apache Spark API完全兼容，并且其设计能够与结构化流式处理紧密集成，可以轻松地将单个数据副本用于批处理和流式处理操作，并提供大规模增量处理。 DLI中Delta的使用限制

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
与其他云服务的关系 - 数据湖探索 DLI

Hive语法创建OBS表》。备份数据：使用DLI提供导出API，将DLI的数据导出到OBS中备份。具体API请参考《导出数据》。存储查询结果：DLI提供API供用户将日常作业的查询结果数据保存到OBS。具体API请参考《导出查询结果》。与统一身份认证服务（IAM）的关系

 帮助中心 > 数据湖探索 DLI > 产品介绍
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

'properties.security.protocol' = 'SASL_SSL'； 'properties.sasl.mechanism' = 'GSSAPI或者PLAIN'； 'properties.sasl.jaas.config' = 'org.apache.kafka.common.security

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 588

上一页
1
...
11
12
13
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SparkSQL建表参数规范 - 数据湖探索 DLI

提交SQL作业时，返回“unsupported media Type”信息 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Spark表数据维护规范 - 数据湖探索 DLI

Hudi锁配置说明 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

使用CDM迁移数据到DLI，迁移作业日志上报UQUERY_CONNECTOR_0001:Invoke DLI service api failed错误 - 数据湖探索 DLI

Hudi开发规范概述 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

身份认证与访问控制 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线