搜索_华为云

Hudi数据表Compaction规范 - 数据湖探索 DLI

要求Compaction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何合理的设置这个周期，周期如果太短意味着Spark任务可能会空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

"v1"为V1表；"v2"则为V2表。如需修改V1表为V2表请提交工单联系客户支持获取操作帮助。升级示例升级Spark引擎和修改数据表时，如新建队列时切换了计算资源类型可能会导致计费资源的费用变化。如果原队列使用的是弹性资源池类型的计算资源，那么新建队列不涉及计算资源的费用变化。如果原队

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
从Kafka读取数据写入到DWS - 数据湖探索 DLI

新建的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。长度限制：1~128个字符。队列名称不区分大小写，系统会自动转换为小写。类型：队列类型选择“通用队列”。“按需计费”时需要勾选“专属资源模式”。 AZ策略、CPU架构、规格：保持默认即可。企业项目：当前选择为“default”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

新建的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。长度限制：1~128个字符。队列名称不区分大小写，系统会自动转换为小写。类型：队列类型选择“通用队列”。“按需计费”时需要勾选“专属资源模式”。 AZ策略、CPU架构、规格：保持默认即可。企业项目：当前选择为“default”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

)(bar)', 2) 返回 "bar"。 INITCAP(string) 返回新形式的 STRING，其中每个单词的第一个字符转换为大写，其余字符转换为小写。这里的单词表示字母数字的字符序列。 CONCAT(string1, string2, ...) 返回连接 string1，string2，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Hudi Clustering操作说明 - 数据湖探索 DLI

mns），然后应用该策略重写数据。创建一个REPLACE提交，并更新HoodieReplaceCommitMetadata中的元数据。如何执行Clustering Spark SQL（设置如下参数，写数据时触发） hoodie.clustering.inline=true //

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Confluent Avro Format - 数据湖探索 DLI

servers=<yourKafkaAddress1>:<yourKafkaPort>,<yourKafkaAddress2>:<yourKafkaPort> 将ecs切换到confluent-5.5.2目录下，使用下述命令启动confluent： bin/schema-registry-start etc/

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

生的临时数据，例如：作业日志、作业结果等。如果不创建该桶，将无法查看作业日志。可以通过配置生命周期规则实现定时删除OBS桶中的对象或者定时转换对象的存储类别。桶名称为系统默认。如果不需要创建DLI临时数据桶，并且希望不再收到该提示，可以勾选“下次不再提示”并单击“取消”。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

是：“window_start”，“window_end”，“window_time”。函数运行后，原有的时间属性 “timecol” 将转换为一个常规的 timestamp 列。 TUMBLE(TABLE data, DESCRIPTOR(timecol), size [, offset

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

用户在使用Flink 1.12版本，则依赖的Dis connector版本需要不低于2.0.1，详细代码参考DISFlinkConnector相关依赖，如何配置connector，详细参考自定义Flink Streaming作业。若读取DIS，且配置groupId，则需要提前在DIS的“App管理”中创建所需的App名称。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
从Kafka读取数据写入到RDS - 数据湖探索 DLI

新建的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。长度限制：1~128个字符。队列名称不区分大小写，系统会自动转换为小写。类型：队列类型选择“通用队列”。“按需计费”时需要勾选“专属资源模式”。 AZ策略、CPU架构、规格：保持默认即可。企业项目：当前选择为“default”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Confluent Avro Format - 数据湖探索 DLI

Flink 将可为空的类型映射到 Avro union(something, null), 其中 something 是从 Flink 类型转换的 Avro 类型。示例从kafka中作为source的topic中读取json数据，并以confluent avro的形式写入作为sink的topic中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi常见配置参数 - 数据湖探索 DLI

hoodie.datasource.hive_sync.partition_extractor_class 用于提取hudi分区列值，将其转换成hive分区列。 org.apache.hudi.hive.SlashEncodedDayPartitionValueExtractor

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED 语法 SHOW TABLE EXTENDED [IN | FROM schema_name] LIKE 'identifier_with_wildcards' [PARTITION (partition_spec)] 描述

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

管理Spark作业查看Spark作业的基本信息在总览页面单击“Spark作业”简介，或在左侧导航栏单击“作业管理”>“Spark作业”，可进入Spark作业管理页面。Spark作业管理页面显示所有的Spark作业，作业数量较多时，系统分页显示，您可以查看任何状态下的作业。表1

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
删除全局变量 - 数据湖探索 DLI

删除全局变量功能介绍该API用于删除全局变量。只有创建全局变量的用户才可以删除对应的变量。调试您可以在API Explorer中调试该接口。 URI URI格式 DELETE /v1.0/{project_id}/variables/{var_name} 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

DLI委托概述什么是委托？各云服务之间存在业务交互关系，一些云服务需要与其他云服务协同工作，需要您创建云服务委托，将操作权限委托给DLI服务，让DLI服务以您的身份使用其他云服务，代替您进行一些资源运维工作。例如：在DLI新建Flink作业所需的AKSK存储在数据加密服务D

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
查询所有全局变量 - 数据湖探索 DLI

查询所有全局变量功能介绍该API用于查询当前project下所有全局变量的信息。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id}/variables 参数说明表1 URI参数说明参数名称是否必选参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Java开发环境配置 - 数据湖探索 DLI

Java开发环境配置操作场景在安装和使用Java SDK前，确保您已经完成开发环境的基本配置。 Java SDK要求使用JDK1.8或更高版本。考虑到后续版本的兼容性，推荐使用1.8版本。在Java运行环境配置好的情况下，打开windows的命令行，执行命令Java -version，可以检查版本信息。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置

总条数： 558

上一页
1
...
20
21
22
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Compaction规范 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

删除全局变量 - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

查询所有全局变量 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

Java开发环境配置 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线