搜索_华为云

Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

Canal Format 功能描述 Canal是一个 CDC（ChangeLog Data Capture，变更日志数据捕获）工具，可以实时地将 MySQL 变更传输到其他系统。Canal 为变更日志提供了统一的数据格式，并支持使用 JSON 或 protobuf序列化消息（Canal

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

默认值数据类型参数说明 connector 是无 String 读取表类型。需要填写'hudi' path 是无 String 表存储的路径。如obs://xx/xx table.type 是 COPY_ON_WRITE String Hudi表类型。 MERGE_ON_READ

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
查询作业详情 - 数据湖探索 DLI

参数类型说明 job_id 否 Long 作业ID。 name 否 String 作业名称。长度限制：0-57个字符。 desc 否 String 作业描述。长度限制：0-512个字符。 job_type 否 String 作业类型。 flink_sql_job：flink sql作业

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移MRS Hive数据至DLI。其他MRS Hadoop组件数据，均可以通过CDM与DLI进行双向同步。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

作业ID，用户名，类型，状态，执行语句，运行时长，创建时间，结束时间，参数设置，标签，结果条数，已扫描数据，扫描数据条数，错误记录条数，存储路径，数据格式，数据库，表，表头，分隔符，引用字符，转义字符，日期格式，时间戳格式，CPU累计使用量，输出字节。建表（create ta

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

连接容器镜像服务。登录SWR管理控制台。选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。在安装容器引擎的虚拟机中执行上一步复制的登录指令。创建容器镜像组织。如果已创建组织则本步骤可以忽略。登录SWR管理控制台。选择左侧导航栏的“组织管理”，单击页面右上角的“创建组织”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

参数类型说明 name 否 String 作业名称。长度限制：0-57个字符。 desc 否 String 作业描述。长度限制：0-512个字符。 queue_name 否 String 队列名称。长度限制：0-128个字符。 sql_body 否 String Stream SQL语句，至少包含source

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

DLI Hudi元数据 DLI Hudi元数据说明创建Hudi表时会在元数据仓创建表的相关元数据信息。 Hudi支持对接DLI元数据和Lakeformation元数据（仅Spark 3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

略详情。具体请参考《标签管理服务用户指南》。说明：最多支持20个标签。一个“键”只能添加一个“值”。每个资源中的键名不能重复。标签键：在输入框中输入标签键名称。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : +-@ ,

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

Ogg Format 功能描述 Oracle GoldenGate (a.k.a ogg) 是一个实现异构 IT 环境间数据实时数据集成和复制的综合软件包。该产品集支持高可用性解决方案、实时数据集成、事务更改数据捕获、运营和分析企业系统之间的数据复制、转换和验证。Ogg 为变更日志提供了统一的格式结构，并支持使用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi数据表Compaction规范 - 数据湖探索 DLI

Plan没有去执行而导致Spark任务耗时长并且也会导致下游的读作业时延高。对此场景，在这里给出以下建议：按照集群资源使用情况，可以每2小时或每4个小时去调度执行一次异步Compaction作业，这是一个基本的维护MOR表的方案。采用Spark异步执行Compaction，不采用Flink进行Compaction。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

参数名称参数说明配置样例计费模式选择弹性资源池计费模式。按需计费区域选择弹性资源池所在区域。华东-上海二项目每个区域默认对应一个项目，由系统预置。系统默认项目名称弹性资源池名称。 dli_resource_pool 规格选择弹性资源池规格。标准版 CU范围弹性资源池最大最小CU范围。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
DLI Delta元数据 - 数据湖探索 DLI

DLI Delta元数据在DLI中提交Spark SQL作业开发Delta的SQL语法请参考Delta SQL语法参考。在DLI中提交Spark Jar作业开发Delta请参考在DLI使用Delta提交Spark Jar作业。 DLI Delta元数据说明创建Delta表时会在元数据仓创建表的相关元数据信息。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

只能配置一个，不能同时配置。若有多个topic，请以';'分隔，如'topic-1;topic-2'。 topic-pattern 否无 String 匹配读取kafka topic名称的正则表达式。注意：“topic-pattern”和“topic”只能选择一个，不可同时存在。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

推荐使用SparkSQL统一建表表名必须满足Hive格式要求表名必须以字母或下划线开头，不能以数字开头。表名只能包含字母、数字、下划线。表名长度不能超过128个字符。表名中不能包含空格和特殊字符，如冒号、分号、斜杠等。表名不区分大小写，但建议使用小写字母。 Hive保留关键字不能作为表名，如select、from、where等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
数学函数和运算符 - 数据湖探索 DLI

--^A# width_bucket(x, bound1, bound2, n) → bigint 在具有指定bound1和bound2边界以及n个存储桶的等宽直方图中返回x的容器数量 select value,width_bucket(value,1,5000,10) from (values

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

chema-syntax为array-scores时，除主键字段外，只能有两个非主键字段，且这两个字段的类型需要为array。两个字段其中第一个字段类型是array，表示Redis的set中的值；第二个字段类型为array<double>，表示相应索引的score。其示例如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Spark3.3.x不再支持使用“0$”指定第一个参数说明： format_string(strfmt, obj, ...) 和 printf(strfmt, obj, ...) 中的 strfmt 将不再支持使用“0$”指定第一个参数，第一个参数应始终由“1$”引用当使用参数索引来指示参数在参数列表中的位置。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比

总条数： 378

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Canal Format - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

DLI Delta元数据 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

数学函数和运算符 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线