搜索_华为云

创建DLI表关联RDS - 数据湖探索 DLI

访问MySQL集群填写"数据库名.表名" 注意：连接的RDS数据库名不能包含中划线-或^特殊字符，否则会创建表失败。访问PostGre集群填写"模式名.表名" 说明：模式名即为数据库模式（schema）的名称。数据库中schema是数据库对象集合，包含了表，视图等多种对象。 user （已废弃）RDS用户名。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

可以选择配置作业名称，便于识别和筛选。配置”应用程序”，路径指向上一步上传至OBS的Spark jar包。配置委托。选择提交DLI作业所需的委托。自定义委托请参考创建DLI自定义委托。配置”主类（--class）”，为上一步中所写的，包含需要执行的main函数的类的全名。在”Spark参数（--conf）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

Queries）可以读到最新的commit/compaction产生的快照。对于MOR表，还会在查询中合并最新的delta log文件的内容，使读取的数据近实时。增量查询增量查询（Incremental Queries）只会查询到给定的commit/compaction之后新增的数据。读优化查询

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

'#'号指定的字段类型当“fields.#.kind”字段为：random时有效。表示随机生成器的最小值，'#' 指定的字段仅适用于数字类型。 fields.#.max 否 '#'号指定的字段类型的最大值 '#'号指定的字段类型当“fields.#.kind”字段为：random时有效。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
percent - 数据湖探索 DLI
percent - 数据湖探索 DLI

percent_rank percent_rank函数为窗口的ORDER BY子句所指定列中值的返回值，但以介于0和1之间的小数形式表示，计算方法为 (分组内当前行的RANK值-1)/(分组内总行数-1)。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
迁移数据场景概述 - 数据湖探索 DLI

数据迁移数据类型映射将其他云服务或业务平台数据迁移到DLI ，或者将DLI数据迁移到其他云服务或业务平台时，涉及到源和目的端数据类型的转换和映射，根据表2可以获取到源和目的端的数据类型映射关系。表2 数据类型映射表 MySQL Hive DWS Oracle PostgreSQL Hologres

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

es"修改为对应的数据库名字。 passwdauth DLI侧创建的Password类型的跨源认证名称。使用跨源认证则无需在作业中配置账号和密码。 dbtable 数据库postgres中的数据表。 partitionColumn 读取数据时，用于设置并发使用的数值型字段。说明：

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
创建数据库（废弃） - 数据湖探索 DLI

开通了企业管理服务的用户可设置该参数绑定指定的项目。 tags 否 Array of Objects 数据库的标签。具体请参考表3。表3 tags参数参数名称是否必选参数类型说明 key 是 String 标签的键。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
rank - 数据湖探索 DLI
rank - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回INT类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
SHOW_INVALID_PARQUET - 数据湖探索 DLI

show_invalid_parquet(path => 'obs://path/hudi_table/dt=2021-08-28'); 注意事项使用由DLI提供的元数据服务时，不支持本命令。权限需求由DLI提供的元数据服务 SQL权限： database table 无 SELECT 细粒

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数 > 表值函数
流生态作业开发指引 - 数据湖探索 DLI

通过对等连接建立与其他VPC的网络连接后，用户可以在DLI的租户独享集群中访问所有Flink和Spark支持的数据源与输出源，如Kafka、Hbase、ElasticSearch等。自拓展生态用户可通过编写代码实现从想要的云生态或者开源生态获取数据，作为Flink作业的输入数据。 DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

db_name 需要执行INSERT命令的表所在数据库的名称。 table_name 需要执行INSERT命令的表的名称。 part_spec 指定详细的分区信息。若分区字段为多个字段，需要包含所有的字段，但是可以不包含对应的值，系统会匹配上对应的分区。单表分区数最多允许100000个。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
row - 数据湖探索 DLI
row - 数据湖探索 DLI

partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基于源数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。产品内核及架构深度优化，综合性能是传统MapReduce模型的百倍以上，SLA保障99.95%可用性。图1 DLI Serverless架构与传统自建Hadoop集群相比，Serverless架构的DLI还具有以下优势：

帮助中心 > 数据湖探索 DLI > 产品介绍
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

在DLI中，表和数据库是定义底层数据的元数据容器。表中的元数据让DLI知道数据所在的位置，并指定了数据的结构，例如列名称、数据类型和表名称。数据库是表的逻辑分组。 OBS表、DLI表、CloudTable表不同表类型表示不同的数据存储位置。 OBS表表示数据存储在OBS服务的桶中。 DLI表表示数据存储在本服务内部的表中。

帮助中心 > 数据湖探索 DLI > 产品介绍
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

Flink、trino生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

生成compaction计划（op指定为“schedule”），或者执行已经生成的compaction计划（op指定为“run”）是 table 需要查询表的表名，支持database.tablename格式 table，path须选填其中之一 path 需要查询表的路径 table，path须选填其中之一 timestamp

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS

总条数： 784

上一页
1
...
34
35
36
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建DLI表关联RDS - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

percent - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

创建数据库（废弃） - 数据湖探索 DLI

rank - 数据湖探索 DLI

SHOW_INVALID_PARQUET - 数据湖探索 DLI

string_split - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

row - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线