搜索_华为云

Flink Jar作业开发基础样例 - 数据湖探索 DLI

获取MRS集群全部节点的ip和域名映射，在DLI跨源连接修改主机信息中配置host映射。如何添加IP域名映射，请参见《数据湖探索用户指南》中“修改主机信息”章节。 Kafka服务端的端口如果监听在hostname上，则需要将Kafka Broker节点的hostname和IP的对应关系添加到DLI队列中。Kafka

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

字母、数字、下划线或者短横线。域名的顶级域名至少包含两个及以上的字母，例如.com，.net，.cn等。测试时域名后可选择添加端口，用":"隔开，端口最大限制为5位，端口范围：0~65535。例如example.com:8080。跨源认证使用约束限制更多跨源认证约束限制请参考跨源认证简介。

帮助中心 > 数据湖探索 DLI > 产品介绍
URL函数 - 数据湖探索 DLI
URL函数 - 数据湖探索 DLI

name=xxx&age=25#teacher');--teacher url_extract_host(url)→ varchar 描述：返回url中的主机域名。 select url_extract_host('http://www.example.com:80/stu/index.html

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建DLI表关联DCS - 数据湖探索 DLI

TABLE关键字说明参数描述 host DCS的连接IP，需要先创建跨源连接，管理控制台操作请参考增强型跨源连接。创建增强型跨源连接后，使用DCS提供的"连接地址"。"连接地址"有多个时，选择其中一个即可。说明：访问DCS目前只支持增强型跨源。 port DCS的连接端口，例如6379。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
增强型跨源连接概述 - 数据湖探索 DLI

字母、数字、下划线或者短横线。域名的顶级域名至少包含两个及以上的字母，例如.com，.net，.cn等。测试时域名后可选择添加端口，用":"隔开，端口最大限制为5位，端口范围：0~65535。例如example.com:8080。 DLI跨源分析流程使用DLI进行跨源分析

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

若为true，则表示输出数据到taskmanager的error文件中。若为false，则表示输出数据到taskmanager的out中。示例从kafka中读取数据输出到taskmanager的out文件中，可以在taskmanager的out文件中看到输出结果。 create table kafkaSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
创建增强型跨源连接 - 数据湖探索 DLI

字母、数字、下划线或者短横线。域名的顶级域名至少包含两个及以上的字母，例如.com，.net，.cn等。测试时域名后可选择添加端口，用":"隔开，端口最大限制为5位，端口范围：0~65535。例如example.com:8080。操作流程图1 创建增强型跨源连接操作流程

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

'connector.host' = '', 'connector.port' = '' ); 参数说明表1 参数说明参数是否必选说明 connector.type 是 connector类型，对于redis，需配置为'redis'。 connector.host 是 redis连接地址。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
对象存储OBS源表 - 数据湖探索 DLI

对象存储OBS源表功能描述文件系统连接器可用于将单个文件或整个目录的数据读取到单个表中。当使用目录作为source路径时，对目录中的文件进行无序的读取。更多信息参考文件系统 SQL 连接器语法格式 1 2 3 4 5 6 7 8 9 10 11 CREATE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

type 是 connector类型，对于redis，需配置为'redis'。 connector.host 是 redis连接地址。 connector.port 是 redis连接端口。 connector.password 否 redis认证密码。 connector.deploy-mode

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hudi Archive操作说明 - 数据湖探索 DLI

Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
pyspark样例代码 - 数据湖探索 DLI

6 7 8 dataFrame.write .format("redis")\ .option("host", host)\ .option("port", port)\ .option("table", table)\ .option("password", auth)\

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

OpenTSDB，若使用增强型跨源连接，填写OpenTSDB所在节点IP与端口，格式为"IP:PORT"，OpenTSDB存在多个节点时，用分号隔开，获取方式请参考“图 MRS集群OpenTSDB IP信息”和“图 MRS集群OpenTSDB 端口信息”。若使用经典型跨源，填写经典型跨源返回的连接地址

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
Hudi Compaction操作说明 - 数据湖探索 DLI

Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进行不阻塞摄入的异步Compaction很有意义。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Hudi Clean操作说明 - 数据湖探索 DLI

Hudi Clean操作说明什么是Clean Cleaning用于清理Hudi表不再需要的老版本数据文件 (parquet文件或者log文件)，减轻存储压力，提升list操作效率。如何执行Clean 写完数据后clean Spark SQL（设置如下参数，随后执行任意写入SQL时，在满足条件时触发）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

参数描述 host 需要连接的redis集群的IP。获取方式为：登录华为云官网，之后搜索redis，进入“分布式缓存服务”,接着选择“缓存管理”，根据主机名称需要的IP，可选择其中任意一个IP进行复制即可（其中也包含了port信息），请参考图1。 port 访问端口。 password

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

是否跳过，将jar包、Python程序文件、配置文件上传到OBS和加载到DLI服务端资源列表。当相关资源文件已经加载到DLI服务资源列表中，可以使用该参数跳过该步骤。不携带该参数时，默认会上传和加载命令中的所有资源文件到DLI服务中。 all：跳过所有资源文件的上传和加载 app：跳过Spark应用程序文件的上传和加载

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
table - 数据湖探索 DLI
table - 数据湖探索 DLI

table_reference 格式无。说明表或视图的名称，仅支持字符串类型，也可为子查询，当为子查询时，必须加别名。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
Delta清理和优化 - 数据湖探索 DLI

前创建的数据文件。 VACUUM delta_table0; VACUUM delta_table0 RETAIN 168 HOURS;--单位只支持HOURS 优化Delta表为了提高查询速度，Delta Lake支持优化数据在存储中的布局，这会将许多较小的文件压缩为较大的文件。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
Hudi表使用约束 - 数据湖探索 DLI

写时复制表也简称COW表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述

总条数： 387

上一页
1
2
3
4
5
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink Jar作业开发基础样例 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

URL函数 - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

对象存储OBS源表 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

table - 数据湖探索 DLI

Delta清理和优化 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线