搜索_华为云

从Kafka读取数据写入到RDS - 数据湖探索 DLI

步骤4：创建增强型跨源连接创建DLI连接Kafka的增强型跨源连接在Kafka管理控制台，选择“Kafka专享版”，单击对应的Kafka名称，进入到Kafka的基本信息页面。在“连接信息”中获取该Kafka的“内网连接地址”，在“基本信息”的“网络”中获取该实例的“虚拟私有云”和“子网”信息，方便后续操作步骤使用。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
字符串函数和运算符 - 数据湖探索 DLI

这些函数假定输入字符串包含有效的UTF-8编码的Unicode代码点。不会显式检查UTF-8数据是否有效，对于无效的UTF-8数据，函数可能会返回错误的结果。可以使用from_utf8来更正无效的UTF-8数据。此外，这些函数对Unicode代码点进行运算，而不是对用户可见的字符（或字形群集

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
使用DataSource语法创建OBS表 - 数据湖探索 DLI

CTAS建表语句不能指定表的属性。 OBS目录下包含子目录的场景：创建表时，若指定路径为OBS上的目录，且该目录下包含子目录（或嵌套子目录），则子目录下的所有文件类型及其内容也是表内容。您需要保证所指定的目录及其子目录下所有文件类型和建表语句中指定的存储格式一致，所有文件内容和表中的字段一致，否则查询将报错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
查询作业执行进度信息 - 数据湖探索 DLI

rogress表示整个作业的运行进度，因为没有子作业在运行，sub_job_id不展示。如果有子作业在运行中，则展示该子作业的运行进度，progress的计算方法为：子作业已经完成的task数除以子作业总的task数。此时progress表示子作业的运行进度，sub_job_id展示。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
查询作业状态 - 数据湖探索 DLI

Insert作业执行过程中扫描到的错误记录数。 input_size Long 作业执行过程中扫描文件的大小，单位字节。 result_count Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name String 记录其操作的表所在的数据库名称。类

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Hudi常见配置参数 - 数据湖探索 DLI

有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite.insert.split.size 插入写入并行度。为单个分区的总共插入次数。写出100MB的文件，至少1KB大小的记录，意味着

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

EXCEPT_KEY：记录的value部分包含schema的所有内容，定义为主键的字段除外。 properties.* 否无 String 该选项可以传递任意的Kafka参数。 “properties.”后的后缀名必须匹配定义在 kafka参数文档中的参数名。 Flink会自动移除选项名中的 "properties

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

cu_number 否 Integer 用户为作业选择的CU数。默认值为“2”。 CU数量为DLI的计算单元数量和管理单元数量总和，CU也是DLI的计费单位，1CU=1核4G。当前配置的CU数量为运行作业时所需的CU数，不能超过其绑定队列的CU数量。管理单元参数设置详见：manager_cu_number。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DLI对接LakeFormation - 数据湖探索 DLI

优先推荐您使用控制台提供的“元数据来源”参数项进行配置。 Lakeformation 数据目录名称配置Spark作业访问的数据目录名称。此处选择的是在DLI管理控制台创建的数据目录，即DLI与Lakeformation默认实例下的数据目录的映射，该数据目录连接的是LakeForma

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
修改表分区位置（只支持OBS表） - 数据湖探索 DLI

所要修改位置的表分区必须是已经存在的，否则将报错。 “partition_specs”中的参数默认带有“( )”，例如：PARTITION (dt='2009-09-09',city='xxx')。所指定的新的OBS路径必须是已经存在的绝对路径，否则将报错。若新增分区指定的路径包含

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Color 函数 - 数据湖探索 DLI
Color 函数 - 数据湖探索 DLI

Color 函数 bar(x, width) 描述：使用默认的低频红色和高频绿色渲染ANSI条形图中的单个条形。例如，如果将25％的x和40的宽度传递给此函数。将绘制一个10个字符的红色条形，后跟30个空格，以创建一个40个字符的条形。 bar(x, width, low_color,

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

数据湖探索DLI的计费由不同的计费项组成，不同的计费项有不同的计费模式，如图1所示。图1 DLI的计费组成计费项 DLI的计费项包括计算计费、存储计费、扫描量计费。DLI的计费详情请参见DLI产品价格详情。您可以通过DLI提供的价格计算器，快速计算出购买资源的参考价格。表1

帮助中心 > 数据湖探索 DLI > 计费说明
左外连接 - 数据湖探索 DLI
左外连接 - 数据湖探索 DLI

JOIN：返回左表的所有记录，没有匹配值的记录将返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例左外连接时利用student_info表中的courseId与course_info中的courseId进行匹配，返回已经选课的学生姓名及所选的课程名称，没有匹配值的右表记录将返回NULL。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

schema_name 描述 DATABASE和SCHEMA在此处是等价的，可互换的，它们有这相同的含义。该语法用于显示SCHEMA的名称、注释、还有它在文件系统上的根路径。可选项EXTENDED可以用来显示SCHEMA的数据库属性。示例 CREATE SCHEMA web; DESCRIBE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
查看指定表所有列 - 数据湖探索 DLI

查看指定表所有列功能描述查看指定表中的所有列。语法格式 1 SHOW COLUMNS {FROM | IN} table_name [{FROM | IN} db_name]; 关键字 COLUMNS：表中的列。 FROM/IN：指定数据库，显示指定数据库下的表的列名。FROM和IN没有区别，可替换使用。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

Queries）可以读到最新的commit/compaction产生的快照。对于MOR表，还会在查询中合并最新的delta log文件的内容，使读取的数据近实时。增量查询增量查询（Incremental Queries）只会查询到给定的commit/compaction之后新增的数据。读优化查询

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
OFFSET - 数据湖探索 DLI
OFFSET - 数据湖探索 DLI

OFFSET OFFSET OFFSET的作用是丢弃结果集中的前若干行数据。 OFFSET count [ ROW | ROWS ] 如果有ORDER BY，则OFFSET将会作用于排序后的结果集，OFFSET丢弃前若干行数据后保留的数据集，仍然是排序的： SELECT name FROM

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
右外连接 - 数据湖探索 DLI
右外连接 - 数据湖探索 DLI

OUTER JOIN：返回右表的所有记录，没有匹配值的记录将返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例右外连接和左外连接相似，但是会将右边表（这里的course_info)中的所有记录返回，没有匹配值的左表记录将返回NULL。 1 2

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
Spark jar 如何读取上传文件 - 数据湖探索 DLI

–-file中提交上来的文件的本地路径，即：SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的路径作为参数传给Executor去执行。 Executor获取文件路径的时候，仍然需要使用SparkFiles

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 1279

上一页
1
...
21
22
23
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从Kafka读取数据写入到RDS - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

Color 函数 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

左外连接 - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

查看指定表所有列 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

OFFSET - 数据湖探索 DLI

右外连接 - 数据湖探索 DLI

Spark jar 如何读取上传文件 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线