搜索_华为云

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

所要修改位置的表分区必须是已经存在的，否则将报错。 “partition_specs”中的参数默认带有“( )”，例如：PARTITION (dt='2009-09-09',city='xxx')。所指定的新的OBS路径必须是已经存在的绝对路径，否则将报错。若新增分区指定的路径包含

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
ClickHouse结果表 - 数据湖探索 DLI

er实例的IP:ClickHouseBalancer实例的http端口/数据库名 ClickHouseBalancer实例的IP地址：登录MRS管理控制台，选择“集群名称 > 组件管理 > ClickHouse > 实例”，获取ClickHouseBalancer实例的业务IP。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
更新Flink Jar作业 - 数据湖探索 DLI

用户为作业选择的CU数量。默认值为“2”。 manager_cu_number 否 Integer 用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。默认值为“1”。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能连

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

使用ogg-json读取kafka中的ogg记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

8。配置Java环境变量JAVA_HOME。查询弹性云服务器ECS详细信息，获取ECS的“私有IP地址”。使用增强型跨源连接打通DLI队列和Livy实例所在的VPC网络。具体操作可以参考增强型跨源连接。 DLI Livy工具下载及安装本次操作下载的DLI Livy版本为apache-livy-0.7.2.0107-bin

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

该字段的map的value需要为double类型，表示score，该字段的map的key表示redis的set中的值。当data-type为sorted-set，且schema-syntax为array-scores时，除主键字段外，只能有两个非主键字段，且这两个字段的类型需要为array。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库问题描述 Spark3.x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

业日志的OBS桶，方便后续查看作业日志。创建的HBase结果表的列簇必须定义为ROW类型，字段名对应列簇名（column family），嵌套的字段名对应列限定符名（column qualifier）。用户只需在表结构中声明查询中使用的的列簇和列限定符。除了ROW类型的列，剩下的原子数据类型字段（比如，STRING

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

1996; 96 M 月份 July; Jul; 07 w 年中的周数 27(该年的第27周) W 月中的周数 2(该月的第2周) D 年中的天数 189(该年的第189天) d 月中的天数 10(该月的第10天) u 星期中的天数 1 = 星期一, ..., 7 = 星期日 a am/pm

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
弹性资源池的实际CUs、CU范围、规格的含义 - 数据湖探索 DLI

弹性资源池的实际CUs、CU范围、规格的含义实际CUs：弹性资源池当前分配的可用CUs。 CU范围：CU设置主要是为了控制弹性资源池扩缩容的最大最小CU范围，避免无限制的资源扩容风险。弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。弹性资源池中任意一

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

tableIndentifier 需要执行INSERT命令的Hudi表的名称。 select query 查询语句。注意事项写入模式：Hudi对于设置了主键的表支持三种写入模式，用户可以设置参数hoodie.sql.insert.mode来指定Insert模式，默认为upsert。 hoodie.sql

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
常见场景的委托权限策略 - 数据湖探索 DLI

常见场景的委托权限策略本节操作提供了DLI常见场景的委托权限策略，用于用户自定义权限时配置委托的权限策略。委托策略中的“Resource”根据需要具体情况进行替换。数据清理委托权限配置适用场景：数据清理委托，表生命周期清理数据及lakehouse表数据清理使用。该委托需新建

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
SORT BY - 数据湖探索 DLI
SORT BY - 数据湖探索 DLI

]; 关键字 ASC/DESC：ASC为升序，DESC为降序，默认为ASC。 SORT BY：一般与GROUP BY一起使用，为PARTITION进行单列或多列的局部排序。注意事项所排序的表必须是已经存在的，否则会出错。示例根据字段score对表student在Reducer中进行升序排序。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
INTERSECT - 数据湖探索 DLI
INTERSECT - 数据湖探索 DLI

INTERSECT返回多个查询结果的交集。语法格式 1 select_statement INTERSECT select_statement; 关键字 INTERSECT：返回多个查询结果的交集，且每一个SELECT语句返回的列数必须相同，列的类型和列名不一定要相同。INTERSECT默认去重。注意事项

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 集合运算SELECT
CREATE FUNCTION语句 - 数据湖探索 DLI

tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA 和 SCALA，且函数的默认语言为 JAVA。示例创建一个名为STRINGBACK的函数 create function STRINGBACK as 'com.dli.StringBack' 父主题：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

REPLACE，或者替换所有作业中的函数F1为F2。需要重启Spark SQL队列后新创建的自定义函数F2生效需要重启Spark SQL队列，影响当前运行的作业。重启队列后，影响F1原有功能，F1的功能变为和F2一样。场景二在原有程序包类的基础上新增了类，新创建的函数指定为新增的类，包名不变。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
查看增强型跨源连接的基本信息 - 数据湖探索 DLI

是否支持IPv6：如果创建增强型跨源连接时您选择的子网是开启IPv6的，则您创建的增强型跨源连接也是支持IPv6的。主机信息：访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。详细信息请参考修改弹性资源池的主机信息。图1 增强型跨源连接基本信息父主题：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
创建表时指定表的生命周期 - 数据湖探索 DLI

创建表时指定表的生命周期功能描述 DLI提供了表生命周期管理功能，在创建表时指定表的生命周期。DLI会根据每张表的最后修改时间和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置，避免因误操作丢失数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理

总条数： 1272

上一页
1
...
5
6
7
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

弹性资源池的实际CUs、CU范围、规格的含义 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

常见场景的委托权限策略 - 数据湖探索 DLI

SORT BY - 数据湖探索 DLI

INTERSECT - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

查看增强型跨源连接的基本信息 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线