搜索_华为云

Hudi表索引设计规范 - 数据湖探索 DLI

实时入湖场景中，Spark引擎采用Bucket索引，Flink引擎可以用Bucket索引或者状态索引。实时入湖都是需要分钟内或者分钟级的高性能入湖，索引的选择会影响到写Hudi表的性能。在性能方面各个索引的区别如下： Bucket索引优点：写入过程中对主键进行hash分桶写入，性能比较高，不受

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

源池的购买。在弹性资源池中创建队列。创建完弹性资源池后，弹性资源池可以添加一个或多个队列用于后续作业的运行。在弹性资源池管理页面。选择要操作的弹性资源池，在“操作”列，单击“添加队列”。在“添加队列”界面，完成队列的基础信息配置。单击“确定”完成添加队列配置。创建作业。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
创建表时指定表的生命周期 - 数据湖探索 DLI

分区表指定的生命周期，适用于该表所有的分区。生命周期设置后，DLI表和OBS表支持数据备份，OBS表的备份目录需要手工设置。且备份目录应选择在并行文件系统上，备份目录必须和原表目录在同一个桶上，备份目录不能与原表相同目录或者子目录同名。语法格式 DataSource语法创建DLI表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
权限管理概述 - 数据湖探索 DLI

通过IAM，您可以在华为云账号中给员工创建IAM用户，并使用策略来控制他们对华为云资源的访问范围。例如您的员工中有负责软件开发的人员，您希望他们拥有DLI的使用权限，但是不希望他们拥有删除DLI等高危操作的权限，那么您可以使用IAM为开发人员创建用户，通过授予仅能使用DLI，但是不允许删除DLI的权限策略，控制他们对DLI资源的使用范围。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。若需要获取key的值，则可以通过在flink中设置

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
DLI作业开发流程 - 数据湖探索 DLI

配置DLI作业桶。配置元数据的访问权限。请参考在DLI控制台配置数据库权限、在DLI控制台配置表权限。 DLI数据导入指引 DLI支持在不迁移数据的情况下，直接对OBS中存储的数据进行查询分析，您只需要将数据上传OBS即可使用DLI进行数据分析。上传数据至OBS请参考《对象存储用户指南》。

帮助中心 > 数据湖探索 DLI > 用户指南
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

作业列表查询支持以下参数: name，status，show_detail，cursor，next，limit，order。本示例排序方式选择降序desc，将会列出作业id小于cursor的作业列表信息。示例代码如下： 1 2 3 4 private static void Q

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

into，load data）时由于数据源不支持事务性，在系统故障或队列资源重启后，可能会导致数据重复或数据不一致等问题。为了避免这种情况，建议优先选择支持事务性的数据源，如Hudi类型数据源，该类数据源具备ACID（Atomicity、Consistency、Isolation、Dura

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
弹性资源池CU设置 - 数据湖探索 DLI

小于等于弹性资源池当前的CU值，否则会修改失败。 CU设置操作在左侧导航栏单击“资源管理 > 弹性资源池”，可进入弹性资源池管理页面。选择要操作的弹性资源池，在“操作”列，单击“更多 > CU设置”。在“CU设置”界面，“CU范围”参数中，左边为最小CU，右边为最大CU，根

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
FileSystem结果表 - 数据湖探索 DLI

件，在这之后，原始的临时文件也会被删除掉。分区功能 Filesystem sink支持分区功能，通过partitioned by语法根据选择的字段进行分区。示例如下： path └── datetime=2022-06-25 └── hour=10 ├──

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

具体的权限介绍和授权操作请参考《数据湖探索用户指南》。创建队列。在“资源管理 > 队列管理”下，单击右上角“购买队列”，进入购买队列页面选择“通用队列”，即Spark作业的计算资源。如果创建队列的用户不是管理员用户，在创建队列后，需要管理员用户赋权后才可使用。关于赋权的具体操作请参考《数据湖探索用户指南》。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
创建批处理作业 - 数据湖探索 DLI

of Strings 传入主类的参数，即应用程序参数。 sc_type 否 String 计算资源类型，目前可接受参数A, B, C。如果不指定，则按最小类型创建。具体资源类型请参见表3。 jars 否 Array of Strings 用户已上传到DLI资源管理系统的类型为ja

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
查询作业列表 - 数据湖探索 DLI

manager_cu_number 否 Integer 管理单元CU数。默认为“1”。 cu_number 否 Integer 用户为作业选择的CU数量。 “show_detail”为“true”时独有。最小值：2 最大值：400 默认为“2”。 parallel_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查询作业详情 - 数据湖探索 DLI

作业使用计算节点个数。 executor_cu_number 否 Integer 计算节点cu数。 cu_number 否 Integer 用户为作业选择的CU数量。 “show_detail”为“true”时独有。最小值：2 最大值：400 默认为“2”。 parallel_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

》中“安全组”章节。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
权限策略和授权项 - 数据湖探索 DLI

服务中给用户组授权并生效。如果仅支持IAM项目，不支持企业项目，表示仅能在IAM中给用户组授权并生效，如果在企业管理中授权，则该自定义策略不生效。关于IAM项目与企业项目的区别，详情请参见：IAM与企业管理的区别。仅在表1中的接口支持自定义授权，其他不在表格中的接口不支持自定义授权。

帮助中心 > 数据湖探索 DLI > API参考
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
字符串函数和运算符 - 数据湖探索 DLI

些语言将多个代码点组合成单个用户感观字符（这是语言书写系统的基本单位），但是函数会将每个代码点视为单独的单位。 lower和upper函数不执行某些语言所需的区域设置相关、上下文相关或一对多映射。 chr(n) → varchar 描述：返回Unicode编码值为n的字符值。 select

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

否跳过的阈值，用于判断“已处理的group分组/已处理的行数”的比例。如果这个比例大于配置的阈值，则认为预聚合效果不好，此时Spark可以选择跳过部分聚合，避免进一步的性能损失。在使用时系统先按照spark.sql.aggregate.adaptivePartialAggreg

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

》中“安全组”章节。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis

总条数： 521

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表索引设计规范 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线