搜索_华为云

Hudi表索引设计规范 - 数据湖探索 DLI

文件的footer中。 Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写入；该索引写入速度最快，但是需要合理配置分桶数目；Flink、Spark均支持该索引写入。状态索引：Flink引擎独有索引，是将行记录的存储位置记录到状态后端的一种索引形式，在

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
创建弹性资源池 - 数据湖探索 DLI

队列的标签，使用标签标识云资源。包括“标签键”和“标签值”，具体请参考表3。 label 否 map 弹性资源池属性字段。如果需要购买基础版，配置该参数值为{"spec":"basic"}。不配置该参数时默认为标准版弹性资源池。表3 tags参数参数名称是否必选参数类型说明 key 是 String

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

NAME primary-keys ARRAY<STRING> NULL 保存源表的主键的列名的数组。如果includePrimaryKeys配置属性设置为true，则仅在JSON输出中包含primary-keys字段。 ingestion-timestamp TIMESTAMP_LTZ(6)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

<scope> provided </scope> </dependency> 或使用exclusions标签将其排除关联。若使用到hdfs的配置文件，则需要将core-site.xml、hdfs-site.xml、yarn-site.xml 修改为mrs-core-site.xml、mrs-hdfs-site

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Spark 2.4.5版本说明 - 数据湖探索 DLI

版本主要的功能特性。更多版本新特性请参考Release Notes - Spark 2.4.5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

使用hive 方言：表属性中需要添加'is_lakehouse'='true'。创建Flink OpenSource SQL作业时，在作业编辑界面配置开启checkpoint功能。语法格式、参数说明请参考Hive源表的语法格式和参数说明。父主题： Hive

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
SQL作业使用咨询 - 数据湖探索 DLI

系统按超时取消处理。用户可以通过dli.sql.job.timeout（单位是秒）参数配置超时时间。 DLI支撑本地测试Spark作业吗? DLI暂不支持本地测试Spark作业，您可以安装DLI Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

https://{Endpoint}/v3/projects”，其中{Endpoint}为IAM的终端节点，可以从地区和终端节点获取。响应示例如下，例如DLI服务部署的区域为“cn-north-4”，相应消息体中查找“name”为“cn-north-4”，其中projects下的“id”即为项目ID。 {

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
查询作业列表 - 数据湖探索 DLI

shared_cluster：共享 exclusive_cluster：独享 edge_node：边缘节点 job_config 否 Object 作业配置。 “show_detail”为“false”时独有。具体参数说明请参见表6。 main_class 否 String jar包主类。“s

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

中的open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据语法格式 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建并使用跨源链接 - 数据湖探索 DLI

"ip":"192.168.0.1", "name":"ecs-97f8-0001" }, { "ip":"192.168.0.2", "name":"ecs-97f8-0002" } ] } 响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
查询作业详情 - 数据湖探索 DLI

shared_cluster：共享 exclusive_cluster：独享 edge_node：边缘节点 job_config 否 Object 作业配置, 具体参数说明请参见表4。 main_class 否 String jar包主类。例如，org.apache.spark.examples

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

dli:table:insertIntoTable, dli:table:delete。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例部分字段更新 create table h0(id int, comb int, name string

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Flink 1.15版本说明 - 数据湖探索 DLI

最小化提交，避免依赖包与flink内核中依赖包冲突：仅Flink 1.15版本支持Flink Jar作业最小化提交，通过在运行优化参数中配置flink.dli.job.jar.minimize-submission.enabled=true可以开启最小化提交。 Flink相关依

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

IDEA界面，选择调试的配置文件，单击“Edit Configurations”。在“Run/Debug Configurations”界面，勾选：include dependencies with "Provided" scope。单击“OK”完成应用配置。使用方式将写好的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
修改弹性资源池关联队列的扩缩容策略 - 数据湖探索 DLI

s 是 Array of objects 该队列在该弹性资源池下的扩缩容策略信息。单条策略信息包含时间段、优先级和CU范围。每个队列至少要配置一条时间段为[00:00, 24:00]的默认扩缩容策略。详细参数说明请参考表3。表3 queue_scaling_policies 参数

 帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

_cus)/(cu_number-manager_cu_number)”。 operator_config 否 String 算子的并行度配置。 resume_checkpoint 否 Boolean 异常重启是否从checkpoint恢复。 resume_max_num 否 Integer

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

); 参数说明表1 参数说明参数是否必选说明 connector 是固定为print。 print-identifier 否配置一个标识符作为输出数据的前缀。 standard-error 否该值只能为true或false，默认为false。若为true，则表示

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

数据库的URL connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否访问数据库所需要的账号 connector.password 否访问数据库所需要的密码

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 820

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表索引设计规范 - 数据湖探索 DLI

创建弹性资源池 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

MERGE INTO - 数据湖探索 DLI

Flink 1.15版本说明 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

修改弹性资源池关联队列的扩缩容策略 - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线