搜索_华为云

CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

Hudi当前只有int、bigint、float、double、decimal、string、date、timestamp、boolean、binary类型支持设置默认值。 Hudi表必须指定primaryKey与preCombineField。在指定路径下创建表时，如果路径下已存在Hudi表，则建

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
管理Flink作业模板 - 数据湖探索 DLI

保存保存修改。创建作业使用当前模板创建作业。格式化对SQL语句进行格式化，将SQL语句格式化后，需要重新编辑SQL语句。主题设置更改字体大小、自动换行、页面风格（黑色底或白色底）等配置。在SQL语句编辑区域，输入SQL语句，实现业务逻辑功能。SQL语句的编写请参考《数据湖探索SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例以SQL作业为例：配置参数 hoodie.tableName.consume.mode=INCREMENTAL // 必须设置当前表读取为增量读取模式 hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
pyspark样例代码 - 数据湖探索 DLI

IntegerType, StringType, Row from pyspark.sql import SparkSession 创建会话并设置AK/SK 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Flink 1.15版本说明 - 数据湖探索 DLI

将非Connector的Flink依赖项（以flink-开头）和第三方库（如Hadoop、Hive、Hudi、Mysql-cdc）的作用域设置为provided，可以确保这些依赖项不会被包含在Jar作业中，从而实现最小化提交，避免依赖包与flink内核中依赖包冲突：仅Flink

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

percentage)→array<[same as x]> 描述：按照百分比percentage，返回所有x输入值的近似百分位数。每一项的权重值为w且必须为正数。x设置有效的百分位。percentage的值必须在0到1之间，并且所有输入行必须为常量。 select approx_percentile(x,

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
将OBS数据导入至DLI - 数据湖探索 DLI

说明：路径同时支持文件和文件夹。 obs://DLI/sampledata.csv 表头:无/有当“文件格式”为“CSV”时该参数有效。设置导入数据源是否含表头。选中“高级选项”，勾选“表头:无”前的方框，“表头:无”显示为“表头:有”，表示有表头；取消勾选即为“表头:无”，表示无表头。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
常用操作与系统权限关系 - 数据湖探索 DLI

ALTER_TABLE_RECOVER_PARTITION 恢复表分区 √ × √ √ ALTER_TABLE_SET_LOCATION 设置分区路径 √ × √ √ GRANT_PRIVILEGE 表的赋权 √ × √ √ REVOKE_PRIVILEGE 表权限的回收 √ ×

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

登录DEW管理控制台选择“凭据管理”，进入“凭据管理”页面。单击“创建凭据”。配置凭据基本信息 DLI Spark jar作业编辑界面设置作业参数。 Spark参数： spark.hadoop.fs.obs.bucket.USER_BUCKET_NAME.dew.access

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Spark SQL语法概览 - 数据湖探索 DLI

自定义函数相关语法创建函数删除函数显示函数详情显示所有函数数据多版本相关语法创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
批作业SQL语法概览 - 数据湖探索 DLI

自定义函数相关语法创建函数删除函数显示函数详情显示所有函数数据多版本相关语法创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据父主题： Spark SQL语法参考（即将下线）

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
权限策略和授权项 - 数据湖探索 DLI

/v1.0/{project_id}/jobs/submit-job，SQL语句调用 dli:table:showPartitions √ × 设置表配置 POST /v1.0/{project_id}/jobs/submit-job，SQL语句调用 dli:table:alterTableSetProperties

帮助中心 > 数据湖探索 DLI > API参考
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

* from ... 在“数据湖探索管理控制台>SQL编辑器”页面，单击编辑窗口右上角“设置”，可配置参数。通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
开启Flink作业动态扩缩容 - 数据湖探索 DLI

据。因扩缩容过程中需要触发savepoint，因此必须配置obs桶，并保存日志，同时请注意开启checkpoint。扩缩容检测周期不要设置过小，避免频繁启停作业。扩缩容作业恢复过程中的时间长短受savepoint的大小影响，如果保存点较大，可能恢复时间较慢。如果需要调整动

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

* from ... 在“数据湖探索管理控制台>SQL编辑器”页面，单击编辑窗口右上角“设置”，可配置参数。通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
查看指定表所有分区 - 数据湖探索 DLI

语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。参数说明表1 参数描述参数描述 db_name Da

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 查看表

总条数： 683

上一页
1
...
27
28
29
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CREATE TABLE - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Flink 1.15版本说明 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

常用操作与系统权限关系 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Spark SQL语法概览 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

批作业SQL语法概览 - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线