搜索_华为云

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

在Spark Jar作业编辑界面，选择配置优化参数，配置信息如下: 不同的OBS桶，使用不同的AKSK认证信息。可以使用如下配置方式，根据桶指定不同的AKSK信息，参数说明详见表1。 spark.hadoop.fs.obs.bucket.USER_BUCKET_NAME.dew.access

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

commit String Batch增量消费，通过参数“read.streaming.start-commit”指定起始消费位置，通过参数“read.end-commit”指定结束消费位置，为闭区间，即包含起始、结束的Commit，默认到最新Commit。 read.rate.limit

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
last - 数据湖探索 DLI
last - 数据湖探索 DLI

当参数的值为True时，返回窗口中第一条非NULL的值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。 frame_clause 否用于确定数据边界。返回值说明参数的数据类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
费用账单 - 数据湖探索 DLI
费用账单 - 数据湖探索 DLI

查看指定队列或弹性资源池的账单 DLI控制台并未展示弹性资源池的ID。查询DLI队列或弹性资源池的资源账单，包含以下三步操作：在DLI云服务控制台获取资源名称。根据DLI资源名称，在“我的资源”页面根据资源名称查看资源ID。（资源名称不唯一，因此建议使用名称查询指定的资源ID后再查看账单。）

帮助中心 > 数据湖探索 DLI > 计费说明
Hudi数据表Compaction规范 - 数据湖探索 DLI

OOM将会导致整个作业直接失败。建议2~4小时进行一次compaction。 Compaction是MOR表非常重要且必须执行的维护手段，对于实时任务来说，要求Compaction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

.getOrCreate() 获取结果为AK/SK和Securitytoken时，鉴权时，临时AK/SK和Securitytoken必须同时使用，设置如下：代码创建SparkContext val sc: SparkContext = new SparkContext()

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI SDK功能矩阵 - 数据湖探索 DLI

SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询指定资源包、删除资源包的Java SDK使用说明。 SQL作业相关介绍数据库相关、表相关、作业相关Java SDK使用说明。 Flink作业相关

 帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
更新跨源认证 - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。请求参数名称是否必选参数类型说明 auth_info_name 是 String 指定更新的跨源认证名称。 user_name 否 String 用户安全集群的新登录用户名。 password 否 String 用户安全集群的新登录密码。

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
DLI Delta常见问题 - 数据湖探索 DLI

retention period? 根因分析：RETAIN 保留期过短（少于168小时），需要确认是否能清理该时间前的数据，将无法再回头查看在指定数据保留期之前创建的版本。确认清理可在console页面设置中添加参数spark.databricks.delta.retentionDurationCheck

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
Hive方言 - 数据湖探索 DLI
Hive方言 - 数据湖探索 DLI

您可以为执行的每个语句动态切换方言。无需重新启动会话即可使用其他方言。语法格式 SQL 方言可以通过 table.sql-dialect 属性指定 1 set table.sql-dialect=hive; 注意事项 Hive方言只能用于操作Hive对象，并要求当前Catalog是一个HiveCatalog

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

配置作业运行参数：选择队列，并配置Flink版本至少为1.15。配置权限足够的委托。配置OBS桶。开启Checkpoint，使用Hudi时必须开启Checkpoint。提交作业并检查Flink UI和日志：直接点击界面右上角的”提交”，在跳转界面再次确认参数无误后，点击底部”

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
日期、时间函数及运算符 - 数据湖探索 DLI

'2019-07-09');--2019-07-31 add_months(timestamp) -> [same as input] 描述：通过将指定的月份增加指定的日期来返回正确的日期。 SELECT add_months(timestamp'2019-09-09 00:00:00.000',

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

table_name Database中的表名，由字母、数字和下划线（_）组成。 boolExpression 过滤条件表达式。 columnList z排序指定的字段列表，Z顺序列应与分区列不同。所需权限 SQL权限表2 OPTIMIZE所需权限列表权限描述表的UPDATE权限细粒度权限：dli:table:update。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Color 函数 - 数据湖探索 DLI
Color 函数 - 数据湖探索 DLI

个空格，以创建一个40个字符的条形。 bar(x, width, low_color, high_color) 描述：在ANSI条形图中以指定宽度绘制一条直线。参数x是0到1之间的一个双精度值。x的值超出[0，1]范围将被截断为0或1值。low_color和high_color捕

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
查询分组资源列表（废弃） - 数据湖探索 DLI

参数类型说明 kind 否 String 指定文件类型。包括以下文件类型： jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。 tags 否 String 指定标签过滤。请求消息无请求参数。响应消息

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Spark将不可为null的模式转换为可空说明：在Spark 2.4.x版本中，当用户指定的schema包含不可为空的字段时，Spark会将这些不可为null的模式转换为可空的。但是在Spark 3.3.x版本中，Spark尊重用户指定的schema中的nullability，即如果字段被定义为不可

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
first - 数据湖探索 DLI
first - 数据湖探索 DLI

当参数的值为True时，返回窗口中第一条非NULL的值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。 frame_clause 否用于确定数据边界。返回值说明参数的数据类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
比较函数和运算符 - 数据湖探索 DLI

NULL AND 6; -- null HetuEngine中，value，min和max 三个参数在between和not between中必须是同一数据类型。错误示例：'John' between 2.3 and 35.2 BETWEEN等价写法示例： SELECT 3 BETWEEN

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
DLI Delta表概述 - 数据湖探索 DLI

SHOW CREATE TABLE显示建表语句 show create table table1; INSERT INTO/OVERWRITE指定静态分区插入表 insert into table1 partition(part='part1') select * from table2;

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
弹性资源池扩缩容历史记录 - 数据湖探索 DLI

是否必选参数类型描述 start_time 否 Long start_time用于查询扩缩容历史的开始时间，该时间点需大于当前时间点减30天，必须小于end_time 。时间格式为unix时间戳，单位：毫秒。若start_time为空，则查询end_time前七天到end_time

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API

总条数： 777

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

last - 数据湖探索 DLI

费用账单 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

更新跨源认证 - 数据湖探索 DLI

DLI Delta常见问题 - 数据湖探索 DLI

Hive方言 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

日期、时间函数及运算符 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

Color 函数 - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

first - 数据湖探索 DLI

比较函数和运算符 - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

弹性资源池扩缩容历史记录 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线