搜索_华为云

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

登录DEW管理控制台选择“凭据管理”，进入“凭据管理”页面。单击“创建凭据”。配置凭据基本信息 DLI Spark jar作业编辑界面设置作业参数。 Spark参数： spark.hadoop.fs.obs.bucket.USER_BUCKET_NAME.dew.access

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
权限策略和授权项 - 数据湖探索 DLI

/v1.0/{project_id}/jobs/submit-job，SQL语句调用 dli:table:showPartitions √ × 设置表配置 POST /v1.0/{project_id}/jobs/submit-job，SQL语句调用 dli:table:alterTableSetProperties

帮助中心 > 数据湖探索 DLI > API参考
开启Flink作业动态扩缩容 - 数据湖探索 DLI

据。因扩缩容过程中需要触发savepoint，因此必须配置obs桶，并保存日志，同时请注意开启checkpoint。扩缩容检测周期不要设置过小，避免频繁启停作业。扩缩容作业恢复过程中的时间长短受savepoint的大小影响，如果保存点较大，可能恢复时间较慢。如果需要调整动

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Spark SQL语法概览 - 数据湖探索 DLI

自定义函数相关语法创建函数删除函数显示函数详情显示所有函数数据多版本相关语法创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

* from ... 在“数据湖探索管理控制台>SQL编辑器”页面，单击编辑窗口右上角“设置”，可配置参数。通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查看指定表所有分区 - 数据湖探索 DLI

语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。参数说明表1 参数描述参数描述 db_name Da

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

Forbidden 解决方案 Spark程序访问OBS数据时，需要通过配置AK、SK的访问进行访问。具体访问方式可以参考：通用队列操作OBS表如何设置AK/SK。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
本文样例表数据准备 - 数据湖探索 DLI

--创建视图 create view orders_by_date as select * from orders; --设置表的注释信息，可以通过设置注释信息为NULL来删除注释 COMMENT ON TABLE people IS 'master table'; --创建一个具有列名id、name的新表：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > 附录
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

10:10:00 cookie2 2015-04-10 11:00:00 url77 2015-04-10 10:50:01 说明：因为没有设置默认值，当没有上两行时显示为NULL。示例2： SELECT cookieid, createtime, url, LAG(createtime

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
DLI弹性资源池与队列简介 - 数据湖探索 DLI

图1 DLI计算资源模式弹性资源池模式：计算资源的池化管理模式，提供计算资源的动态扩缩容能力，同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率，应对业务高峰期的资源需求。适用场景：适合业务量有明显波动的场合，如周期性的数据批处理任务或实时数据处理需求。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
配置DLI云服务委托权限 - 数据湖探索 DLI

限。更新DLI委托权限（dli_management_agency）在DLI控制台左侧导航栏中单击“全局配置 > 服务授权”。在委托设置页面，按需选择以下场景的权限。单击权限卡片上的可以查看包含的详细的权限策略。委托说明如表1所示。表1 dli_management_agency委托包含的权限

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
DLI Delta常见问题 - 数据湖探索 DLI

predicate on partitioned table `777dd`.`test_delta_parts1` 解决方案：在console页面设置中添加参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled值为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
创建Bucket索引表调优 - 数据湖探索 DLI

024 分区表桶数 = 单分区数据量大小(G)/2G，再后向上取整，最小设置1个桶需要使用的是表的总数据大小，而不是压缩以后的文件大小桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。父主题： Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi Clean操作说明 - 数据湖探索 DLI

SparkDataSource（option里设置如下参数，写数据时触发） hoodie.clean.automatic=true hoodie.cleaner.commits.retained=10 // 默认值为10，根据业务场景指定 Flink（with属性里设置如下参数，写数据时触发） clean

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用DLI分析账单消费数据 - 数据湖探索 DLI

> 数据湖探索DLI”。在消费汇总中可以发现DLI计算资源使用量消费最多。图2 费用汇总单击“账单详情 > 自定义账单”，单击“维度设置”，选择“按使用量”。“统计周期”选择“明细”。在显示数据的标题行，“产品类型”选择“数据湖探索 DLI”，“产品”选择“DLI计算资源使用量”，单击“导出账单”。

帮助中心 > 数据湖探索 DLI > 最佳实践

总条数： 525

上一页
1
...
21
22
23
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

Spark SQL语法概览 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

本文样例表数据准备 - 数据湖探索 DLI

lag - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

DLI Delta常见问题 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线