搜索_华为云

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

图1 配置DLI委托访问授权完成配置后，在IAM控制台的委托列表中，可查看到dli_management_agency的委托信息。步骤1：上传数据至OBS 参考Spark作业样例代码开发Spark Jar作业程序，编译并打包为“spark-examples.jar”。

帮助中心 > 数据湖探索 DLI > 快速入门
为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

当前Spark作业支持访问的外部数据源详情请参考DLI常用跨源分析开发方式。创建跨源连接操作请参见配置DLI与数据源网络连通（增强型跨源连接）。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

line: line.split(" ")).map(lambda word: (word, 1)).reduceByKey(lambda a, b: a + b) # write counts.saveAsTextFile(out_file_name) 父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hudi数据表Compaction规范 - 数据湖探索 DLI

不需要对每张Hudi表都开发异步Compaction任务，这样会导致作业开发成本上升。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

DLI SDK（服务自研）：是DLI服务自行开发的SDK，本手册介绍DLI 自研SDK的使用方法。相关开发包请从华为云DLI 开发工具包（SDK）获取。

帮助中心 > 数据湖探索 DLI > SDK参考
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

具体方法如下： Statement st = conn.stamte() st.execute("set spark.sql.shuffle.partitions=20") 父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
怎样查看DLI队列负载？ - 数据湖探索 DLI

操作步骤在控制台搜索“云监控服务 CES”。图1 搜索CES 进入CES后，在页面左侧“云服务监控”列表中，单击“数据湖探索”。图2 云服务监控选择队列进行查看。图3 查看队列负载父主题： DLI弹性资源池和队列类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

跨源连接需要使用VPC、子网、路由、对等连接功能，因此需要获得VPC（虚拟私有云）的VPC Administrator权限。可在服务授权中进行设置。

帮助中心 > 数据湖探索 DLI > 功能总览
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

表1 DLI获取访问凭据相关开发指南类型操作指导说明 Flink作业场景 Flink Opensource SQL使用DEW管理访问凭据 Flink Opensource SQL场景使用DEW管理和访问凭据的操作指导，将Flink作业的输出数据写入到Mysql或DWS时，在connector

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。当指定

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi数据表Clean规范 - 数据湖探索 DLI

Hudi数据表Clean规范 Clean也是Hudi表的维护操作之一，该操作对于MOR表和COW表都需要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

子用户使用DLI时，可以查看队列，但是不能查看Flink作业，可以通过在DLI中对子用户授权，或在IAM中对子用户授权： DLI授权管理使用租户账号，或者作业owner账号，或有DLI Service Administrator权限的账号，登录DLI控制台。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
创建DLI表关联OpenTSDB - 数据湖探索 DLI

管理控制台操作请参考增强型跨源连接。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表

总条数： 714

上一页
1
...
8
9
10
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

怎样查看DLI队列负载？ - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

创建DLI表关联OpenTSDB - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线