搜索_华为云

Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关完整样例代码和依赖包说明请参考：Python SDK概述。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

通过不同的接口与Kyuubi进行交互。是 mysql thrift_binary kyuubi.engine.dli.schema.show.name 用于指定当用户执行show schemas或show databases语句时，Kyuubi引擎如何展示数据源接口的模式名称。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

valuator实现UDAFEvaluator接口。 Evaluator需要实现UDAFEvaluator的init、iterate、terminatePartial、merge、terminate这几个函数。 init函数实现接口UDAFEvaluator的init函数。 it

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

通过不同的接口与Kyuubi进行交互。是 mysql thrift_binary kyuubi.engine.dli.schema.show.name 用于指定当用户执行show schemas或show databases语句时，Kyuubi引擎如何展示数据源接口的模式名称。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

通过不同的接口与Kyuubi进行交互。是 mysql thrift_binary kyuubi.engine.dli.schema.show.name 用于指定当用户执行show schemas或show databases语句时，Kyuubi引擎如何展示数据源接口的模式名称。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

表相关创建DLI表 DLI提供创建DLI表的接口。您可以使用该接口创建数据存储在DLI内部的表。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

通过不同的接口与Kyuubi进行交互。是 mysql thrift_binary kyuubi.engine.dli.schema.show.name 用于指定当用户执行show schemas或show databases语句时，Kyuubi引擎如何展示数据源接口的模式名称。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Flink作业模板相关 - 数据湖探索 DLI

SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。新建作业模板 DLI提供新建Flink作业模板的接口。您可以使用该接口新建一个Flink作业模板。示例代码如下： 1 2 3 4 5 6 public static void createFlinkJ

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

表相关创建DLI表 DLI提供创建DLI表的接口。您可以使用该接口创建数据存储在DLI内部的表。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 def create_dli_tbl(dli_client

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
Hudi表分区设计规范 - 数据湖探索 DLI

= 120个桶。如果采用月分区，分区桶的个数= 3GB * 30 /2GB = 45个桶，这样写入的数据桶数减少到了45个桶。在有限的计算资源下，写入的桶数越少，性能越高。父主题： Hudi数据表设计规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
初始化DLI客户端 - 数据湖探索 DLI

根据提示输入对应信息，单击“确定”。在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。左侧导航栏单击“API凭证”，在“项目列表”中获取“项目ID”即为project_id值，对应的“项目”即为region的值。 Token认证方式样例代码代码样例

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
数据库相关 - 数据湖探索 DLI
数据库相关 - 数据湖探索 DLI

数据库相关创建数据库 DLI提供创建数据库的接口。您可以使用该接口创建数据库，示例代码如下： 1 2 3 4 5 6 7 8 def create_db(dli_client): try: db = dli_client.create_database('db_for_test')

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
数据库相关 - 数据湖探索 DLI
数据库相关 - 数据湖探索 DLI

名为“default”的数据库。删除数据库 DLI提供删除数据库的接口。您可以使用该接口删除数据库。示例代码如下： 1 2 3 4 5 6 7 8 //调用Database对象的deleteDatabase接口删除数据库, //其中Database对象通过调用对象DLIClie

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
初始化DLI客户端 - 数据湖探索 DLI

根据提示输入对应信息，单击“确定”。在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。左侧导航栏单击“API凭证”，在“项目列表”中获取“项目ID”即为project_id值，对应的“项目”即为region的值。 Token认证方式样例代码代码样例

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Spark SQL常用配置项说明 - 数据湖探索 DLI

有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

MySQL数据库中读取数据，并写入到Print结果表中。参考增强型跨源连接，根据RDS MySQL所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置RDS MySQL的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根RDS的地址测试队列连通性。如果能连

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

传参不能为JSON格式。对应批处理作业提交提供两个接口：异步 asyncSubmit，提交后直接返回，不等待同步 submit，提交后会一直等待作业执行结束删除批处理作业 DLI提供删除批处理作业的接口。您可以使用该接口删除批处理作业。示例代码如下： 1 2 3 4 5 6

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

什么区别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的这种模式减轻了运维负担，可以更专注于数据处理和分析任务本身。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表的写任务要开启Hive元数据同步功能。 SparkSQL天然与Hive集成，无需考虑元数据问题。该条建议针对的是通过Spark Datasource API或者Flin写Hudi表的场景，通过这两种方式写Hudi时需要增加向Hive同步元数据的配置项；该配置的目的是将Hudi表的元数据统一托管

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

程序包管理”页面，选择对应的UDTF Jar包，单击“操作”列中的“权限管理”，进入权限管理页面，单击右上角“授权”，勾选对应权限。自定义函数中引用static类或接口时，必须要加上“try catch”异常捕获，否则可能会造成包冲突，导致函数功能异常。环境准备在进行UDTF开发前，请准备以下开发环境。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 764

上一页
1
...
34
35
36
...
39
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark作业相关 - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Flink作业模板相关 - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

数据库相关 - 数据湖探索 DLI

数据库相关 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线