搜索_华为云

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表模型设计规范规则 Hudi表必须设置合理的主键。 Hudi表提供了数据更新和幂等写入能力，该能力要求Hudi表必须设置主键，主键设置不合理会导致数据重复。主键可以为单一主键也可以为复合主键，两种主键类型均要求主键不能有null值和空值，可以参考以下示例设置主键： SparkSQL：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
count函数如何进行聚合 - 数据湖探索 DLI

count函数如何进行聚合使用count函数进行聚合的正确用法如下： SELECT http_method, count(http_method) FROM apigateway WHERE service_id = 'ecs' Group BY http_method

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 DLI Livy简介 DLI Livy是基于开源的Apache Livy用于提交Spark作业到DLI的客户端工具。准备工作创建DLI队列。在“队列类型”中选择“通用队列”，即Spark作业的计算资源。具体请参考创建队列。准备一个li

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况查看Spark作业原始资源配置登录DLI 控制台，单击左侧“作业管理”>“Spark作业”，在作业列表中找到需要查看的Spark作业，单击“作业ID”前的，即可查看对应Spark作业的原始资源配置参数。在创建Spark作业时，

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK （推荐）方案1：使用临时AK/SK 建议使用临时AK/SK，获取方式可参见统一身份认证服务_获取临时AK/SK。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。表1

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
如何获取AK/SK？ - 数据湖探索 DLI

如何获取AK/SK？访问密钥即AK/SK（Access Key ID/Secret Access Key），表示一组密钥对，用于验证调用API发起请求的访问者身份，与密码的功能相似。用户通过调用API接口进行云资源管理（如创建集群）时，需要使用成对的AK/SK进行加密签名，确保

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
创建Bucket索引表调优 - 数据湖探索 DLI

创建Bucket索引表调优创建Bucket索引表调优 Bucket索引常用设置参数： Spark： hoodie.index.type=BUCKET hoodie.bucket.index.num.buckets=5 Flink index.type=BUCKET hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入如果需要将数据插入到表中，但只想指定部分字段，可以使用INSERT INTO语句结合SELECT子句来实现。但是DLI目前不支持直接在INSERT INTO语句中指定部分列字段进行数据插入，您需要确保在SELECT子句中选择的字段

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
下载并安装JDBC驱动包 - 数据湖探索 DLI

下载并安装JDBC驱动包操作场景 JDBC用于连接DLI服务，您可以在Maven获取JDBC安装包，或在DLI管理控制台下载JDBC驱动文件。本文介绍通过JDBC连接DLI并提交SQL作业。获取服务端连接地址连接DLI服务的地址格式为：jdbc:dli://<endPoi

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业提交Spark jar作业的场景需要手动配置由LakeFormation提供元数据服务的Hudi锁实现类，请参照 Hudi锁配置说明。登录DLI管理控制台，选择“作业管理 > Spark作业”，进入到Spark作业的界面。提交Hudi相关的Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
userDefined结果表 - 数据湖探索 DLI

userDefined结果表功能描述您可通过编写代码实现将DLI处理之后的数据写入到指定的云生态或者开源生态。前提条件已编写代码实现自定义sink类：自定义sink类需要继承Flink开源类：RichSinkFunction，并指定数据类型为：Tuple2<Boolean

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
在DLI控制台配置表权限 - 数据湖探索 DLI

在DLI控制台配置表权限表权限操作场景针对不同用户，可以通过权限设置分配不同的表权限。管理员用户和表的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其表权限。给新用户设置表权限时，该用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant G

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
配置Flink作业权限 - 数据湖探索 DLI

配置Flink作业权限 Flink作业权限操作场景针对不同用户，可以通过权限设置分配不同的作业，不同用户之间的作业效率互不影响，保障作业性能。管理员用户和作业的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其作业权限。给新用户设置作业权限时，该用户所在用户组的所属区域需具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业操作场景在Linux或Windows环境下您可以使用JDBC应用程序连接DLI服务端提交作业。使用JDBC连接DLI提交的作业运行在Spark引擎上。 JDBC版本2.X版本功能重构后，仅支持从DLI作业桶读取查询结果，如需使用该特性需具备以下条件：

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表如果需要关联OBS桶中嵌套的JSON格式数据，可以使用异步模式创建表。以下是一个示例的建表语句，展示了如何使用 JSON 格式选项来指定 OBS 中的路径： create table tb1 using json options(path

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
在DLI控制台配置数据库权限 - 数据湖探索 DLI

在DLI控制台配置数据库权限数据库权限操作场景针对不同用户，可以通过权限设置分配不同的数据库权限。管理员用户和数据库的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其数据库权限。给新用户设置数据库权限时，该用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源

总条数： 287

上一页
1
...
7
8
9
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

如何获取AK/SK？ - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

在DLI控制台配置表权限 - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线