搜索_华为云

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启）操作场景本节操作介绍创建Flink作业时，配置流应用实现高可靠性能的操作方法。操作步骤用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
跨源认证概述 - 数据湖探索 DLI

Kafka开启SASL认证。 MRS Kafka开启SSL认证。 Password DWS、RDS、CSS、Redis - 维表 Kerberos HBase MRS安全集群已开启Kerberos认证。 Password DWS、RDS、Redis - 父主题：使用DLI的跨源认证管理数据源访问凭证

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
Spark作业使用咨询 - 数据湖探索 DLI

Spark作业使用咨询 DLI Spark作业是否支持定时周期任务作业 DLI Spark不支持作业调度，用户可以通过其他服务，例如数据湖管理治理中心DataArts Studio服务进行调度，或者通过API/SDK等方式对作业进行自定义调度。使用DataArts Studi

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
弹性资源池扩缩容历史记录 - 数据湖探索 DLI

/v3/{project_id}/elastic-resource-pools/{elastic_resource_pool_name}/scale-records 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

计费样例计费场景某公司用户A申请了256CUs的弹性资源池，并将1TB数据存放在DLI表中。该公司想要了解采用哪种计费模式才是性价比最优的方式。数据湖探索服务目前支持三种作业：SQL作业，Flink作业和Spark作业。SQL作业的计费包括存储计费和计算计费，Flink作业和Spark作业的计费只有计算计费。

帮助中心 > 数据湖探索 DLI > 计费说明
Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

Flink作业概述 DLI支持的两种类型的Flink作业： Flink OpenSource SQL类型作业：完全兼容社区版的Flink，确保了作业可以在这些Flink版本上无缝运行。在社区版Flink的基础上，DLI扩展了Connector的支持，新增了Redis、DWS作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
怎样查看DLI的数据扫描量？ - 数据湖探索 DLI

怎样查看DLI的数据扫描量？登录DLI管理控制台。选择“作业管理 > SQL作业”。筛选执行队列为default队列，查看相应的作业。单击展开作业，查看已扫描的数据。如图1所示。图1 查看作业扫描量父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

DLI SDK简介 DLI SDK简介数据湖探索服务软件开发工具包（DLI SDK，Data Lake Insight Software Development Kit）是对DLI服务提供的REST API进行的作业提交的封装，以简化用户的开发工作。用户直接调用DLI SDK提供的接口函数即可实现使用提交DLI

帮助中心 > 数据湖探索 DLI > SDK参考
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
常见场景的委托权限策略 - 数据湖探索 DLI

"lakeformation:database:create", "lakeformation:database:drop", "lakeformation:database:describe",

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

使用DLI提交Flink Jar作业操作场景 Flink Jar作业适用于需要自定义流处理逻辑、复杂的状态管理或特定库集成的数据分析场景。需要用户自行编写并构建Jar作业程序包，在提交Flink Jar作业前，将Jar作业程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。

帮助中心 > 数据湖探索 DLI > 快速入门
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

OBS，为了确保AKSK数据安全，您可以通过数据加密服务（Data Encryption Workshop，DEW）、云凭据管理服务（Cloud Secret Management Service，CSMS），对AKSK统一管理，有效避免程序硬编码或明文配置等问题导致的敏感信息泄露以及权限失控带来的业务风险。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
查询作业监控信息（废弃） - 数据湖探索 DLI

source/sinks参数说明参数名称是否必选参数类型说明 name 否 String 输入流或输出流名称。 records 否 Long 总记录数。 corrupted_records 否 Long 脏数据记录数。示例请求样例 { "job_ids": [298765, 298766]

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > Flink作业相关API（废弃）
数据迁移 - 数据湖探索 DLI
数据迁移 - 数据湖探索 DLI

数据迁移数据迁移概览迁移Hive数据至DLI 迁移Kafka数据至DLI 迁移Elasticsearch数据至DLI 迁移RDS数据至DLI 迁移DWS数据至DLI

帮助中心 > 数据湖探索 DLI > 最佳实践
DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

mRecordsOut Task发出的记录总数 flink_taskmanager_job_task_numRecordsOutPerSecond Task每秒发出的记录总数 flink_taskmanager_job_task_operator_numRecordsIn Operator收到的记录总数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
DLI内置依赖包 - 数据湖探索 DLI

parquet-jackson-1.12.2.jar commons-text-1.10.0.jar jetty-io-9.4.41.v20210516.jar postgresql-42.3.5.jar commons-validator-1.7.jar jetty-rewrite-9.4.43.v20210629

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
更新跨源认证（废弃） - 数据湖探索 DLI

请求执行是否成功。“true”表示请求执行成功。 message String 无请求示例更新跨源认证的名称为rds3。 { "auth_info_name": "rds3" } 响应示例 { "is_success": true, "message": "Update

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
使用Spark作业跨源访问数据源 - 数据湖探索 DLI

使用Spark作业跨源访问数据源概述对接CSS 对接DWS 对接HBase 对接OpenTSDB 对接RDS 对接Redis 对接Mongo 父主题： Spark Jar作业开发指南

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
迁移外部数据源数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI 典型场景示例：迁移Kafka数据至DLI 典型场景示例：迁移Elasticsearch数据至DLI 典型场景示例：迁移RDS数据至DLI 典型场景示例：迁移DWS数据至DLI 父主题：数据迁移与数据传输

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输

总条数： 1848

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

弹性资源池扩缩容历史记录 - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

Flink作业概述 - 数据湖探索 DLI

怎样查看DLI的数据扫描量？ - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

常见场景的委托权限策略 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

查询作业监控信息（废弃） - 数据湖探索 DLI

数据迁移 - 数据湖探索 DLI

DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

更新跨源认证（废弃） - 数据湖探索 DLI

使用Spark作业跨源访问数据源 - 数据湖探索 DLI

迁移外部数据源数据至DLI - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线