搜索_华为云

创建批处理作业 - 数据湖探索 DLI

of Strings 用户已上传到DLI资源管理系统的类型为pyFile的资源包名。也支持指定OBS路径，例如：obs://桶名/包名。 files 否 Array of Strings 用户已上传到DLI资源管理系统的类型为file的资源包名。也支持指定OBS路径，例如：obs://桶名/包名。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

查看队列的的剩余步骤如下：查看队列CU使用量。点击“云监控服务 > 云服务监控 > 数据探索湖 > 队列监控 > 队列CU使用量” 。计算剩余CU量。队列剩余CU量=队列CU量 - 队列CU使用量。当队列剩余CU量小于用户提交的CU量，则需要等待资源，才能提交成功。父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

varchar(32) Flink数据处理时间步骤1：创建资源如表2所示，完成VPC、DMS、RDS、DLI、DLV资源的创建。表2 创建资源资源类型说明操作指导 VPC VPC为资源提供云上的网络管理服务。资源网络规划说明： Kafka与MySQL实例指定的VPC需为同一VPC。

帮助中心 > 数据湖探索 DLI > 最佳实践
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明 mongo只支持增强型跨源。只能使用包年包月队列。 DDS即文档数据库服务，兼容MongoDB协议。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

每次调度之间存在大量空闲期。DLI按需计费只在使用期间收费，有效节约队列成本。资源和成本规划表1 资源和成本规划资源资源说明成本说明 OBS 需要创建一个OBS桶将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。 OBS的使用涉及以下几项费用：存储

 帮助中心 > 数据湖探索 DLI > 最佳实践
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

HTTP请求方法（也称为操作或动词），可告知服务正在请求什么类型的操作。表2 HTTP方法方法说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源，如删除对象等。 HEAD 请求服务器资源头部。 PATCH

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
查询批处理作业列表 - 数据湖探索 DLI

0/{project_id}/batches 参数说明表1 URI参数参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。表2 query参数说明参数名称是否必选参数类型说明 job_name 否 String 批处理作业的名称。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
跨源认证概述 - 数据湖探索 DLI

推荐您使用“数据加密服务DEW”或“DLI提供的跨源认证方式”来存储数据源的认证信息。数据加密服务（Data Encryption Workshop, DEW）是一个综合的云上数据加密服务，为您解决数据安全、密钥安全、密钥管理复杂等问题。推荐使用数据加密服务DEW来存储数据源的认证信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
计费相关问题 - 数据湖探索 DLI

DLI的计费模式有哪些？包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？数据湖队列什么情况下是空闲状态？怎样排查DLI计费异常？已购买套餐包，为什么仍然产生按需计费？怎样查看套餐包资源的使用情况？怎样查看DLI的数据扫描量？按需计费的弹性资源池，如果没提交作业运行就不计费？

帮助中心 > 数据湖探索 DLI > 计费说明
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

步骤1：创建弹性资源池并添加通用队列创建弹性资源池。登录DLI管理控制台，在左侧导航栏单击“资源管理 > 弹性资源池”，可进入弹性资源池管理页面。在弹性资源池管理界面，单击界面右上角的“购买弹性资源池”。在“购买弹性资源池”界面，填写具体的弹性资源池参数，具体参数填写参考创建弹性资源池并添加队列。

帮助中心 > 数据湖探索 DLI > 用户指南
DLI常用跨源分析开发方式 - 数据湖探索 DLI

推荐使用增强型跨源连接打通DLI与数据源之间的网络。跨源分析开发方式表1提供DLI支持的数据源对应的开发方式。表1 跨源分析语法参考服务名称开发SQL作业开发Spark jar作业开发Flink OpenSource SQL作业开发Flink Jar作业 CloudTable

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明 mongo只支持增强型跨源。只能使用包年包月队列。 DDS即文档数据库服务，兼容MongoDB协议。在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
DLI对接AOM Prometheus监控的配置项 - 数据湖探索 DLI

础指标。 metrics.reporter.remote.pool-name 否 None String - 为指标加上当前作业所在的弹性资源池名称作为标签。 metrics.reporter.remote.dli-job-id 否 None String - 为指标加上当前作业的DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
查询所有作业 - 数据湖探索 DLI

0/{project_id}/jobs 参数说明表1 URI 参数参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。表2 query参数参数名称是否必选参数类型说明 page-size 否 Integer 每页显示的最大作业个数，范围:

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误当Spark作业运行大批量数据时，如果出现作业运行超时异常错误，通常是由于作业的资源配置不足、数据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
如何获取项目ID？ - 数据湖探索 DLI

如何获取项目ID？项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
使用Spark作业跨源访问数据源 - 数据湖探索 DLI

使用Spark作业跨源访问数据源概述对接CSS 对接DWS 对接HBase 对接OpenTSDB 对接RDS 对接Redis 对接Mongo 父主题： Spark Jar作业开发指南

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

建议排查代码，确认是否有内存泄漏。图2 Full GC 处理步骤如果频繁Full GC, 建议排查代码，是否有内存泄漏。增加单TM所占的资源。联系技术支持，修改集群心跳配置参数。父主题： Flink作业性能调优类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

模板。标签使用标签标识云资源。包括标签键和标签值。如果您需要使用同一标签标识多种云资源，即所有服务均可在标签输入框下拉选择同一标签，建议在标签管理服务（TMS）中创建预定义标签。如您的组织已经设定DLI的相关标签策略，则需按照标签策略规则为资源添加标签。标签如果不符合标签策

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业

总条数： 943

上一页
1
...
12
13
14
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建批处理作业 - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

查询批处理作业列表 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

计费相关问题 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DLI对接AOM Prometheus监控的配置项 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

使用Spark作业跨源访问数据源 - 数据湖探索 DLI

Jobmanager与Taskmanager心跳超时，导致Flink作业异常怎么办？ - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线