搜索_华为云

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle.partitions提高shuffle read task的并行度来进行解决。设置spark

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

ab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代码的编写与作业的开发，使用Notebook灵活的进行数据分析与探索，本节操作介绍使

 帮助中心 > 数据湖探索 DLI > 用户指南
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志勾选“作业异常告警”，选择1中创建的“SMN主题”。配置该参数，可以在作业异常情况下，向用户指定邮箱或者手机发送消息通知，方便客户及时感知异常。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

传并共享的镜像，运行作业，即可使用自定义镜像运行作业。如果选择的镜像不是共享镜像，自定义镜像处会提示该镜像未授权，则需要授权后才可以使用。具体可以参考图3，提示处单击“立即授权”即可，填写其他作业执行参数后，再执行作业。图2 在DLI Spark作业编辑页面，选择自定义镜像图3

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Spark作业使用咨询 - 数据湖探索 DLI

Spark作业使用咨询 DLI Spark作业是否支持定时周期任务作业 DLI Spark不支持作业调度，用户可以通过其他服务，例如数据湖管理治理中心DataArts Studio服务进行调度，或者通过API/SDK等方式对作业进行自定义调度。使用DataArts Studi

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
对象存储OBS结果表 - 数据湖探索 DLI

系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

无。工作流调度 DataArts Studio-DLF调度。自建大数据生态的调度工具，如Airflow。企业级多租户基于表的权限管理，可以精细化到列权限。基于文件的权限管理。高性能性能基于软硬件一体化的深度垂直优化。大数据开源版本性能。跨源分析支持多种数据格式，

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的这种模式减轻了运维负担，可以更专注于数据处理和分析任务本身。具体请参考《数据湖探索用户指南》。 MRS服务Spark组件的是建立在客户的购买MRS服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”），这些常用

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

DLI服务目前支持：SQL作业、Spark作业和Flink作业。您可以根据业务类型以及数据量大小灵活选择DLI的计费方式。价格说明计费说明计费详情和样例 04 使用您可以详细了解DLI管理控制台的功能，常用SQL语法。除此之外，还可以实时查看监控指标及审计日志，以便及时了解DLI的健康状态。

帮助中心 > 数据湖探索 DLI > 成长地图
弹性资源池关联队列 - 数据湖探索 DLI

弹性资源池关联队列操作场景参考创建弹性资源池并添加队列创建完弹性资源池后，您可以将已有的队列关联至弹性资源池，即可将弹性资源池的资源用于后续作业的运行您可以在弹性资源池页面通过“关联队列”将队列添加到弹性资源池。还可以在队列管理页面分配队列至弹性资源池。弹性资源池Flink版本只支持1

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

Temporal Tables 上的 inner join 示例假如Rates是一个 Temporal Table Function， join 可以使用 SQL 进行如下的表达: SELECT o_amount, r_rate FROM Orders, LATERAL TABLE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
Upsert Kafka结果表 - 数据湖探索 DLI

Kafka sink会保证至少一次将数据插入Kafka topic。这意味着，Flink可以将具有相同key的重复记录写入Kafka topic。因此，upsert-kafka 连接器可以实现幂等写入。语法格式 1 2 3 4 5 6 7 8 9 10 11

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DLI作业开发流程 - 数据湖探索 DLI

当需要将来自不同源的数据进行集中存储和处理时，迁移数据至DLI可以提供一个统一的数据平台。您可以参考使用CDM迁移数据至DLI迁移数据至DLI后再提交作业。如果业务需求需要实时访问和处理来自不同数据源的数据，跨源访问可以减少数据的复制和延迟。跨源访问的必要条件包括“DLI与数据

 帮助中心 > 数据湖探索 DLI > 用户指南
FileSystem结果表 - 数据湖探索 DLI

系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用Hive语法创建DLI表 - 数据湖探索 DLI

示例说明：创建名为table2的DLI非分区表，您可以根据业务需求自定义列子段的原生数据类型：与文字字符有关可以使用STRING、CHAR或者VARCHAR。与时间有关的可以使用TIMESTAMP、DATE。与整数有关的可以使用INT、SMALLINT/SHORT、BIGINT/LONG、TINYINT。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
创建DLI程序包 - 数据湖探索 DLI

说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : +-@ ,但首尾不能含有空格，不能以_sys_开头。标签值：在输入框中输入标签值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_ . : +-@

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

过统一身份认证服务（Identity and Access Management，简称IAM）细粒度鉴权，可以通过在IAM创建策略来管理DLI的权限控制。两种权限控制机制可以共同使用，没有冲突。发布区域：全部创建用户并授权使用DLI DLI自定义策略 DLI常用操作与系统权限关系

 帮助中心 > 数据湖探索 DLI > 功能总览

总条数： 742

上一页
1
2
3
4
5
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

弹性资源池关联队列 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线