搜索_华为云

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

Flink作业”，在作业列表中选择待操作的Flink OpenSource SQL作业。单击操作列的“编辑”，进入作业编辑页面。在右侧的“运行参数”配置区域，选择新的Flink版本。使用Flink 1.15以上版本的引擎执行作业时，需要在自定义配置中配置委托信息，其中key为"flink.dli.job.agency

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
创建DLI程序包 - 数据湖探索 DLI

选择“创建新分组”：可输入自定义的组名称。选择“不分组”：不需要选择或输入组名称。说明：如果选择分组，则对应的权限管理为对应程序包组的权限管理。如果选择不分组，则对应的权限管理为对应程序包的权限管理。程序包组和程序包权限管理请参考程序包权限管理。标签使用标签标识云资源。包括标签键和标签值。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
DLI常用跨源分析开发方式 - 数据湖探索 DLI

跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
数学运算函数 - 数据湖探索 DLI

返回小数部分，d位之后数字的四舍五入，d为int型。例如round(21.263,2)，返回21.26。 PI 所有数字类型返回pi的值。 E() 所有数字类型返回e的值。 RAND() 所有数字类型返回一个0.0和1.0之间的随机double类型的数（包含0.0，不包含1.0）。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

在DLI中，表和数据库是定义底层数据的元数据容器。表中的元数据让DLI知道数据所在的位置，并指定了数据的结构，例如列名称、数据类型和表名称。数据库是表的逻辑分组。 OBS表、DLI表、CloudTable表不同表类型表示不同的数据存储位置。 OBS表表示数据存储在OBS服务的桶中。 DLI表表示数据存储在本服务内部的表中。

帮助中心 > 数据湖探索 DLI > 产品介绍
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

0支持弹性资源池和队列使用DLI提交作业前，您需要为提交作业准备所需的计算资源。 · 弹性资源池和队列：弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），灵活应对业务对计算资源变化的需求。同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。

帮助中心 > 数据湖探索 DLI > 功能总览
原生数据类型 - 数据湖探索 DLI

计算值默认值为0。由于浮点类型的数据在计算机中的存储方式的限制，在比较两个浮点类型的数据是否相等时，因存在精度问题，不能直接采用“a==b”的方式进行比较，建议使用“(a-b)的绝对值<=EPSILON”这种方式进行比较，EPSILON为允许的误差范围，一般为1.1920929

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
权限策略和授权项 - 数据湖探索 DLI

对应API接口：自定义策略实际调用的API接口。授权项：自定义策略中支持的Action，在自定义策略中的Action中写入授权项，可以实现授权项对应的权限功能。依赖的授权项：部分Action存在对其他Action的依赖，需要将依赖的Action同时写入授权项，才能实现对应的权限功能。 IAM

帮助中心 > 数据湖探索 DLI > API参考
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

通时，需确保CDM集群已绑定EIP、CDM云上安全组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。数据源为云上的CSS服务时，网络互通需满足如下条件： i. CDM集群与云上服务处于不同区域的情况下，需要通过公网或者专线打通网络。通过公

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Hudi表索引设计规范 - 数据湖探索 DLI

实时入湖都是需要分钟内或者分钟级的高性能入湖，索引的选择会影响到写Hudi表的性能。在性能方面各个索引的区别如下： Bucket索引优点：写入过程中对主键进行hash分桶写入，性能比较高，不受表的数据量限制。Flink和Spark引擎都支持，Flink和Spark引擎可以实现交叉混写同一张表。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

已创建CDM迁移集群。创建CDM集群的操作可以参考创建CDM集群。如果目标数据源为云下的数据库，则需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群已绑定EIP、CDM云上安全组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。数据源为云上服务RDS、MRS时，网络互通需满足如下条件：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Spark SQL常用配置项说明 - 数据湖探索 DLI

并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

已创建CDM迁移集群。创建CDM集群的操作可以参考创建CDM集群。如果目标数据源为云下的数据库，则需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群已绑定EIP、CDM云上安全组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。数据源为云上的MRS、DWS等服务时，网络互通需满足如下条件：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据DWS和Kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。连接DWS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

已创建CDM迁移集群。创建CDM集群的操作可以参考创建CDM集群。如果目标数据源为云下的数据库，则需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群已绑定EIP、CDM云上安全组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。数据源为云上的MRS、DWS时，网络互通需满足如下条件：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
数据湖探索简介 - 数据湖探索 DLI

开源生态：通过增强型跨源连接建立与其他VPC的网络连接后，用户可以在数据湖探索的租户授权的队列中访问所有Flink和Spark支持的数据源与输出源，如Kafka、Hbase、ElasticSearch等。具体内容请参见《数据湖探索开发指南》。存算分离用户将数据存储到OBS后，DLI可以直接和OBS对接进行

 帮助中心 > 数据湖探索 DLI > 产品介绍
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

面临市场新的竞争压力及出行服务不断变革，车企通过构建车联云平台和车机OS，将互联网应用与用车场景打通，完成车企数字化服务转型，从而为车主提供更好的智联出行体验，增加车企竞争力，促进销量增长。例如：通过对车辆日常指标数据（电池、发动机，轮胎胎压、安全气囊等健康状态）的采集和分析，及时将维保建议回馈给车主。

帮助中心 > 数据湖探索 DLI > 产品介绍
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

如果目标数据源为云下的数据库，则需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群已绑定EIP、CDM云上安全组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。数据源为云上的DWS、MRS等服务时，网络互通需满足如下条件：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

详细的DLI创建数据库的语法可以参考创建DLI数据库。 create database testdb; 后续章节操作都需要在testdb数据库下进行操作。 DataSource和Hive两种语法创建OBS表的区别 DataSource语法和Hive语法主要区别在于支持的表数据存

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 808

上一页
1
2
3
4
5
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

原生数据类型 - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线