搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

支持对接CloudTable的OpenTSDB和MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

SparkUI，确保集群已经拉好了，不要立即单击SparkUI。目前DLI配置SparkUI只展示最新的100条作业信息。 QUERY作业和异步DDL作业除上述操作外，还包括：下载到本地：异步DDL和QUERY语句支持将结果下载到本地。具体操作请见导出作业结果到本地。查看结果：查看作业运行结果。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DROP TABLE - 数据湖探索 DLI
DROP TABLE - 数据湖探索 DLI

由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例 DROP TABLE IF EXISTS db0.delta_table0; 系统响应执行成功，元数据中表将被删除，无法通过show和describe查询该表。父主题： Delta

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
创建弹性资源池并添加队列 - 数据湖探索 DLI

首条扩缩容策略是默认策略，不能删除和修改时间段配置。 Flink作业不支持触发弹性资源池队列的自动扩缩容。单击“确定”完成添加队列配置。弹性资源池队列添加完成后，可以参考调整弹性资源池中队列的扩缩容策略查看弹性资源池添加的所有队列配置和策略信息。父主题：创建弹性资源池和队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
队列属性设置 - 数据湖探索 DLI

仅Spark引擎的SQL队列支持配置队列属性。仅在队列创建完成后支持设置队列属性。当前仅支持设置Spark driver相关队列属性。不支持批量设置队列属性。弹性资源池中的队列，当队列的最小CUs小于16CUs时，在队列属性中设置的“最大spark driver实例数”和“最大预拉起spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
在Spark SQL作业中使用UDF - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SET - 数据湖探索 DLI
SET - 数据湖探索 DLI

SET 功能开启配置参数： hoodie.schema.evolution.enable=true 命令功能 ALTER TABLE ... SET|UNSET语法用于修改表属性。命令语法 ALTER TABLE tableName SET|UNSET tblproperties

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
查询所有数据库（废弃） - 数据湖探索 DLI

状态码状态码如表5所示。表5 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：数据库相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

CDM集群与云上服务同区域情况下，同虚拟私有云、同子网、同安全组的不同实例默认网络互通；如果同虚拟私有云但是子网或安全组不同，还需配置路由规则及安全组规则。配置路由规则请参见如何配置路由规则章节，配置安全组规则请参见如何配置安全组规则章节。 iii. 此外，您还必须确保该云服务的实例与CDM集群所属的企业项目必须相

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
添加分区（只支持OBS表） - 数据湖探索 DLI

您可以在建表语句OPTIONS中设置“multiLevelDirEnable”为true以查询子目录下的内容，此参数默认值为false（注意，此配置项为表属性，请谨慎配置。Hive表不支持此配置项)。示例建OBS表时仅有一个分区列，建表成功后添加分区数据。先使用DataSource语法创建一个OBS分区

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

enable配置项，所以不涉及Apache Spark 命令注入漏洞（CVE-2022-33891）。该漏洞主要影响在启用了ACL（访问控制列表）时，可以通过提供任意用户名来执行命令导致数据安全受到威胁。 DLI在设计时充分考虑了数据安全和数据隔离，因此没有启用相关的配置项，所以不会受到这个漏洞的影响。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码中“pom文件配置”说明。 pom文件配置中依赖包 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本（访问Java官网）。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其2019.1往后的版本。安装Maven 开发环境的基本配置（下载并安装 Maven）。用于项目管理，贯穿软件开发生命周期。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
提交SQL作业（推荐） - 数据湖探索 DLI

String 待提交作业的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。 conf 否 Array of Strings 用户以“key/value”的形式设置用于此作业的配置参数。目前支持的配置项请参考表3。 tags 否 Array of Objects

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
程序包管理概述 - 数据湖探索 DLI

在执行DLI作业前需要将UDF Jar包或Jar作业程序包上传到云平台进行统一的管理和维护。有以下两种方式管理程序包：（推荐使用）上传至OBS管理程序包：提前将对应的jar包上传至OBS桶中，在作业配置时选择对应的OBS路径。（DLI程序包功能即将停用）上传至DLI管理程序包：提

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的这种模式减轻了运维负担，可以更专注于数据处理和分析任务本身。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Confluent Avro Format - 数据湖探索 DLI

根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka或ecs的地址 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

参数填写完成后，单击“立即购买”，在界面上确认当前配置是否正确。单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。

帮助中心 > 数据湖探索 DLI > 快速入门
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

ADD COLUMNS 功能开启配置参数： hoodie.schema.evolution.enable=true 命令功能 ADD COLUMNS命令用于为现有表添加新列。命令语法 ALTER TABLE tableName ADD COLUMNS(col_spec[, col_spec

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

需要导入数据的DLI表的名称。以下是可以在导入数据时使用的配置选项： DATA_TYPE: 指定导入的数据类型，当前支持CSV、Parquet、ORC、JSON、Avro类型，默认值为“CSV”。配置项为OPTIONS('DATA_TYPE'='CSV') 导入CSV和JSON文件时，有三种模式可以选择：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关

总条数： 690

上一页
1
...
9
10
11
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

DROP TABLE - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

队列属性设置 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

SET - 数据湖探索 DLI

查询所有数据库（废弃） - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？ - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线