搜索_华为云

删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

单引号（''）包围起来。 partition_specs 分区信息，key=value形式，key为分区字段，value为分区值。若分区字段为多个字段，可以不包含所有的字段，会删除匹配上的所有分区。“partition_specs”中的参数默认带有“( )”，例如：PARTITION

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

conf文件。创建MRS HBase表创建DLI表关联MRS HBase表之前确保HBase的表是存在的。以样例代码为例，具体的流程是：远程登录ECS，通过hbase shell命令查看表信息。其中，“hbtest”是要查询的表名。 describe 'hbtest' （可选）如果不存在

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

json_path) 表2 参数说明参数数据类型说明 json_string STRING 需要解析的JSON对象，使用字符串表示。 json_path STRING 解析JSON的路径表达式，使用字符串表示。目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

登录OBS控制台，将生成的Jar包文件上传到OBS路径下。登录DLI控制台，选择“作业管理 > Spark作业”。单击操作列“编辑”。编辑“应用程序”，选择1上传的OBS地址。图11 配置应用程序 Spark 3.3以下版本：分别上传Jar包到OBS和DLI下。登录OBS控制台，将生成的Jar包文件上传到OBS路径下。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
日期、时间函数及运算符 - 数据湖探索 DLI

时间，24小时制（hh:mm:ss） %U 周（00 .. 53），星期天是一周的第一天 %u 周（00 .. 53），星期一是一周的第一天 %V 周（01 .. 53），星期天是一周的第一天，与%X配合使用 %v 星期（01 .. 53），第一条为星期一，与%X配合使用 %W 周几（Sunday

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

基于文件的权限管理。高性能性能基于软硬件一体化的深度垂直优化。大数据开源版本性能。跨源分析支持多种数据格式，云上多种数据源、ECS自建数据库以及线下数据库，数据无需搬迁，即可实现对云上多个数据源进行分析，构建企业的统一视图，帮助企业快速完成业务创新和数据价值探索。

帮助中心 > 数据湖探索 DLI > 产品介绍
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

登录OBS控制台，将生成的Jar包文件上传到OBS路径下。登录DLI控制台，选择“作业管理 > Spark作业”。单击操作列“编辑”。编辑“应用程序”，选择1上传的OBS地址。图11 配置应用程序 Spark 3.3以下版本：分别上传Jar包到OBS和DLI下。登录OBS控制台，将生成的Jar包文件上传到OBS路径下。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

LOG.info("Params: " + params.toString()); // Kafka连接地址 String bootstrapServers; // Kafka消费组 String kafkaGroup;

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

创建数据库功能描述创建数据库。语法格式 1 2 3 CREATE [DATABASE | SCHEMA] [IF NOT EXISTS] db_name [COMMENT db_comment] [WITH DBPROPERTIES (property_name=property_value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出DLI表数据至OBS中支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
在DLI控制台创建数据库和表 - 数据湖探索 DLI

在DLI控制台创建数据库和表数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。表是数据库最重要的组成部分之一。表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Spark SQL常用配置项说明 - 数据湖探索 DLI

分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据场景描述 DLI可以查询存储在OBS中的数据，本节操作介绍使用DLI提交SQL作业查询OBS数据的操作步骤。本例新建“sampledata.csv”文件上传OBS桶，并新建弹性资源池队列，使用DLI创建数据库和表，使用DLI提供的SQL编辑器查询表的1000条数据。

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功；否则表示未成功。在MySQL的flink数据库下创建表order_count，创建语句如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据MySQL和kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据MySQL和kafka的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功；否则表示未成功。在MySQL的flink数据库下创建表order_count，创建语句如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移MRS Hive数据至DLI。其他MRS Hadoop组件数据，均可以通过CDM与DLI进行双向同步。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 296

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

删除分区 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

日期、时间函数及运算符 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线