搜索_华为云

导出数据（废弃） - 数据湖探索 DLI

导出数据（废弃）功能介绍该API用于从DLI表中导出数据到文件。该API为异步操作。目前只支持从DLI表导出数据到OBS中，且导出的路径必须指定到文件夹级别。OBS路径中不支持逗号，且其中的桶名不能以正则格式“.[0-9]+(.*)”结尾，即，若桶名包含“.”，则最后一个“

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

kafkaSource; 向kafka的相应topic中插入下列数据： 47.29.201.179 - - [28/Feb/2019:13:17:10 +0000] "GET /?p=1 HTTP/2.0" 200 5316 "https://domain.com/?p=1" "Mozilla/5

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

SDK概述下载样例代码。 kind：资源包类型，当前支持包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 obs_jar_paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。例如："https://bucketname

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
添加分区（只支持OBS表） - 数据湖探索 DLI

若新增分区指定的路径包含子目录（或嵌套子目录），则子目录下面的所有文件类型及内容也将作为该分区的记录。您需要保证该分区目录下所有文件类型和文件内容与表的字段一致，否则查询将报错。您可以在建表语句OPTIONS中设置“multiLevelDirEnable”为true以查询子目录下的内容，此参数默认值为false（

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

Java SDK操作指导请参考Java SDK Python SDK操作指导请参考Python SDK DLI SDK调用接口使用https进行访问，有服务端使用证书。

帮助中心 > 数据湖探索 DLI > SDK参考
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

登录SWR管理控制台。选择左侧导航栏的“组织管理”，单击页面右上角的“创建组织”。填写组织名称，单击“确定”。编写Dockerfile文件。 vi Dockerfile 具体内容参考如下，将tensorflow打包进镜像： ARG BASE_IMG=swr.xxx/dli-public/spark_general-x86_64:3

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入OBS表时，创建OBS表时指定的路径必须是文件夹，若建表路径是文件将导致导入数据失败。仅支持导入位于OBS路径上的原始数据。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。导入数据时只能指定一个路径，路径中不能包含逗号。当OBS桶目录下有文件夹和文件同名时，导入数据会优先指向该路径下的文件而非文件夹。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
配置DLI作业桶 - 数据湖探索 DLI

存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台的“全局配置 > 工程配置”页面配置DLI作业桶。操作前准备配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
上传file类型分组资源（废弃） - 数据湖探索 DLI

module_name 否 String 资源模块名 module_type 否 String 资源模块类型。 jar：用户jar文件; pyFile：用户python文件; file：用户文件。表4 details参数说明参数名称是否必选参数类型说明 create_time 否 Long

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
ALTER SCHEMA - 数据湖探索 DLI
ALTER SCHEMA - 数据湖探索 DLI

(property_name=property_value, ...); 描述这条命令并不会将SCHEMA当前的内容移动到修改后的路径下，也不会修改与指定schema关联的表或分区，它只会修改新添加进数据库的表的上级目录。示例 Create schema foo; --修改schema 存储路径

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
管理DLI资源配额 - 数据湖探索 DLI

系统进入“服务配额”页面。图2 我的配额单击“申请扩大配额”。在“新建工单”页面，根据您的需求，填写相关参数。其中，“问题描述”项请填写需要调整的内容和申请原因。填写完毕后，勾选协议并单击“提交”。父主题： DLI常用管理操作

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

步骤：步骤1：创建并上传数据。将数据上传到对象存储服务OBS。步骤2：使用DLI将CSV数据转换为Parquet数据。将CSV数据导入DLI，并将CSV数据转换为Parquet数据。方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark

帮助中心 > 数据湖探索 DLI > 最佳实践
迁移数据场景概述 - 数据湖探索 DLI

迁移数据场景概述为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
获取作业模板 - 数据湖探索 DLI

说明 type String 模板类型。 id String 模板ID。 name String 模板名称。 body Object 模板内容。详细信息参考表5。 group String 模板所在分组名。 description String 模板描述信息。 language String

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie // 元数据文件夹 │

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
查询作业监控信息（废弃） - 数据湖探索 DLI

corrupted_records 否 Long 脏数据记录数。示例请求样例 { "job_ids": [298765, 298766] } 响应样例 { "is_success": true, "message": "消息内容", "metrics": {

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > Flink作业相关API（废弃）
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

userDefined源表功能描述您可通过编写代码实现从云生态或者开源生态获取数据，再把获取到的数据作为Flink作业的输入数据。前提条件自定义source类需要继承类RichParallelSourceFunction，并指定数据类型为Row。例如自定义类MySource：public class

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

COMPACTION 命令功能压缩( compaction)用于在 MergeOnRead表将基于行的log日志文件转化为parquet列式数据文件，用于加快记录的查找。命令格式 SCHEDULE COMPACTION on tableIdentifier |tablelocation;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format

总条数： 1507

上一页
1
...
7
8
9
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导出数据（废弃） - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

上传file类型分组资源（废弃） - 数据湖探索 DLI

ALTER SCHEMA - 数据湖探索 DLI

管理DLI资源配额 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

获取作业模板 - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

查询作业监控信息（废弃） - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线