搜索_华为云

表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

创建OBS表需要指定OBS路径，且该路径需要提前创建。完整样例代码和依赖包说明请参考：Python SDK概述。删除表 DLI提供删除表的接口。您可以使用该接口删除数据库下的所有表。示例代码如下： 1 2 3 4 5 6 7 8 def delete_tbls(dli_client, db_name):

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
数据迁移与传输方式概述 - 数据湖探索 DLI

确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
pyspark样例代码 - 数据湖探索 DLI

com:9200" resource为指定在CSS关联的资源名。格式可以用"/index/type"指定资源位置（可简单理解index为database，type为table，但绝不等同）。 ES 6.X版本中，单个Index只支持唯一type，type名可以自定义。 ES 7.X版

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
查看多版本备份数据 - 数据湖探索 DLI

HISTORY FOR TABLE：查看备份数据。 PARTITION：指定分区列。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 column 分区列名。 value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

obs://bucket/checkpoint 编译运行应用程序开发完成后，参考Flink Jar作业开发基础样例将编译打包的JAR包上传到DLI运行，查看对应OBS路径下是否有相关的数据信息。父主题： Flink作业开发指南

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询制定资源包、删除资源包的Python SDK使用说明。 SQL作业相关介绍数据库相关、表相关、作业相关的Python SDK使用说明。 Spark作业相关介绍提交Spark作业、取消Spark作业、删除Spark作业等Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
设置多版本备份数据保留周期 - 数据湖探索 DLI

TBLPROPERTIES：TBLPROPERTIES子句给表添加key/value的属性。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 days 多版本中备份数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

hive_sync.table", tableName) .option("hoodie.datasource.hive_sync.database", databaseName) .mode(SaveMode.Overwrite) .save(basePath)

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
清理多版本数据 - 数据湖探索 DLI

table：清理多版本数据。 older_than：指定清理多版本数据的时间范围。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。时间戳删除该时间戳时间点

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询指定资源包、删除资源包的Java SDK使用说明。 SQL作业相关介绍数据库相关、表相关、作业相关Java SDK使用说明。 Flink作业相关介绍新建Flink作业、查询作业详情、查询作业列表等Java SDK使用说明。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
恢复多版本备份数据 - 数据湖探索 DLI

VERSION：指定版本号。具体的版本号可以通过SHOW HISTORY命令获取，详情请参考查看多版本备份数据。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 column 分区列名。 value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

SQL创建hudi表名为${table_name}，同步元数据服务后，数据库中多出两张表分别为${table_name}_rt和${table_name}_ro。实时视图读取（SparkSQL为例）：直接读取相同数据库中后缀为_rt的hudi表即可。 select count(*) from

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
基本语句 - 数据湖探索 DLI
基本语句 - 数据湖探索 DLI

col_name_list]] [LIMIT number]; 关键字表1 SELECT关键字说明参数描述 ALL ALL关键字用于返回数据库所有匹配的行，包括重复的行。ALL关键字的后面只能跟*，否则执行语句会出错。 ALL是SQL语句的默认行为，通常不会被明确写出，如果不指定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT
在Spark SQL作业中使用UDF - 数据湖探索 DLI

单击“确定”，完成创建程序包。创建UDF函数。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。图11 选择队列和数据库在SQL编辑区域输入下列命令创建UDF函数，单击“执行”提交创建。 CREATE FUNCTION TestSumUDF AS

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
配置多版本过期数据回收站 - 数据湖探索 DLI

TBLPROPERTIES：TBLPROPERTIES子句给表添加key/value的属性。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 obs桶多版本回收站目录

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

Information Database: default

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

本章节介绍了目前DLI所提供的API列表。表1 DLI API列表类型说明权限相关API 包括队列赋权、查看队列的使用者、数据赋权、查看数据库的使用者、查看表的使用者、查看表的用户权限和查看赋权对象使用者权限信息。全局变量相关API 包括创建全局变量、删除全局变量、修改全局变量和查询所有全局变量。

帮助中心 > 数据湖探索 DLI > API参考
使用DLI分析账单消费数据 - 数据湖探索 DLI

在数据湖探索服务中创建表。登录DLI控制台，左侧导航栏单击“SQL编辑器”，执行引擎选择“spark”，选择执行的队列和数据库。本次演示队列和数据库选择“default”。下载的文件中包含时间用量等，按表头意义在DLI上创建表，具体可以参考如下示例，其中amount列为费用。

帮助中心 > 数据湖探索 DLI > 最佳实践
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

单击“确定”，完成创建程序包。创建UDAF函数。登录登录DLI管理控制台，创建SQL队列和数据库。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。在SQL编辑区域输入下列命令创建UDAF函数，单击“执行”提交创建。如果该客户

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hudi表模型设计规范 - 数据湖探索 DLI

precombine字段值可以保证数据的准确性，老数据不会覆盖新数据，也就是幂等写入能力。该字段可用选择的类型包括：业务表中更新时间戳、数据库的提交时间戳等。precombine字段不能有null值和空值，可以参考以下示例设置precombine字段： SparkSQL: //通

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范

总条数： 862

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

表相关 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

查看多版本备份数据 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

恢复多版本备份数据 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

基本语句 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线