搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-redis").getOrCreate() 设置连接参数 1 2 3 4 host = "192.168.4.199" port = "6379" table = "person" auth

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

com/artifactory/api/pypi/cbu-pypi-public/simple 内容复制到基础镜像中 USER omm 其中，主要包含了以下步骤：设置pip的可用仓库地址。使用pip3安装tensorflow算法包。将安装了算法包的临时镜像builder里的内容复制到基础镜像中（这一

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
清理多版本数据 - 数据湖探索 DLI

需要为yyyy-MM-dd HH:mm:ss 注意事项 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。该命令不会删除当前版本数据。示例删除dliTable表在2021-09-25 23:59:59之前生

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
SQL作业使用咨询 - 数据湖探索 DLI

Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark Jar作业。 DLI 表(OBS表 / DLI 表 )数据支持删除某行数据吗？ DLI 表(OBS表 / DLI 表 )数据暂不支持删除某行数据。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

时同步元数据至由DLI提供的元数据服务。（具体参数详见Flink参数一节）请将作业中sink表的path参数修改为希望保存hudi表的obs路径。 -- 临时表作为source，通过datagen mock数据 create table orderSource ( order_id

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
DLI SDK功能矩阵 - 数据湖探索 DLI

SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java SDK使用说明。

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

Key)或Token两种认证方式初始化客户端，具体操作请参考初始化DLI客户端 Java SDK列表表1 Java SDK列表类型说明 OBS授权介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java SDK使用说明。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

key VALUE value [ { NULL | ABSENT } ON NULL ]) 通过将键值表达式聚合到单个JSON对象中来构建JSON对象字符串。键表达式必须返回一个不可为空的字符串。值表达式可以是任意的，包括其他JSON函数。如果值为NULL，则ON NULL行

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

------------------------------------------------------------------------- web obs://bucket/user/hive/warehouse/web.db dli USER (1 row) 父主题：辅助命令语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

schema) // 步骤3：配置写入的表名和OBS路径 val databaseName = "default" val tableName = "hudi_table" val basePath = "obs://bucket/path/hudi_table"

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

percentage)→array<[same as x]> 描述：按照百分比percentage，返回所有x输入值的近似百分位数。每一项的权重值为w且必须为正数。x设置有效的百分位。percentage的值必须在0到1之间，并且所有输入行必须为常量。 select approx_percentile(x,

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

snapshot同时也作为默认值，因此可以缺省本配置项 .load("obs://bucket/to_your_table"); // 指定读取的hudi表路径，DLI仅支持使用OBS路径 dataFrame.show(100); // 2. 通过SparkSession

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源，如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。当资源不存在的时候，PATCH可能会去创建一个新的资源。

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
Json函数和运算符 - 数据湖探索 DLI

'null'。不过，在从包含NULL的数组或Map进行转换时，生成的JSON将包含NULL。在从ROW转换为JSON时，结果是一个JSON数组，而不是一个JSON对象。这是因为对于SQL中的行，位置比名称更重要。支持从BOOLEAN、TINYINT、SMALLINT、INTEGER、BIGINT、RE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
SHOW_INVALID_PARQUET - 数据湖探索 DLI

参数描述参数描述是否必填 path 需要查询的FS路径是示例 call show_invalid_parquet(path => 'obs://path/hudi_table/dt=2021-08-28'); 注意事项使用由DLI提供的元数据服务时，不支持本命令。权限需求

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
迁移数据场景概述 - 数据湖探索 DLI

数据迁移数据类型映射将其他云服务或业务平台数据迁移到DLI ，或者将DLI数据迁移到其他云服务或业务平台时，涉及到源和目的端数据类型的转换和映射，根据表2可以获取到源和目的端的数据类型映射关系。表2 数据类型映射表 MySQL Hive DWS Oracle PostgreSQL Hologres

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Confluent Avro Format - 数据湖探索 DLI

t avro的形式写入作为sink的topic中。根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from test_dds").show() 操作结果通过DataFrame API访问设置连接参数 val url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。您可以使用本文档提供API对数据湖探索进行相关操作，包括队列、SQL作业、Flink

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Hudi表使用约束 - 数据湖探索 DLI

Hudi支持使用Spark SQL操作Hudi的DDL/DML的语法。但在使用DLI提供的元数据提交SparkSQL作业时，部分直接操作OBS路径的SQL语法暂不支持，详细说明请参考DLI Hudi SQL语法参考。不支持在HetuEngine中写Hudi表，以及修改Hudi表结构，仅支持读Hudi表。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述

总条数： 855

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

DESCRIBE DATABASE| SCHEMA - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

SHOW_INVALID_PARQUET - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线