搜索_华为云

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
数据迁移与传输方式概述 - 数据湖探索 DLI

数据迁移与传输方式概述导入数据至OBS DLI支持在不迁移数据的情况下，直接访问OBS中存储的数据进行查询分析。您只需将本地数据导入OBS即可开始使用DLI进行数据分析。导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据可以在

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
怎样排查DLI计费异常？ - 数据湖探索 DLI

怎样排查DLI计费异常？如果您在使用DLI服务的过程中，感觉计费有异常，可按照以下步骤进行排查：包周期资源与预付费资源，本节操作重点介绍怎样排查按需资源使用中的扣费异常。 SQL作业登录DLI管理控制台。进入“作业管理”>“SQL作业”页面。查看需要确认的作业详情，确认在扣费时间段内是否有以下操作

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
FileSytem结果表 - 数据湖探索 DLI

FileSytem结果表功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DLI内置依赖包 - 数据湖探索 DLI

DLI内置依赖包 DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。 Spark 3.1.1 依赖包表1 Spark 3.1.1 依赖包依赖包名称 accessors-smart-1.2

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

GROUP BY GROUP BY GROUP BY将SELECT语句的输出行划分成包含匹配值的分组。简单的GROUP BY可以包含由输入列组成的任何表达式，也可以是按位置选择输出列的序号。以下查询是等效的： SELECT count(*), nationkey FROM customer

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
get_json_object - 数据湖探索 DLI
get_json_object - 数据湖探索 DLI

get_json_object get_json_object函数用于根据所给路径对json对象进行解析，当json对象非法时将返回NULL。命令格式 get_json_object(string <json>, string <path>) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

Avro Format 功能描述 Avro格式允许基于Avro schema 读取和写入Avro 数据。目前，Avro schema 从表schema 推导。支持的Connector Kafka Upsert Kafka 参数说明表1 参数说明参数是否必选默认值类型说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
普通队列弹性扩缩容 - 数据湖探索 DLI

普通队列弹性扩缩容前提条件新创建的按需计费队列需要运行作业后才可进行弹性扩缩容。本节操作仅适用于普通队列，不适用于弹性资源池队列。约束与限制 16CUs队列不支持扩容和缩容。 64CUs队列不支持缩容。目前只支持计费模式为“按需/CU时”和“按需/专属资源模式”的队列进行弹性扩缩容

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
在DLI控制台配置数据库权限 - 数据湖探索 DLI

在DLI控制台配置数据库权限数据库权限操作场景针对不同用户，可以通过权限设置分配不同的数据库权限。管理员用户和数据库的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其数据库权限。给新用户设置数据库权限时，该用户所在用户组的所属区域需具有Tenant Guest权限

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

Avro Format 功能描述 Avro格式允许基于Avro schema 读取和写入Avro 数据。目前，Avro schema 从表schema 推导。更多具体使用可参考开源社区文档：Avro Format。支持的Connector Kafka Upsert Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

作业相关导入数据 DLI提供导入数据的接口。您可以使用该接口将存储在OBS中的数据导入到已创建的DLI表或者OBS表中。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 //实例化importJob

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

Redis源表功能描述创建source流从Redis获取数据，作为作业的输入数据。前提条件创建该作业前，需要建立DLI和Redis的增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
创建DLI委托（废弃） - 数据湖探索 DLI

创建DLI委托（废弃）功能介绍该API用于创建DLI用户委托。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2/{project_id}/agency 参数说明表1 URI参数参数名称是否必选参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 委托相关API（废弃）
Spark SQL常用配置项说明 - 数据湖探索 DLI

Spark SQL常用配置项说明本章节为您介绍DLI 批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

DataGen源表功能描述 DataGen主要用于生成随机数据，可用于调试以及测试等场景。前提条件无注意事项创建DataGen表时，表字段类型不支持Array，Map和Row复杂类型，可以通过CREATE TABLE语句中的“COMPUTED COLUMN”来进行类似功能构造

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

窗口Top-N 功能描述窗口 Top-N 是特殊的 Top-N，它返回每个分区键的每个窗口的N个最小或最大值。与普通Top-N不同，窗口Top-N只在窗口最后返回汇总的Top-N数据，不会产生中间结果。窗口 Top-N 会在窗口结束后清除不需要的中间状态。窗口 Top-N 适用于用户不需要每条数据都更新

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用DataSource语法创建OBS表功能描述本节介绍使用DataSource语法创建OBS表。 DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文件系统是一种高性能文件系统

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
导入Flink作业 - 数据湖探索 DLI
导入Flink作业 - 数据湖探索 DLI

导入Flink作业功能介绍该API用于导入Flink作业数据。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1.0/{project_id}/streaming/jobs/import 参数说明表1 URI参数说明参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

JDBC维表创建JDBC表用于与输入流连接。前提条件请务必确保您的账户下已创建了相应实例。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表

总条数： 832

上一页
1
...
36
37
38
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

怎样排查DLI计费异常？ - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

get_json_object - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

创建DLI委托（废弃） - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

导入Flink作业 - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线