搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Postgres CDC源表 - 数据湖探索 DLI

Postgres CDC源表功能描述 Postgres的CDC源表，即Postgres的流式源表，用于依次读取PostgreSQL数据库全量快照数据和变更数据，保证不多读一条也不少读一条数据。即使发生故障，也能采用Exactly Once方式处理。前提条件 PostgreSQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
查询所有全局变量 - 数据湖探索 DLI

查询所有全局变量功能介绍该API用于查询当前project下所有全局变量的信息。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id}/variables 参数说明表1 URI参数说明参数名称是否必选参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
查询SQL作业日志 - 数据湖探索 DLI

查询SQL作业日志操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并获取SQL作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
配置多版本过期数据回收站（废弃，不推荐使用） - 数据湖探索 DLI

配置多版本过期数据回收站（废弃，不推荐使用）功能描述多版本功能计划废弃，不推荐使用。更多相关功能推荐：Hudi多版本清理操作、Hudi Archive操作说明。更在DLI数据多版本功能开启后，过期的备份数据后续在执行insert overwrite或者truncate语句时会被系统直接清理

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据（废弃，不推荐使用）
跨源认证权限管理 - 数据湖探索 DLI

跨源认证权限管理操作场景通过跨源认证的用户授权，可设置分配不同的跨源认证，且不同用户的作业不影响跨源认证的使用。使用须知管理员用户和跨源认证的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其跨源认证权限。给新用户设置跨源认证权限时，该用户所在用户组具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
DLI弹性资源池与队列简介 - 数据湖探索 DLI

DLI弹性资源池与队列简介 DLI的计算资源是执行作业的基础，本节内容介绍DLI计算资源的模式和队列类型。什么是弹性资源池和队列？在了解DLI计算资源模式前首先了解弹性资源池和队列的基本概念。弹性资源池是DLI计算资源的一种池化管理模式，可以看做DLI计算资源的集合。DLI支持在弹性资源池中创建多个队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI常用跨源分析开发方式跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
查询Spark作业日志 - 数据湖探索 DLI

查询Spark作业日志操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并获取Spark作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI通过Kafka结果表将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

API概览本章节介绍了目前DLI所提供的API列表。表1 DLI API列表类型说明权限相关API 包括队列赋权、查看队列的使用者、数据赋权、查看数据库的使用者、查看表的使用者、查看表的用户权限和查看赋权对象使用者权限信息。全局变量相关API 包括创建全局变量、删除全局变量

 帮助中心 > 数据湖探索 DLI > API参考
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

CREATE TABLE 命令功能 CREATE TABLE命令通过指定带有表属性的字段列表来创建Delta Table。注意事项在该命令中，IF EXISTS和db_name是可选配置。在DLI中delta只支持OBS外表，通过表名创建且未指定location时将会失败。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
添加增强型跨源连接的路由信息 - 数据湖探索 DLI

添加增强型跨源连接的路由信息操作场景路由即路由规则，在路由中通过配置目的地址、下一跳类型、下一跳地址等信息，来决定网络流量的走向。路由分为系统路由和自定义路由。增强型跨源连接创建后，子网会自动关联系统默认路由。除了系统默认路由，您可以根据需要添加自定义路由规则，将指向目的地址的流量转发到指定的下一跳地址

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述队列网络连通配置DLI队列与内网数据源的网络连通 DLI在创建运行作业需要连接外部其他数据源

 帮助中心 > 数据湖探索 DLI > 快速入门
已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？问题描述已经购买了DLI的套餐包，使用过程中仍然产生了按需费用。排查思路 DLI提供优惠的资源套餐包，购买套餐包后，资源按照套餐包类型计费。套餐包是用户预先购买的资源使用量配额，超出当前套餐包的额度，将自动转为按需收费。建议您按以下顺序排查原因

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的剩余可用

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

Flink作业相关前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化，参考队列相关完成队列创建等操作。新建SQL作业 DLI提供新建Flink SQL作业的接口。您可以使用该接口新建Flink SQL作业并提交到

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
队列权限管理 - 数据湖探索 DLI

队列权限管理管理员用户和队列的所有者拥有队列的所有操作权限，且根据业务需求对其他用户分配队列的操作权限，确保用户之间的作业互不影响，保障作业的执行性能。本节操作介绍队列权限管理的相关操作。操作须知管理员用户和队列的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其队列权限

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
ClickHouse结果表 - 数据湖探索 DLI

ClickHouse结果表功能描述 DLI支持将Flink作业数据输出到ClickHouse数据库中。ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。详细请参考ClickHouse

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
配置DLI 队列与公网网络联通 - 数据湖探索 DLI

配置DLI 队列与公网网络联通操作场景本节操作为您提供DLI队列在公网访问场景下网络打通的方法。通过配置SNAT规则，添加到公网的路由信息，可以实现队列到和公网的网络打通。操作流程图1 配置DLI队列访问公网流程步骤1：创建VPC 登录虚拟私有云控制台，创建虚拟私有云。创建的

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 配置DLI队列网络联通最佳实践

总条数： 746

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消