搜索_华为云

创建表（废弃） - 数据湖探索 DLI

OBS表必选参数。 data_path 否 String 新增OBS表数据的存储路径，必须是OBS的路径。说明： OBS表必选参数。 data_path配置的OBS桶路径不建议为根目录，否则清空表数据的时候，就会把根目录内的数据全部清除，导致数据丢失。 with_column_header 否

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
修改弹性资源池的主机信息 - 数据湖探索 DLI

修改弹性资源池的主机信息操作场景主机信息用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。在跨源连接创建完成后，支持修改主机信息。常见的访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。约束限制已获取MR

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。若使用MRS HBase，请在增强型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用DLI的跨源认证管理数据源访问凭证 - 数据湖探索 DLI

创建CSS类型跨源认证创建Kerberos跨源认证创建Kafka_SSL类型跨源认证创建Password类型跨源认证跨源认证权限管理父主题：配置DLI读写外部数据源数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
如何获取项目ID？ - 数据湖探索 DLI

如何获取项目ID？项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
创建Password类型跨源认证 - 数据湖探索 DLI

pwd_auth_name 否 String 创建源表、结果表、维表时均使用该字段关联跨源认证。通过配置pwd_auth_name字段写入创建的Password类型的跨源认证名称。如果配置该参数则不需要在SQL中配置数据源的账号密码。具体的建表操作指导请参考DLI 语法参考。 Flink OpenSource

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

lookup.cache.max-rows 否无 Integer 维表配置，缓存的最大行数，超过该值时，最先添加的数据将被标记为过期。默认表示不使用该配置。 lookup.cache.ttl 否无 Duration 维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

CDM集群与云上服务同区域情况下，同虚拟私有云、同子网、同安全组的不同实例默认网络互通；如果同虚拟私有云但是子网或安全组不同，还需配置路由规则及安全组规则。配置路由规则请参见如何配置路由规则章节，配置安全组规则请参见如何配置安全组规则章节。 iii. 此外，您还必须确保该云服务的实例与CDM集群所属的企业项目必须相

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

S集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 create table hbaseSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
管理增强型跨源连接 - 数据湖探索 DLI

添加增强型跨源连接的路由信息删除增强型跨源连接的路由信息修改弹性资源池的主机信息增强型跨源连接标签管理删除增强型跨源连接父主题：配置DLI读写外部数据源数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SQL作业运行慢如何定位 - 数据湖探索 DLI

SQL作业运行慢如何定位作业运行慢可以通过以下步骤进行排查处理。可能原因1：FullGC原因导致作业运行慢判断当前作业运行慢是否是FullGC导致：登录DLI控制台，单击“作业管理 > SQL作业”。在SQL作业页面，在对应作业的“操作”列，单击“更多 > 归档日志”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

S集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 create table hbaseSink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

业”。首先配置队列，Spark版本选择 3.3.1 及之后的版本。可以选择配置作业名称，便于识别和筛选。配置”应用程序”，路径指向上一步上传至OBS的Spark jar包。配置委托。选择提交DLI作业所需的委托。自定义委托请参考创建DLI自定义委托。配置”主类（--c

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

Spark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

)。默认的扩缩容策略不支持时间段配置修改。弹性资源池扩缩容策略生效规则为：在任意一个时间段周期内，优先满足所有队列的最小CU数。剩余的CU（弹性资源池最大CU-所有队列的最小CU数之和）则根据配置的优先级顺序分配：如果队列的优先级不同，根据配置的优先级顺序分配，直到剩余的CU数分配完成。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
下载并安装JDBC驱动包 - 数据湖探索 DLI

com/96a17d961b84434baec6a58b9e567908。下载并安装JDBC驱动 JDBC版本2.X版本功能重构后，仅支持从DLI作业桶读取查询结果，如需使用该特性需具备以下条件：在DLI管理控制台“全局配置 > 工程配置”中完成作业桶的配置。 2024年5月起，新用户可以直接使用DLI服务

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
添加增强型跨源连接的路由信息 - 数据湖探索 DLI

添加增强型跨源连接的路由信息操作场景路由即路由规则，在路由中通过配置目的地址、下一跳类型、下一跳地址等信息，来决定网络流量的走向。路由分为系统路由和自定义路由。增强型跨源连接创建后，子网会自动关联系统默认路由。除了系统默认路由，您可以根据需要添加自定义路由规则，将指向目的地址的流量转发到指定的下一跳地址。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接

总条数： 644

上一页
1
...
5
6
7
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建表（废弃） - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

使用DLI的跨源认证管理数据源访问凭证 - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

创建Password类型跨源认证 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

典型场景示例：迁移Elasticsearch数据至DLI - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

管理增强型跨源连接 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

添加增强型跨源连接的路由信息 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线