搜索_华为云

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

将CSV格式的数据上传到对象存储服务OBS，使用DLI将CSV数据转换为Parquet数据，并将转换后的Parquet数据存储到OBS中。图1 方案简介流程指导使用DLI将CSV数据转换为Parquet数据主要包括以下步骤：步骤1：创建并上传数据。将数据上传到对象存储服务OBS。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
Elasticsearch结果表 - 数据湖探索 DLI

请务必确保您的账户下已在云搜索服务里创建了集群。如何创建集群请参考《云搜索服务用户指南》中创建集群章节。该场景作业需要运行在DLI的独享队列上，因此要与云搜索服务建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Elasticsearch结果表 - 数据湖探索 DLI

请务必确保您的账户下已在云搜索服务里创建了集群。如何创建集群请参考《云搜索服务用户指南》中创建集群章节。该场景作业需要运行在DLI的独享队列上，因此要与云搜索服务建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建Redis表 - 数据湖探索 DLI
创建Redis表 - 数据湖探索 DLI

CS）里创建了Redis类型的缓存实例。如何创建Redis类型的缓存实例请参考《分布式缓存服务用户指南》。该场景作业需要运行在DLI的独享队列上，因此要与DCS实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建维表
认证鉴权 - 数据湖探索 DLI
认证鉴权 - 数据湖探索 DLI

Content-Type: application/json X-Auth-Token: ABCDEFJ.... 您还可以通过这个视频教程了解如何使用Token认证：https://bbs.huaweicloud.com/videos/101333 。 AK/SK认证 AK/SK认证

 帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

SQL作业相关问题如何理解DLI分区表的列赋权？如何避免字符码不一致导致的乱码？ OBS表压缩率较高更多跨源连接相关问题 Flink作业如何进行性能调优？更多 Spark作业相关问题如何查看DLI Spark作业的实际资源使用情况 Spark队列操作OBS表如何设置AK/SK？

帮助中心 > 数据湖探索 DLI > 成长地图
数据湖探索简介 - 数据湖探索 DLI

用户不需要管理任何服务器，即开即用。 DLI支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。

帮助中心 > 数据湖探索 DLI > 产品介绍
程序包管理概述 - 数据湖探索 DLI

程序包管理概述在执行DLI作业前需要将UDF Jar包或Jar作业程序包上传到云平台进行统一的管理和维护。有以下两种方式管理程序包：（推荐使用）上传至OBS管理程序包：提前将对应的jar包上传至OBS桶中，在作业配置时选择对应的OBS路径。（DLI程序包功能即将停用）上传

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

1-2.3.7.1720240419835647952528832.202404250955 创建自定义镜像以tensorflow为例，说明如何将tensorflow打包进镜像，生成安装了tensorflow的自定义镜像，在DLI作业中使用该镜像运行作业。准备容器环境。请参考安

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
DWS输出流（通过OBS转储方式） - 数据湖探索 DLI

单字节，建议使用不可见字符，如\u0007。 db_obs_server 否已在数据库中创建的外部服务器，如obs_server。如何创建外部服务器，具体操作步骤可参考《数据仓库服务数据库开发指南》中创建外部服务器章节。如果编码方式为orc格式时需指定该参数。 obs_dir 是中间文件存储目录。格式为{桶名}/{目录名}，

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
DWS输出流（通过OBS转储方式） - 数据湖探索 DLI

单字节，建议使用不可见字符，如\u0007。 db_obs_server 否已在数据库中创建的外部服务器，如obs_server。如何创建外部服务器，具体操作步骤可参考《数据仓库服务数据库开发指南》中创建外部服务器章节。如果编码方式为orc格式时需指定该参数。 obs_dir 是中间文件存储目录。格式为{桶名}/{目录名}，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch 引擎的索引中。 Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

WS）里创建了DWS集群。如何创建DWS集群，请参考《数据仓库服务管理指南》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

显示访问目录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark Jar作业读取和查询OBS数据。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
创建CSS类型跨源认证 - 数据湖探索 DLI

在“集群管理”页面中，单击对应的集群名称，进入“基本信息”页面。单击“安全模式”后的下载证书，下载CSS安全集群的证书。将认证凭证上传到OBS桶。关于如何创建OBS桶并上传数据，请参考《对象存储服务快速入门》。创建跨源认证。登录DLI管理控制台。选择“跨源管理 > 跨源认证”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
count函数如何进行聚合 - 数据湖探索 DLI

count函数如何进行聚合使用count函数进行聚合的正确用法如下： SELECT http_method, count(http_method) FROM apigateway WHERE service_id = 'ecs' Group BY http_method

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？问题描述需要查看DLI的队列中作业状态为“提交中”和“运行中”的作业数，判断当前队列中的作业是否有积压。解决方案可以通过“云监控服务 CES”来查看DLI队列中不同状态的作业情况，具体操作步骤如下：在控制台搜索“云监控服务 CES”，进入云监控服务控制台。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
权限管理概述 - 数据湖探索 DLI

通过ACL赋权给其他子用户使用。作用范围：项目级服务。系统角色无具体的授权方式请参考创建IAM用户并授权使用DLI以及《如何创建子用户》和《如何修改用户策略》。 DLI权限分类 DLI服务权限分类如表2所示，其可控制的资源请参考表4。表2 DLI权限分类权限大类权限小类

 帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ Spark jar 作业一直处于“提交中”可能是队列剩余的CU量不足导致作业无法提交。查看队列的的剩余步骤如下：查看队列CU使用量。点击“云监控服务 > 云服务监控 > 数据探索湖 > 队列监控 > 队列CU使用量” 。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 707

上一页
1
2
3
4
5
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

创建Redis表 - 数据湖探索 DLI

认证鉴权 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

DWS输出流（通过OBS转储方式） - 数据湖探索 DLI

DWS输出流（通过OBS转储方式） - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

创建CSS类型跨源认证 - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

概述 - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线