搜索_华为云

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

将CSV格式的数据上传到对象存储服务OBS，使用DLI将CSV数据转换为Parquet数据，并将转换后的Parquet数据存储到OBS中。图1 方案简介流程指导使用DLI将CSV数据转换为Parquet数据主要包括以下步骤：步骤1：创建并上传数据。将数据上传到对象存储服务OBS。

帮助中心 > 数据湖探索 DLI > 最佳实践
数据保护技术 - 数据湖探索 DLI

置。 true spark.network.sasl.serverAlwaysEncrypt 该参数用于配置服务器端是否使用加密来与客户端通信。当设置为true时，服务器将要求所有客户端使用加密连接，这可以提高通信的安全性。 true spark.authenticate 该参数

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？问题现象手动在OBS表的分区目录下上传了分区数据，但是在SQL编辑器中查询该表新增的分区数据时却查询不到。解决方案手动添加分区数据后，需要刷新OBS表的元数据信息。具体操作如下： MSCK REPAIR TABLE

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？场景概述 DLI Flink作业具有高可用保障能力，通过设置“异常自动重启”功能，可在周边服务短时故障恢复后自动重启。操作步骤登录DLI控制台，选择“作业管理”>“Flink作业”。在Flink作业编辑页面，勾选“异常自动重启”。例如，图1所示。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
查询分组资源列表（废弃） - 数据湖探索 DLI

"UPLOADING"表示正在上传。 "READY"表示模块包已上传,。 "FAILED"表示模块包上传失败。 resources 否 Array of Strings 该模块包含的资源包名列表。 description 否 String 模块描述。 create_time 否 Long 模块上传的unix时间戳。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

Duration flush 缓冲操作的间隔。可以设置为'0'来禁用它。注意，'sink.bulk-flush.max-size'和'sink.bulk-flush.max-actions'都设置为'0'的这种 flush 间隔设置允许对缓冲操作进行完全异步处理。 sink.bulk-flush

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在创建的新数据源配置界面中，输入Kyuubi服务器的相关信息。数据库名称：本例输入DLI数据库名称。服务器地址：输入Kyuubi服务器的弹性公网IP地址。端口号：Kyuubi服务监听的端口，使用Hive Thrift协议，默认端口10009。用户名和密码：按需配置Kyuubi服务器用户名和密码。按需配置其他高级选项，然后保存配置。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在创建的新数据源配置界面中，输入Kyuubi服务器的相关信息。数据库名称：本例输入DLI数据库名称。服务器地址：输入Kyuubi服务器的弹性公网IP地址。端口号：Kyuubi服务监听的端口，使用Hive Thirft协议，默认端口10009。用户名和密码：按需配置Kyuubi服务器用户名和密码。按需配置其他高级选项，然后保存配置。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

单击所建桶“dli-test-obs01”，进入“对象”页面。选择左侧列表中的“对象”，选择“上传对象”，将需要上传的文件，例如“flink-examples.jar”上传到指定目录，单击“确定”。本例文件上传成功后，路径为“obs://dli-test-obs01/flink-examples

帮助中心 > 数据湖探索 DLI > 快速入门
数据湖探索简介 - 数据湖探索 DLI

用户不需要管理任何服务器，即开即用。 DLI支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。

帮助中心 > 数据湖探索 DLI > 产品介绍
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个SQL设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

单击所建桶“dli-test-obs01”，进入“对象”页面。选择左侧列表中的“对象”，选择“上传对象”，将需要上传的文件，例如“spark-examples.jar”上传到指定目录，单击“确定”。本例文件上传成功后，文件路径为“obs://dli-test-obs01/spark-examples

帮助中心 > 数据湖探索 DLI > 快速入门
设置Flink作业优先级 - 数据湖探索 DLI

在“自定义配置”中输入如下语句，先开启动态扩缩容功能，再设置作业优先级。对于Flink作业，必须先设置flink.dli.job.scale.enable=true开启动态扩缩容功能，再设置作业优先级。开启动态扩缩容的更多参数设置请参考开启Flink作业动态扩缩容。 flink.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建批处理作业 - 数据湖探索 DLI

jars 否 Array of Strings 用户已上传到DLI资源管理系统的类型为jar的程序包名。也支持指定OBS路径，例如：obs://桶名/包名。 pyFiles 否 Array of Strings 用户已上传到DLI资源管理系统的类型为pyFile的资源包名。也支

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
设置Spark作业优先级 - 数据湖探索 DLI

设置Spark作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

的依赖包，用于支持各种数据处理和分析任务。如果您上传的Jar包中包含DLI Flink运行平台中已经存在的包，则会提示Flink Jar 包冲突，导致作用提交失败。请参考DLI用户指南中提供的依赖包信息先将重复的包删除后再上传。 DLI内置依赖包请参考《数据湖探索用户指南》。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Elasticsearch结果表 - 数据湖探索 DLI

12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。请务必确保您的账户下已在云搜索服务里创建了集群。如何创建集群请参考《云搜索服务用户指南》中创建集群章节。该场景作业需要运行在DLI的独享队列上，因此要与云搜索服务建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

用户自定义UDF文件，在后续作业中可以调用插入Jar包中的自定义函数。 UDF Jar包的管理方式：上传OBS管理程序包：提前将对应的jar包上传至OBS桶中。并在此处选择对应的OBS路径。上传DLI管理程序包：提前将对应的jar包上传至OBS桶中，并在DLI管理控制台的“数据管理>程序包管理”中创建程序包，具体操作请参考创建DLI程序包。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

从Oracle官网下载并安装JDK1.8版本安装包。本例使用jdk-8u261-linux-x64.tar.gz。将jdk上传到linux服务器对应的目录下并执行解压命令，此处上传到/usr/local目录下。 sudo tar -xzf jdk-8u261-linux-x64.tar.gz

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

用户获取Spark作业委托临时凭证本操作介绍获取Spark Jar作业委托临时凭证的操作方法。方案2：Spark Jar作业设置获取AK/SK 获取结果为AK/SK时，设置如下：代码创建SparkContext val sc: SparkContext = new SparkContext()

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 533

上一页
1
2
3
4
5
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线