搜索_华为云

Hudi常见配置参数 - 数据湖探索 DLI

置为0，会关闭此功能。由于批处理中分区中插入记录的数量众多，总会出现小文件。Hudi提供了一个选项，可以通过将对该分区中的插入作为对现有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
查询Spark作业日志 - 数据湖探索 DLI

Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
更新跨源认证（废弃） - 数据湖探索 DLI

用户安全集群的新登录密码。 krb5_conf 否 String krb5配置文件obs路径。 keytab 否 String keytab配置文件obs路径。 truststore_location 否 String truststore配置文件obs路径。 truststore_password 否

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？问题现象手动在OBS表的分区目录下上传了分区数据，但是在SQL编辑器中查询该表新增的分区数据时却查询不到。解决方案手动添加分区数据后，需要刷新OBS表的元数据信息。具体操作如下： MSCK REPAIR TABLE

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
pyspark样例代码 - 数据湖探索 DLI

css_table") jdbcDF.show() 操作结果提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Spark 2.4.5版本说明 - 数据湖探索 DLI

5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Confluent Avro Format - 数据湖探索 DLI

2版本的confluent（https://packages.confluent.io/archive/5.5/）和jdk1.8.0_232，并上传到购买的ecs集群中，然后使用下述命令解压（假设解压目录分别为confluent-5.5.2和jdk1.8.0_232）。 tar zxvf

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
导入Flink作业 - 数据湖探索 DLI
导入Flink作业 - 数据湖探索 DLI

参数名称是否必选参数类型说明 zip_file 是 String 从OBS上导入的作业zip文件路径，支持填写文件夹，导入文件夹下的所有zip文件。说明：文件夹中只能包含zip文件。 is_cover 否 Boolean 如果导入的作业与服务已有的作业同名，是否覆盖服务中已有的作业。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查询SQL作业日志 - 数据湖探索 DLI

前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI内置依赖包 - 数据湖探索 DLI

DLI内置依赖包 DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。 Spark 3.1.1 依赖包表1 Spark 3.1.1 依赖包依赖包名称 accessors-smart-1

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

file_num 指定目录的文件数量 storage_size 该目录的Size（bytes） storage_size(unit) 该目录的Size（KB） storage_path 指定目录的完整FS绝对路径 space_consumed 返回文件/目录在集群中占用的实际空间，即它考虑了为集群设置的复制因子

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

程序包使用约束限制限制项说明程序包程序包支持删除，但不支持删除程序包组。支持上传的程序包类型： JAR：用户jar文件。 PyFile：用户Python文件。 File：用户文件。 ModelFile：用户AI模型文件。增强型跨源连接约束限制更多增强型跨源连接约束限制请参考增强型跨源连接概述。

帮助中心 > 数据湖探索 DLI > 产品介绍
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入OBS表时，创建OBS表时指定的路径必须是文件夹，若建表路径是文件将导致导入数据失败。仅支持导入位于OBS路径上的原始数据。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。导入数据时只能指定一个路径，路径中不能包含逗号。当OBS桶目录下有文件夹和文件同名时，导入数据会优先指向该路径下的文件而非文件夹。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

配置dbt_project.yml文件在项目根目录下创建或编辑 dbt_project.yml文件。参考dbt_project.yml配置项目。确保步骤2：配置DBT连接DLIprofile文件中已设置该项目的profiles.yml中定义的数据源名称。图1 profile文件图2 dbt_project

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

with "Provided" scope，否则本地调试运行时会加载不到pom文件中的依赖包。具体操作以IntelliJ IDEA版本2020.2为例，参考如下：在IntelliJ IDEA界面，选择调试的配置文件，单击“Edit Configurations”。在“Run/Debug

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
导出SQL作业结果 - 数据湖探索 DLI

覆盖指定路径：当计划导出某一个结果时，您可以选择一个已有的文件路径作为输出目录，如果这个路径下已有同名文件，将会自动覆盖这个文件，即原有的作业结果会被新导出的作业结果文件所替代。覆盖指定路径方式适用于在同一个路径下保存唯一的作业结果文件的场景，即不需要旧的作业结果的场景。结果条数否

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI作业开发流程 - 数据湖探索 DLI

配置表权限。 DLI数据导入指引 DLI支持在不迁移数据的情况下，直接对OBS中存储的数据进行查询分析，您只需要将数据上传OBS即可使用DLI进行数据分析。上传数据至OBS请参考《对象存储用户指南》。当需要将来自不同源的数据进行集中存储和处理时，迁移数据至DLI可以提供一个统一的数据平台。

帮助中心 > 数据湖探索 DLI > 用户指南
Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

的依赖包，用于支持各种数据处理和分析任务。如果您上传的Jar包中包含DLI Flink运行平台中已经存在的包，则会提示Flink Jar 包冲突，导致作用提交失败。请参考DLI用户指南中提供的依赖包信息先将重复的包删除后再上传。 DLI内置依赖包请参考《数据湖探索用户指南》。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类

总条数： 341

上一页
1
...
8
9
10
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi常见配置参数 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

更新跨源认证（废弃） - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

导入Flink作业 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线