搜索_华为云

DLI数据库和表类 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ join表时没有添加on条件，造成笛卡尔积查

 帮助中心 > 数据湖探索 DLI > 常见问题
Spark作业开发类 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？父主题： Spark作业相类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

志”，可以通过如下操作查看。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
SQL作业开发类 - 数据湖探索 DLI

SQL作业开发类 SQL作业使用咨询如何合并小文件 DLI如何访问OBS桶中的数据创建OBS表时怎样指定OBS路径关联OBS桶中嵌套的JSON格式数据如何创建表 count函数如何进行聚合怎样将一个区域中的DLI表数据同步到另一个区域中？ SQL作业如何指定表的部分字段进行表数据的插入

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
Spark作业运维类 - 数据湖探索 DLI

verifyBucketExists on XXXX: status [403] Spark作业运行大批量数据时上报作业运行超时异常错误使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常执行作业的用户数据库和表权限不足导致作业运行失败为什么Spark3.x的作业日志中打印找不到global_temp数据库

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

志”，可以通过如下操作查看。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Flink SQL作业类 - 数据湖探索 DLI

在Flink SQL作业中创建表使用EL表达式，作业运行提示DLI.0005错误怎么办？ Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.Il

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
创建IAM用户并授权使用DLI - 数据湖探索 DLI

如果您需要对您所拥有的DLI资源进行精细的权限管理，您可以使用统一身份认证服务（Identity and Access Management，简称IAM），具体IAM使用场景可以参考权限管理概述。如果华为云账号已经能满足您的要求，不需要创建独立的IAM用户，您可以跳过本章节，不影响您使用DLI服务的其它功能。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
SQL作业运行慢如何定位 - 数据湖探索 DLI

container_xxx_000001归档日志文件夹示例 Spark Jar作业： Spark Jar作业的归档日志文件夹以“batch”开头。图4 Spark Jar作业归档日志文件夹名示例进入归档日志文件目录，在归档日志文件目录下，下载“gc.log.*”日志。打开已下载的“gc.log.*”日志，搜索“Full

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

若计算任务超时或失败，则当次计算不收取费用。数据的存储方式（包括格式，是否压缩）对计算费用有直接的影响。假设Parquet格式文件为原CSV文件大小的1/4，则数据扫描费用为原CSV文件扫描费用的1/4。计费规则表1 数据扫描量计费规则类型资源说明数据扫描数据扫描量仅default

帮助中心 > 数据湖探索 DLI > 计费说明
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

OBS表压缩率较高怎么办？当您在提交导入数据到DLI表的作业时，如果遇到Parquet/Orc格式的OBS表对应的文件压缩率较高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.ma

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Hudi Clustering操作说明 - 数据湖探索 DLI

i表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
程序包管理概述 - 数据湖探索 DLI

程序包程序包支持删除，但不支持删除程序包组。支持上传的程序包类型： JAR：用户jar文件。 PyFile：用户Python文件。 File：用户文件。 ModelFile：用户AI模型文件。程序包管理页面表2 程序包管理参数参数参数说明分组名称程序包所属分组的名称。如果不分组，则显示“--”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
权限管理概述 - 数据湖探索 DLI

等功能，可以帮助您安全地控制华为云资源的访问。通过IAM，您可以在华为云账号中给员工创建IAM用户，并使用策略来控制他们对华为云资源的访问范围。例如您的员工中有负责软件开发的人员，您希望他们拥有DLI的使用权限，但是不希望他们拥有删除DLI等高危操作的权限，那么您可以使用IAM

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
创建Bucket索引表调优 - 数据湖探索 DLI

预先增加桶数，缺点是随着数据的增长，文件依然会持续膨胀；方法二：大粒度分区（推荐），如果使用分区表则需要根据数据增长情况来计算，例如使用年分区，这种方式相对麻烦些但是多年后表无需重新导入。方法三：数据老化，按照业务逻辑分析大的维度表是否可以通过数据老化清理无效的维度数据从而降低数据规模。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
DLI自定义策略 - 数据湖探索 DLI

DLI自定义策略如果系统预置的DLI权限，不满足您的授权要求，可以创建自定义策略。自定义策略中可以添加的授权项（Action）请参考权限策略和授权项。目前华为云支持以下两种方式创建自定义策略：可视化视图创建自定义策略：无需了解策略语法，按可视化视图导航栏选择云服务、操作、资源、条件等策略内容，可自动生成策略。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
比较函数 - 数据湖探索 DLI
比较函数 - 数据湖探索 DLI

UNKNOWN。如果需要可以定义转义字符。尚不支持转义字符。 value1 IN (value2 [, value3]* ) BOOLEAN 在给定列表 (value2, value3, …) 中存在value1返回TRUE。当列表包含NULL，如果可以找到value1则返回TRUE，否则返回UNKNOWN。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
数据保护技术 - 数据湖探索 DLI

接，这可以提高通信的安全性。 true spark.authenticate 该参数用于配置是否对Spark应用程序的组件进行身份验证。启用身份验证可以防止未授权的访问。这个参数可以设置为true来启用身份验证。 true Flink作业传输通信加密在Flink作业可以通过配置表2中的参数来开启SSL传输。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
配置多版本过期数据回收站 - 数据湖探索 DLI

e语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。回收站数据自动清理需要在OBS并行文件系统的桶上配置回收站数据的生命周期规则。具体步骤参考如下：在OBS服务控制台页面左侧选择“并行文件系统”，单击对应的文件系统名称。在“基础配置”下单击“生命周期规则”，创建或者编辑生命周期规则。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表

总条数： 1045

上一页
1
2
3
4
5
...
53
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI数据库和表类 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

SQL作业开发类 - 数据湖探索 DLI

Spark作业运维类 - 数据湖探索 DLI

Print - 数据湖探索 DLI

Flink SQL作业类 - 数据湖探索 DLI

创建IAM用户并授权使用DLI - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

比较函数 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线