搜索_华为云

DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

DWS维表功能描述创建DWS表用于与输入流连接，从而生成相应的宽表。前提条件请务必确保您的账户下已在数据仓库服务（DWS）里创建了DWS集群。如何创建DWS集群，请参考《数据仓库服务管理指南》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
DWS维表（不推荐使用） - 数据湖探索 DLI

认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据 with参数中字段只能使用单引号，不能使用双引号。语法格式 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

使用DEW管理数据源访问凭证使用DLI提交作业读写外部数据源数据时，需要妥善保存数据源的访问凭证确保数据源认证的安全性，便于DLI安全访问数据源。数据加密服务（Data Encryption Workshop, DEW）是一个综合的云上数据加密服务，为您解决数据安全、密钥安全、

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后单击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
配置多版本过期数据回收站 - 数据湖探索 DLI

配置多版本过期数据回收站功能描述在DLI数据多版本功能开启后，过期的备份数据后续在执行insert overwrite或者truncate语句时会被系统直接清理。OBS并行文件系统可以通过配置回收站加速删除操作过期的备份数据。通过在表属性添加配置“dli.multi.version

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
BI工具连接DLI方案概述 - 数据湖探索 DLI

BI工具是数据分析的强大助手，提供数据可视化、报表生成和仪表板创建等功能。 DLI服务通过对数据的融合分析处理，可以为BI工具提供标准的、有效的高质量数据，供给后续的数据统计分析使用。通过连接到DLI，BI工具可以更加灵活的使用DLI访问和分析数据，帮助企业快速做出基于数据的决策。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
跨源认证概述 - 数据湖探索 DLI

15及以上版本的跨源访问场景推荐使用数据加密服务DEW来存储数据源的认证信息，为您解决数据安全、密钥安全、密钥管理复杂等问题。具体操作请参考使用DEW管理数据源访问凭证。跨源认证用于管理访问指定数据源的认证信息。配置跨源认证后，无需在作业中重复配置数据源认证信息，提高数据源认证的安全性，便于DLI安全访问数据源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。根据该验证方式，初步定位是因为文件数据量较大，文本编辑器无法全部读取。通过执行查询

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

置规范写作业未停止情况下，禁止手动执行run schedule命令生成compaction计划。错误示例： run schedule on dsrTable 如果还有别的任务在写这张表，执行该操作会导致数据丢失。执行run compaction命令时，禁止将hoodie.run

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
查询指定资源类型的标签信息 - 数据湖探索 DLI

项目中资源类型的所有资源标签集合。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v3/{project_id}/{resource_type}/tags

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
对象存储OBS结果表 - 数据湖探索 DLI

时，uid会重新生成。文件合并 FileSink 开始支持已经提交Pending文件的合并，从而允许应用设置一个较小的时间周期并且避免生成大量的小文件。这一功能开启后，在文件转为Pending状态与文件最终提交之间会进行文件合并。这些Pending状态的文件将首先被提交为一个以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
对已创建的上传作业进行鉴权（废弃） - 数据湖探索 DLI

对已创建的上传作业进行鉴权（废弃）功能介绍该API用于检查已创建的上传作业是否合法，并授权合法作业上传数据至DLI。当前接口已废弃，不推荐使用。 URI URI格式： POST /v1.0/{project_id}/uploader/authentication 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 上传数据相关API（废弃）
Doris维表 - 数据湖探索 DLI
Doris维表 - 数据湖探索 DLI

认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据集群未启用Kerberos认证（普通模式）。 Doris的表名是区分大小写。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

RDS表有自增主键时怎样在DLI插入数据？在DLI中创建关联RDS表时，如果RDS表包含自增主键或其他自动填充字段，您在DLI中插入数据时可以采取以下措施：插入数据时省略自增字段：在DLI中插入数据时，对于自增主键字段或其他自动填充的字段，您可以在插入语句中省略这些字段。数据库会自动为这些字段生成值。例如

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
库表管理标签管理 - 数据湖探索 DLI

每个资源中的键名不能重复。单击“确定”，完成数据库标签的添加。如需删除标签，在标签列表中，单击操作列中“删除”可对选中的标签进行删除。数据表标签管理在DLI管理控制台的左侧导航栏中，单击“数据管理> 库表管理”。单击数据库名称，查看数据库下的数据表。在数据表的操作列，选择“更多> 标签”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
使用CDM迁移数据至DLI - 数据湖探索 DLI

单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：每个用户仅允许新增两个访问密钥。为保证访问密钥的安全，访问密钥仅在初次

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

否 3 Integer 维表配置，数据拉取最大重试次数。 krb_auth_name 否无 String DLI侧创建的Kerberos类型的跨源认证名称。数据类型映射 HBase以字节数组存储所有数据。在读和写过程中要序列化和反序列化数据。 Flink的HBase连接器利用HBase（Hadoop)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

自定义镜像使用流程获取DLI基础镜像。使用Dockerfile将作业运行需要的依赖（文件、jar包或者软件）打包到镜像中，生成自定义镜像。将镜像发布到SWR（容器镜像服务）中。在DLI服务作业编辑页面选择自己生成的镜像，运行作业。查看作业执行情况。获取DLI基础镜像请根据队列的架构类型选择相同类型的基础镜像。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Hudi表索引设计规范 - 数据湖探索 DLI

2GB的数据存储成列存Parquet文件后，大概的数据文件大小是150MB ~ 256MB左右。不同业务数据会有出入。而HDFS单个数据块一般会是128MB，这样可以有效地利用存储空间。数据读写占用的内存空间都是原始数据大小（包括空值也是会占用内存的），2GB在大数据计算过程中，处于单task读写可接受范围之内。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

管理Spark作业查看Spark作业的基本信息在总览页面单击“Spark作业”简介，或在左侧导航栏单击“作业管理”>“Spark作业”，可进入Spark作业管理页面。Spark作业管理页面显示所有的Spark作业，作业数量较多时，系统分页显示，您可以查看任何状态下的作业。表1

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业

总条数： 1508

上一页
1
2
3
4
5
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DWS维表 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

BI工具连接DLI方案概述 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

查询指定资源类型的标签信息 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

对已创建的上传作业进行鉴权（废弃） - 数据湖探索 DLI

Doris维表 - 数据湖探索 DLI

RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

库表管理标签管理 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线