搜索_华为云

作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

在提交导入作业前，可选择设置导入数据的格式，如样例所示，调用ImportJob对象的setStorageType接口设置数据存储类型为csv，数据的具体格式通过调用ImportJob对象的setCsvFormatInfo接口进行设置。在提交导入作业前，可选择设置导入数据的分区并配置

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

print(status) 在提交导入作业前，可选择通过data_type参数设置导入数据的类型，例如将data_type设置为csv。csv数据的具体格式通可过options参数设置，例如：csv的分隔符，转义符等。当OBS桶目录下有文件夹和文件同名时，加载数据会优先

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

[403] 该报错信息可能是由于OBS桶被设置为了DLI日志桶，而日志桶不能用于DLI的其他业务功能。您可以按以下操作步骤进行查询：检查该OBS桶是否被设置为了DLI日志桶。在DLI管理控制台的“全局配置 > 作业配置” 页查看对应OBS桶是否被设置为了DLI日志桶，日志桶不能用于DLI的其他业务功能中。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

Properties info); 其中，JDBC的配置项通过url传入，请参考表2配置参数。JDBC配置对象，除了在url中以分号间隔设置配置项外，还可以通过Info对象动态设置属性项，具体属性项参见表3。表2 数据库连接参数参数描述 url url的格式如下。 jdbc:dli://<endPoint>/projectId

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
在DLI控制台配置表权限 - 数据湖探索 DLI

在“用户权限信息”列表中找到需要设置权限的用户：如果用户为子用户且不是表的所有者，可进行“权限设置”。若用户为管理员用户或表的所有者，只能查看“权限信息”。在“项目权限信息”列表中找到需要设置权限的项目，进行“权限设置”。在子用户或项目的“操作”栏中单击“权限设置”，可弹出表“权限设置”对话框。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
配置Flink作业权限 - 数据湖探索 DLI

配置Flink作业权限 Flink作业权限操作场景针对不同用户，可以通过权限设置分配不同的作业，不同用户之间的作业效率互不影响，保障作业性能。管理员用户和作业的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其作业权限。给新用户设置作业权限时，该用户所在用户组的所属区域需具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Hudi常见配置参数 - 数据湖探索 DLI

org/cn/docs/0.11.0/configurations/。提交DLI Spark SQL作业时，在SQL编辑器界面右上角的”设置”->”参数设置”中可以配置Hudi参数。提交DLI Spark jar作业时，Hudi参数可以通过Spark datasource API的option来配置。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

tableIndentifier 需要执行INSERT命令的Hudi表的名称。 select query 查询语句。注意事项写入模式：Hudi对于设置了主键的表支持三种写入模式，用户可以设置参数hoodie.sql.insert.mode来指定Insert模式，默认为upsert。 hoodie.sql.insert

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
弹性资源池权限管理 - 数据湖探索 DLI

弹性资源池权限管理针对不同用户，管理员可以通过权限设置赋予各用户不同的操作权限，控制各用户弹性资源池的操作范围。注意事项管理员用户和弹性资源池的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其队列权限。给新用户设置弹性资源池权限时，该用户所在用户组的所属区域需具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
创建DLI表关联RDS - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
配置Hudi数据列默认值 - 数据湖探索 DLI

该特性允许用户在给表新增列时，设置列的默认值。查询历史数据时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。列的默认值设置要与列的类

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
资产识别与管理 - 数据湖探索 DLI

通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置统一的标签将很容易帮助您对不同的应用进行使用量分析和成本核算。对DLI来说，

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
跨源认证权限管理 - 数据湖探索 DLI

跨源认证权限管理操作场景通过跨源认证的用户授权，可设置分配不同的跨源认证，且不同用户的作业不影响跨源认证的使用。使用须知管理员用户和跨源认证的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其跨源认证权限。给新用户设置跨源认证权限时，该用户所在用户组具有Tenant Guest权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
在DLI控制台配置数据库权限 - 数据湖探索 DLI

如果用户为管理员用户，只能查看“权限信息”。在“项目权限信息”列表中找到需要设置权限的项目，进行“权限设置”。在子用户或项目的“操作”栏中单击“权限设置”，可弹出数据库“权限设置”对话框。数据库用户或项目详细的权限描述请参考表1。单击“确定”，完成权限设置。回收某用户或项目具备的所有权限回收某用户具

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例以SQL作业为例：配置参数 hoodie.tableName.consume.mode=INCREMENTAL // 必须设置当前表读取为增量读取模式 hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Flink Jar作业开发基础样例 - 数据湖探索 DLI

管理单元设置管理单元的CU数，支持设置1~4个CU，默认值为1个CU。并行数作业中每个算子的最大并行数。说明：并行数不能大于计算单元（CU数量-管理单元CU数量）的4倍。并行数最好大于用户作业里设置的并发数，否则有可能提交失败。 TaskManager配置用于设置TaskManager资源参数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

annotation 支持在SQL中设置set spark参数。 PowerBI、FineBI、SuperSet、DBT需要设置为true。否 true kyuubi.engine.dli.set.conf.sql.suffix 支持在SQL中尾端设置set spark参数。 PowerBI、DBT需要设置为true。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

SQL读取Hudi表数据。更多具体使用可参考开源社区文档：Hudi。注意事项建议Hudi作为Source表时设置限流 Hudi表作为Source表时，为防止数据上限超过流量峰值导致作业出现异常，建议设置限流（read.rate.limit），限流上限应该为业务上线压测的峰值。及时对Hudi表进行Compaction，防止Hudi

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
配置DLI程序包权限 - 数据湖探索 DLI

针对不同用户，可以通过权限设置分配不同的程序包组或程序包，不同用户之间的作业效率互不影响，保障作业性能。管理员用户、程序包组拥有程序包组的所有权限。不需要进行权限设置，且其他用户无法修改其程序包组权限。管理员用户、程序包的所有者拥有程序包的所有权限。不需要进行权限设置，且其他用户无法修改其程序包权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
终端节点 - 数据湖探索 DLI
终端节点 - 数据湖探索 DLI

端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）华北-北京四 cn-north-4 dli.cn-north-4.myhuaweicloud.com

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读

总条数： 430

上一页
1
2
3
4
5
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

作业相关 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

在DLI控制台配置表权限 - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

弹性资源池权限管理 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

跨源认证权限管理 - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

终端节点 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线