搜索_华为云

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

配置DLI委托访问授权 DLI使用过程中涉及到OBS、VPC、SMN等服务交互，首次使用DLI需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录DLI管理控制台，在左侧导航栏单击“全局配置 > 服务授权”。在委托设置页面，勾选基础使用、跨源场景、运维场景的委托权限后，单击“更新委托权限”。

帮助中心 > 数据湖探索 DLI > 快速入门
增强型跨源连接权限管理 - 数据湖探索 DLI

项目B需要访问项目A上的数据源，对应操作如下。对于项目A：使用项目A对应的账号登录DLI服务。通过对应数据源的VPC信息在DLI服务中创建增强型跨源连接“ds”。将增强型跨源连接“ds”授权给项目B。对于项目B：使用项目B对应的账号登录DLI服务。对增强型跨源连接“ds”进行绑定队列操作。（可选）设置主机信息，创建路由。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 DLI提供了Spark和Flink计算引擎，为用户提供了一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，当前，Flink计算引擎推荐版本：Flink 1.15，Spark计算引擎推荐版本： Spark 3.3.1。本节操作介绍如何升级作业的引擎版本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

配置DLI委托访问授权 DLI使用过程中涉及到OBS、VPC、SMN等服务交互，首次使用DLI需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录DLI管理控制台，在左侧导航栏单击“全局配置 > 服务授权”。在委托设置页面，勾选基础使用、跨源场景、运维场景的委托权限后，单击“更新委托权限”。

帮助中心 > 数据湖探索 DLI > 快速入门
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

储等场景。数据接入服务（Data Ingestion Service，简称DIS）为处理或分析流数据的自定义应用程序构建数据流管道，主要解决云服务外的数据实时传输到云服务内的问题。数据接入服务每小时可从数十万种数据源（如IoT数据采集、日志和定位追踪事件、网站点击流、社交媒体源

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Postgres数据库登录RDS管理控制台，在“实例管理”界面，选择已创建的RDS Postgres实例，选择操作列的“更多 > 登录”，进入数据管理服务实例登录界面。输入实例登录的用户名和密码。单击“登录”，即可进入RDS Postgres数据库并进行管理。新建数据库实例testrdsdb。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
更新管理 - 数据湖探索 DLI
更新管理 - 数据湖探索 DLI

更新管理更新漏洞 DLI云服务通过华为云安全公告密切跟踪漏洞，如Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）、Fastjson存在反序列化漏洞（CNVD-2022-40233）等。一旦发现服务模块涉及漏洞影响，会迅速通过官方解决方案升级现网更新漏洞。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
对象存储OBS结果表 - 数据湖探索 DLI

对象存储OBS结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表什么是DLI datasourcev1表和DLI datasourcev2表？ DLI datasource v1表（以下简称V1表）：DLI的Datasource表格式，建表/插入/truncate命令使用DLI自

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
DROP TABLE - 数据湖探索 DLI
DROP TABLE - 数据湖探索 DLI

EXISTS hudidb.h1; 权限需求由DLI提供的元数据服务 SQL权限： database table DROP_TABLE 无细粒度权限：dli:table:dropTable 由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
Hudi Clustering操作说明 - 数据湖探索 DLI

lustering服务来重写数据以优化Hudi数据湖文件的布局。 Clustering服务可以异步或同步运行，Clustering会添加了一种新的REPLACE操作类型，该操作类型将在Hudi元数据时间轴中标记Clustering操作。 Clustering服务基于Hudi的MV

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Hudi常见配置参数 - 数据湖探索 DLI

hudi.keygen.ComplexKeyGenerator 同步Hive表配置由DLI提供的元数据服务是一种Hive Metastore服务（HMS），因此下列参数与同步元数据服务相关。表2 同步Hive表参数配置参数描述默认值 hoodie.datasource.hive_sync

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

注意事项创建作业提交任务前，建议先开通云审计服务，用于记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。云审计服务支持的DLI操作列表详见使用CTS审计DLI服务。关于如何开通云审计服务以及如何查看追踪事件，请参考《云审计服务快速入门》。创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

Redis源表功能描述创建source流从Redis获取数据，作为作业的输入数据。前提条件创建该作业前，需要建立DLI和Redis的增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用Dockerfile将作业运行需要的依赖（文件、jar包或者软件）打包到镜像中，生成自定义镜像。将镜像发布到SWR（容器镜像服务）中。在DLI服务作业编辑页面选择自己生成的镜像，运行作业。查看作业执行情况。获取DLI基础镜像表1 获取DLI基础镜像镜像类型架构 URL

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

JSON Format 功能描述 JSON Format 能读写 JSON 格式的数据。当前，JSON schema 是从 table schema 中自动推导而得的。支持的Connector Kafka Upsert Kafka Elasticsearch 参数说明表1 参数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Flink作业推荐配置指导 - 数据湖探索 DLI

、抛出异常或者保存脏数据。选择“运行队列”。提交并运行作业。登录云监控服务CES控制台，在“云服务监控”列表中找到“数据湖探索”服务。在Flink作业中找到目标作业，单击“创建告警规则”。图6 云服务监控图7 创建告警规则 DLI 为Flink作业提供了丰富的监控指标，用

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 DLI整理了Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异，便于您了解Spark版本升级后SQL队列上运行的作业在适配新版本引擎时的影响。 histogram_numeric函数的返回值的类型不同

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比

总条数： 740

上一页
1
...
27
28
29
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

增强型跨源连接权限管理 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

更新管理 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DROP TABLE - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线