搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

sparkSession.conf.set("fs.obs.access.key", ak) sparkSession.conf.set("fs.obs.secret.key", sk) sparkSession.conf.set("fs.obs.endpoint", enpoint) sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
从Kafka读取数据写入到DWS - 数据湖探索 DLI

默认即可。所属队列：选择步骤1：创建队列中创建的队列。 Flink版本：选择1.12。保存作业日志：勾选。 OBS桶：选择保存作业日志的OBS桶，根据提示进行OBS桶权限授权。开启Checkpoint：勾选。 Flink作业编辑框中输入具体的作业SQL，本示例作业参考如下。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

默认即可。所属队列：选择步骤1：创建队列中创建的队列。 Flink版本：选择1.12。保存作业日志：勾选。 OBS桶：选择保存作业日志的OBS桶，根据提示进行OBS桶权限授权。开启Checkpoint：勾选。 Flink作业编辑框中输入具体的作业SQL，本示例作业参考如下。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

方法二：如果在提交运行作业前“运行参数”选择了“保存作业日志”，可以通过如下操作查看。登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

从控制台获取项目ID 调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目信息API获取。获取项目ID的接口为“GET https://{Endpoint}/v3/projects”，其中{Endpoint}为IAM的终端节点，可以从地区和终端节点获取。响应示例如下，例如D

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
删除队列 - 数据湖探索 DLI
删除队列 - 数据湖探索 DLI

删除队列根据实际使用情况，您可以通过删除操作释放队列。如果待删除的队列中有正在提交或正在运行的作业，将不支持删除操作。删除队列不会导致您数据库中的表数据丢失。删除队列步骤在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择待删除的队列，单击“操作”列的“删除”删除。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
开启Flink作业动态扩缩容 - 数据湖探索 DLI

在实际作业运行中，由于作业的数据流量变化，导致所需计算资源不同，造成流量较小时计算资源浪费，流量较大时计算资源不足以满足计算所需。 DLI提供的动态扩缩容功能可以根据当前作业的负载情况，例如：数据输入输出量、数据输入输出速率、反压等情况，动态的调整当前作业所用的计算资源，提升资源利用率。开启Fli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
管理Spark作业模板 - 数据湖探索 DLI

管理Spark作业模板操作场景在创建Spark作业时，您可以在已有的Spark样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。当前云平台尚未提供预置的Spark模板，但支持用户自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Flink作业模板相关 - 数据湖探索 DLI

SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。新建作业模板 DLI提供新建Flink作业模板的接口。您可以使用该接口新建一个Flink作业模板。示例代码如下： 1 2 3 4 5 6 public static void createFlink

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

Grouping Sets 可以通过一个标准的 GROUP BY 语句来描述更复杂的分组操作。数据按每个指定的 Grouping Sets 分别分组，并像简单的 group by 子句一样为每个组进行聚合。 GROUPING SETS 的每个子列表可以是：空的，多列或表达式，它们的解释方式和直接使用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Debezium Format 功能描述 Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到 Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
HAVING - 数据湖探索 DLI
HAVING - 数据湖探索 DLI

ALL：返回重复的行。为默认选项。其后只能跟*，否则会出错。 DISTINCT：从结果集移除重复的行。 groupby_expression：可以是单字段，多字段，也可以是聚合函数，字符串函数等。 operator：此操作符包含等式操作符与不等式操作符，及IN，NOT IN操作符。注意事项所

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
Hudi数据表Clean规范 - 数据湖探索 DLI

新版本 clean作业每天至少执行一次，可以2~4小时执行一次。 Hudi的MOR表和COW表都需要保证每天至少1次Clean，MOR表的Clean可以参考2.2.1.6小节和Compaction放在一起异步去执行。COW的Clean可以在写数据时自动判断是否执行。父主题： Hudi数据表管理操作规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

Redis源表功能描述创建source流从Redis获取数据，作为作业的输入数据。前提条件要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute by rand()”，可以增加处理作业的并发量。例如： insert into table table_target

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
队列赋权（废弃） - 数据湖探索 DLI

队列赋权（废弃）功能介绍该API用于与其他用户共享指定的队列，可以给用户赋使用指定的队列的权限或者收回使用权限。用户所属的用户组需要在所属区域内具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见权限策略和《统一身份认证服务用户指南》中的创建用户组。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
配额管理 - 数据湖探索 DLI
配额管理 - 数据湖探索 DLI

如果当前资源配额限制无法满足使用需要，您可以申请扩大配额。怎样查看我的配额登录管理控制台。单击管理控制台左上角的，选择区域和项目。在页面右上角，选择“资源 > 我的配额”。系统进入“服务配额”页面。图1 我的配额您可以在“服务配额”页面，查看各项资源的总配额及使用情况。

帮助中心 > 数据湖探索 DLI > 产品介绍
管理DLI资源配额 - 数据湖探索 DLI

如果当前资源配额限制无法满足使用需要，您可以申请扩大配额。怎样查看我的配额登录管理控制台。单击管理控制台左上角的，选择区域和项目。在页面右上角，选择“资源 > 我的配额”。系统进入“服务配额”页面。图1 我的配额您可以在“服务配额”页面，查看各项资源的总配额及使用情况。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

=> 'obs://bucket/path/hudi_mor/dt=2021-08-28/.*?log.*?'); call show_logfile_records(table => 'hudi_mor', log_file_path_pattern => 'obs://bu

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
创建CSS类型跨源认证 - 数据湖探索 DLI

在“集群管理”页面中，单击对应的集群名称，进入“基本信息”页面。单击“安全模式”后的下载证书，下载CSS安全集群的证书。将认证凭证上传到OBS桶。关于如何创建OBS桶并上传数据，请参考《对象存储服务快速入门》。创建跨源认证。登录DLI管理控制台。选择“跨源管理 > 跨源认证”。单击“创建”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证

总条数： 1096

上一页
1
...
30
31
32
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

删除队列 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

Flink作业模板相关 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

HAVING - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

队列赋权（废弃） - 数据湖探索 DLI

配额管理 - 数据湖探索 DLI

管理DLI资源配额 - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

创建CSS类型跨源认证 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线