搜索_华为云

DLI对接LakeFormation - 数据湖探索 DLI

步骤2：在LakeFormation管理控制台创建Catalog 数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。您可以在LakeFormation中创建并管理多个Catalog，用于不同外部集群的元数据隔离。登录LakeFormation管理控制台。选择“元数据 > Catalog”。单击“创建Catalog”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
Hudi表使用约束 - 数据湖探索 DLI

Hetu 2.1.0 0.11.0 如何判断队列支持的计算引擎版本：首先进入DLI的控制台界面，点击左侧菜单栏的”资源管理”-> ”队列管理”。在队列管理的界面筛选并选中需要查询的队列，随后点击窗口底部的窗格，展开隐藏的队列详情页面，在支持版本即可查看可用的计算引擎版本。对于SQL队列

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
程序包管理概述 - 数据湖探索 DLI

桶中，并在DLI管理控制台的“数据管理>程序包管理”中创建程序包，在作业配置时选择对应的DLI程序包。本节操作介绍在DLI管理控制台上传并管理程序包的方式。 DLI程序包功能即将停用，使用Spark3.3.1及以上版本、和Flink1.15及以上版本执行作业时，推荐直接选择OBS中的程序包。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Spark作业开发类 - 数据湖探索 DLI

如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

underlying_name 否 String 资源包在队列中的名字。 is_async 否 Boolean 是否异步上传资源包。请求示例从OBS上传python文件至DLI，并定义分组名称为gatk。 { "paths": [ "https://test.obs.xxx.com/dli_tf

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
（推荐）DLI SDK V3 - 数据湖探索 DLI

huaweicloud-sdk-java-v3 Java SDK使用指导 Java SDK视频指导 Python huaweicloud-sdk-python-v3 Python SDK使用指导 Python SDK视频指导 PHP huaweicloud-sdk-php-v3 PHP SDK使用指导

 帮助中心 > 数据湖探索 DLI > SDK参考
SHOW TABLE - 数据湖探索 DLI
SHOW TABLE - 数据湖探索 DLI

由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应可以直接在提交任务界面查看任务结果，或者在SQL作业界面，点击对应任务右侧的”更多”->”查看结果”检查任务结果。父主题： Hudi DDL语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
CREATE TABLE AS SELECT - 数据湖探索 DLI

文档。系统响应 Table创建成功，创建的Hudi表可以进入DLI控制台，在左侧菜单栏选择”数据管理”->”库表管理”，随后筛选数据库并点击名称，进入表列表查询。父主题： Hudi DML语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
安全 - 数据湖探索 DLI
安全 - 数据湖探索 DLI

安全责任共担资产识别与管理身份认证与访问控制数据保护技术审计与日志服务韧性监控安全风险故障恢复更新管理认证证书

 帮助中心 > 数据湖探索 DLI > 产品介绍
DLI SDK与API的对应关系 - 数据湖探索 DLI

SDK与API的对应关系 OBS授权表1 OBS授权相关API&SDK的对应关系表 Class Method Java Method Python Method API Authorize OBS授权 authorizeBucket - POST /v1.0/{project_i

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

DBeaver官网提供了针对不同操作系统的客户端安装包，单击下载DBeaver访问DBeaver官网下载系统对应的DBeaver客户端安装包并完成安装。推荐使用24.0.3版本的DBeaver。连接信息：表1 连接信息类别说明获取方式 DLI AKSK AK/SK认证就

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

自研SDK的使用方法。相关开发包请从华为云DLI 开发工具包（SDK）获取。 Java SDK操作指导请参考Java SDK Python SDK操作指导请参考Python SDK DLI SDK调用接口使用https进行访问，有服务端使用证书。

帮助中心 > 数据湖探索 DLI > SDK参考
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

LITERAL 时，指定字符串文字以替换空键。支持的Connector Kafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
管理Flink作业模板 - 数据湖探索 DLI

作业编辑页面。当前已有的样例模板包括如下场景：利用地址信息的维表生成订单信息宽表实时统计每天成交额、订单数和支付人数等指标统计实时点击量最高的商品自定义模板自定义模板列表显示所有的jar作业模板，自定义模板列表参数说明如表 1所示。表3 自定义模板列表参数参数参数说明

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

包文件的OBS路径，格式为：obs://桶名/文件夹路径名/包名。依赖python文件（--py-files）运行spark作业依赖的py-files。可以输入Python文件名称，也可以输入Python文件对应的OBS路径，格式为：obs://桶名/文件夹路径名/文件名。其他依赖文件（--files）

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Hudi Clustering操作说明 - 数据湖探索 DLI

此外还有一个选项可以限制组大小，以改善并行性并避免混排大量数据。将Clustering计划以avro元数据格式保存到时间线。执行Clustering：使用执行策略处理计划以创建新文件并替换旧文件。读取Clustering计划，并获得ClusteringGroups，其标记了需要进行Clustering的文件组。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
使用DataSource语法创建DLI表 - 数据湖探索 DLI

WHERE col_1 = 'Ann'; 示例4：创建DLI非分区表，并自定义列字段数据类型示例说明：创建名为table2的DLI非分区表，您可以根据业务需求自定义列子段的原生数据类型：与文字字符有关可以使用STRING、CHAR或者VARCHAR。与时间有关的可以使用TIMESTAMP、DATE。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

见表1。 # 以下参数均支持在提交作业时覆盖。 spark.yarn.isPython=true spark.pyspark.python=python3 # 当前参数值为生产环境web地址 spark.dli.user.uiBaseAddress=https://console

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
DLI作业开发流程 - 数据湖探索 DLI

DLI作业开发流程本节内容为您介绍DLI作业开发流程。创建IAM用户并授权使用DLI 如果您是企业用户，并计划使用IAM对您所拥有的DLI资源进行精细的权限管理，请创建IAM用户并授权使用DLI。具体操作请参考创建IAM用户并授权使用DLI。首次使用DLI您需要根据控制台的引导更新DL

帮助中心 > 数据湖探索 DLI > 用户指南
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

spark.sql(sql).show() } spark.close() } } Python样例代码 #!/usr/bin/python # -*- coding: UTF-8 -*- from __future__ import print_function

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南

总条数： 206

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI对接LakeFormation - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

SHOW TABLE - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

安全 - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线