搜索_华为云

Spark开源命令支持说明 - 数据湖探索 DLI

Spark开源命令支持说明本章节介绍了目前DLI对开源的Spark SQL语法的支持情况。详细的语法、参数说明，示例等信息请参考Spark官方文档。表1 DLI Spark开源命令支持说明功能描述语法示例 DLI Spark 2.4.5 DLI Spark 3.3.1 创建数据库

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

利用Dockerfile生成自定义镜像。镜像打包命令格式： docker build -t [自定义组织名称]/[自定义镜像名称]:[自定义镜像版本] --build-arg BASE_IMG=[DLI基础镜像地址] -f Dockerfile . DLI基础镜像地址为获取DLI基础镜像中的镜像地址。示例：

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
SDK的获取与安装 - 数据湖探索 DLI

安装其他服务SDK依赖。 DLI依赖SDK（例如，OBS SDK），可以通过配置华为云的maven镜像源仓库下载。（推荐）以华为镜像源作为主仓库：配置华为maven镜像源的具体方法可参见：华为开源镜像站>选择“华为SDK”>单击“HuaweiCloud SDK”。使用maven构建时，settings

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Superset连接DLI进行数据查询和分析 Superset是一个开源的数据探索和可视化平台，支持对数据进行快速、直观的探索，同时支持创建丰富的数据可视化和交互式仪表板。通过将Superset与DLI对接，用户可以访问DLI进行数据查询和分析,简化了数据访问流程，提供了数

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
区域和可用区 - 数据湖探索 DLI

资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用云服务的Region；专属Regio

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 DLI Livy简介 DLI Livy是基于开源的Apache Livy用于提交Spark作业到DLI的客户端工具。准备工作创建DLI队列。在“队列类型”中选择“通用队列”，即Spark作业的计算资源。具体请参考创建队列。准备一个li

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

基于表的权限管理，可以精细化到列权限。基于文件的权限管理。高性能性能基于软硬件一体化的深度垂直优化。大数据开源版本性能。跨源分析支持多种数据格式，云上多种数据源、ECS自建数据库以及线下数据库，数据无需搬迁，即可实现对云上多个数据源进行分析，构建企业的统一视图，帮助企业快速完成业务创新和数据价值探索。

帮助中心 > 数据湖探索 DLI > 产品介绍
Flink Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败 - 数据湖探索 DLI

SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败问题根因该问题属于开源设计缺陷。解决措施您可以尝试将retry_rejected修改为retry-rejected。父主题： Flink SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
userDefined结果表 - 数据湖探索 DLI

userDefined结果表功能描述您可通过编写代码实现将DLI处理之后的数据写入到指定的云生态或者开源生态。前提条件已编写代码实现自定义sink类：自定义sink类需要继承Flink开源类：RichSinkFunction，并指定数据类型为：Tuple2<Boolean, Row>。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

单击“确定”，驱动设置完成。步骤2：测试连接数据库在DBeaver客户端单击“数据库 > 新建数据库连接”，选择步骤1：在DBeaver新建DLI JDBC驱动中创建的数据驱动。图4 新建数据库连接单击“完成”，即可连接到DLI。在“数据库导航”栏可查看到连接的数据库信息。通过新建的连接即可对DLI执行后续的数据查询相关工作。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
更新Flink Jar作业 - 数据湖探索 DLI

Flink镜像的版本。 image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Flink镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
流生态作业开发指引 - 数据湖探索 DLI

流生态系统基于Flink和Spark双引擎，完全兼容Flink/Storm/Spark开源社区版本接口，并且在此基础上做了特性增强和性能提升，为用户提供易用、低时延、高吞吐的数据湖探索。数据湖探索的流生态开发包括云服务生态、开源生态和自拓展生态：云服务生态 DLI服务在Stream SQL中支

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

步骤4：注册ModelArts自定义镜像基于ModelArts提供的MindSpore预置镜像，并借助ModelArts命令行工具，通过加载镜像构建模板并修改Dockerfile，构建出一个新镜像，最后注册后在Notebook使用。 ModelArts命令行工具请参考ma-cli镜像构建命令介绍。基础镜像地址：swr

帮助中心 > 数据湖探索 DLI > 用户指南
Spark作业使用咨询 - 数据湖探索 DLI

数据湖探索的终端节点请参考终端节点。数据湖探索API请参考：数据湖探索API。 DLI自定义的Spark3.1.1镜像，需要把第三方依赖jar放到哪个路径下呢？ DLI自定义的Spark3.1.1镜像，建议将第三方依赖jar存放/opt/spark/jars目录。父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

务场景定义数据库和表。 · 数据目录：数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。您可以在DLI中创建并管理多个Catalog，用于不同的元数据隔离。 · 数据库：数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。数据库通常用于存储、

帮助中心 > 数据湖探索 DLI > 功能总览
新建Flink Jar作业 - 数据湖探索 DLI

Flink镜像的版本。 image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Flink镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Flink Jar作业开发基础样例 - 数据湖探索 DLI

getResource("userData/fileName") 作业特性队列为CCE队列时，显示该参数。基础型自定义镜像：选择镜像名称和镜像版本。用户可在“容器镜像服务”设置的镜像。具体操作请参考《容器镜像服务用户指南》。 Flink版本选择Flink版本前，需要先选择所属的队列。推荐选择Flink 1

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
创建批处理作业 - 数据湖探索 DLI

image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Spark镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 create_time

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
查询批处理作业详情 - 数据湖探索 DLI

image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Spark镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 req_body

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
DLI作业开发流程 - 数据湖探索 DLI

您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相

 帮助中心 > 数据湖探索 DLI > 用户指南

总条数： 359

上一页
1
2
3
4
5
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark开源命令支持说明 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

Flink Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

查询批处理作业详情 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线