搜索_华为云

创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

应jar包文件的OBS路径，格式为：obs://桶名/文件夹路径名/包名。依赖python文件（--py-files）运行spark作业依赖的py-files。可以输入Python文件名称，也可以输入Python文件对应的OBS路径，格式为：obs://桶名/文件夹路径名/文件名。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

ob.setOverWrite(Boolean.TRUE)。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。导入分区数据 DLI提供导入数据的接口。您可以使用该接口将存储在OBS中的

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
CLEANING - 数据湖探索 DLI
CLEANING - 数据湖探索 DLI

参数描述是否必填 table 需要查询表的表名，支持database.tablename格式是 clean_policy 清理老版本数据文件的策略，默认KEEP_LATEST_COMMITS 否 retain_commits 仅对KEEP_LATEST_COMMITS策略有效否

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
导出查询结果 - 数据湖探索 DLI

file_format 写入的文件格式，支持按CSV、Parquet、ORC、JSON、Avro格式。 file_format为csv时，options参数可以参考表3。注意事项通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

原因分析 Flink jar包冲突。用户提交的flink jar 与 DLI 集群中的hdfs jar包存在冲突。处理步骤 1. 将用户pom文件中的的hadoop-hdfs设置为： <dependency> <groupId>org.apache.hadoop</groupId>

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

用户自定义是否永久运行。当前示例选择为：否。拉取数据超时时间持续拉取数据多长时间超时，单位分钟。当前示例配置为：15。等待时间可选参数，超出等待时间还是无法读取到数据，则不再读取数据，单位秒。当前示例不配置该参数。消费组ID 用户指定消费组ID。当前使用MRS Kafka默认的消息组ID：“example-group1”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
类型转换函数 - 数据湖探索 DLI

单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。查询结果参考如下： +I(1,1,2022-04-02T15:00

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

相同。当data-type为sorted-set且schema-syntax为fields和array时，只能读取redis的sorted set中的值，而不能读取score。当data-type为string时，只能有一个非主键字段。当data-type为sorted-s

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
上传jar类型分组资源（废弃） - 数据湖探索 DLI

module_name 否 String 资源模块名 module_type 否 String 资源模块类型。 jar：用户jar文件; pyFile：用户python文件; file：用户文件。表4 details参数说明参数名称是否必选参数类型说明 create_time 否 Long

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
创建Kerberos跨源认证 - 数据湖探索 DLI

登录MRS Manager界面。选择“系统 > 权限 > 用户”。单击“更多 > 下载认证凭据”，保存后解压得到用户的keytab文件与krb5.conf文件。上传认证凭证到OBS桶。关于如何创建OBS桶并上传数据，请参考《对象存储服务快速入门》。创建跨源认证。登录DLI管理控制台。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
DLI作业开发流程 - 数据湖探索 DLI

性资源池并添加队列。您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在

 帮助中心 > 数据湖探索 DLI > 用户指南
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

/opt/livy/repl_2.11-jars/livy-repl_2.11-0.7.2.0107.jar 修改DLI Livy工具配置文件。编辑修改配置文件“ /opt/livy/conf/livy-client.conf”。 vi /opt/livy/conf/livy-client

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
导出Flink作业 - 数据湖探索 DLI
导出Flink作业 - 数据湖探索 DLI

ID。请求消息表2 请求参数说明参数名称是否必选参数类型说明 obs_dir 是 String OBS路径，用于保存导出的作业文件。 is_selected 是 Boolean 是否导出指定的作业。 job_selected 否 Array of Longs 当“is

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
初始化DLI客户端 - 数据湖探索 DLI

Access Key sk：账号 Secret Access Key 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
初始化DLI客户端 - 数据湖探索 DLI

Access Key sk：账号 Secret Access Key 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
查询作业详细信息 - 数据湖探索 DLI

目录已经存在，系统将返回错误信息，无法执行导出操作。 “Overwrite”：覆盖。在指定目录下新建文件，会删除已有文件。 data_path 是 String 导入或导出的文件路径。 data_type 是 String 导入或导出的数据类型（当前支持csv和json格式）。 database_name

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

单ID、订单金额等信息。维表：用户信息表，包含商品ID、商品类别信息。结果表：按商品类别统计订单销售金额数据。作业首先从订单数据源表读取实时订单数据，将订单数据流与商品商品类别信息维表关联起来，然后聚合统计订单总额，最后将统计结果写入结果表。本例中订单表作为驱动源表输入，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
新建Flink Jar作业 - 数据湖探索 DLI

用户已上传到DLI资源管理系统的资源包名，用户自定义作业的依赖文件。示例："myGroup/test.cvs,myGroup/test1.csv"。通过在应用程序中添加以下内容可访问对应的依赖文件。其中，“fileName”为需要访问的文件名，“ClassName”为需要访问该文件的类名。 ClassName

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 372

上一页
1
...
13
14
15
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Spark作业 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

CLEANING - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

上传jar类型分组资源（废弃） - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

导出Flink作业 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

查询作业详细信息 - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

Hudi - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线