搜索_华为云

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理 > 程序包管理”。在“程序包管理”页面，单击右上角“创建”可创建程序包。在“创建程序包”对话框，配置如下参数：包类型：PyFile。 OBS路径：选择1.aegg包所在的OBS路径。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

这个函数里面有delete 和 insert SAA_OUTBOUND_ORDER_CUST_SUM的操作。处理步骤修改作业逻辑，避免对同一张表并发执行insert overwrite操作。父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
自定义函数类型推导 - 数据湖探索 DLI

自定义函数类型推导操作场景类型推导包含了验证输入值、派生参数和返回值数据类型。从逻辑角度看，Planner需要知道数据类型、精度和小数位数；从 JVM 角度来看，Planner 在调用自定义函数时需要知道如何将内部数据结构表示为JVM对象。 Flink 自定义函数实现了自动的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

schema) // 步骤3：配置写入的表名和OBS路径 val databaseName = "default" val tableName = "hudi_table" val basePath = "obs://bucket/path/hudi_table"

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
删除队列 - 数据湖探索 DLI
删除队列 - 数据湖探索 DLI

根据实际使用情况，您可以通过删除操作释放队列。如果待删除的队列中有正在提交或正在运行的作业，将不支持删除操作。删除队列不会导致您数据库中的表数据丢失。删除队列步骤在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择待删除的队列，单击“操作”列的“删除”删除。图1 删除队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表如果需要关联OBS桶中嵌套的JSON格式数据，可以使用异步模式创建表。以下是一个示例的建表语句，展示了如何使用 JSON 格式选项来指定 OBS 中的路径： create table tb1 using json options(path

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
查询作业模板列表 - 数据湖探索 DLI

用户已上传到DLI资源管理系统的类型为jar的程序包名。也支持指定OBS路径，例如：obs://桶名/包名。 pyFiles Array of Strings 用户已上传到DLI资源管理系统的类型为pyFile的资源包名。也支持指定OBS路径，例如：obs://桶名/包名。 files Array of

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
查询所有作业 - 数据湖探索 DLI

系统提示信息，执行成功时，信息可能为空。 job_count 是 Integer 作业总个数。 jobs 是 Array of Objects 作业信息。具体参数请参见表4。表4 jobs参数参数名称是否必选参数类型说明 job_id 是 String 作业ID。 job_type

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
创建并提交Spark作业 - 数据湖探索 DLI

创建批处理作业：创建并提交Spark批处理作业。查询批处理作业状态：查看批处理作业状态。查询批处理作业日志：查看批处理作业日志。操作步骤创建弹性资源池elastic_pool_dli 接口相关信息 URI格式：POST /v3/{project_id}/elastic-resource-pools

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

x访问元数据时，DataSource语法创建avro类型的OBS表创建失败问题描述使用Spark访问元数据时，DataSource语法创建avro类型的OBS表创建失败。图1 avro类型的OBS创建失败根因分析当前Spark2.3.x不支持创建avro类型的OBS表，Spark2.4.x及以上的版本支持avro类型的OBS表。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

Overwrite) .save() 表1 redis操作参数参数描述 host 需要连接的redis集群的IP。获取方式为：登录华为云官网，之后搜索redis，进入“分布式缓存服务”,接着选择“缓存管理”，根据主机名称需要的IP，可选择其中任意一个IP进行复制即可（其中也包含了port信息），请参考图1。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

sink算子的并行度。默认情况下，并行度是由框架决定，即与上游并行度一致。分区扫描功能介绍为了加速Source任务实例中的数据读取，Flink为JDBC表提供了分区扫描功能。以下参数定义了从多个任务并行读取时如何对表进行分区。 scan.partition.column：用于对输入进行分区的列

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

Q：作业运行正常，但是DWS中一直没有数据怎么办？ A：请分别排查以下场景：查看jobmanager和taskmanager的日志是否有错误抛出。日志查看操作步骤如下：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机IP信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Elasticsearch结果表 - 数据湖探索 DLI

需和“username”参数同时配置。 certificate 否无 String Elasticsearch集群的证书在obs中的位置。例如：obs://bucket/path/CloudSearchService.cer 仅在开启安全模式，且开启https，且未使用其他跨源认证的场景下下需要配置该参数。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hudi Clean操作说明 - 数据湖探索 DLI

Hudi Clean操作说明什么是Clean Cleaning用于清理Hudi表不再需要的老版本数据文件 (parquet文件或者log文件)，减轻存储压力，提升list操作效率。如何执行Clean 写完数据后clean Spark SQL（设置如下参数，随后执行任意写入SQL时，在满足条件时触发）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
DELETE - 数据湖探索 DLI
DELETE - 数据湖探索 DLI

[ WHERE boolExpression] 参数描述表1 DELETE参数参数描述 tableIdentifier 在其中执行删除操作的Hudi表的名称。 boolExpression 删除项的过滤条件示例示例1： delete from h0 where column1

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
file - 数据湖探索 DLI
file - 数据湖探索 DLI

file_path 格式无。说明文件路径，该路径是OBS路径。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

"driverCores":2, "driverMemory":"7G", "catalog_name": "dli" } Java样例代码本示例操作步骤采用Java进行编码，具体完整的样例代码参考如下： package com.huawei.dli.demo; import org.apache

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南

总条数： 698

上一页
1
...
23
24
25
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

自定义函数类型推导 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

删除队列 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

DELETE - 数据湖探索 DLI

file - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线