搜索_华为云

Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
重命名分区（只支持OBS表） - 数据湖探索 DLI

partition_specs RENAME TO PARTITION partition_specs; 关键字 PARTITION：分区。 RENAME：重命名。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。注意事项

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

服务以您的身份访问DEW服务。图1 DLI云服务委托 DLI委托在使用DLI前，为了确保正常使用DLI的功能，建议先进行DLI委托权限设置。 DLI默认提供以下类型的委托：dli_admin_agency、dli_management_agency、dli_data_clea

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

在“程序包管理”页面，单击右上角“创建”可创建程序包。在“创建程序包”对话框，配置如下参数：包类型：PyFile。 OBS路径：选择1.aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
普通队列弹性扩缩容 - 数据湖探索 DLI

在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择需要扩容的队列，单击“操作”列“更多”中的“弹性扩缩容”。在“弹性扩缩容”页面，“变更方式”选择“扩容”，设置扩容的CU值。图1 弹性扩容确认费用无误后，单击“确定”。弹性缩容当计算业务较小，不需要那么大的队列规格时，可以通过手动变更队列规格来缩容当前队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

\"age\":\"23\"}")); Dataset<Row> dataFrame = sqlContext.read().json(javaRDD); 设置连接参数 String url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin";

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
Hudi数据表Compaction规范 - 数据湖探索 DLI

paction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何合理的设置这个周期，周期如果太短意味着Spark任务可能会空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU 当前扩缩容策略支持的最大CU数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
数据权限列表 - 数据湖探索 DLI

命名表分区） ALTER_TABLE_RECOVER_PARTITION（恢复表分区） ALTER_TABLE_SET_LOCATION（设置分区的路径） SHOW_PARTITIONS（显示所有分区） SHOW_CREATE_TABLE（查看建表语句） TABLE上可以赋权/回收的权限：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
Hudi数据表Archive规范 - 数据湖探索 DLI

automatic默认为true)。 Archive操作并不是每次写数据时都会触发，至少需要满足以下两个条件： Hudi表满足hoodie.keep.max.commits设置的阈值。如果是Flink写hudi至少提交的checkpoint要超过这个阈值；如果是Spark写hudi，写Hudi的次数要超过这个阈值。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-mongo").getOrCreate() 设置连接参数 1 2 3 4 5 6 url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
查看增强型跨源连接的基本信息 - 数据湖探索 DLI

选择“跨源管理 > 增强型跨源”。进入增强型跨源连接列表页面，选择您需要查看的增强型跨源连接。在列表页面的右上方单击可以自定义显示列，并设置表格内容显示规则、操作列显示规则。在列表页面上方的搜索区域，您可以名称和标签筛选需要的增强型跨源连接。单击查看增强型跨源连接详细信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
导出查询结果 - 数据湖探索 DLI

file_format为csv时，options参数可以参考表3。注意事项通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute by rand()”，可以增加处理作业的并发量。例如：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

DISTINCT] query ALL和DISTINCT表示是否返回包含重复的行。ALL返回所有的行；DISTINCT返回只包含唯一的行。如果未设置，默认为DISTINCT。 INTERSECT query INTERSECT [DISTINCT] query INTERSECT仅返回

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

jar包冲突。用户提交的flink jar 与 DLI 集群中的hdfs jar包存在冲突。处理步骤 1. 将用户pom文件中的的hadoop-hdfs设置为： <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>h

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Hive方言 - 数据湖探索 DLI
Hive方言 - 数据湖探索 DLI

Flink目前支持两种SQL 方言: default 和 hive。您需要先切换到Hive 方言，然后才能使用Hive语法编写。下面介绍如何使用SQL设置方言。您可以为执行的每个语句动态切换方言。无需重新启动会话即可使用其他方言。语法格式 SQL 方言可以通过 table.sql-dialect

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
trans - 数据湖探索 DLI
trans - 数据湖探索 DLI

作为key的列类型保持不变，其余所有的列是STRING类型。拆分成的行数以个数多的数组为准，不足的补NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示例。创建表salary，并添加数据，命令示例如下： CREATE EXTERNAL TABLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
创建全局变量 - 数据湖探索 DLI

下划线开头，且不能超过128字符。 var_value 是 String 全局变量值。 is_sensitive 否 Boolean 是否设置为敏感变量。默认为“false”。响应消息表3 响应参数说明参数名称是否必选参数类型说明 is_success 否 Boolean

帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
pyspark样例代码 - 数据湖探索 DLI

StructField("value", DoubleType())]) 设置数据 1 dataList = sparkSession.sparkContext.parallelize([("aaa", "abc",

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
存储计费 - 数据湖探索 DLI
存储计费 - 数据湖探索 DLI

总览”的“欠费金额”查看，华为云将在您充值时自动扣取欠费金额。如果您在宽限期内仍未支付欠款，那么就会进入保留期，资源状态变为“已冻结”，您将无法对处于保留期的按需计费资源执行任何操作。保留期到期后，若您仍未支付账户欠款，那么资源将被释放，数据无法恢复。华为云根据客户等级定义了不同客户的宽限期和保留期时长。

帮助中心 > 数据湖探索 DLI > 计费说明

总条数： 794

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Avro Format - 数据湖探索 DLI

重命名分区（只支持OBS表） - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

数据权限列表 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

查看增强型跨源连接的基本信息 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

Hive方言 - 数据湖探索 DLI

trans - 数据湖探索 DLI

创建全局变量 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

存储计费 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线