搜索_华为云

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.partitions参数值来解决缓冲区不足问题。具体该参数设置步骤如下：登录DLI管理控制台，单击“作业管理 >

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
在Spark SQL作业中使用UDF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。创建UDF函数。登录DLI管理控制台，单击“SQL编辑器”，执

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU 当前扩缩容策略支持的最大CU数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hudi Compaction操作说明 - 数据湖探索 DLI

入延迟，因而进行不阻塞摄入的异步Compaction很有意义。如何执行Compaction 仅执行Schedule Spark SQL（设置如下参数，写数据时触发） hoodie.compact.inline=true hoodie.schedule.compact.only.inline=true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
SHOW PARTITIONS - 数据湖探索 DLI
SHOW PARTITIONS - 数据湖探索 DLI

PARTITIONS [catalog_name.][db_name.]table_name [PARTITION (partitionSpecs)]; 描述这个表达式用于列出指定的的所有分区。示例 SHOW PARTITIONS test PARTITION(hr = '12'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

在“SQL编辑器”页面创建队列。在DLI管理控制台的左侧导航栏中，选择“SQL编辑器”。单击“队列”切换到该页签，单击右侧的创建队列。在“购买队列”页面，参见表2设置相关参数。表2 参数说明参数名称描述计费模式包年/包月该计费模式的队列为专属队列。按需计费：建议购买cu时套餐包享受优惠。区域

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 1 2 3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 DWS结果表中不允许指定所有属性为PRIMARY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DWS Connector概述 - 数据湖探索 DLI

您可以通过自定义函数（UDF）的方式使用DWS自研的DWS Connector。自定义函数操作请参考自定义函数。 DWS-Connector的使用方法请参考dws-connector-flink。（废弃，不推荐使用）DLI服务的DWS Connector：支持自定义sink和sourc

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

上述示例中，因为CSS安全集群关闭了https访问，所以“es.net.ssl”参数要设置为“false”。“es.net.http.auth.user”以及“es.net.http.auth.pass”为创建集群时设置的账号和密码。插入数据 1 sparkSession.sql("insert

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

登录DLI管理控制台，在左侧导航栏单击“跨源管理”，在跨源管理界面，单击“增强型跨源”，单击“创建”。在增强型跨源创建界面，配置具体的跨源连接参数。具体参考如下。连接名称：设置具体的增强型跨源名称。本示例输入为：dli_kafka。弹性资源池：选择步骤1：创建队列中已经创建的队列。虚拟私有云：选择Kafka的虚拟私有云。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
最佳实践内容概览 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据使用DLI将CSV数据转换为Parquet数据的方法。使用DLI分析电商BI报表以某商城真实的用户、商品、评论数据（脱敏后）为基础，介绍使用DLI进行电商BI报表分析的方法。使用DLI分析账单消费数据以DLI实际消费数据为样例，介绍使用DLI进行账单分析和成本优化的措施。

帮助中心 > 数据湖探索 DLI > 最佳实践
Hudi Archive操作说明 - 数据湖探索 DLI

多会导致性能问题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发） hoodie.archive.automatic=true hoodie.keep.max.commits=30

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

* from ... 在“数据湖探索管理控制台>SQL编辑器”页面，单击编辑窗口右上角“设置”，可配置参数。通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
数据库相关 - 数据湖探索 DLI
数据库相关 - 数据湖探索 DLI

nt client) throws DLIException { //通过调用DLIClient对象的createDatabase方法创建数据库 String dbName = "databasename"; Database database = client

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

Flink作业相关前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化，参考队列相关完成队列创建等操作。新建SQL作业 DLI提供新建Flink SQL作业的接口。您可以使用该接口新建Flink SQL作业并提交到DLI，示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

eckPoint间隔为分钟级。 checkpoint容忍失败次数设置，execution.checkpointing.tolerable-failed-checkpoints。 Flink On Hudi作业建议设置checkpoint容忍次数多次，如100。若需要使用Hive风格分区，需同时配置如下参数：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
管理队列 - 数据湖探索 DLI
管理队列 - 数据湖探索 DLI

管理队列查看队列的基本信息队列权限管理分配队列至项目创建消息通知主题队列标签管理队列属性设置测试地址连通性删除队列变更普通队列规格普通队列弹性扩缩容设置普通队列的弹性扩缩容定时任务修改普通队列的网段父主题：创建弹性资源池和队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
停止计费 - 数据湖探索 DLI
停止计费 - 数据湖探索 DLI

> 我的资源”。进入我的资源页面。在搜索条件中选择按资源ID搜索，并输入资源ID，单击图标搜索资源信息，并记录资源所在区域。按照图1的方法复制资源名称。图1 查找资源名称根据资源ID在云服务的控制台查找资源并删除。在控制台中选择“大数据 > 数据湖探索 DLI”，并切换选择资源所在区域。

帮助中心 > 数据湖探索 DLI > 计费说明

总条数： 547

上一页
1
...
19
20
21
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

SHOW PARTITIONS - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

最佳实践内容概览 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

数据库相关 - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

管理队列 - 数据湖探索 DLI

停止计费 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线