搜索_华为云

Spark作业使用咨询 - 数据湖探索 DLI

如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。查看Spark内置依赖包的版本请参考内置依赖包。资源包管理中的包是否能够下载? 资源包仅提供托管服务，不提供下载功能。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询所有队列 - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。表2 query参数参数名称是否必选参数类型说明 queue_type 否 String 队列的类型，有如下三种类型： sql：查询SQL队列类型的队列。 general：查询通用队列类型的队列。 all：查询所有类型的队列。如果不指定，默认为sql。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 DLI Flink作业提交或运行失败时，对应生成的作业日志保存方式，包含以下三种情况：提交失败，只会在submit-client下生成提交日志。运行失败且在1分钟内的日志，可以直接在管理控制台页面查看，具体如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
获取全部集群信息（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。请求消息无请求参数。响应消息返回码成功返回200。响应参数表2 响应参数说明参数是否必选参数类型说明 create_time 是 Long 创建集群的时间。 description 否 String 集群的描述信息。 cu_count

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
初始化DLI客户端 - 数据湖探索 DLI

dliInfo); 参数说明及获取方式参数说明 ak：账号 Access Key sk：账号 Secret Access Key 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
创建DLI表关联CSS - 数据湖探索 DLI

X版本时，该参数只需要填写index即可。 pushdown CSS的下压功能是否开启，默认为“true”。包含大量IO传输的表在有where过滤条件的情况下能够开启pushdown降低IO。 strict CSS的下压是否是严格的，默认为“false”。精确匹配的场景下比pushdown降低更多IO。 batch

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
创建DLI表关联DCS - 数据湖探索 DLI

非必填。用于指定schema中的某个字段作为Redis中key的标识。在插入数据时与参数“table”配合使用。 partitions.number 读取数据时，并发task数。 scan.count 每批次读取的数据记录数，默认为100。如果在读取过程中，redis集群中的CPU使用率还有提升空间，可以调大该参数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
创建DLI表关联HBase - 数据湖探索 DLI

wkey指定的字段只有一个的时候，该字段的类型可以是支持的所有数据类型，并且不需要填写长度。在组合Rowkey的场景中插入Rowkey数据时，如果某个属性的实际数据的长度比属性作为Rowkey时指定的长度要短，则会在数据后面补'\0'字符；如果某个属性的实际数据的长度比属性作

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
对象存储OBS结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用Hive语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS语句将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不论在创建t

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
弹性资源池规格变更 - 数据湖探索 DLI

弹性资源池规格变更使用场景包年包月的弹性资源池CU数在规格（包周期CU）的范围内使用包年包月计费，超过规格（包周期CU）的部分则按弹性资源池CU时计费的方式计费，您可以根据实际CU的使用情况通过规格变更来使得计费更优惠。例如，当前弹性资源池的规格（包周期CU）为64CU，实际使

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
max - 数据湖探索 DLI
max - 数据湖探索 DLI

指定表名。必须对表有读权限。返回值说明返回STRING类型的值。返回最大的一级分区的值。如果只是用alter table的方式新加了一个分区，但是此分区中并无任何数据，则此分区不会做为返回值。示例代码例如 table1 是分区表，该表对应的分区为20120801和20120802，且都

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
DLI自定义策略 - 数据湖探索 DLI

策略。IAM最新提供的一种细粒度授权的能力，可以精确到具体服务的操作、资源以及请求条件等。 Effect 作用。包含两类：允许（Allow）和拒绝（Deny），既有Allow又有Deny的授权语句时，遵循Deny优先的原则。 Action 授权项，指对资源的具体操作权限，不超过100个，如图1所示。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

随机变量的概率分布范围分为几个等份的数值点，常用的有中位数（即二分位数）、四分位数、百分位数等。quantile digest是一个分位数的集合，当需要查询的数据落在某个分位数附近时，就可以用这个分位数做为要查询数据的近似值。它的精度可以调节，但更高精度的结果会带来空间的昂贵开销。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
FileSystem结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

Flink作业”，在作业列表中选择待操作的Flink OpenSource SQL作业。单击操作列的“编辑”，进入作业编辑页面。在右侧的“运行参数”配置区域，选择新的Flink版本。使用Flink 1.15以上版本的引擎执行作业时，需要在自定义配置中配置委托信息，其中key为"flink.dli.job.agency

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

业运行超时异常错误，通常是由于作业的资源配置不足、数据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。例如访问DWS大批量数据库数据时设置并发数，启动多任务的方式运行，避免作业运行超时。具体并发设

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
创建消息通知主题 - 数据湖探索 DLI

创建消息通知主题操作场景确定创建消息通知主题后，您可在消息通知服务的“主题管理”页面中，对相应的主题添加订阅，选择不同方式（例如短信或者邮件等）进行订阅。订阅成功后，如果作业失败，则系统将会自动发送消息到您指定的订阅终端。如果作业提交1分钟内立即失败，通常不会触发消息通知。如

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
存储计费 - 数据湖探索 DLI
存储计费 - 数据湖探索 DLI

按照存储在DLI服务中的数据存储量（单位为“GB”）收取存储费用。计费周期按需计费DLI数据存储每一个小时整点结算一次费用（以UTC+8时间为准），结算完毕后进入新的计费周期。计费的起点以DLI表的创建时间点为准，终点以DLI表删除时间为准。资源从创建到启动需要一定时长，按需计费的数据存

 帮助中心 > 数据湖探索 DLI > 计费说明

总条数： 1281

上一页
1
2
3
4
5
...
65
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark作业使用咨询 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

获取全部集群信息（废弃） - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

弹性资源池规格变更 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

max - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

创建消息通知主题 - 数据湖探索 DLI

存储计费 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线