-
Java开发环境配置 - 数据湖探索 DLI
8或更高版本。考虑到后续版本的兼容性,推荐使用1.8版本。 在Java运行环境配置好的情况下,打开windows的命令行,执行命令Java -version,可以检查版本信息。 操作步骤 安装JDK。从Oracle官网下载并安装JDK1.8版本安装包。 配置环境变量,在“控制面板”选择“系统”属性,单击“环境变量”。
-
程序包组和程序包权限管理 - 数据湖探索 DLI
程序包组 查询权限,用户可以查看该用户创建的程序包组以及该组下的所有程序包,也可以查看被赋权任意权限的程序包组。 程序包组作为一个单元,用于管理行为一致的程序包,所以只能赋权给用户程序包组相关权限。 程序包 查询权限,用户可以查看该用户创建的程序包,也可以查看被赋权任意权限的程序包。
-
创建程序包 - 数据湖探索 DLI
说明: 标签的键的最大长度为128个字符,标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格,不能以_sys_开头。 标签值:在输入框中输入标签值。 说明: 标签值的最大长度为255个字符,标签的值可以包含任意语种字母、数字、空格和_ . : =+-@
-
数据湖队列什么情况下是空闲状态? - 数据湖探索 DLI
数据湖队列什么情况下是空闲状态? 队列空闲状态是指在DLI 作业管理中,该队列下均无SQL 作业运行,或者 Flink 作业运行、Spark 作业运行。 即一个自然小时内无作业运行,该自然小时为空闲状态。不会进行计费。 通常按需计费的队列,在空闲1h后计算资源会被释放,再次使用时
-
计费概述 - 数据湖探索 DLI
成本,将资源消耗控制在一定范围内。如果您有短时的专属资源需求,也可以在购买按需队列时勾选专属资源模式,享受资源专属。 生产项目:在此项目下,您的作业相对稳定(经过开发调试再上线),建议您使用包年/包月计费模式,可以更优惠。同时,按需计费的队列,在空闲1小时后(队列空闲是指该队列上
-
弹性资源池权限管理 - 数据湖探索 DLI
弹性资源池权限管理 针对不同用户,管理员可以通过权限设置赋予各用户不同的操作权限,控制各用户弹性资源池的操作范围。 注意事项 管理员用户和弹性资源池的所有者拥有所有权限,不需要进行权限设置且其他用户无法修改其队列权限。 给新用户设置弹性资源池权限时,该用户所在用户组的所属区域需具有Tenant
-
停止计费 - 数据湖探索 DLI
对于包年/包月计费模式的资源,例如包年/包月的弹性资源池、包年/包月的队列等,用户在购买时会一次性付费,服务将在到期后自动停止使用。 如果在计费周期内不再使用包年/包月资源,您可以执行退订操作,系统将根据资源是否属于五天无理由退订、是否使用代金券和折扣券等条件返还一定金额到您的账户。详细的退订规则请参见云服务退订规则概览。
-
数据库权限管理 - 数据湖探索 DLI
数据库权限管理 数据库权限操作场景 针对不同用户,可以通过权限设置分配不同的数据库权限。 管理员用户和数据库的所有者拥有所有权限,不需要进行权限设置且其他用户无法修改其数据库权限。 给新用户设置数据库权限时,该用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant
-
弹性资源池的实际CUs、CU范围、规格的含义 - 数据湖探索 DLI
弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。 弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。 弹性资源池至少可以满足弹性资源池中所有队列按最小CU运行,尽量满足队列按最大CU运行。 规格:购买弹性资源池时选择的CU范围的最小值即弹性资源池规格。规格是
-
弹性扩缩容定时任务 - 数据湖探索 DLI
会存在资源不足的情况;而如果购买的队列规格比较大,又可能会存在资源浪费的情况。 基于以上场景,DLI提供了队列弹性扩缩容定时任务功能。用户可以根据自己的业务周期或者使用情况,基于现有队列规格,在不同的时间或者周期内设置不同的队列大小,以满足自己的业务需求,节约成本。 使用弹性扩缩容定时任务注意事项
-
使用场景二:配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI
时间段内也有固定周期的作业请求也需要保障。 针对上述场景,弹性资源池上可以添加两个队列,队列test_a用于运行A部门的作业任务,队列test_b运行B部门的作业任务。两个部门请求量大的任务时间段固定,则可以在test_a和test_b队列上分别添加两个时间段00:00-09:0
-
Flink作业如何进行性能调优 - 数据湖探索 DLI
压状态和时延可以通过Flink UI或者作业任务列表查看,一般情况下反压和高时延成对出现: 图2 反压状态和时延 性能分析 由于Flink的反压机制,流作业在存在性能问题的情况下,会导致数据源消费速率跟不上生产速率,从而引起Kafka消费组的积压。在这种情况下,可以通过算子的反压和时延,确定算子的性能瓶颈点。
-
修改队列网段 - 数据湖探索 DLI
修改队列网段 使用增强型跨源时,如果DLI队列的网段和用户数据源的网段发生冲突,您可以通过修改网段操作更改包年包月队列的网段。 如果待修改网段的队列中有正在提交或正在运行的作业,或者该队列已经绑定了增强型跨源,将不支持修改网段操作。 修改队列网段步骤 目前只支持计费模式为“包年包
-
如何在DLI中运行复杂PySpark程序? - 数据湖探索 DLI
于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源,那如何来保证用户可以更好的运行他的程序呢? DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库(具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”),这些常用
-
内置依赖包 - 数据湖探索 DLI
parquet-jackson-1.12.2.jar commons-text-1.10.0.jar jetty-io-9.4.41.v20210516.jar postgresql-42.3.5.jar commons-validator-1.7.jar jetty-rewrite-9.4.43.v20210629
-
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线(EOL)公告 - 数据湖探索 DLI
DLI“包年/包月”和“按需计费”计费模式队列在EOM和EOL后,可以使用哪个功能替换? 如果您正在使用“包年/包月”和“按需计费”计费模式队列运行作业,请尽快更换使用“弹性资源池”或“default队列”。 使用“按需专属”计费模式的队列可以直接迁移至新购的弹性资源池中。 使用“包年/包月”和
-
修订记录 - 数据湖探索 DLI
调整手册结构,新增入门指引、注册华为帐号并开通华为云。 2022-07-28 新增创建并提交Flink OpenSource SQL作业。 Flink SQL EOS,下线“创建并提交Flink SQL作业”相关内容。
-
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI
在SparkUI页面可查看Spark作业实时运行资源。 图2 SparkUI 在SparkUI页面还可以查看Spark作业原始资源配置(只对新集群开放)。 在SparkUI页面,单击“Environment”,可以查看Driver信息和Executor信息。 图3 Driver信息 图4 Executor信息
-
续费概述 - 数据湖探索 DLI
包年/包月的DLI资源从购买到被自动删除之前,您可以随时在DLI控制台为队列或弹性资源池续费,以延长资源的使用时间。 自动续费 开通自动续费后,DLI资源会在每次到期前自动续费,避免因忘记手动续费而导致资源被自动删除。 在DLI资源生命周期的不同阶段,您可以根据需要选择一种方式进行续费,具体如图1所示。
-
作业管理 - 数据湖探索 DLI
作业管理 概述 SQL作业管理 导出SQL作业结果 Flink作业管理 Spark作业管理 设置作业优先级