搜索_华为云

Java开发环境配置 - 数据湖探索 DLI

Java开发环境配置操作场景在安装和使用Java SDK前，确保您已经完成开发环境的基本配置。 Java SDK要求使用JDK1.8或更高版本。考虑到后续版本的兼容性，推荐使用1.8版本。在Java运行环境配置好的情况下，打开windows的命令行，执行命令Java -version，可以检查版本信息。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

餐包资源的使用情况？如果套餐包额度已超出，产生按需计费为正常现象；如果套餐包额度未超出，请继续排查判断是否产生了套餐包未涵盖的计费项。判断是否产生了套餐包未涵盖的计费项 DLI的计费项分为计算资源计费、数据存储量计费、数据扫描量计费。如果购买的套餐包资源未覆盖使用的计费项，产生按需计费属于正常现象：

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

modelfile：用户AI模型文件 paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。 description：资源包描述信息。查询所有资源包 DLI提供查询资源列表接口，您可以使用该接口并选择相应的资源来执行作业。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

kind：资源包类型，当前支持的包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 obs_jar_paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

log_line in logs: print(log_line) 取消批处理作业 DLI提供取消批处理作业的接口。您可以使用该接口取消批处理作业。若作业已经执行结束或失败则无法取消。示例代码如下： 1 2 3 4 5 6 7 def del_spark_batch(dli_client

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
库表管理标签管理 - 数据湖探索 DLI

标签管理标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。如您的组织已经设定DLI的相关标签策略，则需按照标签

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
URL函数 - 数据湖探索 DLI
URL函数 - 数据湖探索 DLI

描述：提取函数用于从HTTP URL（或任何符合RFC 2396标准的URL）中提取内容。 [protocol:][//host[:port]][path][?query][#fragment] 提取的内容不会包含URI的语法分割符，比如“：”或“？”。 url_extract_fragment(url)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
用户导表到OBS报“path obs://xxx already exists”错误 - 数据湖探索 DLI

该提示信息说明您将数据导出到一个已经存在的OBS路径。解决方案：新建OBS目录。您可以新建一个不存在的OBS目录用于存储导出的数据。删除已存在的OBS目录。删除已存在的OBS目录后，目录下的所有数据将会被删除。请谨慎执行此删除操作。检查目录权限确保您已具备访问和写入该OBS路径的权限。如果

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
增强型跨源连接标签管理 - 数据湖探索 DLI

操作场景标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。如您的组织已经设定DLI的相关标签策略，则需按照标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Confluent Avro Format - 数据湖探索 DLI

ent avro的形式写入作为sink的topic中。根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
配置Hudi数据列默认值 - 数据湖探索 DLI

该特性允许用户在给表新增列时，设置列的默认值。查询历史数据时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。列的默认值设置要与列的类型一致

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

刚购买DLI队列后，第一次进行SQL作业的提交。需要等待5~10分钟，待后台拉起集群后，即可提交成功。若刚刚对队列进行网段修改，立即进行SQL作业的提交。需要等待5~10分钟，待后台重建集群后，即可提交功。按需队列，队列已空闲状态（超过1个小时），则后台资源已经释放。此时进行SQL作业的提交。需要等待

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP BY）、多表的关联（JOIN）等。本示例通过创建PostgreSQL CDC源表来监控Postgres的数据变化，并将变化的数据信息插入到DWS数据库中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

作业管理参数参数参数说明作业ID 所提交Spark作业的ID，由系统默认生成。名称所提交Spark作业的名称。队列所提交Spark作业所在的队列。用户名执行Spark作业的用户名称。状态作业的状态信息，包括如下。启动中：正在启动运行中：正在执行任务已失败：session已退出

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

Management，简称IAM）进行精细的企业级多租户管理。该服务提供用户身份认证、权限分配、访问控制等功能，可以帮助您安全地控制华为云资源的访问。通过IAM，您可以在华为云账号中给员工创建IAM用户，并使用策略来控制他们对华为云资源的访问范围。目前包括角色（粗粒度授权）和策略（细粒度授权）。具体的权限介绍

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Beeline是数据分析师和数据工程师的重要工具之一，适用于大规模数据处理的场景。Beeline提供了的SQL引擎，使得用户可以使用SQL的语言来执行数据查询、数据分析和管理任务。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

ErrorIfExis：如果已经存在数据，则抛出异常。 Overwrite：如果已经存在数据，则覆盖原数据。 Append：如果已经存在数据，则追加保存。 Ignore：如果已经存在数据，则不做操作。这类似于SQL中的“如果不存在则创建表”。读取DWS上的数据。方式一：read.format()方法

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

实际CUs：弹性资源池当前分配的可用CUs。已使用CUs：当前弹性资源池已经被分配使用的CUs 待提交作业所需的CUs需小于等于弹性资源池的剩余可用CUs，才可以确保作业任务的正常执行。作业资源的占用情况请参考怎样查看作业所需的资源CUs数？。怎样查看作业所需的资源CUs数？ SQL作业：

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
查看弹性资源池的基本信息 - 数据湖探索 DLI

v6，如果开启IPv6将显示具体的子网的IPv6网段。关于弹性资源池的实际CUs、已使用CUs、CU范围、规格（包周期CU）的含义请参考弹性资源池的实际CUs、已使用CUs、CU范围、规格（包周期CU）。图1 弹性资源池基本信息弹性资源池的实际CUs、已使用CUs、CU范围、规格（包周期CU）

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
查询所有SQL样例模板（废弃） - 数据湖探索 DLI

价格摘要报告查询。\r\n-- 在单个表lineitem上查询某个时间段内，对已经付款的、已经运送的等各类商品进行统计，包括业务量的计费、发货、折扣、税、平均价格等信息。\r\n-- 特点：带有分组、排序、聚集操作并存的单表查询操作。这个查询会导致表上的数据有95%到97%行被读取到。\r\nSELECT\r\n

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 模板相关API（废弃）

总条数： 1271

上一页
1
...
5
6
7
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Java开发环境配置 - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

库表管理标签管理 - 数据湖探索 DLI

URL函数 - 数据湖探索 DLI

用户导表到OBS报“path obs://xxx already exists”错误 - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

查询所有SQL样例模板（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线