搜索_华为云

创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

接）。创建完跨源连接后，可以通过“资源管理 > 队列管理”页面，单击“操作”列“更多”中的“测试地址连通性”，验证队列到外部数据源之间的网络连通是否正常。详细操作可以参考测试地址连通性。操作步骤在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Spark作业”，进入“Spark作业”页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出数据的文件格式。当前只支持json格式。队列选择队列。压缩格式导出数据的压缩方式，选择如下压缩方式。 none bzip2 deflate gzip 存储路径输入或选择OBS路径。导出路径必须为OBS桶中不存在的文件夹，即用户需在OBS目标路径后创建一个新文件夹。文件夹名称不能包含下列特殊字符：\

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

com:3306', //根据实际url修改 'dbtable'='test.customer', 'user'='root', //根据实际user修改 'password'='######', //根据实际password修改 'driver'='com

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

'true' 'hive_sync.partition_extractor_class' = 'org.apache.hudi.hive.MultiPartKeysValueExtractor' 默认Hudi写表是Flink状态索引，如果需要使用bucket索引需要在Hudi写表中添加参数：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
创建IAM用户并授权使用DLI - 数据湖探索 DLI

ReadOnlyAccess”已生效。更多操作创建子用户请参考《如何创建子用户》。创建自定义策略请参考DLI自定义策略。修改用户策略请参考《如何修改用户策略》。父主题：准备工作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

放在低成本的对象存储服务OBS上，高频访问的热数据存放在数据引擎（CloudTable和DWS）中，降低整体存储成本。告警快速敏捷触发服务器弹性伸缩：对CPU、内存、硬盘空间和带宽无特殊要求。建议搭配以下服务使用 DIS、CDM、OBS、DWS、RDS、CloudTable 图2

帮助中心 > 数据湖探索 DLI > 产品介绍
配置DLI作业桶 - 数据湖探索 DLI

业结果混乱等问题。 OBS桶需要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。操作步骤在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sparkContext().addFile("obs://桶名/地址/transport-keystore.jks"); sparkSession.sparkContext().addFile("obs://桶名/地址/truststore.jks"); //

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

redis操作参数参数描述 host 需要连接的redis集群的IP。获取方式为：登录华为云官网，之后搜索redis，进入“分布式缓存服务”,接着选择“缓存管理”，根据主机名称需要的IP，可选择其中任意一个IP进行复制即可（其中也包含了port信息），请参考图1。 port 访问端口。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
pyspark样例代码 - 数据湖探索 DLI

table 'person')".stripMargin) 插入数据 1 sparkSession.sql("INSERT INTO TABLE person VALUES ('John', 30),('Peter', 45)".stripMargin) 查询数据 1 sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
上传分组资源（废弃） - 数据湖探索 DLI

1551345369070 } 状态码状态码如表6所示。表6 状态码状态码描述 201 上传成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：分组资源相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Spark 3.3.1版本说明 - 数据湖探索 DLI

使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。支持容器集群Spark日志跳转查看

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
查看弹性资源池的基本信息 - 数据湖探索 DLI

详细信息。支持查看以下信息：弹性资源池名称、弹性资源池创建用户、创建时间、弹性资源池VPC网段、弹性资源池是否启用IPv6，如果开启IPv6将显示具体的子网的IPv6网段。关于弹性资源池的实际CUs、已使用CUs、CU范围、规格（包周期CU）的含义请参考弹性资源池的实际CUs

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
查看Flink作业详情 - 数据湖探索 DLI

停止：停止Flink作业。如果该功能置灰，表示当前状态的作业不支持停止。删除：删除作业。说明：作业删除后不可恢复，请谨慎操作。名称和描述修改：修改作业名称和描述。导入保存点：导入原实时流计算服务作业导出的数据。触发保存点：“运行中”的作业可以“触发保存点”，保存作业的状态信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

'topic' = 'TOPIC', 'properties.bootstrap.servers' = 'KafkaIP:PROT,KafkaIP:PROT,KafkaIP:PROT', 'properties.group.id' = 'GroupId', 'scan.startup

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
创建消息通知主题 - 数据湖探索 DLI

如果选择“短信”协议，需要在“订阅终端”中填写接收确认短信的手机号码。如果选择“邮件”协议，需要在“订阅终端”中填写接收确认邮件的邮箱地址。更多信息，请参考《消息通知服务用户指南》中《添加订阅》章节。图4 添加订阅通过单击短信或者邮件中的链接确认后，将收到“订阅成功”的信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

System.out.println(result); } 查询作业APIG网关服务访问地址 DLI提供查询Flink作业APIG访问地址的接口。您可以使用该接口查询作业APIG网关服务访问地址。示例代码如下： 1 2 3 4 5 private static void ge

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

Default Type Description table.exec.hive.load-partition-splits.thread-num 3 Integer 配置的值应大于0。 SQL 提示可用于将配置应用于 Hive 表，而无需更改其在 Hive 元存储中的定义。Hints

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能连通，则表示跨源已经绑定成功；否则表示未成功。创建flink opensource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。支持容器集群Spark日志跳转查看

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告

总条数： 550

上一页
1
...
17
18
19
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Spark作业 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

创建IAM用户并授权使用DLI - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

查看弹性资源池的基本信息 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

创建消息通知主题 - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线