搜索_华为云

从Kafka读取数据写入到RDS - 数据湖探索 DLI

MySQL实例。本示例创建的RDS MySQL数据库版本选择为：8.0。具体步骤可参考：RDS MySQL快速入门。整体作业开发流程整体作业开发流程参考图1。图1 作业开发流程步骤1：创建队列：创建DLI作业运行的队列。步骤2：创建Kafka的Topic：创建Kafka生产消费数据的Topic。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

问题1：运行Spark作业，作业运行失败，作业日志中提示java server connection或container启动失败问题现象运行Spark作业，作业运行失败，作业日志中提示java server connection或container启动失败。解决方案确认是否已修改跨源连接的主机信息，如果没有，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

'upperBound'='100', 'numPartitions'='2' DLI中会起2个并发task，一个task执行id>=0 and id < 50，另一个task执行id >=50 and id < 100。 fetchsize 读取数据时，每一批次获取数据的记录数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

019.1或其2019.1往后的版本。安装Maven 开发环境的基本配置（下载并安装 Maven）。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDAF函数开发流程参考如下：图1 UDAF开发流程表2 开发流程说明序号阶段操作界面说明 1 新建Maven工程，配置pom文件

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

opentsdb_new_test values('Penglai', 'abc', '2021-06-30 18:00:00', 30.0)"); System.out.println("Penglai new timestamp"); sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

'upperBound'='100', 'numPartitions'='2' DLI中会起2个并发task，一个task执行id>=0 and id < 50，另一个task执行id >=50 and id < 100。 fetchsize 读取数据时，每一批次获取数据的记录数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
CSS安全集群配置 - 数据湖探索 DLI

rvice.cer），keytool工具还有其他参数，可根据需求设置。打开cmd，输入下列命令生成含有一个私钥的keystore文件。 keytool -genkeypair -alias certificatekey -keyalg RSA -keystore transport-keystore

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明本样例只适用于MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 <dependency> <groupId>org

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
SQL作业运行慢如何定位 - 数据湖探索 DLI

Spark SQL作业：查看带有“driver”或者为“container_xxx_000001”的日志文件夹则为需要查看的Driver日志目录。图2 带有driver的归档日志文件夹名示例图3 container_xxx_000001归档日志文件夹示例 Spark Jar作业：

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

testcsvdata3source; 图5 查询结果在OBS桶的“obs://dli-test-021/data2”目录下刷新后查询，生成了一个csv数据文件，内容为insert插入的表数据内容。图6 查询结果创建OBS分区表创建单分区OBS表在OBS桶“dli-test-

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

apache.kafka.common.security.plain.PlainLoginModule required\n\ username="xxxx"\n\ password="xxxx"; 父主题： Flink作业开发指南

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Livy用于提交Spark作业到DLI的客户端工具。准备工作创建DLI队列。在“队列类型”中选择“通用队列”，即Spark作业的计算资源。具体请参考创建队列。准备一个linux弹性云服务器ECS，用于安装DLI Livy。 ECS需要放通30000至32767端口、8998端口。具体操作请参考添加安全组规则。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的OpenTSDB和MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过20分钟且只剩余一个task在运行，即为数据倾斜的情况。图1 数据倾斜样例常见数据倾斜场景 Group By聚合倾斜在执行Group

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类

总条数： 849

上一页
1
2
3
4
5
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从Kafka读取数据写入到RDS - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线