搜索_华为云

Spark作业开发类 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？父主题： Spark作业相类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
从Kafka读取数据写入到RDS - 数据湖探索 DLI

SQL作业编辑界面，配置如下参数，其他参数默认即可。所属队列：选择步骤1：创建队列中创建的队列。 Flink版本：选择1.12。保存作业日志：勾选。 OBS桶：选择保存作业日志的OBS桶，根据提示进行OBS桶权限授权。开启Checkpoint：勾选。 Flink作业编辑框中输入具体的作业SQL

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
从Kafka读取数据写入到DWS - 数据湖探索 DLI

SQL作业编辑界面，配置如下参数，其他参数默认即可。所属队列：选择步骤1：创建队列中创建的队列。 Flink版本：选择1.12。保存作业日志：勾选。 OBS桶：选择保存作业日志的OBS桶，根据提示进行OBS桶权限授权。开启Checkpoint：勾选。 Flink作业编辑框中输入具体的作业SQL

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

SQL作业编辑界面，配置如下参数，其他参数默认即可。所属队列：选择步骤1：创建队列中创建的队列。 Flink版本：选择1.12。保存作业日志：勾选。 OBS桶：选择保存作业日志的OBS桶，根据提示进行OBS桶权限授权。开启Checkpoint：勾选。 Flink作业编辑框中输入具体的作业SQL

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查询所有表（废弃） - 数据湖探索 DLI

" } ] } 状态码状态码如表5所示。表5 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：表相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
CREATE TABLE语句 - 数据湖探索 DLI

返回的 watermark 只有当其不为空且其值大于之前发出的本地 watermark 时才会被发出（以保证 watermark 递增）。每条记录的 watermark 生成表达式计算都会由框架完成。框架会定期发出所生成的最大的 watermark ，如果当前 watermark 仍然与前一个

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
错误码 - 数据湖探索 DLI
错误码 - 数据湖探索 DLI

DLI.0007 不支持该操作。 400 DLI.0008 元数据错误。 400 DLI.0009 系统限制。 400 DLI.0011 文件权限校验错误。 400 DLI.0012 资源对象不可用。 401 DLI.0013 用户认证错误。 401 DLI.0014 服务认证错误。

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
Flink 1.12版本说明 - 数据湖探索 DLI

CDC源表、Postgres CDC源表、Redis源表、Upsert Kafka源表、Hbase源表。 Flink 1.12新增支持小文件合并功能。 Flink 1.12新增支持Redis维表、RDS维表。父主题：版本支持公告

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
如何获取AK/SK？ - 数据湖探索 DLI

单击“新增访问密钥”，进入“新增访问密钥”页面。根据提示输入对应信息，单击“确定”，在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。为防止访问密钥泄露，建议您将其保存到安全的位置。父主题： DLI API类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
Flink作业常用操作 - 数据湖探索 DLI

选择需导入的作业配置文件的完整OBS路径。单击“下一步”。配置同名作业策略。单击“下一步”。勾选“配置同名替换”，如果待导入的作业名已存在，则覆盖已存在的作业配置，并且作业状态重置为草稿。不勾选“配置同名替换”，如果待导入的作业名已存在，则不导入同名作业的配置。确认“配置文件”和“同

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

安全CSS集群的证书，生成的keystore文件在OBS上的地址。 es.net.ssl.keystore.pass 安全CSS集群的证书，生成的keystore文件时的密码。 es.net.ssl.truststore.location 安全CSS集群的证书，生成的truststore文件在OBS上的地址。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
描述表信息（废弃） - 数据湖探索 DLI

testtable\n" } 状态码状态码如表4所示。表4 状态码状态码描述 200 操作成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：表相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
权限管理概述 - 数据湖探索 DLI

创建用户，通过授予仅能使用DLI，但是不允许删除DLI的权限策略，控制他们对DLI资源的使用范围。对于新建的用户，需要先登录一次DLI，记录元数据，后续才可正常使用。 IAM是华为云提供权限管理的基础服务，无需付费即可使用，您只需要为您账号中的资源进行付费。关于IAM的详细介绍，请参见《IAM产品介绍》。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
pyspark样例代码 - 数据湖探索 DLI

sql("select * from css_table") jdbcDF.show() 操作结果提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Spark开源命令支持说明 - 数据湖探索 DLI

DATABASE testDB SET DBPROPERTIES ('Edited-by' = 'John'); 不支持不支持修改数据库在OBS上的文件存放路径 ALTER DATABASE testDB SET LOCATION 'obs://bucketName/filePath'; 不支持

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

error message 该场景下就需要使用REFRESH TABLE来解决该问题。REFRESH TABLE是用于重新整理某个分区的文件，重用之前的表元数据信息，能够检测到表的字段的增加或者减少，主要用于表中元数据未修改，表的数据修改的场景。语法格式 1 REFRESH TABLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
查询增强型跨源连接列表 - 数据湖探索 DLI

"ACTIVE" } ] } 状态码状态码如表9所示。表9 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：增强型跨源连接相关API

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
创建表时指定表的生命周期 - 数据湖探索 DLI

的生命周期，适用于该表所有的分区。生命周期设置后，DLI表和OBS表支持数据备份，OBS表的备份目录需要手工设置。且备份目录应选择在并行文件系统上，备份目录必须和原表目录在同一个桶上，备份目录不能与原表相同目录或者子目录同名。语法格式 DataSource语法创建DLI表 CREATE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
创建Bucket索引表调优 - 数据湖探索 DLI

理：持续大量新增数据的维度表方法一：预留桶数，如使用非分区表则需通过预估较长一段时间内的数据增量来预先增加桶数，缺点是随着数据的增长，文件依然会持续膨胀；方法二：大粒度分区（推荐），如果使用分区表则需要根据数据增长情况来计算，例如使用年分区，这种方式相对麻烦些但是多年后表无需重新导入。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例

总条数： 585

上一页
1
...
22
23
24
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark作业开发类 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

查询所有表（废弃） - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

错误码 - 数据湖探索 DLI

Flink 1.12版本说明 - 数据湖探索 DLI

如何获取AK/SK？ - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

描述表信息（废弃） - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

查询增强型跨源连接列表 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线