搜索_华为云

创建DLI程序包 - 数据湖探索 DLI

在“创建程序包”对话框，参见表1设置相关参数。图1 创建程序包表1 参数说明参数名称描述包类型支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件 File：用户文件 ModelFile：用户AI模型文件 OBS路径选择对应程序包的OBS路径。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
导入Flink作业保存点 - 数据湖探索 DLI

true, "message": "作业更新成功" } 状态码状态码描述 200 修改成功。 400 请求错误。 500 内部服务器错误。错误码请参见错误码。父主题： Flink作业管理相关API

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业管理相关API
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

t的完成时间，建议设置为5分钟。 Exactly Once模式保证每条数据只被消费一次，At Least Once模式每条数据至少被消费一次，请依据业务情况选择。勾选“异常自动恢复”和“从Checkpoint恢复”，根据自身业务情况选择重试次数。配置“脏数据策略”，依据自身的

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
配置Flink作业权限 - 数据湖探索 DLI

配置Flink作业权限 Flink作业权限操作场景针对不同用户，可以通过权限设置分配不同的作业，不同用户之间的作业效率互不影响，保障作业性能。管理员用户和作业的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其作业权限。给新用户设置作业权限时，该用户所在用户组的所属区域需具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

“krb5.conf”配置文件的“renew_lifetime = 0m”配置项。端口请使用KafKa服务配置中设置的sasl_ssl.port端口。 security.protocol请设置为SASL_SSL。 CREATE TABLE ordersSource ( order_id

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
解绑队列 - 数据湖探索 DLI
解绑队列 - 数据湖探索 DLI

queues:{q1,q2}." } 状态码状态码如表4所示。表4 状态码状态码描述 200 解绑成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：增强型跨源连接相关API

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

DLI部署时通过物理区域划分，为项目级服务。授权时，“作用范围”需要选择“区域级项目”，然后在指定区域对应的项目中设置相关权限，并且该权限仅对此项目生效；如果在“所有项目”中设置权限，则该权限在所有区域项目中都生效。访问DLI时，需要先切换至授权区域。权限类别：根据授权精程度分为角色和策略。

帮助中心 > 数据湖探索 DLI > 产品介绍
pyspark样例代码 - 数据湖探索 DLI

"binary")”进行保存如果需要指定数据过期时间：“.option("ttl",1000)”;秒为单位读取redis上的数据 1 sparkSession.read.format("redis").option("host", host).option("port", port).option("table"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
跨源认证权限管理 - 数据湖探索 DLI

跨源认证权限管理操作场景通过跨源认证的用户授权，可设置分配不同的跨源认证，且不同用户的作业不影响跨源认证的使用。使用须知管理员用户和跨源认证的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其跨源认证权限。给新用户设置跨源认证权限时，该用户所在用户组具有Tenant Guest权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

是否必填 table 需要查询的表的表名，支持database.tablename格式 table，path须选填其中之一 path 需要查询的表的路径 table，path须选填其中之一 predicate 需要定义的谓语句，筛选需要Clustering的分区否 order 指定clustering的排序字段

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。通过管理控制台创建跨源连接请参考《数据湖探索用户指南》。通过API创建跨源连接请参考《数据湖探索API参考》。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

前提条件创建该作业前，需要建立DLI和Redis的增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表如果需要关联OBS桶中嵌套的JSON格式数据，可以使用异步模式创建表。以下是一个示例的建表语句，展示了如何使用 JSON 格式选项来指定 OBS 中的路径： create table tb1 using json options(path

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

ps://redis.io/。前提条件要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 1 2 3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Flink作业常用操作 - 数据湖探索 DLI

仅支持导入与从DLI导出的Flink作业相同数据格式的作业。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入Flink作业管理页面。单击右上角“导入作业”，打开“导入作业”对话框。选择需导入的作业配置文件的完整OBS路径。单击“下一步”。配置同名作业策略。单击“下一步”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查询Spark作业日志 - 数据湖探索 DLI

DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
修改队列网段（废弃） - 数据湖探索 DLI

"message": "" } 状态码状态码如表4所示。表4 状态码状态码描述 201 修改成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：队列相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
查询SQL作业日志 - 数据湖探索 DLI

您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业

总条数： 842

上一页
1
...
6
7
8
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建DLI程序包 - 数据湖探索 DLI

导入Flink作业保存点 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

解绑队列 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

跨源认证权限管理 - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

修改队列网段（废弃） - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线