搜索_华为云

partition - 数据湖探索 DLI
partition - 数据湖探索 DLI

partition_specs 格式 partition_specs : (partition_col_name = partition_col_value, partition_col_name = partition_col_value, ...); 说明表的分区列表，以key=

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

在DLI中，表和数据库是定义底层数据的元数据容器。表中的元数据让DLI知道数据所在的位置，并指定了数据的结构，例如列名称、数据类型和表名称。数据库是表的逻辑分组。 OBS表、DLI表、CloudTable表不同表类型表示不同的数据存储位置。 OBS表表示数据存储在OBS服务的桶中。 DLI表表示数据存储在本服务内部的表中。

帮助中心 > 数据湖探索 DLI > 产品介绍
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

该示例是从Kafka的一个topic中读取数据，并使用Kafka结果表将数据写入到kafka的另一个topic中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建IAM用户并授权使用DLI - 数据湖探索 DLI

如果您需要对您所拥有的DLI资源进行精细的权限管理，您可以使用统一身份认证服务（Identity and Access Management，简称IAM），具体IAM使用场景可以参考权限管理概述。如果华为云账号已经能满足您的要求，不需要创建独立的IAM用户，您可以跳过本章节，不影响您使用DLI服务的其它功能。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
更新跨源认证 - 数据湖探索 DLI

参数类型说明 auth_info_name 是 String 指定更新的跨源认证名称。 user_name 否 String 用户安全集群的新登录用户名。 password 否 String 用户安全集群的新登录密码。 krb5_conf 否 String krb5配置文件obs路径。

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

Studio-DLF调度。自建大数据生态的调度工具，如Airflow。企业级多租户基于表的权限管理，可以精细化到列权限。基于文件的权限管理。高性能性能基于软硬件一体化的深度垂直优化。大数据开源版本性能。跨源分析支持多种数据格式，云上多种数据源、ECS自建数据库以及线下数据库，

帮助中心 > 数据湖探索 DLI > 产品介绍
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

如下：参考增强型跨源连接，根据redis所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Redis的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据redis的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功，否则表示未成功。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
更新跨源认证（废弃） - 数据湖探索 DLI

参数类型说明 auth_info_name 是 String 指定更新的跨源认证名称。 user_name 否 String 用户安全集群的新登录用户名。 password 否 String 用户安全集群的新登录密码。 krb5_conf 否 String krb5配置文件obs路径。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代码的编写与作业的开发，使用Notebook灵活的进行数据分析与探索，本节操

 帮助中心 > 数据湖探索 DLI > 用户指南
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

conf' krb5.conf的地址。 'keytab'='./user.keytab' Keytab的地址。 'principal' ='krbtest' 认证用户名。 krb5.conf和keytab文件获取请具体参考开启Kerberos认证时的相关配置文件操作说明。插入数据

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Upsert Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Spark表数据维护规范 - 数据湖探索 DLI

Spark表数据维护规范禁止通过Alter命令修改表关键属性信息：type/primaryKey/preCombineField/hoodie.index.type 错误示例，执行如下语句修改表关键属性： alter table dsrTable set tblproperties('type'='xx');

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Checkpoint机制可以保证Flink平台可感知内部状态的精确一致，但对于自定义Source/Sink或者有状态算子，需要合理实现ListCheckpointed接口，来保证业务数据需要的可靠性。为了避免因业务修改等需要，手动重启作业后，不丢失数据：对于无内部状态的作业，您可以配置kafka数据源的启动时间或者消费位点到作业停止之前。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

使用ogg-json读取kafka中的ogg记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
对象存储OBS结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式，能够满足企业对权限最小化的安全管控要求。例如：针对DLI服务，管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。DLI支持的API授权项请参见《权限策略和授权项》。表1 DLI系统权限

 帮助中心 > 数据湖探索 DLI > 产品介绍
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

使用canal-json读取kafka中的canal记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

该操作修改了作业对资源的算法逻辑。例如原有的算法的语句是执行加减运算，当前需要恢复的状态将算法的语句修改成为乘除取余的运算，是无法从checkpoint直接恢复的。修改“静态流图” 不支持该操作修改了作业对资源的算法逻辑。修改“单TM所占CU数”参数支持对计算资源的修改并没有影响到作业算法或算子的运行逻辑。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建并使用跨源链接 - 数据湖探索 DLI

本章节指导用户通过API创建增强型跨源连接。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。创建增强型跨源连接之前需要获取需要建立连接的服务对应VPC的ID和其所在子网的网络ID。获取VPC的ID接口，具体请参考《虚拟私有云API参考》。获取子网网络ID接口，具体请参考《虚拟私有云API参考》。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门

总条数： 796

上一页
1
...
22
23
24
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

partition - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

创建IAM用户并授权使用DLI - 数据湖探索 DLI

更新跨源认证 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

更新跨源认证（废弃） - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Spark表数据维护规范 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线