搜索_华为云

Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。DLI可以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
库表管理标签管理 - 数据湖探索 DLI

每个资源中的键名不能重复。单击“确定”，完成数据库标签的添加。如需删除标签，在标签列表中，单击操作列中“删除”可对选中的标签进行删除。数据表标签管理在DLI管理控制台的左侧导航栏中，单击“数据管理> 库表管理”。单击数据库名称，查看数据库下的数据表。在数据表的操作列，选择“更多> 标签”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
创建跨源认证 - 数据湖探索 DLI

String 用户安全集群的证书路径，目前只支持OBS路径，cer类型文件。 datasource_type 是 String 数据源类型，目前支持CSS,KRB,passwd,Kafka_SSL。 krb5_conf 否 String krb5配置文件obs路径。 keytab 否

 帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
导出查询结果 - 数据湖探索 DLI

file_format 写入的文件格式，支持按CSV、Parquet、ORC、JSON、Avro格式。 file_format为csv时，options参数可以参考表3。注意事项通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
增强型跨源连接标签管理 - 数据湖探索 DLI

说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : +-@ ,但首尾不能含有空格，不能以_sys_开头。标签值您可以选择：在输入框的下拉列表中选择预定义标签值。在输入框中输入标签值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入OBS表时，创建OBS表时指定的路径必须是文件夹，若建表路径是文件将导致导入数据失败。仅支持导入位于OBS路径上的原始数据。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。导入数据时只能指定一个路径，路径中不能包含逗号。当OBS桶目录下有文件夹和文件同名时，导入数据会优先指向该路径下的文件而非文件夹。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

“查询结果写入桶”功能，必须提交工单申请加入白名单。 DLI支持13种数据类型，每一种类型都可以映射成一种JDBC类型，在使用JDBC连接服务器时，请使用映射后的JAVA类型，映射关系如表1所示。表1 数据类型映射 DLI类型 JDBC类型 JAVA类型 INT INTEGER

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
批量添加资源标签 - 数据湖探索 DLI

增强型跨源连接ID：在DLI管理控制台的“增强型跨源连接”列表页获取“连接ID”即为增强型跨源连接ID。数据库ID：添加标签时候传入的数据库ID即数据库名。您可以在DLI控制台的“库表管理”页面查看数据库名称。 Flink作业ID：在DLI管理控制台的“Flink作业”列表页面单击Flink作

 帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
状态码 - 数据湖探索 DLI
状态码 - 数据湖探索 DLI

在客户端提供认证信息后，返回该状态码，表明服务端指出客户端所提供的认证信息不正确或非法。 402 Payment Required 保留请求。 403 Forbidden 请求被拒绝访问。返回该状态码，表明请求能够到达服务端，且服务端能够理解用户请求，但是拒绝做更多的事情，因为

 帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
条件表达式 - 数据湖探索 DLI
条件表达式 - 数据湖探索 DLI

以下情况会被try捕获：分母为0 错误的cast操作或者函数入参数字超过了定义长度不推荐使用，应该明确以上异常，做数据预处理示例：假设有以下表，字段origin_zip中包含了一些无效数据： -- 创建表 create table shipping (origin_state

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
获取跨源认证列表（废弃） - 数据湖探索 DLI

String 创建时指定的证书OBS路径。 datasource_type String 数据源的类型。 create_time Int 创建时间戳。 update_time Int 更新时间戳。 krb5_conf String krb5配置文件obs路径。 keytab String

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
管理Flink作业模板 - 数据湖探索 DLI

Flink SQL样例模板列表参数参数参数说明名称模板名称，只能由英文、中文、数字、中划线和下划线组成，并且长度为1～64个字符。描述模板的相关描述，且长度为0～512个字符。操作 “创建作业”：直接在该模板下创建作业，创建完后，系统跳转到“作业管理”下的作业编辑页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

BI。单击“数据连接 > 数据连接管理”。单击“添加数据源”创建一个新的数据源。在数据源的向导中选择数据库类型。本例选择“Hadoop Hive” 配置数据库连接信息：数据连接名称：用户自定义数据连接名称。驱动：选择2.a中的驱动。数据库名称：DLI的数据库名称。主机：安装Kyuubi主机IP地址。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
pyspark样例代码 - 数据湖探索 DLI

ErrorIfExis：如果已经存在数据，则抛出异常。 Overwrite：如果已经存在数据，则覆盖原数据。 Append：如果已经存在数据，则追加保存。 Ignore：如果已经存在数据，则不做操作。这类似于SQL中的“如果不存在则创建表”。读取RDS上的数据 1 2 3 4 5 6 7

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
更新模板 - 数据湖探索 DLI
更新模板 - 数据湖探索 DLI

name 否 String 模板名称。长度限制：0-57个字符。 desc 否 String 模板描述。长度限制：0-512个字符。 sql_body 否 String Stream SQL语句，至少包含source，query，sink三个部分。长度限制：0-1024*1024个字符。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业模板相关API
配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

LI进行数据查询和分析 Superset是一个开源的数据探索和可视化平台，支持对数据进行快速、直观的探索，同时支持创建丰富的数据可视化和交互式仪表板。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通过

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

Flink作业模板相关API 包括新建模板、更新模板、删除模板和查询模板列表。 Spark作业相关API 包括创建批处理作业、取消批处理作业、查询批处理作业列表、查询批处理作业详情、查询批处理作业状态和查询批处理作业日志。 Spark作业模板相关API 包括保存SQL模板、创建作业模板等模板相关API。

帮助中心 > 数据湖探索 DLI > API参考
查询SQL作业日志 - 数据湖探索 DLI

DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询Spark作业日志 - 数据湖探索 DLI

DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业

总条数： 611

上一页
1
...
14
15
16
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hbase源表 - 数据湖探索 DLI

库表管理标签管理 - 数据湖探索 DLI

创建跨源认证 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

如何合并小文件 - 数据湖探索 DLI

批量添加资源标签 - 数据湖探索 DLI

状态码 - 数据湖探索 DLI

条件表达式 - 数据湖探索 DLI

获取跨源认证列表（废弃） - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

更新模板 - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线