搜索_华为云

使用DLI分析电商BI报表 - 数据湖探索 DLI

关注点击 - 步骤1：上传数据将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。下载OBS Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS

帮助中心 > 数据湖探索 DLI > 最佳实践
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

详情请参见区域和可用区。可用区一个可用区是一个或多个物理数据中心的集合，有独立的风火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。项目区域默认对应一个项目，这个项目由系统预置，用

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE 命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.f

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
查询Flink作业日志 - 数据湖探索 DLI

中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述数据类型是数据的一个基本属性，用于区分不同类型的数据。不同的数据类型所占的存储空间不同，能够进行的操作也不相同。数据库中的数据存储在表中。表中的每一列都定义了数据类型，用户存储数据时，须遵从这些数据类型的属性，否则可能会出错。 DLI当前只支持原生数据类型。父主题：数据类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
费用账单 - 数据湖探索 DLI
费用账单 - 数据湖探索 DLI

水与明细账单。查看数据存储的资源账单 DLI控制台并未展示数据存储的相关信息，您可以在费用中心查询DLI数据存储的资源账单。在控制台顶部菜单栏中选择“费用与成本 > 费用账单”。选择“流水和明细账单 > 明细账单”，在产品的筛选条件中选择“DLI存储空间”，单击图标即可搜索DLI数据存储的资源账单。

帮助中心 > 数据湖探索 DLI > 计费说明
DLI作业开发流程 - 数据湖探索 DLI

表。创建必要的存储桶来存储作业运行过程中产生的临时数据：作业日志、作业结果等。请参考配置DLI作业桶。配置元数据的访问权限。请参考在DLI控制台配置数据库权限、在DLI控制台配置表权限。 DLI数据导入指引 DLI支持在不迁移数据的情况下，直接对OBS中存储的数据进行查询分析

 帮助中心 > 数据湖探索 DLI > 用户指南
查询SQL作业日志 - 数据湖探索 DLI

中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

BADRECORDSPATH：指定导入过程中错误记录的存储目录。 OPTIONS('BADRECORDSPATH'='obs://bucket/path') 配置该选项后，MODE不可配，固定为"DROPMALFORMED"，即将能够成功转换的记录导入到目标表，而将转换失败的记录存储到指定错误记录存储目录。注意事项

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
查询增强型跨源连接列表 - 数据湖探索 DLI

"ACTIVE" } ] } 状态码状态码如表9所示。表9 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：增强型跨源连接相关API

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
Hudi表使用约束 - 数据湖探索 DLI

Write 写时复制表也简称COW表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
查询Spark作业日志 - 数据湖探索 DLI

查询Spark作业日志操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并获取Spark作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
上传分组资源（废弃） - 数据湖探索 DLI

String 标签的键。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

queue_name 否 String 队列名称。长度限制：0-128个字符。 sql_body 否 String Stream SQL语句，至少包含source, query, sink三个部分。长度限制：1024*1024个字符。 run_mode 否 String 作业运行模式： shared_cluster：共享。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
导出查询结果 - 数据湖探索 DLI

o格式进行存储。语法格式 1 2 3 4 INSERT OVERWRITE DIRECTORY path USING file_format [OPTIONS(key1=value1)] select_statement; 关键字 USING：指定所存储格式。 O

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
创建CSS类型跨源认证 - 数据湖探索 DLI

创建CSS类型跨源认证操作场景通过在DLI控制台创建的CSS类型的跨源认证，将CSS安全集群的认证信息存储到DLI，无需在SQL作业中配置账号密码，安全访问CSS安全集群。本节操作介绍在DLI控制台创建CSS安全集群的跨源认证的操作步骤。操作须知已创建CSS安全集群，且集群满足以下条件：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

事务日志来跟踪这些文件，并通过读取所有 Parquet 文件的页脚来自动推断数据架构。转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。如果提供表名，则元存储也将更新，以反映该表现在是 Delta 表。注意事项分区表转换需要设置参数spark.sql.forcePartitionPredic

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
更新表分区信息（只支持OBS表） - 数据湖探索 DLI

SERDEPROPERTIES：Serde属性。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path OBS存储路径。注意事项该命令的主要应用场景是针对分区表，如当手动在OBS上面添加分区目录时，再通过上述命令将该新增的分区信息刷新到元数据库中，通过“SHOW

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

创建Kafka_SSL类型跨源认证操作场景通过在DLI控制台创建的Kafka_SSL类型的跨源认证，将Kafka的认证信息存储到DLI，无需在SQL作业中配置账号密码，安全访问Kafka实例。 MRS Kafka开启Kerberos认证，未开启SSL认证时，创建Kerbero

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证

总条数： 378

上一页
1
...
8
9
10
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI分析电商BI报表 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

费用账单 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

查询增强型跨源连接列表 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

创建CSS类型跨源认证 - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

更新表分区信息（只支持OBS表） - 数据湖探索 DLI

创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线