搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

= './krb5.conf' krb5.conf的地址。 'keytab'='./user.keytab' Keytab的地址。 'principal' ='krbtest' 认证用户名。 krb5.conf和keytab文件获取请具体参考开启Kerberos认证时的相关配置文件操作说明。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

Spark SQL语法参考提供SQL数据库、表、分区、导入及导出数据、自定义函数、内置函数等语法说明和样例指导。使用Spark作业访问DLI元数据提供SQL作业开发的操作指引和样例代码参考。 Spark SQL 相关API 提供SQL相关API的使用说明。父主题：创建并管理SQL作业模板

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

建跨源连接。管理控制台界面具体操作请参考《数据湖探索用户指南》。使用Spark作业跨源访问数据源支持使用scala，pyspark和java三种语言进行开发。表格存储服务CloudTable相关介绍请参考《表格存储服务产品介绍》。云搜索服务CSS相关介绍请参考《云搜索服务产品介绍》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
Flink作业性能调优 - 数据湖探索 DLI

Source端会周期性地发送带当前时间戳的LatencyMarker，下游算子接收到该标记后，通过当前时间减去标记中带的时间戳的方式，计算时延指标。算子的反压状态和时延可以通过Flink UI或者作业任务列表查看，一般情况下反压和高时延成对出现：图2 反压状态和时延性能分析由于Fl

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在工程路径的“src > main > java”文件夹上鼠标右键，选择“New > Package”，新建Package和类文件。 Package根据需要定义，本示例定义为：“com.dli.demo” 图6 新建Package 在包路径下新建Java Class文件，本示例定义为：AvgFilterUDAFDemo。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
导出DLI表数据至OBS中 - 数据湖探索 DLI

在“导出数据”对话框，参考表1填写导出数据相关信息。图2 导出数据表1 参数说明参数名称描述数据库当前表所在的数据库。表名称当前表名称。数据格式导出数据的文件格式。当前只支持json格式。队列选择队列。压缩格式导出数据的压缩方式，选择如下压缩方式。 none bzip2

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

的主题。如何自定义SMN主题，请参见《消息通知服务用户指南》中“创建主题”章节。检查IAM权限。如果SMN主题已经存在，但仍然提示不存在，请进入统一身份认证服务（IAM），选择对应子账户所在的用户组，确保该用户组已添加相应Region的SMN策略。确认主题名称和区域。确

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
添加分区（只支持OBS表） - 数据湖探索 DLI

ADD [IF NOT EXISTS] PARTITION partition_specs1 [LOCATION 'obs_path1'] PARTITION partition_specs2 [LOCATION 'obs_path2']; 关键字 IF NOT EX

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Hbase - 数据湖探索 DLI
Hbase - 数据湖探索 DLI

Hbase HBase连接器支持读取和写入HBase集群。本文档介绍如何使用HBase连接器基于HBase进行SQL查询。 HBase连接器在upsert模式下运行，可以使用 DDL 中定义的主键与外部系统交换更新操作消息。但是主键只能基于HBase的rowkey字段定义。如果没

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Python SDK环境配置 - 数据湖探索 DLI

Studio编译器解决。部分操作系统Visual Studio安装后需重启才可以生效。安装DLI服务Python SDK。选择SDK获取与安装获取的安装包，解压安装包。将"dli-sdk-python-<version>.zip"解压到本地目录，目录可自行调整。安装SDK。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
跨源认证权限管理 - 数据湖探索 DLI

使用须知管理员用户和跨源认证的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其跨源认证权限。给新用户设置跨源认证权限时，该用户所在用户组具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见《权限策略》和《统一身份认证服务用户指南》中的创建用户组。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
手动续费 - 数据湖探索 DLI
手动续费 - 数据湖探索 DLI

列资源到期日不同，可以将到期日统一设置到一个日期，便于日常管理和续费。图4展示了用户将两个不同时间到期的资源，同时续费一个月，并设置“统一到期日”后的效果对比。图4 统一到期日更多关于统一到期日的规则请参见如何设置统一到期日。父主题：续费

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
在DLI控制台配置表权限 - 数据湖探索 DLI

显示表信息：显示当前表的信息。显示创建表语句：显示当前表的创建语句。删除表：删除当前表。重命名表：对当前表重新命名。插入：在当前表内插入数据。重写：在当前表内插入覆盖数据。添加列：在当前表中增加列。赋权：当前用户可将表的权限赋予其他用户。回收：当前用户可回收其他用

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

据源之间的网络。当前Spark作业支持访问的外部数据源详情请参考DLI常用跨源分析开发方式。创建跨源连接操作请参见配置DLI与数据源网络连通（增强型跨源连接）。创建完跨源连接后，可以通过“资源管理 > 队列管理”页面，单击“操作”列“更多”中的“测试地址连通性”，验证队列到

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
在DLI控制台配置数据库权限 - 数据湖探索 DLI

删除角色：删除当前数据库中的角色。显示角色：显示当前用户的角色。绑定角色：在当前数据库绑定角色。解除角色绑定：在当前数据库解除角色绑定。显示所有角色和用户的绑定关系：显示所有角色和用户的绑定关系。创建函数：在当前数据库创建函数。删除函数：删除当前数据库中的函数。显示所有函数：显示当前数据库中的所有函数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
查询SQL作业日志 - 数据湖探索 DLI

操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并获取SQL作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题。 DLI作业要由用户主账户统一设置及修改，子用户无权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
流生态作业开发指引 - 数据湖探索 DLI

流生态作业开发指引流生态系统基于Flink和Spark双引擎，完全兼容Flink/Storm/Spark开源社区版本接口，并且在此基础上做了特性增强和性能提升，为用户提供易用、低时延、高吞吐的数据湖探索。数据湖探索的流生态开发包括云服务生态、开源生态和自拓展生态：云服务生态 DLI服务在Stream

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
查询Spark作业日志 - 数据湖探索 DLI

操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并获取Spark作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题。 DLI作业要由用户主账户统一设置及修改，子用户无权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
SparkSQL建表参数规范 - 数据湖探索 DLI

SparkSQL建表参数规范规则建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
DLI请求条件 - 数据湖探索 DLI
DLI请求条件 - 数据湖探索 DLI

g:UserId 全局级 String 当前登录的用户ID。 g:UserName 全局级 String 当前登录的用户名。 g:ProjectName 全局级 String 当前登录的Project。 g:DomainName 全局级 String 当前登录的Domain。 g:ResourceTag

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理

总条数： 478

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

DLI使用SMN主题，提示SMN主题不存在，怎么处理？ - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

Hbase - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

跨源认证权限管理 - 数据湖探索 DLI

手动续费 - 数据湖探索 DLI

在DLI控制台配置表权限 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

DLI请求条件 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线