搜索_华为云

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败问题描述使用Spark访问元数据时，DataSource语法创建avro类型的OBS表创建失败。图1 avro类型的OBS创建失败根因分析当前Spark2.3.x不支持创建avro类型的OBS表，Spark2

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
队列引擎版本升级后，在创建表时，提示权限不足怎么办？ - 数据湖探索 DLI

DLI队列的引擎版本不同，校验的权限范围不同： HetuEngine不支持通过IAM用户授权，需使用DLI资源授权。解决方案请参考《数据湖探索用户指南》中的数据库权限管理章节授予用户创建表的权限。父主题： DLI权限管理类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
提示OBS Bucket没有授权怎么办？ - 数据湖探索 DLI

提示OBS Bucket没有授权怎么办？ DLI更新委托后，将原有的dli_admin_agency升级为dli_management_agency。 dli_management_agency包含跨源操作、消息通知、用户授权操作所需的权限，除此之外的其他委托权限需求，都需自定义DLI委托。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

Spark作业编辑页面支持执行Spark作业，为用户提供全托管式的Spark计算服务。在总览页面，单击Spark作业右上角的“创建作业”，或在Spark作业管理页面，单击右上角的“创建作业”，均可进入Spark作业编辑页面。进入Spark作业编辑页面，页面会提示系统将创建DL

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
配置DLI云服务委托权限 - 数据湖探索 DLI

取IAM用户相关信息、或影响访问跨源所需的网络资源、无法访问SMN服务发送通知消息。约束限制服务授权需要主账号或者用户组admin中的子账号进行操作。 DLI服务授权需要区分项目，请在每个需要新委托的项目分别执行更新委托操作，即切换至对应项目后，再按照本节的操作更新委托权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

管理SQL作业在SQL作业列表页面查看作业的基本信息 DLI SQL作业管理页面显示所有SQL作业，作业数量较多时，系统分页显示，可根据需要跳转至指定页面。您可以查看任何状态下的作业。作业列表默认按创建时间降序排列。表1 作业管理参数参数参数说明队列作业所属队列的名称。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

在“Spark作业”页面，单击对应作业“操作”列中的“编辑”，跳转至“Spark作业编辑”页面，可根据需要修改参数，执行作业。查找作业在“Spark作业”页面，选择“状态”或“队列”。系统将根据设置的过滤条件，在作业列表显示符合对应条件的作业。终止作业在“Spark作业”页面，单击对

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
创建增强型跨源连接 - 数据湖探索 DLI

可选参数，用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。例如：访问MRS的HBase集群时需要配置Zookeeper实例的主机名（即域名）与对应的IP地址。每行填写一条记录，填写格式为：“IP 主机名/域名”。示例： 192.168.0

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

入RDS页面。在“实例管理页面”，找到您已经创建的RDS实例，获取其内网地址。图5 内网地址单击所创建RDS实例的“登录”，跳转至“数据管理服务-DAS”。输入相关账户信息，单击“测试连接”。显示连接成功后，单击“登录”，进入“实例登录”页面。图6 实例登录登录RDS实例

 帮助中心 > 数据湖探索 DLI > 最佳实践
Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

建跨源连接访问外部数据时因为权限不足而导致跨源访问失败。解决方案登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource Connections Agency Access”是跨源场景访问和使用VPC、子网、路由、对等连接的权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Spark作业使用咨询 - 数据湖探索 DLI

SQL语法不支持定义主键。 DLI Spark jar作业是否能访问DWS跨源表？可以访问。详细操作请参考访问DWS和访问SQL库表。如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
测试地址连通性 - 数据湖探索 DLI

信能力。测试队列与数据源地址连通性登录DLI管理控制台，选择“资源管理 > 队列管理”。在“队列管理”页面，选择需要测试地址连通性的队列，单击操作列下的“更多 > 测试地址连通性”。在“测试地址连通性”页面填写需要测试的地址。支持域名和IP，可指定端口。数据源地址支持以

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
初始化DLI客户端 - 数据湖探索 DLI

regionName ：所属区域名称 projectId ：项目ID 通过以下方式可获取AK/SK，项目ID及对应的region信息。登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
初始化DLI客户端 - 数据湖探索 DLI

regionName ：所属区域名称 projectId ：项目ID 通过以下方式可获取AK/SK，项目ID及对应的region信息。登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

据湖探索用户指南》。创建队列。在“资源管理 > 队列管理”下，单击右上角“购买队列”，进入购买队列页面选择“通用队列”，即Spark作业的计算资源。如果创建队列的用户不是管理员用户，在创建队列后，需要管理员用户赋权后才可使用。关于赋权的具体操作请参考《数据湖探索用户指南》。 DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据功能描述 Spark为了提高性能会缓存Parquet的元数据信息。当更新了Parquet表时，缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据作业执行报错，报错信息参考如下： DLI.0002: FileNotFoundException:

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
查看增强型跨源连接的基本信息 - 数据湖探索 DLI

查看增强型跨源连接的基本信息登录DLI管理控制台。选择“跨源管理 > 增强型跨源”。进入增强型跨源连接列表页面，选择您需要查看的增强型跨源连接。在列表页面的右上方单击可以自定义显示列，并设置表格内容显示规则、操作列显示规则。在列表页面上方的搜索区域，您可以名称和标签筛选需要的增强型跨源连接。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

kind：资源包类型，当前支持的包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 obs_jar_paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
SparkSQL建表参数规范 - 数据湖探索 DLI

建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。参数名称参数描述输入值

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

write.operation参数设置写入模式。 insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_insert：该操作会对主键进行排序后直接以写普通p

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考

总条数： 922

上一页
1
...
4
5
6
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

队列引擎版本升级后，在创建表时，提示权限不足怎么办？ - 数据湖探索 DLI

提示OBS Bucket没有授权怎么办？ - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

测试地址连通性 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

查看增强型跨源连接的基本信息 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线