搜索_华为云

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
配置DLI云服务委托权限 - 数据湖探索 DLI

除dli_management_agency提供的委托权限外，一些场景需要用户自行在IAM页面创建相关委托，并在作业配置中添加新建的委托信息。例如允许DLI读写OBS将日志转储、允许DLI在访问DEW获取数据访问凭证场景的委托需求等，具体操作请参考创建DLI自定义委托权限和常见场景的委托权限策略。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

Authentication failed 问题原因因为账号没有在全局配置中配置服务授权，导致该账号在创建跨源连接访问外部数据时因为权限不足而导致跨源访问失败。解决方案登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

入RDS页面。在“实例管理页面”，找到您已经创建的RDS实例，获取其内网地址。图5 内网地址单击所创建RDS实例的“登录”，跳转至“数据管理服务-DAS”。输入相关账户信息，单击“测试连接”。显示连接成功后，单击“登录”，进入“实例登录”页面。图6 实例登录登录RDS实例

 帮助中心 > 数据湖探索 DLI > 最佳实践
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出DLI表数据至OBS中支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

说明：默认情况下，空值在CSV数据源中，2.4.5版本空字符串为""，升级到spark3.3.1后空字符串无引号。 Spark2.4.x：空值在CSV数据源中为""。 Spark3.3.x：空值在CSV数据源中无引号。如需在Spark3.3.x版本中恢复Spark2.4.x的格式，可以通过设置spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

单击“确认”，创建策略。图3 创建策略在“用户组”页面，找到需要授权的用户所属的用户组，单击用户组名称，进入用户组“权限管理”页面，单击“配置权限”。为对应的用户组授权：在以下作用范围：选择“区域级项目”。拥有以下权限：勾选2中创建的权限策略。或者勾选系统角色“DLI Service

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

基本概念账号用户注册华为账号并开通华为云。账号对其所拥有的资源及云服务具有完全的访问权限，可以重置用户密码、分配用户权限等。由于账号是付费主体，为了确保账号安全，建议您不要直接使用账号进行日常管理工作，而是创建用户并使用他们进行日常管理工作。用户由账号在IAM中创建的用户，是云服

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
创建并提交SQL作业 - 数据湖探索 DLI

《数据湖探索SQL语法参考》。在总览页面，单击左侧导航栏中的“SQL编辑器”或SQL作业简介右上角的“创建作业”，可进入“SQL编辑器”页面。本节内容介绍使用DLI的SQL编辑器创建并提交SQL作业。使用须知首次进入SQL编辑器，页面会提示设置DLI作业桶。该桶用于存储使

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

您需要将其加入用户组，并给用户组授予策略或角色，才能使得该用户组中的用户获得对应的权限，这一过程称为授权。授权后，用户就可以基于被授予的权限对云服务进行操作。 DLI部署时通过物理区域划分，为项目级服务。授权时，“作用范围”需要选择“区域级项目”，然后在指定区域对应的项目中设置

 帮助中心 > 数据湖探索 DLI > 产品介绍
修改弹性资源池的主机信息 - 数据湖探索 DLI

域名即可访问对应的主机。在跨源连接创建完成后，支持修改主机信息。常见的访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。约束限制已获取MRS主机信息。请参考怎样获取MRS主机信息? 修改主机信息登录DLI管理控制台。在左侧导航栏中，选择“跨源管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ Spark中没有datetime数据类型，其使用的是TIMESTAMP类型。您可以通过函数进行转换。例如： select cast(create_date as string)

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

步骤1：创建VPC 登录虚拟私有云控制台，创建虚拟私有云。创建的VPC供NAT访问公网使用。创建VPC的具体操作请参考创建虚拟私有云。图2 创建VPC 步骤2：创建弹性资源池和队列登录DLI管理控制台。在左侧导航栏单击“资源管理 > 弹性资源池”，可进入弹性资源池管理页面。在弹性

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

数据湖探索”，进入到云服务监控页面。在云服务监控页面，“名称”列对应队列名称，单击对应队列名称，进入到队列监控页面。在队列监控页面，分别查看以下指标查看当前队列的作业运行情况。 “提交中作业数”：展示当前队列中状态为“提交中”的作业数量。 “运行中作业数”：展示当前队列中状态为“运行中”的作业数量。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

s化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”），这些常用算法库满足了大部分用户的使用场景

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

测试的结果，被定义为所有查询执行时间平均值的倒数，公式如下：业务场景用户可以通过DLI内置的TPC-H测试套件进行简单高效的交互式查询，无需用户上传数据，即可以体验DLI的核心功能。 DLI内置TPC-H的优势用户只需要登录DLI，完成授予权限，即可操作SQL语句，无需用户自己创建表和导入数据。预置22条TPC-H

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

在Notebook实例页面配置Notebook实例相关参数。创建Notebook实例。具体参数说明请参考创建Notebook实例。配置过程中：镜像：选择自定义镜像，选择步骤4：注册ModelArts自定义镜像中注册的镜像。 VPC接入：开启VPC接入接入功能请联系客户支

 帮助中心 > 数据湖探索 DLI > 用户指南
DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI常用跨源分析开发方式跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

但是在Spark 3.3.x版本中，Spark尊重用户指定的schema中的nullability，即如果字段被定义为不可为空，Spark会保持该配置要求，不会自动转换为可空的字段。 Spark2.4.x：在Spark 2.4.x版本中，当用户指定的schema包含不可为空的字

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

列CU时套餐包”下线（EOL）公告公告说明为了更好的实现资源共享，提高计算资源利用率，DLI将“包年/包月”和“按需计费”计费模式队列升级为“弹性资源池队列”。即使用DLI计算资源需先购买弹性资源池，并在弹性资源池中创建队列。 DLI“包年/包月”和“按需计费”计费模式队列和

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告

总条数： 1216

上一页
1
...
4
5
6
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线