搜索_华为云

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用Hive语法创建OBS表 - 数据湖探索 DLI

file_format 是 OBS表存储格式，支持TEXTFILE, AVRO, ORC, SEQUENCEFILE, RCFILE, PARQUET table_comment 否表描述。仅支持字符串常量。 obs_path 是数据文件所在的OBS存储路径，推荐使用OBS并行文件系统存储。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用DataSource语法创建OBS表 - 数据湖探索 DLI

毫秒级别访问时延，TB/s级别带宽和百万级别的IOPS，适用于大数据交互式分析场景。注意事项创建表时不会统计大小。添加数据时会修改大小至0。如需查看表大小可以通过OBS查看。 CTAS建表语句不能指定表的属性。 OBS目录下包含子目录的场景：创建表时，若指定路径为OBS

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
如何获取AK/SK？ - 数据湖探索 DLI

如何获取AK/SK？访问密钥即AK/SK（Access Key ID/Secret Access Key），表示一组密钥对，用于验证调用API发起请求的访问者身份，与密码的功能相似。用户通过调用API接口进行云资源管理（如创建集群）时，需要使用成对的AK/SK进行加密签名，确保

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
FileSytem结果表 - 数据湖探索 DLI

path。说明：当前schame只支持obs和hdfs。当schema为obs时，表示输出到对象存储服务OBS。注意，OBS必须是并行文件系统，不能是OBS桶。示例：obs://bucketName/fileName，表示数据输出到obs的bucketName桶下的fileName目录中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
OBS授权给DLI服务 - 数据湖探索 DLI

0/{project_id}/dli/obs-authorize 参数说明表1 URI参数说明参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。请求消息表2 请求参数说明参数名称是否必选参数类型说明 obs_buckets

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > Flink作业相关API（废弃）
创建OBS表 - 数据湖探索 DLI
创建OBS表 - 数据湖探索 DLI

创建OBS表使用DataSource语法创建OBS表使用Hive语法创建OBS表父主题：表相关

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关
将OBS数据导入至DLI - 数据湖探索 DLI

CSV 数据源路径直接输入路径或单击选择OBS的路径，如果没有合适的桶可直接跳转OBS创建。创建OBS表时指定的路径必须是文件夹，如果建表路径是文件将导致导入数据失败。当OBS的目录下有同名文件夹和文件时，数据导入指向该路径会优先指向文件而非文件夹。说明：路径同时支持文件和文件夹。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
导入数据（废弃） - 数据湖探索 DLI

该API用于将数据从文件导入DLI或OBS表，目前仅支持将OBS上的数据导入DLI或OBS中。当前接口已废弃，不推荐使用。该API为异步操作。导入数据时，可选择已存在的OBS桶路径或新建OBS桶路径，但只能指定一个OBS桶路径。若需新建OBS桶，需遵守以下命名规则：需全局唯一，不能与已有的任何桶名称重复。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
导出DLI表数据至OBS中 - 数据湖探索 DLI

gzip 存储路径输入或选择OBS路径。导出路径必须为OBS桶中不存在的文件夹，即用户需在OBS目标路径后创建一个新文件夹。文件夹名称不能包含下列特殊字符：\ / : * ? " < > |，并且不能以“.”开头和结尾。导出方式导出数据的保存方式。随导出创建指定路径：指定的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
添加分区（只支持OBS表） - 数据湖探索 DLI

添加分区（只支持OBS表）功能描述创建OBS分区表成功后，OBS表实际还没有生成分区信息。生成分区信息主要有以下两种场景：给OBS分区表插入对应的分区数据，数据插入成功后OBS表才会生成分区元数据信息，后续则可以根据对应分区列进行查询等操作。手工拷贝分区目录和数据到OBS分区表路

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

导入作业默认是追加写，如果需要覆盖写，则可以调用ImportJob对象的setOverWrite接口设置，如：importJob.setOverWrite(Boolean.TRUE)。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统问题现象客户执行Flink Jar作业，通过设置checkpoint存储在OBS桶中，作业一直提交失败，并伴有报错提交日志，提示OBS桶名不合法。原因分析确认OBS桶名是否正确。确认所用AKSK是否有权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Sp

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Flink作业如何保存作业日志？ - 数据湖探索 DLI

Flink作业如何保存作业日志？在创建Flink SQL作业或者Flink Jar作业时，可以在作业编辑页面，勾选“保存作业日志”参数，将作业运行时的日志信息保存到OBS。勾选“保存作业日志”参数后，需配置“OBS桶”参数，选择OBS桶用于保存用户作业日志信息。如果选择的OBS桶是未授权状态，需要单击“OBS授权”。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
如何获取项目ID？ - 数据湖探索 DLI

如何获取项目ID？项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
SQL作业访问报错：DLI.0003: AccessControlException XXX - 数据湖探索 DLI

SQL作业访问报错：DLI.0003: AccessControlException XXX 问题现象 SQL作业访问报错：DLI.0003: AccessControlException XXX。解决措施请检查OBS桶权限，确保账号有权限访问报错信息中提到的OBS桶。如果

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败问题描述使用Spark访问元数据时，DataSource语法创建avro类型的OBS表创建失败。图1 avro类型的OBS创建失败根因分析当前Spark2.3.x不支持创建avro类型的OBS表，Spark2

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
修改表分区位置（只支持OBS表） - 数据湖探索 DLI

LOCATION：分区路径。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path OBS存储路径。注意事项所要修改位置的表分区必须是已经存在的，否则将报错。 “partition_specs”中的参数默认带有“(

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
查看赋权对象使用者权限信息 - 数据湖探索 DLI

project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。表2 query参数参数名称是否必选参数类型说明 object 是 String 授权对象，和赋权API中的“object”对应。 "jobs.flink.flink作业ID"，查询指定的作业。

帮助中心 > 数据湖探索 DLI > API参考 > 权限相关API

总条数： 760

上一页
1
2
3
4
5
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

如何获取AK/SK？ - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

OBS授权给DLI服务 - 数据湖探索 DLI

创建OBS表 - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

Flink作业如何保存作业日志？ - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

SQL作业访问报错：DLI.0003: AccessControlException XXX - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

查看赋权对象使用者权限信息 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线