搜索_华为云

将OBS数据导入至DLI - 数据湖探索 DLI

本节操作介绍将OBS上的数据导入到DLI控制台的表中。注意事项导入数据时只能指定一个路径，路径中不能包含逗号。如果将CSV格式数据导入分区表，需在数据源中将分区列放在最后一列。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。导入文件支持CSV，Parquet，ORC，JSON和Avro格式，且编码格式仅支持UTF-8。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
INSERT - 数据湖探索 DLI
INSERT - 数据湖探索 DLI

overwrite table delta_table0 select 1, 'a1', 20; 系统响应可在执行历史或作业列表中查看任务运行成功或失败。父主题： Delta DML语法说明

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
RESTORE - 数据湖探索 DLI
RESTORE - 数据湖探索 DLI

Database中的表名，由字母、数字和下划线（_）组成。 obs_path Obs路径，表示Delta表的存储位置。 timestamp_expression 时间戳，不能晚于当前时间，格式'yyyy-MM-ddTHH:mm:ss.SSS' version_code 1.3.1中查询结果中的版本号所需权限 SQL权限

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
创建视图 - 数据湖探索 DLI
创建视图 - 数据湖探索 DLI

REPLACE关键字来避免报错。视图中包含的表或视图信息不可被更改，如有更改可能会造成查询失败。如果创建表和创建视图使用的计算引擎不一致，可能会因为varchar类型不兼容，导致视图查询失败。例如：使用Spark 3.x版本创建的表，建议您使用Spark 2.x创建相应的视图。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 视图相关
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

SELECT 13, 'abc'; 单击“语义校验”确保SQL语义校验成功。单击“保存”，保存作业。单击“启动”，启动作业，确认作业参数信息，单击“立即启动”开始执行作业。等待作业运行完成，作业状态显示为“已完成”。登录RDS控制台，单击RDS数据库实例，单击创建的数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

PERMISSIVE（默认）：尽可能地解析bad records，如果遇到不能转换的字段，则整行为null DROPMALFORMED：忽略掉无法解析的bad records FAILFAST：遇到无法解析的记录时，抛出异常并使Job失败 BADRECORDSPATH：指定导入过程中错误记录的存储目录。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
创建并提交SQL作业 - 数据湖探索 DLI

使用须知首次进入SQL编辑器，页面会提示设置DLI作业桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志等。如果不创建该桶，将无法查看作业日志。桶名称为系统默认。在OBS管理控制台页面通过配置桶的生命周期规则，可以实现定时删除OBS桶中的对象或者定时转换对象的存储类别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询SQL作业日志 - 数据湖探索 DLI

DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

print(log_line) 取消批处理作业 DLI提供取消批处理作业的接口。您可以使用该接口取消批处理作业。若作业已经执行结束或失败则无法取消。示例代码如下： 1 2 3 4 5 6 7 def del_spark_batch(dli_client, batch_id):

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
SHALLOW CLONE - 数据湖探索 DLI
SHALLOW CLONE - 数据湖探索 DLI

SHALLOW CLONE delta_table0 VERSION AS OF 10; 系统响应可在执行历史或作业列表中查看任务运行成功或失败。父主题： Delta DDL语法说明

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

格式存储的表。由于connector对不同文件格式的列访问模式不同，drop column后可能会出现查询失败的情况，例如：对于orc格式存储的非分区表，drop column后如果查询失败，需要设置Session属性： set session hive.orc_use_column_names=true;

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建SQL作业模板 - 数据湖探索 DLI

图1 创建模板表1 参数说明参数名称描述名称模板名称。模板名称只能包含数字、英文字母和下划线，但不能是纯数字，不能以下划线开头，且不能为空。输入长度不能超过50个字符。语句需要保存为模板的SQL语句。描述该模板的相应描述。分组设置已有分组创建新分组不分组

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
增强型跨源连接类 - 数据湖探索 DLI

增强型跨源连接类增强型跨源连接绑定队列失败怎么办？ DLI增强型跨源连接DWS失败怎么办？创建跨源成功但测试网络连通性失败怎么办？怎样配置DLI队列与数据源的网络连通？为什么DLI增强型跨源连接要创建对等连接？ DLI创建跨源连接，绑定队列一直在创建中怎么办？新建跨源连

 帮助中心 > 数据湖探索 DLI > 常见问题
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

csv.ignore-parse-errors 否 false Boolean 当解析异常时，是跳过当前字段或行，还是抛出错误失败（默认为 false，即抛出错误失败）。如果忽略字段的解析异常，则会将该字段值设置为null。 csv.array-element-delimiter 否；

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

为了避免因业务修改等需要，手动重启作业后，不丢失数据：对于无内部状态的作业，您可以配置kafka数据源的启动时间或者消费位点到作业停止之前。对于有内部状态的作业，您可以在停止作业时，勾选“触发保存点”。成功后，再次启动作业时，开启“恢复保存点”，作业将从选择的savepoint文件中恢复消费位点及状态。同时，由于Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
查询作业列表 - 数据湖探索 DLI

否 String 作业状态描述。 create_time 否 Long 作业创建时间。 start_time 否 Long 作业启动时间。“0”表示尚未启动。 duration 否 Long 作业运行时长。单位ms，“show_detail”为“false”时独有。 root_id

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

csv.ignore-parse-errors 否 false Boolean 当解析异常时，是跳过当前字段或行，还是抛出错误失败（默认为 false，即抛出错误失败）。如果忽略字段的解析异常，则会将该字段值设置为null。 csv.array-element-delimiter 否；

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
比较函数和运算符 - 数据湖探索 DLI

between适用于值在一个特定的范围内，如：value BETWEEN min AND max Not between适用于值不在某个特定范围内。 null值不能出现在between操作中，如下两种执行结果都是Null： SELECT NULL BETWEEN 2 AND 4; -- null SELECT

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

canal-json.ignore-parse-errors 否 false Boolean 当解析异常时，是跳过当前字段或行，还是抛出错误失败（默认为 false，即抛出错误失败）。如果忽略字段的解析异常，则会将该字段值设置为null。 canal-json.timestamp-format.standard

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

访问OBS的AKSK为例介绍Flink Jar使用DEW获取访问凭证读写OBS的操作指导。用户获取Flink作业委托临时凭证 DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据

总条数： 1278

上一页
1
...
6
7
8
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将OBS数据导入至DLI - 数据湖探索 DLI

INSERT - 数据湖探索 DLI

RESTORE - 数据湖探索 DLI

创建视图 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

SHALLOW CLONE - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

增强型跨源连接类 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

比较函数和运算符 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线