搜索_华为云

使用DLI分析账单消费数据 - 数据湖探索 DLI

在数据湖探索服务中创建表。登录DLI控制台，左侧导航栏单击“SQL编辑器”，执行引擎选择“spark”，选择执行的队列和数据库。本次演示队列和数据库选择“default”。下载的文件中包含时间用量等，按表头意义在DLI上创建表，具体可以参考如下示例，其中amount列为费用。

帮助中心 > 数据湖探索 DLI > 最佳实践
Java SDK - 数据湖探索 DLI
Java SDK - 数据湖探索 DLI

Java SDK Java SDK概述 Java SDK环境配置 OBS授权队列相关资源相关 SQL作业相关 Flink作业相关 Spark作业相关 Flink作业模板相关

 帮助中心 > 数据湖探索 DLI > SDK参考
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

heckpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

以RDS数据源为例：在RDS控制台“实例管理”页面，单击对应实例名称，查看“连接信息”>“内网地址”，即可获取RDS内网地址。查看“连接信息”>“数据库端口”，获取RDS数据库实例端口。在DLI管理控制台，单击“资源管理 > 队列管理”。选择增强型跨源所绑定的资源池下的队列，单击操作列“更多 > 测试地址连通性”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
查询作业详细信息 - 数据湖探索 DLI

您可以在API Explorer中调试该接口。 URI URI格式： GET/v1.0/{project_id}/jobs/{job_id}/detail 参数说明表1 URI 参数参数名称是否必选参数类型说明 project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
提交SQL作业（推荐） - 数据湖探索 DLI

是否必选参数类型说明 sql 是 String 待执行的SQL语句。 currentdb 否 String SQL语句执行所在的数据库。当创建新数据库时，不需要提供此参数。 current_catalog 否 String 待提交作业的表的默认catalog。不填时默认使用DLI

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
配置SQL防御规则 - 数据湖探索 DLI

进行主动防御行为。管理员可将SQL防御行为在“提示”、“拦截”、“熔断”选项之间进行灵活切换，系统会将发生的SQL防御事件实时写入到防御审计日志中。运维人员可进行日志分析，评估现网SQL质量，提前感知潜在SQL风险，并做出有效预防措施。本节操作介绍创建SQL防御规则以增加SQL防御能力的配置方法。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用CES监控DLI服务 - 数据湖探索 DLI

queue_job_succeed_num 已完成作业数展示用户队列中状态为已完成的作业数。 ≥0 队列 5分钟 queue_job_failed_num 已失败作业数展示用户队列中状态为已失败的作业数。 ≥0 队列 5分钟 queue_job_cancelled_num 已取消作业数

 帮助中心 > 数据湖探索 DLI > 用户指南
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

每次写入请求缓存行的最大值。它能提升写入HBase数据库的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。 sink.buffer-flush.max-rows 否 1000 Integer 每次写入请求缓存的最大行数。它能提升写入HBase数据库的性能，但是也可能增加延迟。设置为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

登录RDS管理控制台。在管理控制台左上角选择区域。单击“购买数据库实例”配置相关参数。主要参数的填下说明如下，其他参数保持默认值即可。计费模式：按需付费区域：选择与DLI服务相同的区域实例名称：rds-dliflink 数据库引擎：MySQL 数据库版本：8.0 实例类型：主备存储类型：SSD云盘

 帮助中心 > 数据湖探索 DLI > 快速入门
CREATE SCHEMA - 数据湖探索 DLI
CREATE SCHEMA - 数据湖探索 DLI

[WITH (property_name=property_value,...)] 描述创建一个空的schema。schema是表、视图以及其他数据库对象的容器。当指定可选参数IF NOT EXISTS时，如果系统已经存在同名的schema，将不会报错。示例创建一个名为web的schema：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
配置多版本过期数据回收站 - 数据湖探索 DLI

TBLPROPERTIES：TBLPROPERTIES子句给表添加key/value的属性。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 obs桶多版本回收站目录

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
导入数据（废弃） - 数据湖探索 DLI

、avro数据类型）。说明：不支持导入Hive表生成的avro格式数据。 database_name 是 String 导入表所属的数据库名称。 table_name 是 String 导入表的名称。 with_column_header 否 Boolean 导入数据中的第一

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据功能描述 Spark为了提高性能会缓存Parquet的元数据信息。当更新了Parquet表时，缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据作业执行报错，报错信息参考如下： DLI.0002: FileNotFoundException:

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据问题现象客户创建Flink SQL作业，消费Kafka后sink到es集群，作业执行成功，但无数据。原因分析查看客户作业脚本内容，排查无问题，作业执行成功，出现该问题可能的原因如下：数据不准确。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
在Spark SQL作业中使用UDF - 数据湖探索 DLI

单击“确定”，完成创建程序包。创建UDF函数。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。图11 选择队列和数据库在SQL编辑区域输入下列命令创建UDF函数，单击“执行”提交创建。 CREATE FUNCTION TestSumUDF AS

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

forEachRemaining(credentialProviders::add); if (credentialProviders.size() != 1) { throw new RuntimeException("Failed to obtain

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
数据湖探索简介 - 数据湖探索 DLI

格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。功能介绍 DLI用户可以通过可视化界面、Restful API、JDBC、Beeline等多种接入方式对云上

 帮助中心 > 数据湖探索 DLI > 产品介绍
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询制定资源包、删除资源包的Python SDK使用说明。 SQL作业相关介绍数据库相关、表相关、作业相关的Python SDK使用说明。 Spark作业相关介绍提交Spark作业、取消Spark作业、删除Spark作业等Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK

总条数： 1508

上一页
1
...
12
13
14
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI分析账单消费数据 - 数据湖探索 DLI

Java SDK - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

查询作业详细信息 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

使用CES监控DLI服务 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

CREATE SCHEMA - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线