搜索_华为云

Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持久化的Catalog，二是利用Flink来读写Hive的表。Overview

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码操作场景本例提供使用Spark作业访问DWS数据源的java样例代码。在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
使用DLI进行账单分析与优化 - 数据湖探索 DLI

本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：步骤1：获取消费数据。获取账户的实际消费数据。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

css_table"); 提交Spark作业将写好的代码文件生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明本样例只适用于MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
创建DLI委托（废弃） - 数据湖探索 DLI

able（表格存储服务）的CloudTable Administrator权限；使用VPC（虚拟私有云）的VPC Administrator权限；访问和使用DIS数据源（数据接入服务）的DIS Administrator权限；使用SMN（消息通知服务）的SMN Administr

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 委托相关API（废弃）
Spark作业使用咨询 - 数据湖探索 DLI

如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。查看Spark内置依赖包的版本请参考内置依赖包。资源包管理中的包是否能够下载? 资源包仅提供托管服务，不提供下载功能。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
CloudTable OpenTSDB输出流 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到CloudTable的OpenTSDB中。OpenTSDB是基于HBase的分布式的，可伸缩的时间序列数据库。它存储的是时间序列数据，时间序列数据是指在不同时间点上收集到的数据，这类数据反映了一个对象随时间的变化状态或程度。支持秒级别数据的采集监控，进

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
CloudTable OpenTSDB输出流 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到CloudTable的OpenTSDB中。OpenTSDB是基于HBase的分布式的，可伸缩的时间序列数据库。它存储的是时间序列数据，时间序列数据是指在不同时间点上收集到的数据，这类数据反映了一个对象随时间的变化状态或程度。支持秒级别数据的采集监控，进

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
创建Flink Jar作业 - 数据湖探索 DLI

选择作业运行时使用的队列资源。应用程序选择Jar作业程序包。 Jar包的管理方式：上传OBS管理程序包：提前将对应的jar包上传至OBS桶中。并在此处选择对应的OBS路径。上传DLI管理程序包：提前将对应的jar包上传至OBS桶中，并在DLI管理控制台的“数据管理>程序包

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖。涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
DLI程序包标签管理 - 数据湖探索 DLI

具体请参见《标签管理服务用户指南》中的“创建预定义标签”章节。在输入框中输入标签键名称。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。标签值您可以选择：在输入框的下拉列表中选择预定义标签值。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

该字段对应的值作为redis的hash数据类型的value。而当使用map时，会将flink中该字段值的key作为redis的hash数据类型的field，该字段值的value作为redis hash数据类型的value。其具体示例如下：对于fields：创建的Flink作业运行脚本如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
导入Flink作业 - 数据湖探索 DLI
导入Flink作业 - 数据湖探索 DLI

导入作业的信息。具体请参考表4。表4 job_mapping参数说明参数名称是否必选参数类型说明 old_job_id 否 Long 导入的作业ID。 new_job_id 否 Long 导入后的作业ID，如果“is_cover”为“false”，服务中有同名的作业，则该参数返回值为“-1”。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Flink Jar作业开发基础样例 - 数据湖探索 DLI

供用户调用的方法，DLI只对这些方法的兼容性做出产品保证。图4 配置参数表3 参数说明名称描述 CU数量一个CU为1核4G的资源量。CU数量范围为2~400个。管理单元设置管理单元的CU数，支持设置1~4个CU，默认值为1个CU。并行数作业中每个算子的最大并行数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource Connections Agency Access”是跨源场景访问和使用VPC、子网、路由、对等连接的权限。了解更多DLI委托权限请参考DLI委托权限。选择dli_management_agency需要包含的权限后，并单击“更新委托权限”。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类

总条数： 560

上一页
1
...
21
22
23
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive源表 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

使用DLI进行账单分析与优化 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

创建DLI委托（废弃） - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

CloudTable OpenTSDB输出流 - 数据湖探索 DLI

CloudTable OpenTSDB输出流 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

DLI程序包标签管理 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

导入Flink作业 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线