搜索_华为云

产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

云上：OBS。云下：HDFS。生态兼容 DLV、永洪BI、帆软。大数据生态工具。自定义镜像支持，满足业务多样性。无。工作流调度 DataArts Studio-DLF调度。自建大数据生态的调度工具，如Airflow。企业级多租户基于表的权限管理，可以精细化到列权限。

帮助中心 > 数据湖探索 DLI > 产品介绍
条件函数 - 数据湖探索 DLI
条件函数 - 数据湖探索 DLI

IS_ALPHA(string) 如果字符串中的所有字符都是字母，则返回 true，否则返回 false。 IS_DECIMAL(string) 如果 string 可以解析为有效数字，则返回 true，否则返回 false。 IS_DIGIT(string) 如果字符串中的所有字符都是数字，则返回 true，否则返回

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

json_path) 表2 参数说明参数数据类型说明 json_string STRING 需要解析的JSON对象，使用字符串表示。 json_path STRING 解析JSON的路径表达式，使用字符串表示。目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Spark3.3.1基础镜像内置了3.1.62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 pom文件配置中依赖包 <dependency> <groupId>com.huaweicloud.sdk</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

json_path) 表2 参数说明参数数据类型说明 json_string STRING 需要解析的JSON对象，使用字符串表示。 json_path STRING 解析JSON的路径表达式，使用字符串表示。目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
创建DLI表关联CSS - 数据湖探索 DLI

的条数上限，则停止存储数据，以batch.size.entries为准，提交该批次的数据。 es.nodes.wan.only 是否仅通过域名访问es节点，默认为false。使用经典型跨源的连接地址作为es.nodes时，该参数需要配置为true；使用css服务提供的原始内网IP地址作为es

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

stopFlinkJob(body); System.out.println(result); } 批量删除作业 DLI提供批量删除Flink作业的接口。您可以使用该接口批量删除任何状态的Flink作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

sum; } } } 图8 编写UDAF函数代码编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

} } 最后调用close方法，对需要清理的方法进行清理。编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SDK的获取与安装 - 数据湖探索 DLI

Maven安装完成后，可根据开发需要，直接引入依赖到已有的Maven工程或先用开发工具创建Maven工程。创建项目以idea开发工具为例(已有Maven 工程可跳过此步骤)：打开IntelliJ IDEA 开发工具。点击File - New - project... 在New Pro

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。 DLI

帮助中心 > 数据湖探索 DLI > 最佳实践
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者Sbt构建工具中将scope设为provided 日志配置文件（例如l：“log4j.properties”或者“logback.xml”等）日志输出实现类JAR包（例如：log4j等）

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

图2 续费管理为包年/包月资源开通自动续费。单个资源开通自动续费：选择需要开通自动续费的资源，单击操作列“更多 > 开通自动续费”。批量资源开通自动续费：选择需要开通自动续费的资源，单击列表左上角的“更多 > 开通自动续费”。选择续费时长，并根据需要设置自动续费次数，单击“开通”。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
Flink作业常用操作 - 数据湖探索 DLI

启动作业，有以下两种方式：启动单个作业选择一个作业，在对应的“操作”列中，单击“启动”。也可以在作业列表中，勾选一个作业，单击作业列表左上方的“启动”。批量启动作业勾选多个作业，单击作业列表左上方的“启动”，可以启动多个作业。单击“启动”后，跳转至“作业配置清单”页面。在“作业配置清单”

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建DLI表关联RDS - 数据湖探索 DLI

控制台操作请参考增强型跨源连接。创建经典型跨源连接后，使用经典型跨源连接中返回的连接地址。创建增强型跨源连接后，使用RDS提供的"内网域名"或者内网地址和数据库端口访问，MySQL格式为"协议头://内网IP:内网端口"，PostGre格式为"协议头://内网IP:内网端口/数据库名"。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
Hudi表索引设计规范 - 数据湖探索 DLI

表时严重依赖parquet文件是否存在，如果当前Hudi表写的是log文件，采用Spark写入就会导致重复数据的产生。在批量初始化阶段，先采用Spark批量写入Hudi表，再用Flink基于Flink状态索引写入不会有问题，原因是Flink冷启动的时候会遍历所有的数据文件生成状态索引。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

1.10以上版本，certifi，python-dateutil。关于Python SDK的获取与安装请参考SDK获取与安装。使用SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Toke

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
创建DLI表关联HBase - 数据湖探索 DLI

台操作请参考增强型跨源连接。请确保在DLI队列host文件中添加MRS集群master节点的“/etc/hosts”信息。如何添加IP域名映射，请参见《数据湖探索用户指南》中增强型跨源连接章节。该语法不支持安全集群。语法格式单个RowKey 1 2 3 4 5 6 7 8

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
数据保护技术 - 数据湖探索 DLI

ssl.keystore keystore的存放路径，“flink.keystore”表示用户通过generate_keystore.sh*工具生成的keystore文件名称。是 /opt/flink/usrlib/userData/flink.keystore security

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Flink1.15基础镜像内置了3.1.62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码中“pom文件配置”说明。 pom文件配置中依赖包

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导

总条数： 173

上一页
1
...
5
6
7
8
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

产品优势 - 数据湖探索 DLI

条件函数 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线