搜索_华为云

Python开发环境配置 - 数据湖探索 DLI

Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。操作步骤从Python官网下载并安装Python版本。根据Python官方指导安装Python版本。检验是否配置成功，运行cmd

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

对于随时间变化的分区表，我们可以将其读取为无界流，如果每个分区包含某个版本的完整数据，则该分区可以被视为时间表的一个版本，时间表的版本保留了分区的数据。Flink支持在处理时间关联中自动跟踪时间表的最新分区（版本）。最新分区（版本）由 'streaming-source.partition-order'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
DLI产品咨询类 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 DLI的数据可存储在哪些地方 DLI是否支持导入其他租户共享OBS桶的数据？区域和可用区全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量怎样获取DLI作业样例（Demo） DLI是否存在Apache Spark 命令注入漏洞（CVE-2022-33891）？

帮助中心 > 数据湖探索 DLI > 常见问题
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证数据的完整读取。表1 支持类别类别详情支持表类型源表前提条件 MySQL CDC要求MySQL版本为5.6，5.7或8.0.x。 with参数中字段只能使用单引号，不能使用双引号。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Java开发环境配置 - 数据湖探索 DLI

SDK要求使用JDK1.8或更高版本。考虑到后续版本的兼容性，推荐使用1.8版本。在Java运行环境配置好的情况下，打开windows的命令行，执行命令Java -version，可以检查版本信息。操作步骤安装JDK。从Oracle官网下载并安装JDK1.8版本安装包。配置环境变量

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

根据Spark版本不同，regexp_replace函数的功能略有差异： Spark2.4.5版本及以前版本：regexp_replace函数用于将source字符串中匹配pattern的子串替换成指定字符串replace_string后，返回结果字符串。 Spark3.1.1版本：re

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
WHERE - 数据湖探索 DLI
WHERE - 数据湖探索 DLI

WHERE 功能描述在WHERE子句中嵌套子查询，利用子查询的结果作为过滤条件。语法格式 1 2 SELECT [ALL | DISTINCT] attr_expr_list FROM table_reference WHERE {col_name operator (sub_query)

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
CSS安全集群配置 - 数据湖探索 DLI

单击“安全模式”中的“下载证书”下载安全证书。使用keytool工具生成keystore和truststore文件。使用keytool工具生成keystore和truststore文件，其中需要使用到安全集群的安全证书（CloudSearchService.cer），keytool工具还有其他参数，可根据需求设置。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
数据湖探索简介 - 数据湖探索 DLI

分钟级别扩缩容，从容应对流量洪峰和资源诉求。支持分时设置队列优先级和配额，提高资源利用率。作业级资源隔离（暂未实现，后续版本支持）支持独立Spark实例运行SQL作业，减少作业间相互影响。自动弹性（暂未实现，后续版本支持）基于队列负载和优先级实时自动更新队列配额。弹性资源池解决方案主要解决了以下问题和挑战。

帮助中心 > 数据湖探索 DLI > 产品介绍
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

数据类型映射 HBase以字节数组存储所有数据，在读和写过程中要序列化和反序列化数据。 Flink的HBase连接器利用HBase（Hadoop) 的工具类org.apache.hadoop.hbase.util.Bytes进行字节数组和Flink数据类型转换。 Flink的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

创建跨源认证数据类型映射 HBase以字节数组存储所有数据，在读和写过程中要序列化和反序列化数据。 Flink的HBase连接器利用HBase（Hadoop) 的工具类org.apache.hadoop.hbase.util.Bytes进行字节数组和Flink数据类型转换。 Flink的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

Hive结果表功能描述本节介绍利用Flink写Hive的表。Hive结果表的定义，以及创建结果表时使用的参数和示例代码。详情可参考：Apache Flink Hive Read & Write Flink 支持在 BATCH 和 STREAMING 模式下从Hive写入数据。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python SDK依赖第三方库包括：urllib3 1.15以上版本，six 1.10以上版本，certifi，python-dateutil。关于Python SDK的获取与安装请参考SDK获取与安装。使用SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。HBase支持消息数据、报表数据、推荐类数据、风控类数据、日志数据、订单数据等结构化、半结构化的KeyValue数据存储。利用DLI，用户可方便地将海量数据高速、低时延写入HBase。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

DLI支持的两种类型的Flink作业： Flink OpenSource SQL类型作业：完全兼容社区版的Flink，确保了作业可以在这些Flink版本上无缝运行。在社区版Flink的基础上，DLI扩展了Connector的支持，新增了Redis、DWS作为数据源类型。为用户提供了更多的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

Canal Format 功能描述 Canal是一个 CDC（ChangeLog Data Capture，变更日志数据捕获）工具，可以实时地将 MySQL 变更传输到其他系统。Canal 为变更日志提供了统一的数据格式，并支持使用 JSON 或 protobuf序列化消息（Canal

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。HBase支持消息数据、报表数据、推荐类数据、风控类数据、日志数据、订单数据等结构化、半结构化的KeyValue数据存储。利用DLI，用户可方便地将海量数据高速、低时延写入HBase。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

csms.version 否最新的version String 在DEW服务的凭据管理中新建的通用凭据的版本号(凭据的版本标识符)。若不指定，则默认获取该通用凭证的最新版本号。配置示例： 'dew.csms.version'='v1' 示例本例以通过DataGen表产生随机

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Spark作业使用咨询 - 数据湖探索 DLI

详细操作请参考访问DWS和访问SQL库表。如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。查看Spark内置依赖包的版本请参考内置依赖包。资源包管理中的包是否能够下载

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

build.sourceEncoding>  <flink.version>1.12.2</flink.version>  <java.version>1.8</java

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南

总条数： 264

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Python开发环境配置 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

DLI产品咨询类 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

Java开发环境配置 - 数据湖探索 DLI

regexp - 数据湖探索 DLI

WHERE - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Flink作业概述 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线