搜索_华为云

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

创建自定义镜像以tensorflow为例，说明如何将tensorflow打包进镜像，生成安装了tensorflow的自定义镜像，在DLI作业中使用该镜像运行作业。准备容器环境。请参考安装容器引擎文档中的“安装容器引擎”章节。使用root用户登录1容器镜像环境，执行以下命令获取DLI的基础镜像。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
CREATE TABLE语句 - 数据湖探索 DLI

则新的 watermark 不会被发出。 Watermark 根据 pipeline.auto-watermark-interval 中所配置的间隔发出。若 watermark 的间隔是 0ms ，那么每条记录都会产生一个 watermark，且 watermark 会在不为空并大于上一个发出的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
CREATE TABLE语句 - 数据湖探索 DLI

则新的 watermark 不会被发出。 Watermark 根据 pipeline.auto-watermark-interval 中所配置的间隔发出。若 watermark 的间隔是 0ms ，那么每条记录都会产生一个 watermark，且 watermark 会在不为空并大于上一个发出的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

NAME primary-keys ARRAY<STRING> NULL 保存源表的主键的列名的数组。如果includePrimaryKeys配置属性设置为true，则仅在JSON输出中包含primary-keys字段。 ingestion-timestamp TIMESTAMP_LTZ(6)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用JDBC提交SQL作业 - 数据湖探索 DLI

使用JDBC提交SQL作业本文介绍通过JDBC连接DLI并提交SQL作业。下载并安装JDBC驱动包使用JDBC连接DLI并提交SQL作业 DLI JDBC Driver支持的API列表父主题：使用客户端工具连接DLI

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

fka写入重复的改动消息，Flink将获得重复的消息。这可能会导致Flink查询得到错误的结果或意外的异常。因此，在这种情况下，建议将作业配置table.exec.source.cdc-events-duplicate设置为true，并在源表上定义PRIMARY KEY。Fram

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

用户为作业选择的CU数。默认值为“2”。 CU数量为DLI的计算单元数量和管理单元数量总和，CU也是DLI的计费单位，1CU=1核4G。当前配置的CU数量为运行作业时所需的CU数，不能超过其绑定队列的CU数量。管理单元参数设置详见：manager_cu_number。 parallel_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
CREATE TABLE语句 - 数据湖探索 DLI

则新的 watermark 不会被发出。 Watermark 根据 pipeline.auto-watermark-interval 中所配置的间隔发出。如果 watermark 的间隔是 0ms ，那么每条记录都会产生一个 watermark，且 watermark 会在不为空并大于上一个发出的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

db/{table_name}，其中{lakeformation_catalog_url}对接的lakeformation catalog配置的location，{schema_name}为建表时使用的schema，{table_name}为表名。不允许向托管表（表属性external

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
数学运算函数 - 数据湖探索 DLI

数学运算函数关系运算符所有数据类型都可用关系运算符进行比较，并返回一个BOOLEAN类型的值。关系运算符均为双目操作符，被比较的两个数据类型必须是相同的数据类型或者是可以进行隐式转换的类型。 Flink SQL提供的关系运算符，请参见表1。表1 关系运算符运算符返回类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
数学运算函数 - 数据湖探索 DLI

数学运算函数关系运算符所有数据类型都可用关系运算符进行比较，并返回一个BOOLEAN类型的值。关系运算符均为双目操作符，被比较的两个数据类型必须是相同的数据类型或者是可以进行隐式转换的类型。 Flink SQL提供的关系运算符，请参见表1。表1 关系运算符运算符返回类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

https://{Endpoint}/v3/projects”，其中{Endpoint}为IAM的终端节点，可以从地区和终端节点获取。响应示例如下，例如DLI服务部署的区域为“cn-north-4”，相应消息体中查找“name”为“cn-north-4”，其中projects下的“id”即为项目ID。 {

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
查询作业列表 - 数据湖探索 DLI

shared_cluster：共享 exclusive_cluster：独享 edge_node：边缘节点 job_config 否 Object 作业配置。 “show_detail”为“false”时独有。具体参数说明请参见表6。 main_class 否 String jar包主类。“s

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查询作业详情 - 数据湖探索 DLI

shared_cluster：共享 exclusive_cluster：独享 edge_node：边缘节点 job_config 否 Object 作业配置, 具体参数说明请参见表4。 main_class 否 String jar包主类。例如，org.apache.spark.examples

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

thon程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DL

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用DLI分析电商BI报表 - 数据湖探索 DLI

将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。下载OBS Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录

 帮助中心 > 数据湖探索 DLI > 最佳实践
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

户组授予策略或角色，才能使得该用户组中的用户获得对应的权限，这一过程称为授权。授权后，用户就可以基于被授予的权限对云服务进行操作。 DLI部署时通过物理区域划分，为项目级服务。授权时，“作用范围”需要选择“区域级项目”，然后在指定区域对应的项目中设置相关权限，并且该权限仅对此项目

 帮助中心 > 数据湖探索 DLI > 产品介绍
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

DLI委托可以确保DLI在跨源分析场景中安全、有效地访问其他云服务。发布区域：全部创建DLI自定义委托 OBS 2.0支持自定义镜像 DLI支持容器部署的集群。在容器集群中，Spark作业和Flink作业相关组件都运行在容器中，通过下载DLI提供的自定义镜像，可以改变Spark作业和Fli

帮助中心 > 数据湖探索 DLI > 功能总览
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

时间戳。此函数不是确定性的，这意味着将为每个记录重新计算该值。 UNIX_TIMESTAMP(string1[, string2]) BIGINT 使用表配置中指定的时区将格式为 string2 的日期时间字符串 string1（如果未指定默认情况下：yyyy-MM-dd HH:mm:ss）转换为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数

总条数： 499

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

使用JDBC提交SQL作业 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线