搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

show() 操作结果提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
DLI API类 - 数据湖探索 DLI
DLI API类 - 数据湖探索 DLI

提交SQL作业时，返回“unsupported media Type”信息创建SQL作业的API执行超过时间限制，运行超时报错 API接口返回的中文字符为乱码，如何解决？

帮助中心 > 数据湖探索 DLI > 常见问题
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其2019.1往后的版本。安装Maven 开发环境的基本配置（下载并安装 Maven）。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDAF函数开发流程参考如下：图1 UDAF开发流程表2 开发流程说明

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Flink作业常用操作 - 数据湖探索 DLI

否从保存点恢复。勾选“触发保存点”表示创建保存点。不勾选“触发保存点”表示不创建保存点。默认不创建保存点。保存点的生命周期从触发保存点并停止作业开始，重启作业后结束。保存点在重启作业后自动删除，不会一直保存。停止作业过程中，在作业列表的“状态”列中将显示作业状态，说明如下：

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
pyspark样例代码 - 数据湖探索 DLI

show() 操作结果提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
创建增强型跨源连接 - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。请求消息表2 请求参数参数名称是否必选参数类型说明 name 是 String 连接名称。名称只能包含数字、英文字母、下划线。不能为空。输入长度不能超过64个字符。 dest_vpc_id 是 String 对应服务的vpc的ID。具体请参考《虚拟私有云API参考》。

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

据流管道，主要解决云服务外的数据实时传输到云服务内的问题。数据接入服务每小时可从数十万种数据源（如IoT数据采集、日志和定位追踪事件、网站点击流、社交媒体源等）中连续捕获、传送和存储数TB数据。DIS的更多信息，请参见《数据接入服务用户指南》。语法格式 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
创建DLI程序包 - 数据湖探索 DLI

在“创建程序包”对话框，参见表1设置相关参数。图1 创建程序包表1 参数说明参数名称描述包类型支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件 File：用户文件 ModelFile：用户AI模型文件 OBS路径选择对应程序包的OBS路径。说明：程序包需提前上传至OBS服务中保存。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

properties对应的程序包创建Flink Jar作业并运行。详情参考创建Flink Jar作业。在应用程序中选择步骤2中创建的Flink Jar文件，在其他依赖文件中选择步骤3中创建的properties文件，并指定主类。表3 创建Flink Jar作业参数说明参数说明

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

新建Maven工程，配置pom文件 IntelliJ IDEA 参考操作步骤说明，编写UDTF函数代码。 2 编写UDTF函数代码 3 调试，编译代码并导出Jar包 4 上传Jar包到OBS OBS控制台将生成的UDTF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDTF函数 DLI控制台

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

rownum <=1 | rownum < 2)：优化器通过 rownum = 1 | rownum <=1 | rownum < 2 来识别查询能否被翻译成窗口去重。注意事项 Flink 只支持在滚动窗口、滑动窗口和累积窗口的窗口表值函数后进行窗口去重窗口去重只支持根据事件时间属性进行排序

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

该示例是从HBase数据源中读取数据，并写入到Print结果表中，其具体步骤参考如下（该示例使用的HBase版本1.3.1和2.1.1和2.2.3）：参考增强型跨源连接，在DLI上根据HBase所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink作业队列。参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

ROW 不支持示例该示例是从HBase数据源中读取数据，并写入到Print结果表中（该示例使用的HBase版本2.2.3）：参考增强型跨源连接，在DLI上根据HBase所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink作业队列。参考“修改主机信息”章节描

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

DLI功能增强，保证表刷新操作能对缓存生效，提高程序健壮性。 ADD PARTITION新增支持使用类型化文字说明： Spark2.4.x：在Spark 2.4.x版本中，使用ADD PARTITION时，如果使用类型化文字（例如date'2020-01-01'），分区值会被解析为字符串值date'20

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
服务韧性 - 数据湖探索 DLI
服务韧性 - 数据湖探索 DLI

服务韧性 DLI通过流量限制、跨AZ容灾、备份恢复等技术方案，保障数据的持久性和可靠性。流量限制：DLI通过设置流量控制机制，防止服务过载并保持服务的稳定性。跨AZ容灾：DLI云服务采用跨可用区容灾部署，减少单点故障的风险，提高系统的可用性和弹性。备份恢复：DLI自动化的备份

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
查看队列定时扩缩容计划（废弃） - 数据湖探索 DLI

参数类型说明 id 否 Long 扩缩容计划的ID编号。 plan_name 否 String 队列扩缩容计划名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。 target_cu 否 Integer 队列扩缩容计划CU的目标值。 start_hour

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

求再进行购买。优先推荐使用弹性资源池队列，提高资源使用的灵活性和资源利用效率。购买弹性资源池并在弹性资源池中添加队列请参考创建弹性资源池并添加队列。用户首次使用子账号创建队列时，需要先使用主账号登录控制台，在DLI的数据库中保持记录，才能创建队列。新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
在DLI控制台创建数据库和表 - 数据湖探索 DLI

在“创建数据库”页面，参见表1输入数据库名称和描述信息。图1 库表管理-创建数据库表1 参数说明参数名称描述数据库名称数据库名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。数据库名称大小写不敏感且不能为空。输入长度不能超过128个字符。说明： “defau

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

Management，简称IAM）细粒度鉴权，可以通过在IAM创建策略来管理DLI的权限控制。两种权限控制机制可以共同使用，没有冲突。发布区域：全部创建用户并授权使用DLI DLI自定义策略 DLI常用操作与系统权限关系 OBS 2.0支持弹性资源池和队列使用DLI提交作业前，您需要为提交作业准备所需的计算资源。

帮助中心 > 数据湖探索 DLI > 功能总览
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

JSON函数 JSON函数使用SQL标准的ISO/IEC TR 19075-6中描述的JSON路径表达式。它们的语法受到ECMAScript的启发并采用了ECMAScript的许多特性，但既不是其子集，也不是其超集。路径表达式有两种，一种是宽松模式，另一种是严格模式。当省略时，它默认为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数

总条数： 206

上一页
1
...
4
5
6
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

DLI API类 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

服务韧性 - 数据湖探索 DLI

查看队列定时扩缩容计划（废弃） - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线