搜索_华为云

Spark jar 如何读取上传文件 - 数据湖探索 DLI

Executor获取文件路径的时候，仍然需要使用SparkFiles.get(“filename”)的方式获取。 SparkFiles.get()方法需要spark初始化以后才能调用。图1 添加其他依赖文件代码段如下所示 package main.java import org.apache

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

* from ... 在“数据湖探索管理控制台>SQL编辑器”页面，单击编辑窗口右上角“设置”，可配置参数。通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
查询作业详情 - 数据湖探索 DLI

“show_detail”为“true”时独有。最小值：2 最大值：400 默认为“2”。 parallel_number 否 Integer 用户设置的作业并行数。 “show_detail”为“true”时独有。最小值：1 最大值：2000 默认为“1”。 smn_topic 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
初始化DLI客户端 - 数据湖探索 DLI

险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称 projectId ：项目ID 通过以下方式可

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

STRUCT 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列> 找到作业的所属队列> 更多> 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
初始化DLI客户端 - 数据湖探索 DLI

险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称 projectId ：项目ID 通过以下方式可

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

percentage)→array<[same as x]> 描述：按照百分比percentage，返回所有x输入值的近似百分位数。每一项的权重值为w且必须为正数。x设置有效的百分位。percentage的值必须在0到1之间，并且所有输入行必须为常量。 select approx_percentile(x,

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用DLI分析账单消费数据 - 数据湖探索 DLI

> 数据湖探索DLI”。在消费汇总中可以发现DLI计算资源使用量消费最多。图2 费用汇总单击“账单详情 > 自定义账单”，单击“维度设置”，选择“按使用量”。“统计周期”选择“明细”。在显示数据的标题行，“产品类型”选择“数据湖探索 DLI”，“产品”选择“DLI计算资源使用量”，单击“导出账单”。

帮助中心 > 数据湖探索 DLI > 最佳实践
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from test_dds").show() 操作结果通过DataFrame API访问设置连接参数 val url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

带有“( )”，例如：PARTITION (facultyNo=20, classNo=103);。示例为了便于理解删除分区语句的使用方法，本节示例为您提供源数据，基于源数据提供删除分区的操作示例。使用DataSource语法创建一个OBS表分区表。创建了一个名为stud

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
开启Flink作业动态扩缩容 - 数据湖探索 DLI

据。因扩缩容过程中需要触发savepoint，因此必须配置obs桶，并保存日志，同时请注意开启checkpoint。扩缩容检测周期不要设置过小，避免频繁启停作业。扩缩容作业恢复过程中的时间长短受savepoint的大小影响，如果保存点较大，可能恢复时间较慢。如果需要调整动

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

Hudi当前只有int、bigint、float、double、decimal、string、date、timestamp、boolean、binary类型支持设置默认值。 Hudi表必须指定primaryKey与preCombineField。在指定路径下创建表时，如果路径下已存在Hudi表，则建

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
增强型跨源连接概述 - 数据湖探索 DLI

增强型跨源连接需要使用VPC、子网、路由、对等连接功能，因此需要获得VPC（虚拟私有云）的VPC Administrator权限。可在服务授权中进行设置。使用约束限制使用DLI增强型跨源时，弹性资源池/队列的网段与数据源网段不能重合。访问跨源表需要使用已经创建跨源连接的队列。跨源表不支持Preview预览功能。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
创建DLI自定义委托权限 - 数据湖探索 DLI

单击右上方登录的用户名，在下拉列表中选择“统一身份认证”。在左侧导航栏中，单击“委托”。在“委托”页面，单击“创建委托”。在“创建委托”页面，设置如下参数：委托名称：按需填写，例如“dli_obs_agency_access”。委托类型：选择“云服务”。云服务：（“委托类型”选

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

创建OBS表的Hive语法可以参考使用Hive语法创建OBS表。使用DataSource语法创建OBS表以下通过创建CSV格式的OBS表举例，创建其他数据格式的OBS表方法类似，此处不一一列举。创建OBS非分区表指定OBS数据文件，创建csv格式的OBS表。按照以下文件内容创建“test.csv”文件，并将“test

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 -W：默认管理员用户的密码。在命令行窗口输入以下命令创建数据库“testdwsdb”。 CREATE DATABASE

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
添加Flink作业标签 - 数据湖探索 DLI

单击“确定”。（可选）在标签列表中，单击“操作”列中“删除”可对选中的标签进行删除。根据标签查找作业对于已经添加过标签的作业，用户可以通过设置标签过滤条件进行搜索，以便快速查找到作业。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入Flink作业管理页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
分析窗口函数概览 - 数据湖探索 DLI

percent_rank percent_rank() DOUBLE 为窗口的ORDER BY子句所指定列中值的返回秩，但以介于0和1之间的小数形式表示，计算方法为 (RANK - 1)/(- 1)。 rank rank() INT 计算一个值在一组值中的排位。如果出现并列的情况，RANK函数会在排名序列中留出空位。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

1997-04-25T14:14:14,{flink=123},123,{inner_map={key=234}},234) 各数据类型获取元素的方法： - map：map['key'] - array：array[index] - row：row.key array 的起始下标从 1 开始，即

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

(orc_table_property = value [, ...] ) ] 限制创建分区表时，如果bucket_count为-1且建表语句中未设置buckets，则使用默认值16。默认外部表存储位置{lakeformation_catalog_url}/{schema_name}.

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法

总条数： 514

上一页
1
...
20
21
22
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark jar 如何读取上传文件 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

添加Flink作业标签 - 数据湖探索 DLI

分析窗口函数概览 - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线