搜索_华为云

调用说明 - 数据湖探索 DLI
调用说明 - 数据湖探索 DLI

调用说明数据湖探索提供了REST（Representational State Transfer）风格API，支持您通过HTTPS请求调用，调用方法请参见构造请求。 DLI API中除特殊说明外，通常为同步操作，即响应消息中的“is_success”为请求是否执行成功。若API为异步

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

当您在提交导入数据到DLI表的作业时，如果遇到Parquet/Orc格式的OBS表对应的文件压缩率较高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.maxPartitionBytes=33554432”。该

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
file - 数据湖探索 DLI
file - 数据湖探索 DLI

G，可指定以上6种数据格式，另一种是STORED AS，只能指定ORC和PARQUET。 ORC对RCFile做了优化，可以提供一种高效的方法来存储Hive数据。 PARQUET是面向分析型业务的列式存储格式。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

Us需小于等于弹性资源池的剩余可用CUs，才可以确保作业任务的正常执行。本节操作介绍查看弹性资源池计算资源使用情况、作业所需CU数的查看方法。怎样查看弹性资源池的资源使用情况？登录DLI管理管理控制台。选择“资源管理 > 弹性资源池”。在弹性资源池的列表页查看资源池的“实际CUs”和“已使用CUs”。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

using json options(path 'obs://....') using json：指定使用 JSON 格式。 options：用于设置表的选项。 path：指定OBS中JSON文件的路径。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Bitwise函数 - 数据湖探索 DLI
Bitwise函数 - 数据湖探索 DLI

Bitwise函数 bit_count(x, bits) → bigint 计算2的补码表示法中x中设置的位数（视为有符号位的整数）。 SELECT bit_count(9, 64); -- 2 SELECT bit_count(9, 8); -- 2 SELECT bit_count(-7

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建并使用跨源链接 - 数据湖探索 DLI

"ip":"192.168.0.1", "name":"ecs-97f8-0001" }, { "ip":"192.168.0.2", "name":"ecs-97f8-0002" } ] } 响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
增强型跨源连接标签管理 - 数据湖探索 DLI

在对应连接的“操作”列，选择“更多”>“标签”。进入标签管理页面，显示当前连接的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。标签键和标签值设置完成后，单击“添加”，将标签加入到输入框中。图1 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

续使用。购买套餐包登录DLI管理控制台。选择“资源管理 > 队列管理”。在队列管理页面，单击“购买套餐包”。在“购买套餐包”页面设置相关参数。表2 参数说明参数名称描述区域选择所在的区域。不同区域的云服务之间内网互不相通；请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。

帮助中心 > 数据湖探索 DLI > 计费说明
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
查询OpenTSDB表 - 数据湖探索 DLI
查询OpenTSDB表 - 数据湖探索 DLI

SELECT命令用于查询OpenTSDB表中的数据。若OpenTSDB上不存在metric，查询对应的DLI表会报错。若OpenTSDB开了安全模式，则访问时，需要设置conf:dli.sql.mrs.opentsdb.ssl.enabled=true 语法格式 1 SELECT * FROM table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

多IO。 batch.size.entries 单次batch插入entry的条数上限，默认为1000。如果单条数据非常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
查询所有全局变量 - 数据湖探索 DLI

user_id 否 String 用户ID。 user_name 否 String 用户名。 is_sensitive 否 Boolean 是否设置为敏感变量。 create_time 否 Long 创建时间。 update_time 否 Long 更新时间。请求示例无响应示例 {

帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
创建DLI表关联HBase - 数据湖探索 DLI

上已有的表。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联HBase之前需要创建跨源连接。管理控制台操作请参考增强型跨源连接。请确保在DLI队列h

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
lead - 数据湖探索 DLI
lead - 数据湖探索 DLI

orderby_clause 否指定数据在一个窗口内如何排序。返回值说明参数的数据类型。示例代码示例数据为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示例。创建表logs，并添加数据，命令示例如下： create table logs( cookieid

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
创建DLI表关联DCS - 数据湖探索 DLI

有的Key。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联DCS之前需要创建跨源连接，绑定队列。管理控制台操作请参考增强型跨源连接。语法格式指定Key

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
percent - 数据湖探索 DLI
percent - 数据湖探索 DLI

percent_rank percent_rank函数为窗口的ORDER BY子句所指定列中值的返回值，但以介于0和1之间的小数形式表示，计算方法为 (分组内当前行的RANK值-1)/(分组内总行数-1)。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
row - 数据湖探索 DLI
row - 数据湖探索 DLI

否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示例。创建表logs，并添加数据，命令示例如下： CREATE TABLE logs ( cookieid

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Flink作业推荐配置指导 - 数据湖探索 DLI

执行Checkpoint机制会影响实时计算性能，配置间隔时间需权衡对业务的性能影响及恢复时长，建议大于Checkpoint的完成时间，建议设置为5分钟。 Exactly Once模式保证每条数据只被消费一次，At Least Once模式每条数据至少被消费一次，请依据业务情况选择。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类

总条数： 534

上一页
1
...
18
19
20
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

调用说明 - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

file - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

Bitwise函数 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

查询OpenTSDB表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

查询所有全局变量 - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

lead - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

percent - 数据湖探索 DLI

row - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线