搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-redis").getOrCreate() 设置连接参数 1 2 3 4 host = "192.168.4.199" port = "6379" table = "person" auth

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

com/artifactory/api/pypi/cbu-pypi-public/simple 内容复制到基础镜像中 USER omm 其中，主要包含了以下步骤：设置pip的可用仓库地址。使用pip3安装tensorflow算法包。将安装了算法包的临时镜像builder里的内容复制到基础镜像中（这一

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

job_ids.add(jobId); job_ids.add(jobId2); GetFlinkJobsMetricsBody body = new GetFlinkJobsMetricsBody(); body.jobIds(job_ids); QueryF

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

10:10:00 cookie2 2015-04-10 11:00:00 url77 2015-04-10 10:50:01 说明：因为没有设置默认值，当没有上两行时显示为NULL。示例2： SELECT cookieid, createtime, url, LAG(createtime

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

Key)或Token两种认证方式初始化客户端，具体操作请参考初始化DLI客户端 Java SDK列表表1 Java SDK列表类型说明 OBS授权介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java SDK使用说明。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

percentage)→array<[same as x]> 描述：按照百分比percentage，返回所有x输入值的近似百分位数。每一项的权重值为w且必须为正数。x设置有效的百分位。percentage的值必须在0到1之间，并且所有输入行必须为常量。 select approx_percentile(x,

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

schema) // 步骤3：配置写入的表名和OBS路径 val databaseName = "default" val tableName = "hudi_table" val basePath = "obs://bucket/path/hudi_table"

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

建议为streaming-source.monitor-interval（最新分区作为临时表）或 lookup.join.cache.ttl（所有分区作为临时表）设置一个相对较大的值。否则，作业容易出现性能问题，避免表更新和重新加载过于频繁。缓存刷新需加载整个Hive表。无法区分新数据和旧数据。参数说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Json函数和运算符 - 数据湖探索 DLI

'null'。不过，在从包含NULL的数组或Map进行转换时，生成的JSON将包含NULL。在从ROW转换为JSON时，结果是一个JSON数组，而不是一个JSON对象。这是因为对于SQL中的行，位置比名称更重要。支持从BOOLEAN、TINYINT、SMALLINT、INTEGER、BIGINT、RE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Confluent Avro Format - 数据湖探索 DLI

t avro的形式写入作为sink的topic中。根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from test_dds").show() 操作结果通过DataFrame API访问设置连接参数 val url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

从地区和终端节点中获取。 scope参数定义了Token的作用域，下面示例中IAM获取的Token仅能访问project下的资源。您还可以设置Token的作用域为某个账号下所有资源或账号的某个project下的资源，详细定义请参见IAM获取用户Token。 1 2 3 4

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

keytab','principal'='krbtest') "); 与未开启kerberos认证相比，开启了kerberos认证需要多设置三个参数，如表1所示。表1 参数说明参数名称与参数值参数说明 'krb5conf' = './krb5.conf' krb5.conf的地址。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。您可以使用本文档提供API对数据湖探索进行相关操作，包括队列、SQL作业、Flink

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

并且促使各个厂商以及研究机构将该项技术推向极限。本示例将演示DLI直接对存储在OBS中的TPC-H数据集进行查询的操作，DLI已经预先生成了100M的TPC-H-2.18的标准数据集，已将数据集上传到了OBS的tpch文件夹中，并且赋予了只读访问权限，方便用户进行查询操作。 TPC-H的测试和度量指标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
为什么在DLI控制台中查询不到表？ - 数据湖探索 DLI

> 库表管理”。单击对应的数据库名称，进入到表管理界面。在对应表的“操作”列，单击“权限管理”，进入到表权限管理界面。单击“授权”，授权对象选择“用户授权”，用户名选择需要授权的用户名，勾选对应需要操作的权限。如“查询表”、“插入”等根据需要勾选。单击“确定”完成权限授权。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

1008L) or ts >= 1009L', order => 'ts'); call run_clustering(path => 'obs://bucket/path/hudi_test2', predicate => "dt = '2021-08-28'", order =>

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

Location: obs://bucket/user/hive/warehouse/fruit Table Type:

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
CLEAN_FILE - 数据湖探索 DLI
CLEAN_FILE - 数据湖探索 DLI

mode=>'query'); call clean_file(table => 'h1', mode=>'undo', backup_path=>'obs://bucket/hudi/h1/.hoodie/.cleanbackup/hoodie_repair_backup_20230527');

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

在估算存储费用时，请特别注意，DLI采用压缩存储，通常能压缩到原文件大小的 1/5 。DLI存储按照压缩后的大小计费。如果数据存储在OBS服务中，则DLI服务不收取存储费用，对应的费用由OBS服务收取。扫描量计费按照用户每个作业的数据扫描量（单位为“GB”）收取计算费用。当前仅适用于在默认def

帮助中心 > 数据湖探索 DLI > 计费说明

总条数： 729

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

lag - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

为什么在DLI控制台中查询不到表？ - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

DESCRIBE - 数据湖探索 DLI

CLEAN_FILE - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线