搜索_华为云

get_json_object - 数据湖探索 DLI
get_json_object - 数据湖探索 DLI

Key:Value,...} path 是 STRING 表示在json中的path，以$开头。不同字符的含义如下： $表示根节点。 .表示子节点。 []表示[number]表示数组下标，从0开始。 *表示Wildcard for []，返回整个数组。*不支持转义。返回值说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
提交SQL作业（推荐） - 数据湖探索 DLI

209715200 配置执行连接时显示所有工作节点的表的最大字节大小。通过将此值设置为“-1”，可以禁用显示。说明：当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

使用以下命令在ClickHouse的default_cluster集群节点上创建数据库flink。 CREATE DATABASE flink ON CLUSTER default_cluster; 使用以下命令在default_cluster集群节点上和flink数据库下创建表名为order的ReplicatedMergeTree表。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Format概述 - 数据湖探索 DLI
Format概述 - 数据湖探索 DLI

Format概述 Flink 提供了一套与表连接器（table connector）一起使用的表格式（table format）。表格式是一种存储格式，定义了如何把二进制数据映射到表的列上。表1 Flink支持格式 Formats 支持的Connectors CSV Kafka, Upsert

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie_approx percentile_approx函数用于计算近似百分位数，适用于大数据量。先对指定列升序排列，然后取第p位百分数最靠近的值。命令格式 percentile_approx (colname,DOUBLE p) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
CREATE CATALOG语句 - 数据湖探索 DLI

catalog_name WITH (key1=val1, key2=val2, ...) 语法说明 WITH OPTIONS catalog属性一般用于存储关于这个catalog额外的信息。表达式 key1=val1 中的键和值都是字符串文本常量。父主题： DDL语法定义

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
创建并提交SQL作业 - 数据湖探索 DLI

首次进入SQL编辑器，页面会提示设置DLI作业桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志等。如果不创建该桶，将无法查看作业日志。桶名称为系统默认。在OBS管理控制台页面通过配置桶的生命周期规则，可以实现定时删除OBS桶中的对象或者定时转换对象的存储类别。具体操作请参考通过配置生命周期规则。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

<key1>=<val1>;<key2>=<val2>… endpoint指DLI的域名。projectId指项目ID。在地区和终端节点获取DLI对应的Endpoint，从华为云“用户名”>“我的凭证”页面获取项目编号。 “？”后面接其他配置项，每个配置项以“key=val

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

Endpoint 指定承载REST服务端点的服务器域名或IP。不同服务不同区域的Endpoint不同，您可以从地区和终端节点中查询所有服务的终端节点。例如IAM服务在“华北-北京四”区域的Endpoint为“iam.cn-north-4.myhuaweicloud.com”。

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch.size.bytes 单次batch的总数据量上限，默认为1mb。如果单条数据非常小，在bulk存储到总数据量前提前

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie percentile函数用于计算精确百分位数，适用于小数据量。先对指定列升序排列，然后取第p位百分数的精确值。命令格式 percentile(colname,DOUBLE p) 参数说明表1 参数说明参数是否必选参数类型说明 colname 是 STRING类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

获取AK/SK DLI Endpoint地址地区与终端节点，即云服务在不同Region有不同的访问域名。获取EndPoint DLI所在的项目ID 项目编号，用于资源隔离。获取项目ID DLI区域信息 DLI所属区域信息地区和终端节点步骤1：部署DBT环境安装dbt-core

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
SDK的获取与安装 - 数据湖探索 DLI

>单击“HuaweiCloud SDK”。使用maven构建时，settings.xml文件需要修改，增加以下内容：在profiles节点中添加如下内容： <profile> <id>MyProfile</id> <repositories> <repository>

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Hudi Clean操作说明 - 数据湖探索 DLI

Clean操作说明什么是Clean Cleaning用于清理Hudi表不再需要的老版本数据文件 (parquet文件或者log文件)，减轻存储压力，提升list操作效率。如何执行Clean 写完数据后clean Spark SQL（设置如下参数，随后执行任意写入SQL时，在满足条件时触发）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
在DLI控制台创建数据库和表 - 数据湖探索 DLI

有符号整数（smallint/short）：存储空间为2字节。有符号整数（bigint/long）：存储空间为8字节。时间戳（timestamp）：表示日期和时间，可达到小数点后6位。单精度浮点型（float）：存储空间为4字节。有符号整数（tinyint）：存储空间为1字节。仅OBS表支持。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE 命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.f

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

获取AK/SK DLI Endpoint地址地区与终端节点，即云服务在不同Region有不同的访问域名。获取EndPoint DLI所在的项目ID 项目编号，用于资源隔离。获取项目ID DLI区域信息 DLI所属区域信息地区和终端节点步骤1：安装SuperSet并配置数据连接驱动

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

CLEAN 命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明

总条数： 438

上一页
1
...
4
5
6
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

get_json_object - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

Format概述 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

CREATE CATALOG语句 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线