搜索_华为云

跨源认证概述 - 数据湖探索 DLI

Kerberos类型的跨源认证：适用于开启Kerberos认证的MRS安全集群。配置时需指定MRS集群认证凭证，包括“krb5.conf”和“user.keytab”文件。详细操作请参考创建Kerberos跨源认证。 Kafka_SSL类型的跨源认证：适用于开启SSL的Kafka，配置时需指定KafkaTr

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

存储计费按照存储在DLI服务中的表数据存储量（单位为“GB”）收取存储费用。在估算存储费用时，请特别注意，DLI采用压缩存储，通常能压缩到原文件大小的 1/5 。DLI存储按照压缩后的大小计费。如果数据存储在OBS服务中，则DLI服务不收取存储费用，对应的费用由OBS服务收取。扫描量计费

 帮助中心 > 数据湖探索 DLI > 计费说明
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

Zookeeper实例信息，格式为：ZookeeperAddress:ZookeeperPort 以MRS Hbase集群为例，该参数的所使用Zookeeper的ip地址和端口号获取方式如下：在MRS Manager上，选择“集群 > 待操作的集群名称 > 服务 > ZooKeeper > 实例”，获取ZooKeeper角色实例的IP地址。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执行注册viewManager时，会校验该数据库在metastore是否存在，如果该数据库存在则会导致Spark作业执行失败。因此当Spark3

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

"Task Managers" -> "Stdout"。方法二：若在提交运行作业前选择了保存日志，则可以从日志的taskmanager.out文件中查看。 -U(111,scooter,Big2-wheel scooter,5.15) +U(111,scooter,Big2-wheel

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
DWS维表（不推荐使用） - 数据湖探索 DLI

使用gsjdbc4驱动连接时，格式为：jdbc:postgresql://${ip}:${port}/${dbName} 。使用gsjdbc200驱动连接时，格式为：jdbc:gaussdb://${ip}:${port}/${dbName}。 table-name 是无 String 读取数据库中的数据所在的表名。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
字符串函数和运算符 - 数据湖探索 DLI

[, string keyToExtract]) →string 描述：返回URL的指定部分。partToExtract参数有效值包括：HOST、PATH、QUERY、REF、PROTOCOL、AUTHORITY、FILE和USERINFO。keyToExtract为可选参数，用于选取QUERY中的key对应的值。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
更新Flink Jar作业 - 数据湖探索 DLI

jar”。 dependency_files 否 Array of Strings 用户已上传到DLI资源管理系统的资源包名，用户自定义作业的依赖文件。示例："myGroup/test.cvs,myGroup/test1.csv" tm_cus 否 Integer 每个taskmanager的CU数，默认值为“1”。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
创建Hive Catalog - 数据湖探索 DLI

系统中存储的函数和信息。数据处理最关键的方面之一是管理元数据。元数据可以是临时的，例如临时表、或者通过TableEnvironment注册的UDF。元数据也可以是持久化的，例如Hive Metastore中的元数据。Catalog 提供了一个统一的API，用于管理元数据，并使其可以从Table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
创建DLI表关联DDS - 数据湖探索 DLI

FIELDNAME2 FIELDTYPE2) USING MONGO OPTIONS ( 'url'='IP:PORT[,IP:PORT]/[DATABASE][.COLLECTION][AUTH_PROPERTIES]', 'database'='xx',

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据 Upsert Kafka 始

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
CREATE TABLE语句 - 数据湖探索 DLI

“db_name” 的数据库一起注册到 metastore 中。使用 db_name.table_name 的表将会被注册到当前执行的 table environment 中的 catalog 且数据库会被命名为 “db_name”；对于 table_name, 数据表将会被注册到当前正在运行的catalog和数据库中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
如何获取项目ID？ - 数据湖探索 DLI

如何获取项目ID？项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。例如pr

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

基本概念账号用户注册华为账号并开通华为云。账号对其所拥有的资源及云服务具有完全的访问权限，可以重置用户密码、分配用户权限等。由于账号是付费主体，为了确保账号安全，建议您不要直接使用账号进行日常管理工作，而是创建用户并使用他们进行日常管理工作。用户由账号在IAM中创建的用户

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
存储计费 - 数据湖探索 DLI
存储计费 - 数据湖探索 DLI

按照存储在DLI服务中的表数据存储量（单位为“GB”）收取存储费用。在估算存储费用时，请特别注意，DLI采用压缩存储，通常能压缩到原文件大小的 1/5 。DLI存储按照压缩后的大小计费。如果数据存储在OBS服务中，则DLI服务不收取存储费用，对应的费用由OBS服务收取。计费规则

 帮助中心 > 数据湖探索 DLI > 计费说明
创建表（废弃） - 数据湖探索 DLI

"timestamp_format": "yyyy-MM-dd HH:mm:ss" } “date_format”和“timestamp_format”的格式需与导入的csv文件中的时间格式一致。创建data_location为DLI的表。 { "table_name": "tb2", "data_location":

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

本示例将演示DLI直接对存储在OBS中的TPC-H数据集进行查询的操作，DLI已经预先生成了100M的TPC-H-2.18的标准数据集，已将数据集上传到了OBS的tpch文件夹中，并且赋予了只读访问权限，方便用户进行查询操作。 TPC-H的测试和度量指标 TPC-H 测试分解为3 个子测试：数据装载测试、Pow

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
查询所有作业 - 数据湖探索 DLI

bad_row_count 否 Long Insert作业执行过程中扫描到的错误记录数。 input_size 是 Long 作业执行过程中扫描文件的大小。 result_count 是 Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
DLI作业开发流程 - 数据湖探索 DLI

性资源池并添加队列。您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在

 帮助中心 > 数据湖探索 DLI > 用户指南
使用DLI分析账单消费数据 - 数据湖探索 DLI

登录DLI控制台，左侧导航栏单击“SQL编辑器”，执行引擎选择“spark”，选择执行的队列和数据库。本次演示队列和数据库选择“default”。下载的文件中包含时间用量等，按表头意义在DLI上创建表，具体可以参考如下示例，其中amount列为费用。 CREATE TABLE `spending`

帮助中心 > 数据湖探索 DLI > 最佳实践

总条数： 396

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

跨源认证概述 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

存储计费 - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线