搜索_华为云

认证证书 - 数据湖探索 DLI
认证证书 - 数据湖探索 DLI

华为云还提供以下资源来帮助用户满足合规性要求，具体请查看资源中心。图2 资源中心销售许可证&软件著作权证书另外，华为云还提供了以下销售许可证及软件著作权证书，供用户下载和参考。具体请查看合规资质证书。图3 销售许可证&软件著作权证书父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSON等）是以UTF-8编码保存的。如果数据源不是UTF-8编码，请在导入前提前转换为UTF-8编码。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
数据迁移与传输方式概述 - 数据湖探索 DLI

为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
Python开发环境配置 - 数据湖探索 DLI

Python开发环境配置操作场景在安装和使用Python SDK前，确保您已经完成开发环境的基本配置。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

参数说明如下：表3 弹性资源池队列管理界面参数说明参数名参数描述名称弹性资源池添加的队列名称。类型弹性资源池添加的队列类型。 SQL队列。通用队列。时间段弹性资源池队列扩缩容策略的开始和结束时间范围。时间区间包括开始时间，不包括结束时间即[开始时间, 结束时间)

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

DLI Hudi元数据 DLI Hudi元数据说明创建Hudi表时会在元数据仓创建表的相关元数据信息。 Hudi支持对接DLI元数据和Lakeformation元数据（仅Spark 3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
列别名 - 数据湖探索 DLI
列别名 - 数据湖探索 DLI

attr_expr [AS] alias, ... FROM table_reference; 关键字 alias：用于对attr_expr中的字段名称起别名。 AS：是否添加此关键字不会影响结果。注意事项所要查询的表必须是已经存在的，否则会出错。别名的命名必须在别名的使用之前，否则会出错。此外，建议不要重名。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 别名SELECT
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

作业管理参数参数参数说明作业ID 所提交Spark作业的ID，由系统默认生成。名称所提交Spark作业的名称。队列所提交Spark作业所在的队列。用户名执行Spark作业的用户名称。状态作业的状态信息，包括如下。启动中：正在启动运行中：正在执行任务已失败：session已退出

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Flink作业提交错误，如何定位 - 数据湖探索 DLI

常见的失败原因可能包括： CU资源不足：需扩容队列。生成jar包失败：检查SQL语法及UDF等。如果信息不足以定位或者是调用栈错误，可以进一步单击作业名称，进入到作业详情页面，选择“提交日志”页签，查看作业提交日志。父主题： Flink Jar作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
DLI作业开发流程 - 数据湖探索 DLI

可通过交互式会话（session）和批处理（batch）方式提交计算任务。通过在DLI提供的弹性资源池队列上提交作业，简化了资源管理和作业调度。支持多种数据源和格式，提供了丰富的数据处理能力，包括但不限于SQL查询、机器学习等。详细操作请参考创建Spark作业。适用于大规模数据处理和分析，如机器学

 帮助中心 > 数据湖探索 DLI > 用户指南
使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

Spark SQL语法参考提供SQL数据库、表、分区、导入及导出数据、自定义函数、内置函数等语法说明和样例指导。使用Spark作业访问DLI元数据提供SQL作业开发的操作指引和样例代码参考。 Spark SQL 相关API 提供SQL相关API的使用说明。父主题：创建并管理SQL作业模板

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
内连接 - 数据湖探索 DLI
内连接 - 数据湖探索 DLI

在一次查询中可以连接两个以上的表。示例通过将student_info与course_info两张表中的课程编号匹配建立JOIN连接，来查看学生姓名及所选课程名称。 1 2 SELECT student_info.name, course_info.courseName FROM student_info

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

FROM schema_name 指定schema名称，未指定时默认使用当前的schema。 LIKE 'identifier_with_wildcards' identifier_with_wildcards只支持包含“*”和“|”的规则匹配表达式。其中“*”可以匹配单个或多

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

col_name：新增列名，必须指定。给嵌套列添加新的子列需要指定子列的全名称：添加新列col1到STURCT类型嵌套列users struct<name: string, age: int>，新列名称需要指定为users.col1。添加新列col1到MAP类型嵌套列memeber

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
创建路由（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。 connection_id 是 String 跨源id。请求参数表2 请求参数名称是否必选参数类型说明 name 是 String 路由名称，长度限制：1-64个字符。 cidr 是 String 路由网段范围。响应参数表3 响应参数参数参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 增强型跨源连接相关API（废弃）
Hudi常见配置参数 - 数据湖探索 DLI

指定为具体的表字段 hoodie.datasource.write.payload.class 在更新过程中，该类用于提供方法将要更新的记录和更新的记录做合并，该实现可插拔，如要实现自己的合并逻辑，可自行编写。 org.apache.hudi.common.model.Defaul

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
更新跨源认证（废弃） - 数据湖探索 DLI

project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。请求参数名称是否必选参数类型说明 auth_info_name 是 String 指定更新的跨源认证名称。 user_name 否 String 用户安全集群的新登录用户名。 password 否

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

个查询顺序执行1 遍，同时执行一对RF1 和RF2 操作。最后进行Throughput 测试，也是最核心和最复杂的测试，更接近于实际应用环境，与Power 测试比对SUT 系统的压力有非常大的增加，有多个查询语句组，同时有一对RF1 和RF2 更新流。测试中测量的基础数据都与执

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
pyspark样例代码 - 数据湖探索 DLI

湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.redis。如果选择Spark版本为3.1.1时，无需选择Module模块，需在 'Spark参数（--conf)'

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
创建作业模板 - 数据湖探索 DLI

String 类型。 SQL：SQL模板。 SPARK：Spark模板。 name 是 String 模板名称。 body 是 String 模板内容。 group 否 String 模板分组名称。 description 否 String 模板描述信息。 language 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API

总条数： 682

上一页
1
...
28
29
30
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

认证证书 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

列别名 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

Flink作业提交错误，如何定位 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

内连接 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

创建路由（废弃） - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

更新跨源认证（废弃） - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

创建作业模板 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线