搜索_华为云

复杂数据类型 - 数据湖探索 DLI

使用限制创建含有复杂数据类型字段的表时，该表存储格式不支持CSV（txt）。如果表中含有复杂数据类型字段时，该表不支持CSV（txt）格式的文件数据导入。 MAP数据类型建表必须指定schema，且不支持date、short、timestamp数据类型。对于JSON格式OBS表，MAP的键类型只支持STRING类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

单击所建桶“obs1”，进入“对象”页面。勾选左侧列表中的“对象”，选择“上传对象”，将需要上传的文件“sampledata.csv”上传到指定目录，单击“上传”。 “sampledata.csv”样例文件可以通过新建“sampledata.txt”，复制如下英文逗号分隔的文本内容，再另存为“sampledata

帮助中心 > 数据湖探索 DLI > 快速入门
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境自定义镜像应用场景通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
pyspark样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备 import相关依赖包 1 2 3 from __future__ import

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
从Kafka读取数据写入到DWS - 数据湖探索 DLI

为集群“公网访问地址”或“公网访问域名”，如果通过内网地址连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 password ：默认管理员用户的密码。在命令行窗口输

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

为Parquet数据。方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间

 帮助中心 > 数据湖探索 DLI > 最佳实践
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
导入数据（废弃） - 数据湖探索 DLI

）和中划线（-）相邻，禁止以英文句号（.）和中划线（-）开头或结尾。禁止使用IP地址。如果名称中包含英文句号（.），访问桶或对象时可能会进行安全证书校验。导入源文件时，如果源文件中的某一列与目标表列类型不匹配，将会导致该行数据的查询结果为null 。不支持并发导入同一张表。调试您可以在API Explorer中调试该接口。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
迁移数据场景概述 - 数据湖探索 DLI

LI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。图1 迁移数据至DLI 常见迁移场景与迁移方案指导

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
查询Spark作业日志 - 数据湖探索 DLI

Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

影响作业执行。如需使用UDF热加载功能请提交工单开通白名单。关键字 USING <resources>：需要加载的资源。可以是JAR、文件或者URI的列表。 OR REPLACE：支持自定义函数热加载功能。如果创建自定义函数时不携带OR REPLACE，则需要注意以下场景：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1 2 3 4

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
pyspark样例代码 - 数据湖探索 DLI

I参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码直接复制如下样例代码到py文件中后，需要注意文件内容中的“\”后面可能会有unexpected character的问题。需要将“\”后面的缩进或是空格全部删除。通过DataFrame

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
查询SQL作业日志 - 数据湖探索 DLI

前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSON等）是以UTF-8编码保存的。如果数据源不是UTF-8编码，请在导入前提前转换为UTF-8编码。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
查询Flink作业日志 - 数据湖探索 DLI

前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表

总条数： 350

上一页
1
...
5
6
7
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

复杂数据类型 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线