搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包 1 2 3 from __future__ import

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

击桶dli-demo。OBS Browser+提供强大的拖拽上传功能，您可以将本地的一个或多个文件或者文件夹拖拽到对象存储的对象列表或者并行文件系统的对象列表中；同时您也可以将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_01.zi

帮助中心 > 数据湖探索 DLI > 最佳实践
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载文件名包含taskmanager.out的文件查看结果日志。父主题： Connector列表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
导入数据（废弃） - 数据湖探索 DLI

）和中划线（-）开头或结尾。禁止使用IP地址。如果名称中包含英文句号（.），访问桶或对象时可能会进行安全证书校验。导入源文件时，如果源文件中的某一列与目标表列类型不匹配，将会导致该行数据的查询结果为null 。不支持并发导入同一张表。调试您可以在API Explorer中调试该接口。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

开启Kerberos认证后的krb5.conf文件路径，格式为'./krb5.conf'。具体详情参考开启Kerberos认证时的相关配置文件。 keytab 开启Kerberos认证后的keytab文件路径，格式为'./user.keytab'。具体详情参考开启Kerberos认证时的相关配置文件。 principal

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。构造依赖信息，创建SparkSession 导入依赖。涉及到mvn依赖 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
迁移数据场景概述 - 数据湖探索 DLI

使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。图1 迁移数据至DLI 常见迁移场景与迁移方案指导表1 常见迁移场景与迁移方案指导数据类型迁移工具迁移方案 Hive CDM

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Flink作业运行异常，如何定位 - 数据湖探索 DLI

单击OBS桶，获取对应作业的完整运行日志。图2 查看运行日志下载最新“jobmanager.log”文件，搜索“RUNNING to FAILED”关键字，通过上下文的错误栈，确认失败原因。如果“jobmanager.log”文件中的信息不足以定位，可以在运行日志中找到对应的“taskmanager.log”日志，搜索“RUNNING

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
添加分区（只支持OBS表） - 数据湖探索 DLI

LOCATION 'obs_path'。若新增分区指定的路径包含子目录（或嵌套子目录），则子目录下面的所有文件类型及内容也将作为该分区的记录。您需要保证该分区目录下所有文件类型和文件内容与表的字段一致，否则查询将报错。您可以在建表语句OPTIONS中设置“multiLevelDirE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

/user.keytab','principal'='krbtest') "); 与未开启kerberos认证相比，开启了kerberos认证需要多设置三个参数，如表1所示。表1 参数说明参数名称与参数值参数说明 'krb5conf' = './krb5.conf' krb5

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
类型转换函数 - 数据湖探索 DLI

单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。查询结果参考如下： +I(1,1,2022-04-02T15:00

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
DLI数据库和表类 - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ join表时没有添加on条件，造成笛卡尔积查

 帮助中心 > 数据湖探索 DLI > 常见问题
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

table，则会导致批量数据写成非常大的log文件，对后续compaction形成很大压力需要更多资源才能完成。 Hudi表在Hive元数据中，应该会存在1张内部表（手动创建），2张外部表（写入数据后自动创建）。 2张外部表，表名_ro（用户只读合并后的parquet文件，即读优化视图表），_rt（

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

ob.setOverWrite(Boolean.TRUE)。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。导入分区数据 DLI提供导入数据的接口。您可以使用该接口将存储在OBS中的

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

应jar包文件的OBS路径，格式为：obs://桶名/文件夹路径名/包名。依赖python文件（--py-files）运行spark作业依赖的py-files。可以输入Python文件名称，也可以输入Python文件对应的OBS路径，格式为：obs://桶名/文件夹路径名/文件名。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用DLI分析电商BI报表 - 数据湖探索 DLI

击桶DLI-demo。OBS Browser+提供强大的拖拽上传功能，您可以将本地的一个或多个文件或者文件夹拖拽到对象存储的对象列表或者并行文件系统的对象列表中；同时您也可以将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_04.zi

帮助中心 > 数据湖探索 DLI > 最佳实践
创建Flink Jar作业 - 数据湖探索 DLI

内置依赖包请参考DLI内置依赖包。其他依赖文件用户自定义的依赖文件。其他依赖文件需要自行在代码中引用。依赖文件的管理方式：上传OBS管理程序包：提前将对应的依赖文件上传至OBS桶中。并在此处选择对应的OBS路径。上传DLI管理程序包：提前将对应的依赖文件上传至OBS桶中，并在DLI管

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
CLEANING - 数据湖探索 DLI
CLEANING - 数据湖探索 DLI

参数描述是否必填 table 需要查询表的表名，支持database.tablename格式是 clean_policy 清理老版本数据文件的策略，默认KEEP_LATEST_COMMITS 否 retain_commits 仅对KEEP_LATEST_COMMITS策略有效否

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
pyspark样例代码 - 数据湖探索 DLI

绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。通过DataFrame API 访问 import相关依赖 1 2 3 from __future__

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis

总条数： 347

上一页
1
...
10
11
12
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

Flink作业运行异常，如何定位 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

DLI数据库和表类 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

CLEANING - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线