搜索_华为云

Hudi锁配置说明 - 数据湖探索 DLI

Hudi锁配置说明提交Spark jar作业时需要手动配置Hudi锁。当使用DLI托管的元数据服务时，必须配置Hudi锁开启，且配置使用DLI提供的Hudi锁实现类：配置项配置值 hoodie.write.lock.provider com.huawei.luxor.hudi

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
返回结果 - 数据湖探索 DLI
返回结果 - 数据湖探索 DLI

"error_code": "AS.0001" } 其中，error_code表示错误码，error_msg表示错误描述信息。父主题：如何调用API

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
Python SDK环境配置 - 数据湖探索 DLI

提示信息安装相应版本的Visual Studio编译器解决。部分操作系统Visual Studio安装后需重启才可以生效。安装DLI服务Python SDK。选择SDK获取与安装获取的安装包，解压安装包。将"dli-sdk-python-<version>.zip"解压到本地目录，目录可自行调整。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
典型场景DLI委托权限配置示例 - 数据湖探索 DLI

典型场景DLI委托权限配置示例表1 DLI委托权限配置场景开发指南类型操作指导说明 Flink作业场景 Flink Opensource SQL使用DEW管理访问凭据 Flink Opensource SQL场景使用DEW管理和访问凭据的操作指导，将Flink作业的输出数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
SQL作业运行慢如何定位 - 数据湖探索 DLI

SQL作业运行慢如何定位作业运行慢可以通过以下步骤进行排查处理。可能原因1：FullGC原因导致作业运行慢判断当前作业运行慢是否是FullGC导致：登录DLI控制台，单击“作业管理 > SQL作业”。在SQL作业页面，在对应作业的“操作”列，单击“更多 > 归档日志”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
离线Compaction配置 - 数据湖探索 DLI

任务分别配置不同的资源执行来节省资源使用。执行资源 Compaction调度的间隔应小于Compaction计划生成的间隔，例如1小时左右生成一个Compaction计划的话，执行Compaction计划的调度任务应该至少半小时调度一次。 Compaction作业配置的资源，v

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
如何获取项目ID？ - 数据湖探索 DLI

如何获取项目ID？项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
Python开发环境配置 - 数据湖探索 DLI

操作步骤从Python官网下载并安装Python版本。根据Python官方指导安装Python版本。检验是否配置成功，运行cmd ，输入 python。运行结果，请参见图1，显示版本信息，则说明安装和配置成功。图1 检验配置是否成功 python安装应用包时出现错误类似错误“error:

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
创建增强型跨源连接 - 数据湖探索 DLI

突。主机信息可选参数，用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。例如：访问MRS的HBase集群时需要配置Zookeeper实例的主机名（即域名）与对应的IP地址。每行填写一条记录，填写格式为：“IP 主机名/域名”。示例： 192

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

是基于PySpark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink作业推荐配置指导 - 数据湖探索 DLI

图2 添加订阅登录DLI控制台，创建Flink SQL作业，编写作业SQL后，配置“运行参数”。 Flink Jar作业可靠性配置与SQL作业相同，不再另行说明。根据如下公式，配置作业的“CU数量”、“管理单元”与“最大并行数”： CU数量 = 管理单元 + (算子总并行数 /

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

作用范围：选择“项目级服务”。策略配置方式：选择“可视化视图”。策略内容：依次选择“允许”，“数据湖探索”，“dli:jobs:list_all”。单击“确认”，创建策略。图3 创建策略在“用户组”页面，找到需要授权的用户所属的用户组，单击用户组名称，进入用户组“权限管理”页面，单击“配置权限”。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
count函数如何进行聚合 - 数据湖探索 DLI

count函数如何进行聚合使用count函数进行聚合的正确用法如下： SELECT http_method, count(http_method) FROM apigateway WHERE service_id = 'ecs' Group BY http_method

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Flink作业配置参数对于Flink Jar作业，您需要在代码中开启Checkpoint，同时如果有自定义的状态需要保存，您还需要实现ListCheckpointed接口，并为每个算子设置唯一ID。然后在作业配置中，勾选“从Checkpoint恢复”，并准确配置Checkpoint路径。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

设置告警规则基本信息，并配置告警规则的详细信息。详细参数说明请参考按全量指标创建。配置告警规则时选择的Prometheus实例应是需要配置告警通知的作业所在的弹性资源池绑定的Prometheus 实例。配置高级设置：仅”全量指标创建”的方式支持该配置项，配置时建议开启无数据处理。即配置监控周

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况查看Spark作业原始资源配置登录DLI 控制台，单击左侧“作业管理”>“Spark作业”，在作业列表中找到需要查看的Spark作业，单击“作业ID”前的，即可查看对应Spark作业的原始资源配置参数。在创建Spark作业时，

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

的操作步骤。操作流程图1 操作流程步骤1：安装并配置Kyuubi连接DLI：安装并配置Kyuubi，确保Kyuubi可以连接到DLI。步骤2：配置ODBC连接Kyuubi：配置Superset安装数据连接驱动。步骤3：配置Tableau使用ODBC连接到Kyuubi：在

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Flink作业权限 - 数据湖探索 DLI

配置Flink作业权限 Flink作业权限操作场景针对不同用户，可以通过权限设置分配不同的作业，不同用户之间的作业效率互不影响，保障作业性能。管理员用户和作业的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其作业权限。给新用户设置作业权限时，该用户所在用户组的所属区域需具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

用到账号、用户和密码等信息。区域从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用云服务的Region；专属Re

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
配置DLI读写外部数据源数据的操作流程 - 数据湖探索 DLI

操作流程。配置DLI与数据源网络连通：您可以参考配置DLI与数据源网络连通（增强型跨源连接）配置DLI与数据源的网络连通。管理DLI具数据源的访问凭证： Spark 3.3.1及以上版本、Flink 1.15及以上版本的跨源访问场景推荐使用数据加密服务DEW来存储数据源的认

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据

总条数： 690

上一页
1
2
3
4
5
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi锁配置说明 - 数据湖探索 DLI

返回结果 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

典型场景DLI委托权限配置示例 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

如何查看DLI Spark作业的实际资源使用情况 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

配置DLI读写外部数据源数据的操作流程 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线