数据湖探索 DLI-DLI作业开发流程:DLI数据导入指引

时间:2025-02-12 15:05:19

DLI 数据导入指引

  • DLI支持在不迁移数据的情况下,直接对OBS中存储的数据进行查询分析,您只需要将数据上传OBS即可使用DLI进行数据分析。

    上传数据至OBS请参考《对象存储用户指南》

  • 当需要将来自不同源的数据进行集中存储和处理时,迁移数据至DLI可以提供一个统一的数据平台。

    您可以参考使用 CDM 迁移数据至DLI迁移数据至DLI后再提交作业。

  • 如果业务需求需要实时访问和处理来自不同数据源的数据,跨源访问可以减少数据的复制和延迟。

    跨源访问的必要条件包括“DLI与数据源网络连通”、“DLI可获取数据源的访问凭证”:

    • DLI与数据源网络连通:您可以参考配置DLI与数据源网络连通(增强型跨源连接)配置DLI与数据源的网络连通。
    • 管理数据源的凭证:
      • 您可以使用DLI提供的跨源认证功能管理访问指定数据源的认证信息。

        适用范围:SQL作业、Flink 1.12作业场景。具体操作请参考使用DLI的跨源认证管理数据源访问凭证

      • 您还可以使用DEW管理数据源的访问凭证,并通过“自定义委托”方式授予DLI访问DEW服务的权限。

        适用范围:Spark 3.3.1及以上版本、Flink 1.15及以上版本。具体操作请参考使用DEW管理数据源访问凭证配置DLI访问其他云服务的委托权限

support.huaweicloud.com/usermanual-dli/dli_01_0001.html