数据治理中心 DATAARTS STUDIO-步骤2:数据开发处理:分析10大用户关注最多的产品

时间:2024-09-24 15:16:26

分析10大用户关注最多的产品

  1. DataArts Studio 控制台首页,选择对应工作空间的“数据开发”模块,进入数据开发页面。
  2. 创建一个 DLI SQL脚本,以通过DLI SQL语句来创建数据表。

    图1 新建脚本

  3. 在新建脚本弹出的SQL编辑器中输入如下SQL语句,单击“运行”,从OBS原始数据表中计算出10大用户关注最多的产品,将结果存放到top_like_product表。

    INSERT
      OVERWRITE table top_like_product
    SELECT
      product.brand as brand,
      COUNT(product.brand) as like_count
    FROM
      action
      JOIN product ON (action.product_id = product.product_id)
    WHERE
      action.type = 'like'
    group by
      brand
    ORDER BY
      like_count desc
    LIMIT
      10
    图2 脚本(分析10大用户关注最多的产品)

    关键参数说明:
    • 数据连接:步骤4中创建的DLI数据连接。
    • 数据库:步骤6中创建的数据库。
    • 资源队列:可使用提供的默认资源队列“default”
      • 当前由于DLI的“default”队列默认Spark组件版本较低,可能会出现无法支持建表语句执行的报错,这种情况下建议您选择自建队列运行业务。如需“default”队列支持建表语句执行,可联系DLI服务客服或技术支持人员协助解决。
      • DLI的“default”队列为共享队列,仅用于用户体验,用户间可能会出现抢占资源的情况,不能保证每次都可以得到资源执行相关操作。当遇到执行时间较长或无法执行的情况,建议您在业务低峰期再次重试,或选择自建队列运行业务。

  4. 脚本调试无误后,单击“保存”保存该脚本,脚本名称为“top_like_product”。单击“提交”,提交脚本版本。在后续开发并调度作业会引用该脚本。
  5. 脚本保存完成且运行成功后,您可通过如下SQL语句查看top_like_product表数据。您还可以参考图3,下载或转储表数据。

    SELECT * FROM top_like_product
    图3 查看top_like_product表数据

support.huaweicloud.com/qs-dataartsstudio/dataartsstudio_04_0023.html