数据治理中心 DATAARTS STUDIO-开发一个MRS Flink作业:数据准备

时间:2024-12-04 08:59:41

数据准备

  • 下载Flink作业资源包"wordcount.jar",下载地址:https://github.com/huaweicloudDocs/dgc/blob/master/WordCount.jar

    下载的Flink作业资源包需要进行JAR包完整性校验。Windows操作系统下,打开本地命令提示符框,输入如下命令,在本地生成已下载JAR包的SHA256值,其中,“D:\wordcount.jar”为JAR包的本地存放路径和JAR包名,请根据实际情况修改。

    certutil -hashfile D:\wordcount.jar SHA256

    命令执行结果示例,如下所示:

    SHA256 的 D:\wordcount.jar 哈希:
    0859965cb007c51f0d9ddaf7c964604eb27c39e2f1f56e082acb20c8eb05ccc4
    CertUtil: -hashfile 命令成功完成。

    对比所下载JAR包的SHA256值和下面JAR包的SHA256值。如果一致,则表示下载过程不存在篡改和丢包。

    SHA256值:0859965cb007c51f0d9ddaf7c964604eb27c39e2f1f56e082acb20c8eb05ccc4

  • 准备数据文件“in.txt”,内容为一段英文单词。
support.huaweicloud.com/usermanual-dataartsstudio/dataartsstudio_01_0526.html