AI开发平台MODELARTS-静态benchmark:静态benchmark验证操作

时间:2024-04-30 18:09:32

静态benchmark验证操作

  1. 切换到benchmark虚拟环境测试,命令如下。静态benchmark验证是在benchmark虚拟环境中操作。
    conda activate benchmark
  2. 运行静态benchmark验证脚本benchmark_parallel.py,具体操作命令如下,可以根据参数说明修改参数。
    cd benchmark_tools 
    python benchmark_parallel.py --backend tgi --host 127.0.0.1 --port 8085 --tokenizer /path/to/tokenizer  --epochs 5 \
    --parallel-num 1 4 8 16 32  --prompt-tokens 1024 2048 --output-tokens 128 256 --benchmark-csv benchmark_parallel.csv

    参数说明

    • --backend:服务类型,支持tgi、vllm、mindspore等。本文档使用的推理接口是tgi。
    • --host:服务IP地址,如127.0.0.1。
    • --port:服务端口,和推理服务端口8085。
    • --tokenizer:tokenizer路径,HuggingFace的权重路径。
    • --epochs:测试轮数,默认取值为5
    • --parallel-num:每轮并发数,支持多个,如 1 4 8 16 32。
    • --prompt-tokens:输入长度,支持多个,如 128 128 2048 2048,数量需和--output-tokens的数量对应。
    • --output-tokens:输出长度,支持多个,如 128 2048 128 2048,数量需和--prompt-tokens的数量对应。
    • --benchmark-csv:结果保存路径,如benchmark_parallel.csv。
  3. 脚本运行完成后,测试结果保存在benchmark_parallel.csv中,示例如下图所示。
    图1 静态benchmark测试结果
support.huaweicloud.com/bestpractice-modelarts/modelarts_10_1574.html