go实现的压测工具【单台机器100w连接压测实战】


0.写在前面

本文介绍压测是什么,解释压测的专属名词,教大家如何压测。介绍市面上的常见压测工具(ab、locust、Jmeter、go实现的压测工具、云压测),对比这些压测工具,教大家如何选择一款适合自己的压测工具

简单扩展即可支持 私有协议

1. 项目说明

1.1. go-stress-testing

go 实现的压测工具,每个用户用一个协程的方式模拟,最大限度的利用 CPU 资源

1.2. 安装

  • 二进制安装:go-stress-testing
  • 下载源代码,根据build.sh文件中的命令,编译成可执行代码

1.2. 项目体验

参数说明:

  • -c 表示并发数
  • -n 每个并发执行请求的次数,总请求的次数 = 并发数 * 每个并发执行请求的次数
  • -u 需要压测的地址
    # 运行以 mac 为示例
    ./go-stress-testing-mac -c 1 -n 100 -u https://www.baidu.com/
    执行以后,终端每秒钟都会输出一次结果,压测完成以后输出执行的压测结果
(base) ➜  go-stress-testing git:(master) ./go-stress-testing-mac -c 1 -n 100 -u https://www.baidu.com/

 开始启动  并发数:1 请求数:100 请求参数:
request:
 form:http
 url:https://www.baidu.com/
 method:GET
 headers:map[Content-Type:application/x-www-form-urlencoded; charset=utf-8]
 data:
 verify:statusCode
 timeout:30s
 debug:false
 http2.0:false
 keepalive:false
 maxCon:1


─────┬───────┬───────┬───────┬────────┬────────┬────────┬────────┬────────┬────────┬────────
 耗时│ 并发数│ 成功数│ 失败数│   qps  │最长耗时│最短耗时│平均耗时│下载字节│字节每秒│ 状态码
─────┼───────┼───────┼───────┼────────┼────────┼────────┼────────┼────────┼────────┼────────
   1s│      1│     15│      0│   15.48│   88.84│   48.76│   64.60│  36,645│  36,621│200:15
   2s│      1│     29│      0│   14.60│  159.11│   48.76│   68.51│  70,847│  35,420│200:29
   3s│      1│     44│      0│   14.87│  159.11│   48.76│   67.25│ 107,492│  35,826│200:44
   4s│      1│     60│      0│   15.27│  159.11│   44.33│   65.49│ 146,580│  36,639│200:60
   5s│      1│     77│      0│   15.67│  159.11│   44.33│   63.83│ 188,111│  37,613│200:77
   6s│      1│     94│      0│   15.73│  159.11│   44.33│   63.55│ 229,642│  38,266│200:94
   6s│      1│    100│      0│   15.74│  159.11│   44.33│   63.55│ 244,300│  38,326│200:100


*************************  结果 stat  ****************************
处理协程数量: 1
请求总数(并发数*请求数 -c * -n): 100 总请求时间: 6.374 秒 successNum: 100 failureNum: 0
tp90: 83.000
tp95: 95.000
tp99: 159.000
*************************  结果 end   ****************************

参数解释:

耗时: 程序运行耗时。程序每秒钟输出一次压测结果

并发数: 并发数,启动的协程数

成功数: 压测中,请求成功的数量

失败数: 压测中,请求失败的数量

qps: 当前压测的 QPS (每秒钟处理请求数量)

最长耗时: 压测中,单个请求最长的响应时长

最短耗时: 压测中,单个请求最短的响应时长

平均耗时: 压测中,单个请求平均的响应时长

错误码: 压测中,接口返回的 code 码:返回次数的集合

2. 压测

2.1. 压测是什么

压测,即压力测试,是确立系统稳定性的一种测试方法,通常在系统正常运作范围之外进行,以考察其功能极限和隐患。

主要检测服务器的承受能力,包括用户承受能力(多少用户同时玩基本不影响质量)、流量承受等。

2.2. 为什么要压测

压测的目的就是通过压测(模拟真实用户的行为),测算出机器的性能(单台机器的 QPS),从而推算出系统在承受指定用户数(100W)时,需要多少机器能支撑得住

压测是在上线前为了应对未来可能达到的用户数量的一次预估(提前演练),压测以后通过优化程序的性能或准备充足的机器,来保证用户的体验。

2.3. 压测名词解释

2.3.1. 压测类型解释

压测类型 解释
压力测试(Stress Testing) 也称之为强度测试,测试一个系统的最大抗压能力,在强负载(大数据、高并发)的情况下,测试系统所能承受的最大压力,预估系统的瓶颈
并发测试(Concurrency Testing) 通过模拟很多用户同一时刻访问系统或对系统某一个功能进行操作,来测试系统的性能,从中发现问题(并发读写、线程控制、资源争抢)
耐久性测试(Configuration Testing) 通过对系统在大负荷的条件下长时间运行,测试系统、机器的长时间运行下的状况,从中发现问题(内存泄漏、数据库连接池不释放、资源不回收)

2.3.2. 压测名词解释

压测名词 解释
并发(Concurrency) 指一个处理器同时处理多个任务的能力(逻辑上处理的能力)
并行(Parallel) 多个处理器或者是多核的处理器同时处理多个不同的任务(物理上同时执行)
QPS(每秒钟查询数量 Queries Per Second) 服务器每秒钟处理请求数量 (req/sec 请求数/秒 一段时间内总请求数/请求时间)
事务(Transactions) 是用户一次或者是几次请求的集合
TPS(每秒钟处理事务数量 Transaction Per Second) 服务器每秒钟处理事务数量(一个事务可能包括多个请求)
请求成功数(Request Success Number) 在一次压测中,请求成功的数量
请求失败数(Request Failures Number) 在一次压测中,请求失败的数量
错误率(Error Rate) 在压测中,请求成功的数量与请求失败数量的比率
最大响应时间(Max Response Time) 在一次压测中,从发出请求或指令系统做出的反映(响应)的最大时间
最少响应时间(Mininum Response Time) 在一次压测中,从发出请求或指令系统做出的反映(响应)的最少时间
平均响应时间(Average Response Time) 在一次压测中,从发出请求或指令系统做出的反映(响应)的平均时间

2.3.3. 机器性能指标解释

机器性能 解释
CPU利用率(CPU Usage) CPU 利用率分用户态、系统态和空闲态,CPU 利用率是指:CPU 执行非系统空闲进程的时间与 CPU 总执行时间的比率
内存使用率(Memory usage) 内存使用率指的是此进程所开销的内存
IO(Disk input/ output) 磁盘的读写包速率
网卡负载(Network Load) 网卡的进出带宽,包量

2.3.4. 访问指标解释

访问 解释
PV(页面浏览量 Page Views) 一定时间范围内(时间范围可以是一天、一个月等自定义的时间段),用户每打开 1 个网站页面,记录 1 个 PV。用户多次打开同一页面,PV 值累计多次
UV(网站独立访客 Unique Visitors) 一定时间范围内(时间范围可以是一天、一个月等自定义的时间段),通过互联网访问、流量网站的自然人。相同访客多次访问网站,只计算为 1 个独立访客

2.4 如何计算压测指标

压测我们需要有目的性的压测,这次压测我们需要达到什么目标(如:单台机器的性能为 100 QPS ?网站能同时满足 100W 人同时在线)

可以通过以下计算方法来进行计算:

  • 压测原则:每天 80% 的访问量集中在20%的时间里,这 20% 的时间就叫做峰值

  • 公式:( 总PV数80% ) / ( 每天的秒数20% ) = 峰值时间每秒钟请求数(QPS)

  • 机器:峰值时间每秒钟请求数(QPS) / 单台机器的QPS = 需要的机器的数量

  • 假设:网站每天的用户数(100W),每天的用户的访问量约为 3000W PV,这台机器的需要多少 QPS ?

    ( 30000000*0.8 ) / (86400 * 0.2) ≈ 1389 (QPS)

  • 假设:单台机器的的 QPS 是 69,需要需要多少台机器来支撑?

    1389 / 69 ≈ 20

3. 常见的压测工具

3.1. ab

简介

ApacheBench 是 Apache 服务器自带的一个web压力测试工具,简称 ab。ab 又是一个命令行工具,对发起负载的本机要求很低,根据 ab 命令可以创建很多的并发访问线程,模拟多个访问者同时对某一 URL 地址进行访问,因此可以用来测试目标服务器的负载压力。总的来说 ab 工具小巧简单,上手学习较快,可以提供需要的基本性能指标,但是没有图形化结果,不能监控。

ab 属于一个轻量级的压测工具,结果不会特别准确,可以用作参考。

安装

# 在linux环境安装
sudo yum -y install httpd

用法

Usage: ab [options] [http[s]://]hostname[:port]/path
用法:ab [选项] 地址

选项:
Options are:
    -n requests      #执行的请求数,即一共发起多少请求。
    -c concurrency   #请求并发数。
    -s timeout       #指定每个请求的超时时间,默认是30秒。
    -k               #启用HTTP KeepAlive功能,即在一个HTTP会话中执行多个请求。默认时,不启用KeepAlive功能。

压测命令

# 使用ab压测工具,对百度的链接 请求100次,并发数1
ab -n 100 -c 1 https://www.baidu.com/

结果

[root@iZbp1iexv86gtywcxse7s0Z ~]# ab -n 100 -c 1 https://www.baidu.com/
This is ApacheBench, Version 2.3 <$Revision: 1430300 $>
Copyright 1996 Adam Twiss, Zeus Technology Ltd, http://www.zeustech.net/
Licensed to The Apache Software Foundation, http://www.apache.org/

Benchmarking www.baidu.com (be patient)...
..done


Server Software:        BWS/1.1
Server Hostname:        www.baidu.com
Server Port:            443
SSL/TLS Protocol:       TLSv1.2,ECDHE-RSA-AES128-GCM-SHA256,2048,128

Document Path:          /
Document Length:        227 bytes

Concurrency Level:      1
Time taken for tests:   5.890 seconds
Complete requests:      100
Failed requests:        0
Write errors:           0
Total transferred:      139297 bytes
HTML transferred:       22700 bytes
Requests per second:    16.98 [#/sec] (mean)
Time per request:       58.898 [ms] (mean)
Time per request:       58.898 [ms] (mean, across all concurrent requests)
Transfer rate:          23.10 [Kbytes/sec] received

Connection Times (ms)
              min  mean[+/-sd] median   max
Connect:       26   43   6.8     43      59
Processing:     9   15   8.7     14      98
Waiting:        9   15   8.7     14      98
Total:         35   59  12.4     58     143

Percentage of the requests served within a certain time (ms)
  50%     58
  66%     63
  75%     64
  80%     66
  90%     71
  95%     74
  98%     81
  99%    143
 100%    143 (longest request)

主要关注的测试指标

  • Concurrency Level 并发请求数
  • Time taken for tests 整个测试时间
  • Complete requests 完成请求个数
  • Failed requests 失败个数
  • Requests per second 吞吐量,指的是某个并发用户下单位时间内处理的请求数。等效于 QPS,其实可以看作同一个统计方式,只是叫法不同而已。
  • Time per request 用户平均请求等待时间
  • Time per request 服务器处理时间

3.2. locust

简介

是非常简单易用、分布式、python 开发的压力测试工具。有图形化界面,支持将压测数据导出。

安装

# pip3 安装locust
pip3  install locust
# 查看是否安装成功
locust -h
# 运行 Locust 分布在多个进程/机器库
pip3 install pyzmq
# webSocket 压测库
pip3 install websocket-client

用法

编写压测脚本 test.py

from locust import HttpUser, TaskSet, task

# 定义用户行为
class UserBehavior(TaskSet):

    @task
    def baidu_index(self):
        self.client.get("/")

class WebsiteUser(HttpUser):
    task = [UserBehavior] # 指向一个定义的用户行为类
    min_wait = 3000 # 执行事务之间用户等待时间的下界(单位:毫秒)
    max_wait = 6000 # 执行事务之间用户等待时间的上界(单位:毫秒)

压测

locust -f  test.py --host=https://www.baidu.com

访问

进入压测首页 http://localhost:8089

Number of users to simulate 模拟用户数

Hatch rate (users spawned/second) 每秒钟增加用户数

点击 “Start swarming” 进入压测页面

压测界面右上角有:被压测的地址、当前状态、RPS、失败率、开始或重启按钮

性能测试参数

  • Type 请求的类型,例如GET/POST
  • Name 请求的路径
  • Request 当前请求的数量
  • Fails 当前请求失败的数量
  • Median 中间值,单位毫秒,请求响应时间的中间值
  • Average 平均值,单位毫秒,请求的平均响应时间
  • Min 请求的最小服务器响应时间,单位毫秒
  • Max 请求的最大服务器响应时间,单位毫秒
  • Average size 单个请求的大小,单位字节
  • Current RPS 代表吞吐量(Requests Per Second的缩写),指的是某个并发用户数下单位时间内处理的请求数。等效于QPS,其实可以看作同一个统计方式,只是叫法不同而已。

3.3. JMeter

简介

Apache JMeter是Apache组织开发的基于Java的压力测试工具。用于对软件做压力测试,它最初被设计用于Web应用测试,但后来扩展到其他测试领域。 JMeter能够对应用程序做功能/回归测试,通过创建带有断言的脚本来验证你的程序返回了你期望的结果。

安装

访问 https://jmeter-plugins.org/install/Install/ 下载解压以后即可使用

用法

JMeter的功能过于强大,这里暂时不介绍用法,可以查询相关文档使用(参考文献中有推荐的教程文档)

3.4. 云压测

3.4.1 云压测介绍

顾名思义就是将压测脚本部署在云端,通过云端对对我们的应用进行全方位压测,只需要配置压测的参数,无需准备实体机,云端自动给我们分配需要压测的云主机,对被压测目标进行压测。

云压测的优势:

  • 轻易的实现分布式部署
  • 能够模拟海量用户的访问
  • 流量可以从全国各地发起,更加真实的反映用户的体验
  • 全方位的监控压测指标
  • 文档比较完善

当然了云压测是一款商业产品,在使用的时候自然还是需要收费的,而且价格还是比较昂贵的~

3.4.2. 阿里云 性能测试 PTS

PTS(Performance Testing Service)是面向所有技术背景人员的云化测试工具。有别于传统工具的繁复,PTS以互联网化的交互,提供性能测试、API调试和监测等多种能力。自研和适配开源的功能都可以轻松模拟任意体量的用户访问业务的场景,任务随时发起,免去繁琐的搭建和维护成本。更是紧密结合监控、流控等兄弟产品提供一站式高可用能力,高效检验和管理业务性能。

阿里云同样还是支持渗透测试,通过模拟黑客对业务系统进行全面深入的安全测试。

3.4.3. 腾讯云 压测大师 LM

通过创建虚拟机器人模拟多用户的并发场景,提供一整套完整的服务器压测解决方案

4. go-stress-testing go语言实现的压测工具

4.1 介绍

  • go-stress-testing 是go语言实现的简单压测工具,源码开源、支持二次开发,可以压测http、webSocket请求、私有rpc调用,使用协程模拟单个用户,可以更高效的利用CPU资源。

  • 项目地址 https://github.com/link1st/go-stress-testing

4.2 用法

Usage of ./go-stress-testing-mac:
  -c uint
      并发数 (default 1)
  -n uint
      请求数(单个并发/协程) (default 1)
  -u string
      压测地址
  -d string
      调试模式 (default "false")
  -http2
    	是否开http2.0
  -k	是否开启长连接
  -m int
    	单个host最大连接数 (default 1)
  -H value
      自定义头信息传递给服务器 示例:-H 'Content-Type: application/json'
  -data string
      HTTP POST方式传送数据
  -v string
      验证方法 http 支持:statusCode、json webSocket支持:json
  -p string
      curl文件路径

示例

# 查看用法
./go-stress-testing-mac

# 使用请求百度页面
./go-stress-testing-mac -c 1 -n 100 -u https://www.baidu.com/

# 使用debug模式请求百度页面
./go-stress-testing-mac -c 1 -n 1 -d true -u https://www.baidu.com/

# 使用 curl文件(文件在curl目录下) 的方式请求
./go-stress-testing-mac -c 1 -n 1 -p curl/baidu.curl.txt

# 压测webSocket连接
./go-stress-testing-mac -c 10 -n 10 -u ws://127.0.0.1:8089/acc

使用 curl文件进行压测

curl是Linux在命令行下的工作的文件传输工具,是一款很强大的http命令行工具。

使用curl文件可以压测使用非GET的请求,支持设置http请求的 method、cookies、header、body等参数

4.3 实现

|____main.go                      // main函数,获取命令行参数
|____server                       // 处理程序目录
| |____dispose.go                 // 压测启动,注册验证器、启动统计函数、启动协程进行压测
| |____statistics                 // 统计目录
| | |____statistics.go            // 接收压测统计结果并处理
| |____golink                     // 建立连接目录
| | |____http_link.go             // http建立连接
| | |____websocket_link.go        // webSocket建立连接
| |____client                     // 请求数据客户端目录
| | |____http_client.go           // http客户端
| | |____websocket_client.go      // webSocket客户端
| |____verify                     // 对返回数据校验目录
| | |____http_verify.go           // http返回数据校验
| | |____websokcet_verify.go      // webSocket返回数据校验
|____heper                        // 通用函数目录
| |____heper.go                   // 通用函数
|____model                        // 模型目录
| |____request_model.go           // 请求数据模型
| |____curl_model.go              // curl文件解析
|____vendor                       // 项目依赖目录

4.4 go-stress-testing 对 Golang web 压测

./go-stress-testing-linux -c 100 -n 10000 -u http://127.0.0.1:8088/

4.5 grpc压测

go run main.go -c 300 -n 1000 -u grpc://127.0.0.1:8099 -data world

5. 压测工具的比较

5.1. 比较

- ab locust Jmeter go-stress-testing 云压测
实现语言 C Python Java Golang -
UI界面
优势 使用简单,上手简单 支持分布式、压测数据支持导出 插件丰富,支持生成HTML报告 项目开源,使用简单,没有依赖,支持webSocket压测 更加真实的模拟用户,支持更高的压测力度

5.2. 如何选择压测工具

这个世界上没有最好的,只有最适合的,工具千千万,选择一款适合你的才是最重要的

在实际使用中有各种场景,选择工具的时候就需要考虑这些:

  • 明确你的目的,需要做什么压测、压测的目标是什么?
  • 使用的工具你是否熟悉,你愿意花多大的成本了解它?
  • 你是为了测试还是想了解其中的原理?
  • 工具是否能支持你需要压测的场景

6. 常见问题

问题一:压测过程中会出现大量 TIME_WAIT

参考TCP四次挥手原理,主动关闭连接的一方会出现 TIME_WAIT 状态,等待的时长为 2MSL(约1分钟左右)

原因是:主动断开的一方回复 ACK 消息可能丢失,TCP 是可靠的传输协议,在没有收到 ACK 消息的另一端会重试,重新发送FIN消息,所以主动关闭的一方会等待 2MSL 时间,防止对方重试,这就出现了大量 TIME_WAIT 状态(参考: 四次挥手的最后两次)

问题二:没有go环境无法使用最新功能

可以使用Dockerfile构建一个容器镜像,假设容器镜像名称为gostress:1111,

  • docker build -t gostress:1111 .
  • 启动一个名称为go-stress的容器docker run -d –name=go-stress gostress:1111
  • 开始压测 docker exec -it go-stress -c 10 -n 10 -u www.baidu.com

7. 参考

[1]go-stress-testing


文章作者: Alex
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Alex !
  目录