在以往性能测试中,通常施压机的硬件资源不会成为压力瓶颈,但是在多任务并行的场景中,如果一个任务占用当前机器资源过多,会影响其他任务执行。或者当前用例本身存在问题,导致性能无法进一步提升,影响了性能测试执行。
根据以上场景,如果能从监控工程上得到解决自然是最好的。可以实时监控施压机和施压进程的CPU占用、内存使用、GC清空。但是,重点来了,并不是总能拥有一套完美的监控系统。这个时候,就需要自己手动解决一些痛点。
经过查阅资源,最终将方案锁定在java.lang.management.ManagementFactory这个类,看名字和路径大概能猜个七七八八了。以上我提到的信息都可以调用这个类的API获取。
CPU使用率
下面分享一下如何获取当前JVM的CPU使用情况。
static ThreadMXBean threadBean = ManagementFactory.getThreadMXBean()
static OperatingSystemMXBean osMxBean = ManagementFactory.getOperatingSystemMXBean()
static long lastSysTime = System.nanoTime()
static long lastUserTime = 0
/**
* 获取最大进程数N,CPU使用率N*100%
* @return
*/
static int getAvailableProcessors() {
osMxBean.getAvailableProcessors()
}
/**
* 获取当前线程CPU使用率,最大100
* 已乘以100,已经除以了系统最大进程数
* @return
*/
static double getCpuUsage(boolean avg = true) {
long totalTime = 0
for (long id : threadBean.getAllThreadIds()) {
totalTime += threadBean.getThreadCpuTime(id)
}
long curtime = System.nanoTime()
long usedTime = totalTime - lastUserTime
long totalPassedTime = curtime - lastSysTime
lastSysTime = curtime
lastUserTime = totalTime
def d = avg ? (((double) usedTime) / totalPassedTime / getAvailableProcessors()) * 100 : (((double) usedTime) / totalPassedTime) * 100
return d > 100 ? 8.88 : d
}
这里我用了一个参数,用来区分是否返回平均使用率还是返回总使用率之和。因为在docker环境中com.funtester.utils.OSUtil#getAvailableProcessors返回值着实让我很迷惑,至今还没懂其中奥妙。
下面分享获取系统负载的方法:
/**
* 获取系统一分钟内的平均load
* @return
*/
static def getLoad() {
osMxBean.getSystemLoadAverage() / getAvailableProcessors()
}
同样的问题也存在这个方法中,但目前使用比较少,就没有做修改。
获取GC信息
static List<GarbageCollectorMXBean> gcMxBeans = ManagementFactory.getGarbageCollectorMXBeans();
/**
* 获取GC信息{@link com.funtester.utils.OSUtil.GCInfo}
* @return
*/
static def getGCinfo() {
def infos = []
for (GarbageCollectorMXBean gcMxBean : gcMxBeans) {
infos << new GCInfo(gcMxBean)
}
infos
}
/**
* GC信息类
*/
static class GCInfo extends AbstractBean {
String name
int count
int time
GCInfo(String name, int count, int time) {
this.name = name
this.count = count
this.time = time
}
GCInfo(GarbageCollectorMXBean gcMxBean) {
this.name = gcMxBean.getName()
this.count = gcMxBean.getCollectionCount()
this.time = gcMxBean.getCollectionTime()
}
}
这里只能算是个输出,很少用GC信息作为独立的依据。
其他
获取内存信息:
/**
* 获取堆内存信息
* @return
*/
static def heapMemInfo() {
memoryMXBean.getHeapMemoryUsage()
}
/**
* 获取非堆内存信息
* @return
*/
static def noHeapMemInfo() {
memoryMXBean.getNonHeapMemoryUsage()
}
使用场景
目前我的使用场景主要2个:
- 在本地执行性能测试场景中,将JVM信息定期输出,包含在性能测试数据取样的功能中。
- 在服务执行性能测试场景中,将JVM信息作为一个资源调配的指标。例如:CPU资源占用过高,就降低一下对象池的活跃数据,主动回收一些资源。
在查阅资料的过程中,发现SDK的API很少能够直接获取硬件信息的,很多案例都是通过com.github.oshi:oshi-core:6.4.0这个类库实现的。看了一下文档,功能非常强大,有兴趣的可以直接上这个。