Kahn's blogs

ASM全解析

2017/11/29

前言

不知道为啥,公司刮起一阵AOP编程的风暴,Java体系很老的技术竟然在Android里面迎来了新生。可能是因为App越做越大需要用到?ASM是AOP编程的一种实现方式,它可以用编程的方法改变类字节码。一般ASM主要用来做AOP,和mock测试。当然了,你要是用ASM来直接写代码,写class,谁也拉不长你,吹不扁你。

AOP

具体的概念就不多说了,网上多的是。说下我自己的理解。现在我们接触到的编程模式大概分为,面向过程面向对象。AOP是面向切面,可以看做是特定功能对面向对象编程的一种补充。此外还有结构化编程(面向对象),和函数式编程。各有好处。

前面说了,AOP是面向对象的补充。

讲一个故事

既然是面向对象,对象是什么?一个个封装好的个体,桌子,板凳,大舅二舅都是对象,这些封装好的个体还有各自的继承关系,他大舅他二舅都是他舅,高桌子低板凳都是木头。对象中可能还持有别的对象,就形成了关联关系。这些继承和关联关系构成了真实世界。真实世界映射到软件中,就是一个面向对象的软件系统。大舅二舅家都有桌子板凳,桌子板凳都会脏,用之前要擦一下。

问题来了,刚买回来桌子板凳的时候,都是新的干净的,没考虑到它会脏啊?这个时候,传统的做法就是让舅舅(大舅二舅的父类)用桌子板凳的时候,要擦一下。但是这个时候你软件系统里可能还有七大姑八大姨,你可能要想了,那就抽象出一个亲戚类,然后写一个坐板凳的方法,里面写上擦板凳,然后让所有亲戚去实现这个坐板凳方法,再在实现中调用父类的坐板凳。这样下去:越来越复杂。

这时候,AOP就出现了,它犹如上帝之手,用直接传功,灵魂注入的方式,让所有亲戚坐板凳之前,都要擦板凳。你的亲戚们什么都没改变,莫名其妙的坐之前都会先擦一下。

实际的应用场景

当然了,我们大部分用AOP的场景都不是用来做业务功能的(坐板凳属于业务功能)。

几个典型的AOP场景

  1. 打Log
  2. 性能监控
  3. 后台服务器的数据库连接和事务管理。解释:一个请求过来,被AOP拦截后,然后打开一个sql的事务。在返回的时候,事务提交或者回滚。这样做的好处是,所有的请求都支持了事务,不用每次都写什么beginTransaction,commit。
  4. 安全性检查
  5. 埋点打桩

ASM

惯例不废话,先分享几篇好的博客
字节码及ASM使用
AOP 的利器:ASM 3.0 介绍
ASM Bytecode Framework探索与使用
JVM指令
Introduction to the ASM 2.0 Bytecode Framework(官方)
ASM 4.0 A Java bytecode engineering library(官方)
深入字节码 – 使用 ASM 实现 AOP(系列文章,个人感觉很好!)

ASM只有百十来kb,用法却是千变万化,毕竟是可以直接改字节的东东。

ASM解析字节码采用访问者模式,它把对字节码的访问解析成很多事件(node),然后顺序的交给访问者(visitor),我们只需要处理visitor给我们提供的回调就可以了。这是修改一个现有类的方式。如果想新建一个类class,则需要你按照它提供的顺序做按部就班的做一些事情,新建比修改难的多,这里的难体现在对字节码的了解程度上。

官方解析时序图

上面的时序图很重要,它完全说明了asm解析class字节码的流程。

Api

ClassReader和ClassVisitor。

ClassReader

顾名思义,这玩意可以读取一个class文件。看下它的api

ClassReader(byte[] b)
ClassReader(byte[] b, int off, int len)
ClassReader(InputStream is)
ClassReader(String name)

很明显了,新建这玩意需要字节数组,或者流和文件名。那么就是一个类的字节码文件的字节数组或者流和文件名对吗?

回看上面的时序图,解析是从accept开始的,接收的参数是一个ClassVisitor,这就是典型的访问者模式了。回看上面的时序图,整个访问流程也是accept方法开始走的,从时序图一路看下来,都是以访问者模式去调用了ClassVisitor中的方法。ClassVisitor中又细化了几个子Visitor,分别是annotationvisitor,fieldvisitor,methodvisitor。

ClassReader就不深究了,里面的方法也不多,它最大的意义在于读取字节码,然后启动整个流程,后面怎样处理就交给了ClassVisitor

ClassVisitor

真正能访问各种visit的东西。它以回调的方式给于我们处理字节码各个环节的机会。ClassReader以访问者模式去调用ClassVisitor,而ClassVisitor内部是以职责链模式来处理的(还记得Android中的touch事件传递吗?return true|false控制整个流程)。意思就是说,一个ClassVisitor可以持有另一个ClassVisitor对象,一路持有下去,而访问时,也会逐一挨个访问。ASM给我们内置了几个ClassVisitor,都是它的子类,需要特别关注一下的是ClassWriter,它如果再ClassVisitor职责链中的一环,在accept完成后,ClassWriter可以调用toByteArray获取被修改后的字节码字节数组,可以随意的处理它。看下ClassVisitor的方法

ClassVisitorMethod.png

全是以visit开头的方法,需要重点关注的是:visit(), visitAnnotation,visitField,visitMethod,visitEnd。

见名知意,并且api上给出了每个方法的解释。重点说下visit,api上解释是这样的,Visits the header of the class.那么什么是一个class的header呢?官方说明的开头就给出了解释,内容太多就不复制过来了。大概就是说,类的声明信息,包括集成,实现,泛型等等。这个方法也是访问一个类最首先访问到的方法!别的方法就不解释了,开头介绍的深入字节码 – 使用 ASM 实现 AOP(系列文章,个人感觉很好!)里面有详细描述。

注意!ClassVisitor是处理类级别的回调,不涉及到具体的东西。可以看到,visitAnnotation,visitField,visitMethod,这三个方法都是带返回值的!也就是我们开头说的子visit,用于处理一些更细节的东西。比如,visitMethod方法的返回值是一个MethodVisitor对象,这个MethodVisitor对象就是用于处理这个方法更细节的东西,比如:注解,代码,泛型等等。我们可以创建自己的MethodVisitor,处理一些自己的东西,然后返回。如果什么也不做,直接super.visitMethod(access, name, desc, signature, exceptions)。如果你return null。对不起,相当于略过了这个方法。asm不会扫描这个方法。

请注意:这几个子visit和ClassVisitor并无继承关系

在ClassVisitor的方法里面,你就可以随便弄了,我们一般的开发模式是生成目标类的子类后,扩展你需要的方法。在调用的时候,使用反射取出强化过的类对象,如果有,返回回去使用。当然你也可以直接改目标类的class。

一般情况下,都是修改类的class,进行一下插桩操作。

总结流程

其实ASM只是一个很小的工具包,大致的调用概念就是上面说的。ClassReader加载字节码文件–>accept方法启动访问者模式–>把class文件拆分成各种visit事件,把拆分的事件循环遍历ClassVisitor中的各种visit方法(ClassVisitor类采用职责链循环递归)–>在ClassVisitor中如遇到visitField,visitMethod等,才用更细化的FieldVisitor等等继续visit–>整个流程完毕

如果没有看文章头部推荐的博客,第一次接触asm,可能说完上面的,还是对流程有点模糊,这时候必须要上代码

ClassReader遍历ClassVisitor的伪代码

首先先看一个类

1
2
3
4
5
6
7
8
9
10
package com.kahn.test.asm.bean;

public class Person {

private String name;
public String getName() {
return name;
}

}

使用ClassReader加载该类的字节码文件后,会把字节码拆分成各种visit事件,它有多少事件呢?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
cw.visit(V1_7, ACC_PUBLIC + ACC_SUPER, "com/kahn/test/asm/bean/Person", null, "java/lang/Object", null);

cw.visitSource("Person.java", null);

{
fv = cw.visitField(ACC_PRIVATE, "name", "Ljava/lang/String;", null, null);
fv.visitEnd();
}
{
mv = cw.visitMethod(ACC_PUBLIC, "<init>", "()V", null, null);
mv.visitCode();
mv.visitVarInsn(ALOAD, 0);
mv.visitMethodInsn(INVOKESPECIAL, "java/lang/Object", "<init>", "()V", false);
mv.visitInsn(RETURN);
mv.visitMaxs(1, 1);
mv.visitEnd();
}
{
mv = cw.visitMethod(ACC_PUBLIC, "getName", "()Ljava/lang/String;", null, null);
mv.visitCode();
mv.visitVarInsn(ALOAD, 0);
mv.visitFieldInsn(GETFIELD, "com/kahn/test/asm/bean/Person", "name", "Ljava/lang/String;");
mv.visitInsn(ARETURN);
mv.visitMaxs(1, 1);
mv.visitEnd();
}
cw.visitEnd();

该代码由工具生成,文章结束有介绍

以上是该类会触发的所有事件,如果想用asm代码直接生成class文件可以用上面代码生成Person.class,下面ClassReader的accept伪代码。下面主要展示Method调用过程

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

类ClassReader
public void accept(ClassVistor cw) {

读取字节码基本信息,常量池等等;
...
cw.visit(xxx);

循环注解信息
...

循环字段信息
...


for(方法个数) {
解析方法基本信息
MethodVisitor mv = cw.visitMethod(方法信息基本信息);

if(mv != null) {
...一些七七八八注解之类的回调
mv.visitCode();
//下面进入方法体解析,一些具体的方法
解析方法详细信息
if(aaa != null){
mv.visitAaa();
}
if(bbb != null){
mv.visitBbb();
}

mv.visitInsn(ARETURN);
//方法结束
mv.visitEnd();
}
}

...

}

就是这样,整个Class文件被accept遍历了一遍,再看下ClassVistor的visitMethod

1
2
3
4
5
6
7
8

public MethodVisitor visitMethod(int access, String name, String desc,
String signature, String[] exceptions) {
if (cv != null) {
return cv.visitMethod(access, name, desc, signature, exceptions);
}
return null;
}

上面代码的cv也是一个ClassVistor,是由创建一个ClassVisitor的时候传入的,这样就形成了职责链,一路调用下去。注意!职责链是有顺序的,采用了堆栈模型,被accept的ClassVisitor A最先调用,然后调用A持有的B。重点来了请注意,我们应该把ClassWriter放在调用链的最后一环才能得到正确的class文件。

源代码跟上面的伪代码实现差不多,再回到开头我们说的,如果想忽略哪个方法,可以在自己实现的ClassVisitor里面的visitMethod方法里面返回null,上面的accept就给出了为什么能忽略该方法的原因。因为返回了null,accpte内部代码没有拿到MethodVisitor,就不会去解析该方法

再来看MethodVisitor的visitCode

1
2
3
4
5
public void visitCode() {
if (mv != null) {
mv.visitCode();
}
}

MethodVisitor中的其他visit方法也都是这么实现的,调用了内部持有的MethodVisitor。所以!MethodVisitor也是一条职责链,同样的FieldVisitor,AnnocationVisitor也是。

到了这里,整个ClassReader加载字节码流程有没有更清楚一点了呢?

现在要用起来了,老规矩,上代码

1
2
3
4
public static void main(String[] args) throws IOException, ClassNotFoundException, InstantiationException, IllegalAccessException {
ClassReader classReader = new ClassReader("com.kahn.test.asm.bean.Person");
classReader.accept(new PrintVisitor(), ClassReader.SKIP_DEBUG);
}

上面的代码很简单,创建一个ClassReader,读取类com.kahn.test.asm.bean.Person的字节码,然后开始accept,传入一个我们自己的PrintVisitor。来看下PrintVisitor

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
public class PrintVisitor extends ClassVisitor {

public PrintVisitor() {
super(Opcodes.ASM5);
}

@Override
public void visit(int version, int access, String name, String signature, String superName, String[] interfaces) {

System.out.println(access + ", " + name + ", " + signature + ", " + superName + ", " + interfaces);
super.visit(version, access, name + "_temp", signature, name, interfaces);
}

@Override
public AnnotationVisitor visitAnnotation(String desc, boolean visible) {
// TODO Auto-generated method stub
return super.visitAnnotation(desc, visible);
}

@Override
public FieldVisitor visitField(int access, String name, String desc, String signature, Object value) {
// TODO Auto-generated method stub

System.out.println(access + ", " + name + ", " + signature );
return super.visitField(access, name, desc, signature, value);
}

@Override
public MethodVisitor visitMethod(int access, String name, String desc, String signature, String[] exceptions) {
System.out.println(access + ", " + name + ", " + signature );
return super.visitMethod(int access, String name, String desc, String signature, String[] exceptions);
}

@Override
public void visitEnd() {
// TODO Auto-generated method stub
super.visitEnd();
}

很简单的ClassVisitor子类,这里我没有使用ClassVisitor(int api, ClassVisitor cv)这个构造函数,也就是说我们这个PrintVisitor内部没有再持有一个ClassVisitor对象,它是职责链顶端也是末端,就它自己。

这里简单的复写了它的几个方法,全部是调用的父类的,调用之前打印了一下日志。

运行代码后,结果为

1
2
3
4
5
6
7
8
33, com/kahn/test/asm/bean/Person, null, java/lang/Object, [Ljava.lang.String;@59f95c5d
2, name, null
2, age, null
1, <init>, null
1, getName, null
1, setName, null
1, getAge, null
1, setAge, null

可以看到ClassReader扫描了这个类的基本信息,还能看到,它先访问了visit方法,然后是visitField,然后是visitMethod(先输出了name,age,后输出,getName…)。

这里都是直接调用的super.xxxx 继续使用父类的。父类的(ClassVisitor的)方法,我们刚刚已经看过了,都是调用内部持有的ClassVisitor,这里我们没有持有内部的ClassVisitor,所以这里的super.xxxx其实什么也做。

同理,调用在visitMethod方法中这样写到: return super.visitMethod(access, name, desc, signature, exceptions); 那么父类内部的ClassVisitor为空,这时我们能猜到,其实这边返回的是一个null。也就是说:在本例中,accept并不会去扫描方法或者字段等等的具体信息,因为它们对应的方法返回了一个null。这也是ASM延迟加载机制,只有在被用到,才会扫描

好了,这么做貌似没什么用,我们来加强一下例子。

1
2
3
4
5
6
7
8
public static void main(String[] args) throws IOException, ClassNotFoundException, InstantiationException, IllegalAccessException {
ClassReader classReader = new ClassReader("com.kahn.test.asm.bean.Person");
ClassWriter cw = new ClassWriter(ClassWriter.COMPUTE_MAXS);
classReader.accept(new PrintVisitor(cw), ClassReader.SKIP_DEBUG);
OutputStream outputStream = new FileOutputStream("Person.class");
outputStream.write(cw.toByteArray());
outputStream.close();
}

在ClassVisitor链条上加了一个ClassWriter,把这个ClassWriter对象赋值给了PrintVisitor,在accept结束后,使用cw.toByteArray()得到新的字节码数组,写成本地文件存储

看下PrintVisitor

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
public class PrintVisitor extends ClassVisitor {

public PrintVisitor(ClassVisitor cv) {
super(Opcodes.ASM5, cv);
}

...

@Override
public MethodVisitor visitMethod(int access, String name, String desc, String signature, String[] exceptions) {
System.out.println(access + ", " + name + ", " + signature );
if ("getName".equals(name)) {

mvTemp = new MethodVisitor(Opcodes.ASM5, super.visitMethod(access, name, desc, signature, exceptions)) {
@Override
public void visitCode() {
super.visitCode();
visitFieldInsn(Opcodes.GETSTATIC, "java/lang/System", "out", "Ljava/io/PrintStream;");
visitLdcInsn("insert ok!");
visitMethodInsn(Opcodes.INVOKEVIRTUAL, "java/io/PrintStream", "println", "(Ljava/lang/String;)V",
false);
}

@Override
public void visitMaxs(int maxStack, int maxLocals) {
super.visitMaxs(2, 1);
}

};
}

else {
mvTemp = super.visitMethod(access, name, desc, signature, exceptions);
}

return mvTemp;
}

...

我改造了一下visitMethod方法,如果遍历到的这个方法名是getName,我就自己实现一个MethodVisitor返回,如果是别的方法,使用父类的super.visitMethod返回。请注意!这回这里的super.visitMethod不再是毫无用处了,因为PrintVisitor不再是职责链的最后一环,它内部还持有一个ClassWriter,这里调用super.visitMethod其实是调用了ClassWriter的visitMethod,ClassWriter的visit方法全是往内存里圧栈的操作,这很重要!以为有了ClassWriter我们才能输出有效的class文件

看下我们自己实现的MethodVisitor,在MethodVisitor构造函数中传入了super.visitMethod返回的MethodVisitor,OK,MethodVisitor也形成了职责链,我们自己的MethodVisitor再调用super.xxx方法时,其实是调用了内部持有的MethodVisitor。这个内部持有的MethodVisitor其实也是刚刚通过super.visitMethod生成的。它是什么呢?它是ClassWriter的visitMethod方法生成的一个MethodWriter对象,这个MethodWriter是MethodVisitor的子类。

回到我们自己的匿名内部MethodVisitor。里面只实现了两个方法,visitCode和visitMaxs。visitCode是刚进入到代码中触发的,而visitMaxs则表示该方法需要的内存堆栈。

先看下visitCode,里面先调用了super.visitCode();这个是必须的!因为要调用职责链下层,MethodWriter的visitCode。紧跟着调用了三句代码,全都是MethodVisitor自己的未被覆盖的代码,这三句代码也同样都会调用MethodWriter的相应方法。

我们知道visitCode是进入代码的意思。那么后面三句是什么意思呢?不要慌,如果看过顶部推荐的博客就已经知道了,没看也没关系,楼主重复造下轮子。

1
2
3
visitFieldInsn(Opcodes.GETSTATIC, "java/lang/System", "out", "Ljava/io/PrintStream;");
visitLdcInsn("insert ok!");
visitMethodInsn(Opcodes.INVOKEVIRTUAL, "java/io/PrintStream", "println", "(Ljava/lang/String;)V",false);

这三句的意思,1,获取System的静态变量out。2,往堆栈中压入一个字符串”insert ok!”。3,调用PrintStream的println方法,联系上下文,现在堆栈中第一位是一个PrintStream的变量out,第二位是一个字符串”insert ok!”,那么这里调用PrintStream的println方法其实就相当于调用System.out.println(“insert ok!”)。

又是一波重点来袭!因为这些方法都是调用的MethodWriter的相应方法,MethodWriter是什么?前面刚刚讲过,要注意!MethodWriter会把这些操作压入堆栈,那么经过刚刚那么一折腾,其实就是,在gatName方法刚入代码后,压入一套System.out.println(“insert ok!”)的字节码指令。

那么重写的visitMaxs是什么意思?super.visitMaxs(2, 1)?因为你这个方法本来的字节码应该调用visitMaxs(1, 1),如果不重写其实默认的就是visitMaxs(1, 1),但是我们修改了字节码,多在堆栈里压了一些东西,所以要改下(测试发现,没重写也能正常运行,可能是ASM有什么特殊处理吧)。

ok!我们重新运行一下。用JD-GUI打开生成的Person.class文件(不要打开原始的,要打开我们新生成的)。可以看到getName里面多了一句System.out.println(“insert ok!”)。

利用这个特性,我们就能做很多事情了。

如果你是android开发,直接修改class文件是一件很好的事情,可以无损注入代码,并且这些操作都是在编译期进行的,对代码执行效率没有任何影响。

如果你是后台开发,最好的做法是生成一个该类的子类class文件,然后使用反射把这个生成的子类对象反射出来返回给要使用的人,这就形成了代理模式。这样做对原始的class文件也没有入侵了,会更优雅一点。但是在android中,能少用反射还是尽量少用。

下面我们看下怎么生成该类的子类。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
@Override
public void visit(int version, int access, String name, String signature, String superName, String[] interfaces) {

System.out.println(access + ", " + name + ", " + signature + ", " + superName + ", " + interfaces);
super.visit(version, access, name + "_temp", signature, name, interfaces);
{
MethodVisitor mv = super.visitMethod(Opcodes.ACC_PUBLIC, "<init>", "()V", null, null);
mv.visitCode();
mv.visitVarInsn(Opcodes.ALOAD, 0);
mv.visitMethodInsn(Opcodes.INVOKESPECIAL, name, "<init>", "()V", false);
mv.visitInsn(Opcodes.RETURN);
mv.visitMaxs(1, 1);
mv.visitEnd();
}
}

看下新修改的visit方法,这里mv其实是ClassWriter返回的MethodWriter对象,前面强调了多次!请悉知!!!后面的super.xxx也都是调用ClassWriter内的方法,重要的事情要多说。
visit方法的调用时机为刚解析这个类的header时。类header的概念前面也有说过。super.visit(version, access, name + “_temp”, signature, name, interfaces),这里的变化是,把类名该为了类名加_temp,父类的名称改为本来类的名称,这时,ClassWriter内持有的class字节信息就变为了

1
public class Person_temp extends Person

再来看下面的代码,

1
2
3
4
5
6
7
MethodVisitor mv = super.visitMethod(Opcodes.ACC_PUBLIC, "<init>", "()V", null, null);
mv.visitCode();
mv.visitVarInsn(Opcodes.ALOAD, 0);
mv.visitMethodInsn(Opcodes.INVOKESPECIAL, name, "<init>", "()V", false);
mv.visitInsn(Opcodes.RETURN);
mv.visitMaxs(1, 1);
mv.visitEnd();

上面的全部代码都表示往字节码堆栈中压入生成了一个构造方法(表示构造方法)

ok,如果你不处理visitMethod方法,到最后你新的字节码堆栈中会有两个构造方法,一个是Person的一个是Person_temp,这样的字节码必然是错误的。so~~要去visitMethod中把从扫描Person类得来的构造方法忽略掉。

1
2
3
if ("<init>".equals(name)) {
mvTemp = null;
}

在visitMethod中,忽略从扫描Person类得来的构造方法。

现在去运行程序,然后反射出该子类对象,再调用getName,看看我们的子类生成计划是否成功

1
2
3
Object o = Class.forName("com.kahn.test.asm.bean.Person_temp").newInstance();
Person p = (Person) o;
System.out.println(p.getName());

运行后输出

1
2
3
4
insert ok!
Exception in thread "main" java.lang.IllegalAccessError: tried to access field com.kahn.test.asm.bean.Person.age from class com.kahn.test.asm.bean.Person_temp
at com.kahn.test.asm.bean.Person_temp.getAge(Unknown Source)
at com.kahn.test.asm.TestOnMain.main(TestOnMain.java:51)

纳尼?what’s wrong?这就尴尬了,插入的语句打印出来了,自带的代码反而报错,自带的代码是什么呢?return name;异常提示,错误的访问了Person.age from Person_temp。意思大概就是说,你在Person_temp里面调用到了父类的同名私有变量。日了狗,怎么能访问到父类的呢?父类里有一个private String name. 我子类里面也有一个private String name,使用JD-GUI打开生成class,发现代码为

1
2
3
4
public String getName() {
System.out.println("insert ok!!");
return this.name;
}

我靠?这没错啊,this.name呀?百思不得骑姐。

回去看开Person.class生成的asm代码,也就是文章最前面的事件分析的地方。

来看下getName的所有visit事件

1
2
3
4
5
6
7
8
9
{
mv = cw.visitMethod(ACC_PUBLIC, "getName", "()Ljava/lang/String;", null, null);
mv.visitCode();
mv.visitVarInsn(ALOAD, 0);
mv.visitFieldInsn(GETFIELD, "com/kahn/test/asm/bean/Person", "name", "Ljava/lang/String;");
mv.visitInsn(ARETURN);
mv.visitMaxs(1, 1);
mv.visitEnd();
}

注意到这句没有?mv.visitFieldInsn(GETFIELD, “com/kahn/test/asm/bean/Person”, “name”, “Ljava/lang/String;”)。在Person类中,取出Person类的name字段。

这样一来就清楚了,我们的Person_temp是从Person扫描得来,所以Person_temp的字节码文件中,getName里面取出的是Person的name字段。坑爹的是JD-GUI竟然能解析。找到解决办法了,让我们的新类Person_temp的getName方法使用字节的name字段就可以了。

在我们自己的MethodVisitor里面再多复写一个方法

1
2
3
4
5
@Override
public void visitFieldInsn(int opcode, String owner, String name, String desc) {
// TODO Auto-generated method stub
super.visitFieldInsn(opcode, owner+"_temp", name, desc);
}

把第二个参数的Person换成Person_temp。

在运行一下,大功告成

直接使用asm生成class

前面都是以ClassReader的accept为起点,扫描一个现有的类。那么我们怎么凭空编造一个类呢?其实看完上面的文章,你应该已经有答案了。生成新的字节码跟ClassReader一点关系也没有,完全是基于ClassWriter。

开篇的事件演示代码就说过了,这些代码就能生成一个Person类的字节码:
再次copy该代码!!!!!

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
cw.visit(V1_7, ACC_PUBLIC + ACC_SUPER, "com/kahn/test/asm/bean/Person", null, "java/lang/Object", null);
cw.visitSource("Person.java", null);
{
fv = cw.visitField(ACC_PRIVATE, "name", "Ljava/lang/String;", null, null);
fv.visitEnd();
}
{
mv = cw.visitMethod(ACC_PUBLIC, "<init>", "()V", null, null);
mv.visitCode();
mv.visitVarInsn(ALOAD, 0);
mv.visitMethodInsn(INVOKESPECIAL, "java/lang/Object", "<init>", "()V", false);
mv.visitInsn(RETURN);
mv.visitMaxs(1, 1);
mv.visitEnd();
}
{
mv = cw.visitMethod(ACC_PUBLIC, "getName", "()Ljava/lang/String;", null, null);
mv.visitCode();
mv.visitVarInsn(ALOAD, 0);
mv.visitFieldInsn(GETFIELD, "com/kahn/test/asm/bean/Person", "name", "Ljava/lang/String;");
mv.visitInsn(ARETURN);
mv.visitMaxs(1, 1);
mv.visitEnd();
}
cw.visitEnd();

只要你自己新建一个ClassWriter,挨个调用上面的代码。在最后,toByteArray出来字节数组然后保存,或者用类加载器加载都可以。

到这里,字节码的修改和生成都已经说完了。

最后

没啥好说的,介绍一下工具吧。

Eclipse上的ASM特供字节码插件BytecodeOutline地址:http://andrei.gmxhome.de/eclipse/,也可以使用这个地址,里面有更多关于asm的工具(内含BytecodeOutline)。http://download.forge.objectweb.org/eclipse-update/

安装插件后,把用showview把BytecodeOutline的视图调出来,就可以看到对应类生成的字节码了,点击红色的asm,就可以看到该类生成的asm代码了。所以!!千万不要傻傻的自己拼,没有意义。

ASM生成的一些代码,是调试信息,行号之类的,无关大局可以移除。像下面这样的

1
2
3
Label l0 = new Label();
mv.visitLabel(l0);
mv.visitLineNumber(10, l0);

又或者

1
2
3
Label l1 = new Label();
mv.visitLabel(l1);
mv.visitLocalVariable("this", "Lcom/kahn/test/asm/bean/Person;", null, l0, l1, 0);

都是可以删除的。我们accept的时候没有扫描到这样的代码,其实是因为我们传了一个SKIP_DEBUG的参数。该工具配置参数里也提供选项可以移除,但是移不干净。

在编写asm代码时的一个技巧是对比原始类和你想要获得的类的asm生成代码,这样就不会出现我之前在子类里面调用父类私有成员变量的问题了。恰好该用具也直接提供了对比两个类的功能。
eclipse-plugin_bytecodeoutline

最后的最后

使用这个一定注意java版本问题。不要随便升级asm版本和java版本。轻易不要追新,毕竟是黑科技,在一个版本上调通就不错了。能用设计模式,代码解决的尽量用代码解决。切记切记。

我哔哔完了。

练习

能自己实现一个插件,把一个类的class文件转成ASM代码吗?

思路:上面我们说了ClassReader的accept流程,它会分布的解析字节码然后调用visit。那么反向思考,用ClassWriter按顺序调用visit就可以还原该类。BytecodeOutline生成的asm代码就是这样的。我们怎么才能获取到accept的调用流程呢?

注入!还是注入。既然accept会逐步调用ClassVisitor的visit方法,我们是不是可以在ClassVisitor的所有visit方法前面注入一段代码?输出方法名和所有参数的值。然后使用这个被我们注入过的ClassVisitor去解析我们想要生成代码的类。注入后的ClassVisitor类似这样的。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
public void visit(int paramInt1, int paramInt2, String paramString1, String paramString2, String paramString3, String[] paramArrayOfString)
{
CollectMethodInfo localCollectMethodInfo = new CollectMethodInfo("visit");
localCollectMethodInfo.putParam(Integer.valueOf(paramInt1));
localCollectMethodInfo.putParam(Integer.valueOf(paramInt2));
localCollectMethodInfo.putParam(paramString1);
localCollectMethodInfo.putParam(paramString2);
localCollectMethodInfo.putParam(paramString3);
localCollectMethodInfo.putParam(paramArrayOfString);
localCollectMethodInfo.print();
if (this.cv != null) {
this.cv.visit(paramInt1, paramInt2, paramString1, paramString2, paramString3, paramArrayOfString);
}
}

上面注的代码为:先把所有参数都存入一个List,然后print出来
localCollectMethodInfo.print();会输出这样的日志

1
visit(51, 33, com/kahn/test/asm/bean/Person, null, java/lang/Object, [Ljava.lang.String;@78308db1, )

51和33都是Opcodes的静态字段,值为V1_7, ACC_PUBLIC + ACC_SUPER(ps:ACC_PUBLIC = 0x0001,ACC_SUPER)

ok,整个程序运行下来全部的输出日志

1
2
3
4
5
6
7
8
9
visit(51, 33, com/kahn/test/asm/bean/Person, null, java/lang/Object, [Ljava.lang.String;@78308db1, )
visitField(2, name, Ljava/lang/String;, null, null, )
visitField(2, age, I, null, null, )
visitMethod(1, <init>, ()V, null, null, )
visitMethod(1, getName, ()Ljava/lang/String;, null, null, )
visitMethod(1, setName, (Ljava/lang/String;)V, null, null, )
visitMethod(1, getAge, ()I, null, null, )
visitMethod(1, setAge, (ILjava/lang/String;Lorg/objectweb/asm/ClassVisitor;Ljava/lang/Runnable;JD[I[JZ)V, null, null, )
visitEnd()

看起来是不是很熟悉?和asm工具生成的工具代码差不多?这只是个简答的例子,还少了很多东西。比如对field,annotation,method的详细visit。但是思路就是这样的,我们这里只注入了ClassVisitor。可以把ASM这一套visitor都注入,比如MethodVisitor。最后得出日志就是asm的代码了。

前面讲的都是插入一段静态的代码,插入静态代码是非常简单的,使用工具查看要生成的asm代码直接copy过去就完事了。但是!这个练习可能会有些不一样。

这个例子的难点在于怎么使用ASM在方法体中取出参数的值。对于一些要检测方法参数的需求,还是有用的。

有空了把这个例子的源代码放上来。