深入理解JVM搬运工(6) 虚拟机类加载机制-早期

二叶草 2020年2月7日10:36:57优化评论阅读模式

Java编译器分3类:

  1. 前端编译器:把*.java文件转变成*.class文件。Sun的javac
  2. JIT编译器:虚拟机的后端运行期编译器,把字节码转变为机器码。HotSpot VM的C1、C2编译器
  3. AOT编译器:静态提前编译器,直接把*.java文件编译成本地机器代码。GNU Complier for the java

Javac编译器

Javac的源码与调试

虚拟机规范严格定义了Class文件的格式,但并没有对如何把java源码文件转变为Class文件的编译过程进行十分严格的定义,这导致Class文件编译在某种程度上与具体的JDK实现相关,有可能会出现某个*.java文件一个编译器可以编译而另一个编译器不能编译的情况。

从javac的代码看,编译过程大致可以分为3个过程:

  1. 解析与填充符号表过程
  2. 插入式注解处理器的注解处理过程
  3. 分析与字节码生成过程

解析与填充符号表

解析步骤包括了经典程序编译原理中的词法分析和语法分析两个过程。

词法、语法分析

词法分析是将源代码的字符流转变为标记(Token)集合,单个字符是程序编写过程的最小元素,而标记是编译过程的最小元素,关键字、变量名、字面量、运算符都可以成为标记。在javac的源码中,词法分析过程由com.sun.tools.javac.parser.Scanner类来实现。

语法分析是根据Token序列构造抽象语法树的过程,抽象语法树(Abstract Syntax Tree,AST)是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构,例如包、类型、修饰符、运算符、接口、返回值甚至代码注释等。

语法分析过程由com.sun.tools.javac.parser.Parser类实现,抽象预发数由com.sun.tools.javac.tree.JCTree类表示。

填充符号表

完成词法和语法分析后,下一步就是填充符号表的过程。符号表是由一组符号地址和符号信息构成的表格。符合表中所登记的信息在编译的不同阶段都要用到。在语义分析中,符号表所登记的内容将用于语义检查和产生中间代码。在目标代码生成阶段,当对符号名进行分配时,符号表是地址分配的依据。

填充符号表的过程由com.sun.tools.javac.comp.Enter类实现。

注解处理器

在JDK1.6中实现了JSR-269规范,提供了一组插入式注解处理器的标准API在编译期对注解进行处理,注解处理器可以读取、修改、添加抽象语法树中的任意元素。如果注解处理器在处理注解期间对语法树进行了修改,编译器将回到解析及填充符号表的过程重新处理,知道所有插入式注解处理器都没有再对语法树进行修改为止。

有了编译器注解处理的标准API后,我们的代码才有可能干涉编译器的行为。

语义分析与字节码生成

语法分析后,编译器获得了程序代码的抽象语法树表示,语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是符合逻辑的。而语义分析的主要任务是对结构上正确的源程序进行上下文有关性质的审查。

标注检查

Javac的编译过程中,语义分析过程分为标注检查以及数据及控制流分析两个步骤。

标注检查步骤检查的内容包括诸如变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等。在标注检查中,还有一个重要的动作称为常量折叠。

标注检查步骤在javac源码中的实现类是com.sun.tools.javac.comp.Attr类和com.sun.tools.javac.comp.Check类。

数据及控制流分析

数据及控制流分析是对程序上下文逻辑更进一步的验证,它可以检查程序局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理等。编译期的数据及控制流分析与类加载时的数据及控制流分析的目的基本一样,但校验范围有所区别,有一些校验只有在编译期或运行期才能进行。

解语法糖

语法糖(SyntacticSugar),也称糖衣语法,指在计算机语言中添加某种语法,这种语法对语言功能并没有影响,但是更方便程序员使用。通常来说,使用语法糖能够增加程序的可读性,从而减少程序代码的出错机会。

Java中最常用的语法糖主要有泛型、变长参数、自动装箱/拆箱等,虚拟机运行时不支持这些语法,它们在编译阶段还原回简单的基础语法结构,这个过程称为解语法糖。

字节码生成

字节码生成阶段不仅仅是把前面各个步骤所生成的信息转化成字节码写到磁盘中,编译器还进行少量的代码添加和转换工作。

完成了对语法树的遍历和调整之后,就会把填充了所有所需信息的符号表交给com.sun.tools.javac.jvm.ClassWriter类,由这个类的writeClass()方法输出字节码,生成最终的Class文件。

Java语法糖

语法糖虽然不会提供实质性的功能改进,但它们或能提高效率,或能提升预发的严谨性,或能减少编码出错的机会。Java的语法糖有泛型、自动装箱、自动拆箱、遍历循环和变长参数、内部类、枚举类、断言语句等。

泛型与类型擦除

泛型是JDK1.5的一项新增特性,它的本质是参数化类型的应用,也就是说所操作的数据类型被指定为一个参数。这种参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口、泛型方法。

泛型技术在C#和Java中的使用方式看似相同,但实现上却有着根本性的分歧,C#的泛型无论在程序源码中,编译后的IL中,或者是运行期的CLR中,都是切实存在的,List<int>和List<String>就是两个不同的类型,它们在系统运行期生成,有自己的虚方法表和类型数据,这种实现称为类型膨胀,基于这种方法实现的泛型称为真是泛型。

Java语言中的泛型则不一样,它只在程序源码中存在,在编译后的字节码文件中,就已经替换为原来的原生类型了,并且在相应的地方插入了强制转型代码,因此对于java语言来说List<int>和List<String>就是同一个类,所以泛型技术实际上是java语言的一颗语法糖,java语言中的泛型实现方法称为类型擦除,基于这种方法实现的泛型称为伪泛型。

条件编译

Java语言中的条件编译的实现,也是java语言的一颗语法糖,根据布尔常量值的真假,编译器将会把分支中不成立的代码块消除掉,这一工作将在编译器解除语法糖阶段完成。由于这种条件编译的实现方式使用了Java语法,只能写在java方法体的内部,因此只能实现语句基本块级别的条件编译。

本文来源于:深入理解JVM搬运工(6) 虚拟机类加载机制-早期 -变化吧门户
特别声明:以上文章内容仅代表作者本人观点,不代表变化吧门户观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与变化吧联系。

  • 赞助本站
  • 微信扫一扫
  • weinxin
  • 加入Q群
  • QQ扫一扫
  • weinxin
二叶草
nginx解析漏洞 优化

nginx解析漏洞

phpstudy(小皮模板存在nginx解析漏洞) 影响版本 phptsuy8.1.07的Nginx1.5.11版本影响版本 phptsuy8.1.07的Nginx1.5.11版本 phpstudy介...
网站SEO优化基础流程(新手必看) 优化

网站SEO优化基础流程(新手必看)

宝塔面板搭建一个获取网站的Favicon图标的APIgetFavicon是一个可以获取网站的Favicon图标并显示在你的网页上的项目。安装方法很简单,属于开箱即食。这篇文章还是基于宝塔面板来搭建。 ...

发表评论