当才华撑不起梦想,就该去读书!
ANTLR 4权威指南
内容简介
ANTLR是一款强大的语法分析器生成工具,可用于读取、处理、执行和翻译结构化的文本或二进制文件。它被广泛应用于学术领域和工业生产实践,是众多语言、工具和框架的基石。Twitter搜索使用ANTLR进行语法分析,每天处理超过20亿次查询;Hadoop生态系统中的Hive、Pig、数据仓库和分析系统所使用的语言都用到了ANTLR;Lex Machina将ANTLR用于分析法律文本;Oracle公司在SQL开发者IDE和迁移工具中使用了ANTLR;NetBeans公司的IDE使用ANTLR来解析C++;Hibernate对象-关系映射框架(ORM)使用ANTLR来处理HQL语言。 除了这些鼎鼎大名的项目之外,还可以利用ANTLR构建各种各样的实用工具,如配置文件读取器、遗留代码转换器、维基文本渲染器,以及JSON解析器。我编写了一些工具,用于创建数据库的对象-关系映射、描述三维可视化以及在Java源代码中插入性能监控代码。我甚至为一次演讲编写了一个简单的DNA模式匹配程序。 一门语言的正式描述称为语法(grammar),ANTLR能够为该语言生成一个语法分析器,并自动建立语法分析树——一种描述语法与输入文本匹配关系的数据结构。ANTLR也能够自动生成树的遍历器,这样你就可以访问树中的节点,执行自定义的业务逻辑代码。 本书既是ANTLR 4的参考手册,也是解决语言识别问题的指南。你会学到如下知识: 识别语言样例和参考手册中的语法模式,从而编写自定义的语法。 循序渐进地为从简单的JSON到复杂的R语言编写语法。同时还能学会解决XML和Python中棘手的识别问题。 基于语法,通过遍历自动生成的语法分析树,实现自己的语言类应用程序。 在特定的应用领域中,自定义识别过程的错误处理机制和错误报告机制。 通过在语法中嵌入Java动作(action),对语法分析过程进行完全的掌控。 本书并非教科书,所有的讨论都是基于实例的,旨在令你巩固所学的知识,并提供语言类应用程序的基本范例。目录
第一部分 ANTLR和计算机语言简介
第1章 初识ANTLR
1.1 安装ANTLR
1.2 运行ANTLR并测试识别程序
第2章 纵观全局
2.1 从ANTLR元语言开始
2.2 实现一个语法分析器
2.3 你再也不能往核反应堆多加水了
2.4 使用语法分析树来构建语言类应用程序
2.5 语法分析树监听器和访问器
第3章 入门的ANTLR项目
3.1 ANTLR工具、运行库以及自动生成的代码
3.2 测试生成的语法分析器
3.3 将生成的语法分析器与Java程序集成
3.4 构建一个语言类应用程序
第4章 快速指南
4.1 匹配算术表达式的语言
4.2 利用访问器构建一个计算器
4.3 利用监听器构建一个翻译程序
4.4 定制语法分析过程
4.5 神奇的词法分析特性
第二部分 使用ANTLR语法开发语言类应用程序
第5章 设计语法
5.1 从编程语言的范例代码中提取语法
5.2 以现有的语法规范为指南
5.3 使用ANTLR语法识别常见的语言模式
5.4 处理优先级、左递归和结合性
5.5 识别常见的词法结构
5.6 划定词法分析器和语法分析器的界线
第6章 探索真实的语法世界
6.1 解析CSV文件
6.2 解析JSON
6.3 解析DOT语言
6.4 解析Cymbol语言
6.5 解析R语言
第7章 将语法和程序的逻辑代码解耦
7.1 从内嵌动作到监听器的演进
7.2 使用语法分析树监听器编写程序
7.3 使用访问器编写程序
7.4 标记备选分支以获取精确的事件方法
7.5 在事件方法中共享信息
第8章 构建真实的语言类应用程序
8.1 加载CSV数据
8.2 将JSON翻译成XML
8.3 生成调用图
8.4 验证程序中符号的使用
第三部分 高级特性
第9章 错误报告与恢复
9.1 错误处理入门
9.2 修改和转发ANTLR的错误消息
9.3 自动错误恢复机制
9.4 勘误备选分支
9.5 修改ANTLR的错误处理策略
第10章 属性和动作
10.1 使用带动作的语法编写一个计算器
10.2 访问词法符号和规则的属性
10.3 识别关键字不固定的语言
第11章 使用语义判定修改语法分析过程
11.1 识别编程语言的多种方言
11.2 关闭词法符号
11.3 识别歧义性文本
第12章 掌握词法分析的“黑魔法”
12.1 将词法符号送入不同通道
12.2 上下文相关的词法问题
12.3 字符流中的孤岛
12.4 对XML进行语法分析和词法分析
第四部分 ANTLR参考文档
第13章 探究运行时API
13.1 包结构概览
13.2 识别器
13.3 输入字符流和词法符号流
13.4 词法符号和词法符号工厂
13.5 语法分析树
13.6 错误监听器和监听策略
13.7 提高语法分析器的速度
13.8 无缓冲的字符流和词法符号流
13.9 修改ANTLR的代码生成机制
第14章 移除直接左递归
14.1 直接左递归备选分支模式
14.2 左递归规则转换
第15章 语法参考
15.1 语法词汇表
15.2 语法结构
15.3 文法规则
15.4 动作和属性
15.5 词法规则
15.6 通配符与非贪婪子规则
15.7 语义判定
15.8 选项
15.9 ANTLR命令行参数
参考文献
第1章 初识ANTLR
1.1 安装ANTLR
1.2 运行ANTLR并测试识别程序
第2章 纵观全局
2.1 从ANTLR元语言开始
2.2 实现一个语法分析器
2.3 你再也不能往核反应堆多加水了
2.4 使用语法分析树来构建语言类应用程序
2.5 语法分析树监听器和访问器
第3章 入门的ANTLR项目
3.1 ANTLR工具、运行库以及自动生成的代码
3.2 测试生成的语法分析器
3.3 将生成的语法分析器与Java程序集成
3.4 构建一个语言类应用程序
第4章 快速指南
4.1 匹配算术表达式的语言
4.2 利用访问器构建一个计算器
4.3 利用监听器构建一个翻译程序
4.4 定制语法分析过程
4.5 神奇的词法分析特性
第二部分 使用ANTLR语法开发语言类应用程序
第5章 设计语法
5.1 从编程语言的范例代码中提取语法
5.2 以现有的语法规范为指南
5.3 使用ANTLR语法识别常见的语言模式
5.4 处理优先级、左递归和结合性
5.5 识别常见的词法结构
5.6 划定词法分析器和语法分析器的界线
第6章 探索真实的语法世界
6.1 解析CSV文件
6.2 解析JSON
6.3 解析DOT语言
6.4 解析Cymbol语言
6.5 解析R语言
第7章 将语法和程序的逻辑代码解耦
7.1 从内嵌动作到监听器的演进
7.2 使用语法分析树监听器编写程序
7.3 使用访问器编写程序
7.4 标记备选分支以获取精确的事件方法
7.5 在事件方法中共享信息
第8章 构建真实的语言类应用程序
8.1 加载CSV数据
8.2 将JSON翻译成XML
8.3 生成调用图
8.4 验证程序中符号的使用
第三部分 高级特性
第9章 错误报告与恢复
9.1 错误处理入门
9.2 修改和转发ANTLR的错误消息
9.3 自动错误恢复机制
9.4 勘误备选分支
9.5 修改ANTLR的错误处理策略
第10章 属性和动作
10.1 使用带动作的语法编写一个计算器
10.2 访问词法符号和规则的属性
10.3 识别关键字不固定的语言
第11章 使用语义判定修改语法分析过程
11.1 识别编程语言的多种方言
11.2 关闭词法符号
11.3 识别歧义性文本
第12章 掌握词法分析的“黑魔法”
12.1 将词法符号送入不同通道
12.2 上下文相关的词法问题
12.3 字符流中的孤岛
12.4 对XML进行语法分析和词法分析
第四部分 ANTLR参考文档
第13章 探究运行时API
13.1 包结构概览
13.2 识别器
13.3 输入字符流和词法符号流
13.4 词法符号和词法符号工厂
13.5 语法分析树
13.6 错误监听器和监听策略
13.7 提高语法分析器的速度
13.8 无缓冲的字符流和词法符号流
13.9 修改ANTLR的代码生成机制
第14章 移除直接左递归
14.1 直接左递归备选分支模式
14.2 左递归规则转换
第15章 语法参考
15.1 语法词汇表
15.2 语法结构
15.3 文法规则
15.4 动作和属性
15.5 词法规则
15.6 通配符与非贪婪子规则
15.7 语义判定
15.8 选项
15.9 ANTLR命令行参数
参考文献
下载
下载不对外开放