Lex词法分析器

最新推荐文章于 2025-04-14 22:26:17 发布

t617

最新推荐文章于 2025-04-14 22:26:17 发布

阅读量8.4k

点赞数 6

分类专栏：编译原理文章标签： lex 编译原理词法分析词法分析器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/t6_17/article/details/78535392

版权

本文介绍了如何设计和实现一个简单的词法分析器，利用Lex进行编译。内容包括词法分析器的设计目的，实验步骤，以及如何定义规则识别保留字、常数、标识符、运算符和分界符。通过词法分析器，可以对源程序进行词法分析，输出单词符号的类别和属性信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Lex词法分析器

一.设计内容

熟悉并实现一个简单的词法分析器

二.设计目的

了解高级语言单词的分类，了解如何识别单词规则，掌握状态图到识别程序的编程。
源程序中，存在许多编辑用的符号，他们对程序逻辑功能无任何影响。例如：回车，换行，多余空白符，注释行等。在词法分析之前，首先要先剔除掉这些符号，使得词法分析更为简单。

三.实验步骤

Lex输入文件由3个部分组成：

定义集（definition），规则集（rule）和辅助程序集（auxiliary routine）或用户程序集（user routine）。

这三个部分由位于新一行第一列的双百分号分开，因此，Lex输入文件的格式如下：

{definitions}
%%
{rules}
%%
{auxiliary routines}

将每个单词符号进行不同类别的划分。单词符号可以划分成5种：

标识符：用户自己定义的名字，常量名，变量名和过程名。
常数：各种类型的常数。
保留字（关键字）：如if、begin、then、while、do等。
运算符：如+、-、*、<、>、=等。
界符：如逗号、分号、括号等。

将各类单词对应到lex中：

词法分析器所输出单词符号常常表示成单词种别，单词符号的属性值的二元式:

单词种别通常用整数编码。标识符一般统归为一种。常数则宜按类型（整、实、布尔等）分种。关键字可将其全体视为一种。运算符可采用一符一种的方法。界符一般用一符一种的方法。对于每个单词符号，除了给出了种别编码之外，还应给出有关单词符号的属性信息。单词符号的属性是指单词符号的特性或特征。

保留字：

定义识别保留字规则

reserved_word [const|var|procedure|begin|end|if|then|while|do|read|call|write|writeln]

由于在lex中不区分大小写，所以将保留字写成：

reserved_word [cC][oO][nN][sS][tT]|[vV][aA][rR]|[pP][rR][oO][cC][eE][dD][uU][rR][eE]|
[bB][eE][gG][iI][nN]|[eE][nN][dD]|[iI][fF]|[tT][hH][eE][nN]|[wW][hH][iI]
[lL][

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。