编译原理--词法分析实验(含代码) 联系客服

发布时间 : 星期一 文章编译原理--词法分析实验(含代码)更新完毕开始阅读432d7df5fd0a79563d1e7238

计算机编译原理实验

班级:计算机科学与技术113班 姓名: 学号:

南昌大学信息工程学院计算机系

实验1 词法分析程序的设计

一、实验目的

掌握计算机语言的词法分析程序的开发方法。

二、实验内容

编制一个能够分析三种整数、标识符、主要运算符和主要关键字的词法分析程序。

三、实验要求

1、根据以下的正规式,编制正规文法,画出状态图;

标识符

<字母>(<字母>|<数字字符>)*

0 |(1|2|3|4|5|6|7|8|9)(0|1|2|3|4|5|6|7|8|9)* 0(1|2|3|4|5|6|7)(0|1|2|3|4|5|6|7)*

0x(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)* + - * / > < = <= >= ( ) ; { } main if then else while do int (可根据需要添加)

十进制整数 八进制整数 十六进制整数 运算符和界符 关键字

如有余力,则进一步分析八进制和十六进制整数,其正规式如下:

2、根据状态图,设计词法分析函数int scan( ),完成以下功能:

1) 从文本文件中读入测试源代码,根据状态转换图,分析出一个单词, 2) 以二元式形式输出单词<单词种类,单词属性>

其中单词种类用整数表示: 0:标识符 1:十进制整数 2:八进制整数 3:十六进制整数

运算符和界符,关键字采用一字一符,不编码 其中单词属性表示如下:

标识符,整数由于采用一类一符,属性用单词表示 运算符和界符,关键字采用一字一符,属性为空

3、编写测试程序,反复调用函数scan( ),输出单词种别和属性。

四、实验环境

PC微机

DOS操作系统或 Windows 操作系统

Turbo C 程序集成环境或 Visual C++ 程序集成环境

五、实验步骤

1、 根据正规式,画出状态转换图; 2、 根据状态图,设计词法分析算法;

3、 采用C或C++语言,设计函数scan( ),实现该算法;

4、 编制测试程序(主函数main);

5、调试程序:读入文本文件program.txt,运行程序得到输出结果result.txt,并检查输出

结果是否正确。

六、测试数据

输入数据:

编辑一个文本文件program.txt,在文件中输入一段程序代码,如:

if data+92>0x3f then data=data+01; else data=data-01; 将输出结果存放在result.txt文件中,输出格式如下:

<0 , data> <+ , -> <1 , 92> <> , -> <3 , 3f> <0 , data> <= , -> <0 , data> <+ , -> <2 , 1> <; ,-> <0 , data> <= , -> <0 , data> <- , -> <2 , -> <; , -> 七、实验报告要求

实验报告应包括以下几个部分: 1、词法的正规式描述; 2、变换后的状态图;

3、词法分析程序的数据结构与算法。 【源程序】

#include

#include using namespace std;

#define LENGTH 5 char ch =' ';

string key[5]={\

int Iskey(string c){ //关键字判断 int i;

for(i=0;i

if(key[i].compare(c)==0) return 1; } return 0; }

int IsLetter(char c) { //判断是否为字母

if(((c<='z')&&(c>='a'))||((c<='Z')&&(c>='A'))) return 1; else return 0; }

int IsLetter1(char c) { //判断是否为a~f字母

if(((c<='f')&&(c>='a'))||((c<='F')&&(c>='A'))) return 1; else return 0; }

int IsNum(char c){ //判断是否为数字 if(c>='0'&&c<='9') return 1; else return 0; }

void scan(FILE *fpin){ string arr=\

while((ch=fgetc(fpin))!=EOF) {

arr=\

if(ch==' '||ch=='\\t'||ch=='\\n'){}

else if(IsLetter(ch)||ch=='_') { arr=arr+ch; ch=fgetc(fpin);

while(IsLetter(ch)||IsNum(ch)) { if((ch<='Z')&&(ch>='A')) ch=ch+32;