书签分享收藏举报版权申诉 / 117

立即下载加入VIP,免费下载

当前位置：首页 > 总结汇报 > 实习总结 > 四川大学计算机学院 C语言编译器编译原理课程设计报告内附源码递归下降 c minusWord文档下载推荐.docx

四川大学计算机学院 C语言编译器编译原理课程设计报告内附源码递归下降 c minusWord文档下载推荐.docx

文档编号：6836199
上传时间：2023-05-07
格式：DOCX
页数：117
大小：436.28KB

《四川大学计算机学院 C语言编译器编译原理课程设计报告内附源码递归下降 c minusWord文档下载推荐.docx》由会员分享，可在线阅读，更多相关《四川大学计算机学院 C语言编译器编译原理课程设计报告内附源码递归下降 c minusWord文档下载推荐.docx（117页珍藏版）》请在冰点文库上搜索。

四川大学计算机学院 C语言编译器编译原理课程设计报告内附源码递归下降 c minusWord文档下载推荐.docx

本程序采用C++语言以面向对象的思想编写，程序分为两部分：

词法分析（Scanner）和语法分析（Parser），分别将两个处理阶段封装成Scanner类和Parser类，两个类各司其职，分别完成词法分析和语法分析的任务。

Scanner类主要的工作是过滤注释、词法分析获取Token。

Parser类的主要工作是根据Scanner类词法分析之后的Token进行语法分析，生成语法树，最后并输出语法树。

在处理过程中，Scanner类的对象作为Parser类的一个成员变量，配合Parser类进行语法分析。

工程文件总体上是按照两个类的格局分为四个文件，分别是两个类的声明文件和实现文件。

四个文件分别为scanner.h和scanner.cpp以及parser.h和parser.cpp，他们分别是Scanner类声明文件、Scanner类实现文件、Parser类声明文件、Parser类实现文件。

词法分析

scanner.h：

与词法分析相关的类（Scanner类）的声明

scanner.cpp：

词法分析阶段类（Scanner类）的实现

语法分析

parser.h：

与语法分析相关的类（Parser类）的声明

parser.cpp：

语法分析阶段类（Parser类）的实现

2.2程序流程

在程序中，Scanner类的对象（scanner）作为Parser类中的一个成员变量，配合Parser类进行语法分析。

它们的关系是这样的：

Parser类的一个成员变量scanner首先对源程序删除注释，然后进行词法分析获取所有Token，并将获取的Token存储在scanner对象的tokenList（vector类型）中。

然后Parser类的语法分析程序就根据tokenList中的Token进行语法分析，生成语法树，最后打印语法树。

同时，这也是程序的流程。

3词法分析

3.1代码结构分析

词法分析阶段的代码被封装成一个类——Scanner，scanner.h中主要是Scanner类的声明代码，scanner.cpp中主要是Scanner类的实现代码。

Scanner类对外提供的函数主要有：

getSourseStringFromFile（strings）（从文件中获取待分析的源代码）、deleteComments（）（过滤注释）、scan（）（词法分析主程序）。

词法分析的过程主要是：

●Scanner调用getSourseStringFromFile（strings），从文件中获取待分析的源代码

●Scanner调用deleteComments（），将注释过滤掉，如果注释出错，则不进行词法分析

●Scanner调用scan（），进行词法分析，将分析得到的所有Token保存在Scanner类的成员变量tokenList中，以备语法阶段调用，并将Token输出到文件Token.txt中

以上三个函数构成了词法分析的骨架，在Scanner类中还有其他成员变量和函数，主要作为这三个函数处理过程的中间步骤，为这三个函数服务。

Scanner类的代码结构和主要的成员变量和函数如下图所示：

其他函数和成员变量的作用和含义：

●voidbackToLastChar（）：

在词法分析过程中，回退一个字符

●DFAStatecharType（char）：

返回字符的类型（按状态分），如whitespace返回START，0-9返回NUM

●chargetNextChar（）：

获取到下一个字符

●TokengetTokenAt（int）：

根据下标从tokenList数组中获取词法分析后所保存的Token（供语法分析阶段调用）

●voidprintToken（）：

将词法分析好的Token输出到文件Token.txt中

●TokenTypereturnTokenType（strings）：

根据字符串返回对应的31种Token类型，如字符串"

int"

将返回INT，"

var"

将返回ID

●intcharIndex：

配合getNextChar（）和backToLastChar（）使用（分别自增和自减1），用以指示当前待分析的char在源代码中的位置

●boolcommentFlag：

标注注释开始的标志，为true时表示正在注释体内，即源代码进入"

/*"

之后且"

*/"

之前的状态

●intlineCount：

对行号计数，表示当前词法分析在源代码的行位置（每次获取到的char为'

/n'

就自增1）

●boolscanSuccess：

词法分析是否成功的标志

●stringsourseString：

获取源代码的字符串

●stringstr：

在分析过程中保存Token对应的串

●vector<

Token>

tokenList：

保存Token序列

3.2Token定义

3.2.1Token的定义和类型

Token定义:

//定义的Token结构体，包括类型、对应的串、所在代码的行号

structToken

{

TokenTypetokenType;

stringtokenString;

intlineNo;

};

Token类型（TokenType）:

程序中，将Token的类型分为31种，分别对应于else、if、int、return、void、while、+、-、*、/、<

、<

=、>

、>

=、==、!

=、=、;

、,、（、）、[、]、{、}、/*、*/、num、id、错误、文件结束，TokenType的定义和种别码分别如下所示：

//定义的Token的类型（31种），分别对应于else、if、int、return、void、while、+、-、*、/、<

、,、（、）、[、]、{、}、/*、*/、num、id、错误、结束

typedefenum

ELSE=1,IF,INT,RETURN,VOID,WHILE,

PLUS,MINUS,TIMES,OVER,LT,LEQ,GT,GEQ,EQ,NEQ,ASSIGN,SEMI,COMMA,LPAREN,RPAREN,LMBRACKET,RMBRACKET,LBBRACKET,RBBRACKET,LCOMMENT,RCOMMENT,

NUM,ID,ERROR,ENDFILE

}TokenType;

3.2.2Token的种别码

TokenType的种别码如下表所示，共31种

单词符号

种别码

Value

else

ELSE

1

=

ASSIGN

17

if

IF

2

;

SEMI

18

int

INT

3

COMMA

19

return

RETURN

4

（

LPAREN

20

void

VOID

5

）

RPAREN

21

while

WHILE

6

[

LMBRACKET

22

+

PLUS

7

]

RMBRACKET

23

-

MINUS

8

LBBRACKET

24

*

TIMES

9

}

RBBRACKET

25

/

OVER

10

/*

LCOMMENT

26

<

LT

11

*/

RCOMMENT

27

LEQ

12

num

NUM

28

>

GT

13

id

ID

29

GEQ

14

错误

ERROR

30

==

EQ

15

结束

ENDFILE

31

!

NEQ

16

3.3DAF分析

由于词法分析程序分为两个步骤处理：

删除注释和词法分析获取Token。

所以对应有两个DFA，程序分别根据这两个DFA进行编写，现根据DFA分析两程序deleteComments（）和scan（）如下：

3.3.1删除注释DFA

删除注释的DFA描述：

删除注释的DFA如下所示，一共分为5个状态，在开始状态1时，如果输入的字符为/,则进入状态2，此时有可能进入注释状态，如果在状态2时，输入的字符为*，则进入注释状态，状态将转到3，如果在状态3时，输入的字符为*，则有可能结束注释状态，此时状态将转到状态4，如果在状态4时输入的字符为/，则注释状态结束，状态转移到结束状态。

对应的DFA的代码分析：

删除注释的功能通过Scanner类的成员函数deleteComments（）实现，功能是将源代码中的注释过滤掉，将其余代码输出到sourceFile.txt文件中。

deleteComments（）函数按照上面的DFA编写，在函数中，state变量表示状态，共分为5个状态：

●在状态1时，如果输入的字符为/,则进入状态2，否则仍处在状态1，且输出输入的字符

●在状态2时，（此时可能进入注释状态），如果输入的字符为*，则进入注释状态，状态将转到3，否则跳转到状态1，并输出/和输入的字符

●在状态3时，（此时可能结束注释状态），如果输入的字符为*，此时状态将转到状态4，否则继续在状态3

●在状态4时，如果输入的字符为/，则注释状态结束，状态转移到结束状态

相应的DFA代码：

代码如下所示：

voidScanner:

:

deleteComments（）

ofstreamfout_Sourse（"

sourseFile.txt"

）;

intstate=1;

charch;

while（state<

6）

{

ch=getNextChar（）;

if（'

\0'

==ch）//文件结束

break;

if（1==state）//DFA中的状态

{

if（'

/'

==ch）

state=2;

else

{

state=1;

fout_Sourse<

ch;

}

elseif（2==state）//DFA中的状态

*'

state=3;

commentFlag=false;

}

"

/"

elseif（3==state）//DFA中的状态

state=4;

elseif（4==state）//DFA中的状态

elseif（'

state=5;

if（5==state）//结束状态，处理

commentFlag=true;

state=1;

}

if（!

commentFlag）

cout<

注释错误，没有结束符！

endl;

scanSuccess=false;

3.3.2词法分析DFA

词法分析的DFA描述：

词法分析的DFA如下所示，一共分为5个状态：

START、INNUM、INID、INDBSYM、DONE。

状态START表示开始状态，状态INNUM表示数字类型（NUM）Token的状态，状态INID表示字符串类型Token的状态（如关键字和一般的标示符），状态INDBSYM表示双目运算符型Token的状态（如<

=、!

=、==），状态DONE表示接收状态。

●在开始状态START时

Ø

如果输入的字符为空白符，如空格换行等，则仍在START状态

如果输入的字符为digit，则进入状态INNUM，即可能是数字类型（NUM）Token的状态

如果输入的字符为letter，则进入状态INID，即可能是字符串类型Token的状态

如果输入的字符为>

、!

、=，则进入状态INDBSYM，即可能是双目运算符型Token的状态

如果输入的字符为是除以上之外的，则进入状态DONE，这次输入的字符可能是单目运算符、错误等

●在状态INNUM时

如果输入的字符为digit，则仍停留在INNUM状态

如果输入的为其他的字符，则转到DONE状态

●在状态INID时

如果输入的字符为letter，则仍停留在INID状态

●在状态INDBSYM时

如果输入的字符为=，将双目运算标志赋值为true后转到DONE状态

如果输入的为其他的字符，则直接转到DONE状态

●在状态DONE时

接受状态，根据分析过程中获取的字符串确定Token的类型，并生成和保存相应的Token

词法分析的功能通过Scanner类的成员函数scan（）实现，功能是根据过滤掉注释的源代码获取Token并保存，获取到的Token通过printToken（）函数输出到Token.txt文件中。

scan（）函数按照上面的DFA编写，在函数中，doubleSym变量表示双目运算符标志，当doubleSym为true时表示INDBSYM状态接收到的字符为'

='

，str变量是在词法分析过程中用来存储分析的Token的字符串，如INT型Token在分析过程中得到"

int"

的字符串，变量ch为当前输入的字符。

分析到最后，在状态DONE中，根据分析过程中获取的str确定Token的类型，并生成和保存相应的Token。

程序一共分为5个状态：

函数在各状态下的处理分析如下：

如果输入的字符为digit，则进入状态INNUM，即可能是数字类型（NUM）Token的状态，同时将ch添加到str中去（str+=ch）

如果输入的字符为letter，则进入状态INID，即可能是字符串类型Token的状态，同时将ch添加到str中去（str+=ch）

、=，则进入状态INDBSYM，即可能是双目运算符型Token的状态，同时将ch添加到str中去（str+=ch）

如果输入的字符为是除以上之外的，则进入状态DONE，同时将ch添加到str中去（str+=ch），这次输入的字符可能是单目运算符、错误等

如果输入的字符为digit，则仍停留在INNUM状态，同时将ch添加到str中去（str+=ch）

如果输入的字符为letter，则仍停留在INID状态，同时将ch添加到str中去（str+=ch）

如果输入的字符为=，将双目运算标志赋值为true后转到DONE状态，同时将ch添加到str中去（str+=ch），并将doubleSym赋值为true（doubleSym=true），表示ch为‘=’

接受状态，根据分析过程中获取的字符串确定Token的类型，并生成和保存相应的Token，同时将str设为空，（以便分析下一个Token）。

在DFA中，[other]表示ch没有被添加到str中后的转移，所以当状态是通过条件[other]跳转到DONE状态的情况时，则需将分析的字符回退回去（backToLastChar（））。

代码如下：

scan（）

{

booldoubleSym=false;

getSourseStringFromFile（"

intstate=START;

lineCount=0;

//每一次循环都执行一次DFA，并获取到一个Token

==ch）//到达文件末尾，文件结束

Tokent;

t.lineNo=lineCount;

t.tokenString="

t.tokenType=ENDFILE;

tokenList.push_back（t）;

if（START==state）//初始状态和空格

state=charType（ch）;

if（state!

=START）

str+=ch;

elseif（INNUM==state）//digit

=INNUM）

state=DONE;

elseif（INID==state）//letter

=INID）

elseif（INDBSYM==state）//除了<

=!

之外的各种符号

{

doubleSym=true;

doubleSym=false;

state=DONE;

if（DONE==state）//接收状态

inttp=0;

\n'

tp=1;

//根据str生成Token

t.lineNo=lineCount-tp;

t.tokenString=str;

t.tokenType=returnTokenType（str）;

if（ERROR==t.tokenType）

scanSuccess=false;

//针对[other]的情形，回退一个字符

intlastState=charType（str[str.length（）-1]）;

if（lastState==INNUM||lastState==INID||（lastState==INDBSYM&

&

doubleSym==false））

backToLastChar（）;

str="

state=START;

if（doubleSym==true）

printToken（）;

//输出Token到文件Token.txt中

4语法分析

4.1代码结构分析

语法分析阶段的代码被封装成一个类——Parser，parser.h中主要是Parser类的声明代码，parser.cpp中主要是Parser类的实现代码。

语法分析的过程主要是：

在语法分析之前进行词法分析，然后通过递归向下分析法根据C-语言的文法进行语法分析，并生成语法树，最后打印语法树。

Parser类在其构造函数中完成语法分析，在构造函数Parser（）中，首先通过Parser类的scanner成员变量进行词法分析（删除注释、词法分析获取Token），然后通过parse（）函数开始递归向下分析，并返回语法树的根节点，最后通过printTree（）打印语法树，输出到文件tokenTree.txt中。

Parser类的代码结构和主要的成员变量和函数如下图所示：

成员函数和变量的作用和含义：

●TokengetToken（）：

获取保存在scanner中TokenList数组中的Token，每次获取完之后数组下标指向下一个

●voidprintSpace（intn）：

打印n个空格

●voidsyntaxError（strings）：

报错的函数，报告出错位置（行号）、出错位置附近的Token

●voidmatch（TokenTypeex）：

与目标Token类型ex匹配，如果匹配成功则获取下一个Token（为currentToken赋值），否则报错

●voidprintTree（TreeNode*t）：

打印生成的语法树

●TreeNode*newNode（Nodekindk）：

根据节点类型新建节点

●以下为递归向下分析文法过程中各阶段的分析函数：

TreeNode*declaration_list（void）;

TreeNode*declaration（void）;

TreeNode*params（void）;

TreeNode*

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 四川大学计算机学院 C语言编译器编译原理课程设计报告内附源码递归下降 minus 四川大学计算机学院语言编译器编译原理课程设计报告源码递归下降

冰点文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：四川大学计算机学院 C语言编译器编译原理课程设计报告内附源码递归下降 c minusWord文档下载推荐.docx
链接地址：https://www.bingdoc.com/p-6836199.html

四川大学计算机学院 C语言编译器 编译原理课程设计报告内附源码 递归下降 c minusWord文档下载推荐.docx

热门标签

四川大学计算机学院 C语言编译器编译原理课程设计报告内附源码递归下降 c minusWord文档下载推荐.docx