本文共 3630 字,大约阅读时间需要 12 分钟。
词法分析:字符流转换为记号流
问题描述:对循环语句和条件判断语句编写词法分析编译程序,只能通过一遍扫描完成。
要求:
(1)关键字: for if then else while do until int input output,所有关键字都是小写。 (2)运算符和分隔符: : = + - * / < > <= <> >= ; ( ) # (3)其他标识符(ID)和整型常数(NUM),通过以下模式定义: ID=letter(letter | digit)* NUM=digit digit* (4)空格由空白、制表符和换行符组成。空格一般用来分隔ID、NUM、运算符、分隔符和关键字,词法分析阶段通常被忽略。词法单元和词法记号的对应关系
程序功能:
输入:源程序 输出:二元组(词法记号,属性值/其在符号表中的位置)构成的序列。样例:
输入:int x:=5; 输出:(30, int)(10,’x’)(18, :=) (11,5) (26, ;)状态转换图:
注:0为初态,2,3,4,6,11,12,13为非确定终态,1,5,7,8,9,10为确定终态 非确定终态:这里表示当前子串还不能确定作为一个词法单元 确定终态:这里表示当前终态可以确定作为一个词法单元 非确定终态的其它未标明输入,皆指向1#includeusing namespace std;int main(){ void fun(char*a); char a[100]={};//保存用户输入, //接收输入,不要超过100个字符,否则getline会设置失效位, //(如果有的话)接下来的输入将被阻断,需要的话,可以调用cin.clear()恢复输入 cin.getline(a,100);//遇见回车表示输入结束 fun(a); cout< < < <>对应的终态 output(7,sub); start=last+1; im=0; break; case 8://<=对应的终态 output(8,sub); start=last+1; im=0; break; case 9://>=对应的终态 output(9,sub); start=last+1; im=0; break; case 10://:=对应的终态 output(10,sub); start=last+1; im=0; break; case 12://可能是关键字 for(kw=0;kw =48&&asc<=57)//遇见数字 om=6; else if(asc>=65&&asc<=90||asc>=97&&asc<=122)//遇见字母 om=11; else//遇见运算符或分隔符 { if(c=='<') om=2; else if(c=='>') om=3; else if(c==':') om=4; else//遇见其它运算符或分隔符 om=5; } break; case 2: if(c=='>')//表示<> om=7; else if(c=='=')//表示<= om=8; else om=1;//表示im break; case 3: if(c=='=')//表示>= om=9; else om=1; break; case 4: if(c=='=')//表示:= om=10; else om=1; break; case 6: if(asc>=48&&asc<=57)//遇见数字 om=6; else om=1; break; case 11: if(asc>=65&&asc<=90||asc>=97&&asc<=122)//遇见字母 om=12; else if(asc>=48&&asc<=57)//遇见数字 om=13; else om=1; break; case 12: if(asc>=65&&asc<=90||asc>=97&&asc<=122)//遇见字母 om=12; else if(asc>=48&&asc<=57)//遇见数字 om=13; else om=1; break; case 13: if(asc>=48&&asc<=57)//遇见数字 om=13; else om=1; default: ; } return om;}void output(int i,string s)//输入一个数字和当前有效子串,输出其对应的词法单元的记号流{ int trans(char c); switch(i) { case 2://表示<,是单个字符 ; case 3://表示>,是单个字符 ; case 4://表示:,是单个字符 ; case 5://表示单个的运算符或分隔符 cout<<" ("< <<","< <<")"; break; case 6://表示数字 cout<<" (11,"<<<")"; break; case 7://表示<> cout<<" (21,<>)"; break; case 8://表示<= cout<<" (22,<)"; break; case 9://表示>= cout<<" (24,<)"; break; case 10://表示:= cout<<" (18,:=)"; break; case 11://表示id ; case 12://表示id ; case 13://表示id cout<<" (10,"<<<")"; break; default: ; }}int trans(char c)//输入一个单运算符或分隔符,返回对应的词法记号,需要结合表格理解{ int token=0; switch(c) { case ':': token=17; break; case '=': token=25; break; case '+': token=13; break; case '-': token=14; break; case '*': token=15; break; case '/': token=16; break; case '<': token=20; break; case '>': token=23; break; case ';': token=26; break; case '(': token=27; break; case ')': token=28; break; case '#': token=0; break; default: ; } return token;}
运行结果: