A – 小C语言–词法分析程序–SDUT

  • Post author:
  • Post category:其他


A – 小C语言–词法分析程序

Description

小C语言文法

1. <程序>→<main关键字>(){<声明序列><语句序列>}

2. <声明序列>→<声明序列><声明语句>|<声明语句>|<空>

3. <声明语句>→<标识符表>;

4. <标识符表>→<标识符>,<标识符表>|<标识符>

5. <语句序列>→<语句序列><语句>|<语句>

6. <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>

7. < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>

8. < while语句>→< while关键字>(<表达式>)<复合语句>

9. < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>

10. <复合语句>→{<语句序列>}

11. <赋值语句>→<表达式>;

12. <表达式>→<标识符>=<算数表达式>|<布尔表达式>

13. <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>

14. <关系运算符>→>|<|>=|<=|==|!=

15. <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>

16. <项>→<项>*<因子>|<项>/<因子>|<因子>

17. <因子>→<标识符>|<无符号整数>|(<算数表达式>)

18. <标识符>→<字母>|<标识符><字母>|<标识符><数字>

19. <无符号整数>→<数字>|<无符号整数><数字>

20. <字母>→a|b|…|z|A|B|…|Z

21. <数字>→0|1|2|3|4|5|6|7|8|9

22. < main关键字>→main

23. < if关键字>→if

24. < else关键字>→else

25. < for关键字>→for

26. < while关键字>→while

27. < int关键字>→int

每行单词数不超过10个

小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符

和运算符。

关键字:main if else for while int

自定义标识符:除关键字外的标识符

整数:无符号整数

界符:{ } ( ) , ;

运算符:= + – * / < <= > >= == !=

Input

输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。

Output

按照源程序中单词出现顺序输出,输出二元组形式的单词串。

(单词种类,单词值)

单词一共5个种类:

关键字:用keyword表示

自定义标识符:用identifier表示

整数:用integer表示

界符:用boundary表示

运算符:用operator表示

每种单词值用该单词的符号串表示。

Sample

Input

main() 
{
    int a, b;
    if(a == 10)
    {
        a = b;
    }
}

Output

(keyword,main)
(boundary,()
(boundary,))
(boundary,{)
(keyword,int)
(identifier,a)
(boundary,,)
(identifier,b)
(boundary,;)
(keyword,if)
(boundary,()
(identifier,a)
(operator,==)
(integer,10)
(boundary,))
(boundary,{)
(identifier,a)
(operator,=)
(identifier,b)
(boundary,;)
(boundary,})
(boundary,})

本题为编译原理题目最初始一题,具体的解决方法是判断到底是什么样的字符,根据字符的特点选用不同的判断方式,比如想要判断是否为数字,则判断传入数据的第一个即可,只要第一个是在0到9内的数字,那么传入函数的字串就为整型。又如运算符>= <= !=则需要进行二次的判断。具体见代码以及代码注释


AC代码:

#include<bits/stdc++.h>

using namespace std;

string S[6] = {"main", "for", "if", "else", "int", "while"};//先将6个关键字定义在开始

void display(string s)//设置display函数用于输出关键词,整数以及自定义字符
{
    if(s[0] >= '0' && s[0] <= '9')
//如果传入的字串第一个字符是数字,那肯定剩下的全部是数字,所以判断头一个即可
        cout<<"(integer,"<<s<<")"<<endl;
    else
    {
        int flag = 1;//定义一个flag参数用于判断是否找到关键字
        for(int i = 0; i < 6; i++)
        {
            if(s == S[i])//找到关键字并输出,记得将flag变为0
            {
                flag = 0;
                cout<<"(keyword,"<<s<<")"<<endl;
            }
        }
        if(flag == 1)//如果既不是数字又不是关键字,那么肯定是自定义字符
            cout<<"(identifier,"<<s<<")"<<endl;
    }
}
//要知道display函数是在判断完不是界符和标识符的基础上判断剩下的三种符号的。

int main()
{
    string s;
    while(cin>>s)
    {
        int len = s.length();//调用length函数保存输入字符长度
        string a = "";//定义字串a并初始化为空字符
        for(int i = 0; i < len; i++)
        {
            if(s[i] == '=' || s[i] == '+' || s[i] == '-' || s[i] == '*' || s[i] == '/' || s[i] == '<' || s[i] == '>' || s[i] == '!')
            {
                if(a.length())//如果a不为空,则进入display函数进行判断是那种词法
                    display(a);
                a = "";
                if(i + 1 < len && s[i + 1] == '=')//此处是判断>= <= !=的情况
                {
                    cout<<"(operator,"<<s[i]<<s[i + 1]<<")"<<endl;
                    i++;//记得将i+1,不然下次循环会重复判断
                }
                else
                    cout<<"(operator,"<<s[i]<<")"<<endl;

            }
            else if(s[i] == '(' || s[i] == ')' || s[i] == '{' || s[i] == '}' || s[i] == ',' || s[i] == ';')
            {
                if(a.length())
                    display(a);//同上
                a = "";
                cout<<"(boundary,"<<s[i]<<")"<<endl;
            }
            else
                a = a + s[i];
        }
        if(a.length())//此处是为了避免a中还存留输入的字符没进行判断,所以最后再调用一次display函数进行清空操作
            display(a);
    }
    return 0;
}



版权声明:本文为weixin_44015865原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。