统计给定文本文件中汉字的个数

  • Post author:
  • Post category:其他


汉字机内码在计算机的表达方式的描述是,使用二个字节,每个字节最高位一位为1.

计算机中,补码第一位是符号位,1 表示为负数,所以 汉字机内码的每个字节表示的十进制数都是负数

所以这题也就可以简化为输入字符串判断其中字符转化为十进制数是否小于零.

注意:汉字是有两个小于零的字符组成,所以在统计结果的时候就要将count除以2了✔

#include <stdio.h>

int main()
{
    int count;
    char c;
      count=0; 
        while ((c = getchar()) != '\n')//逐个判断字符,汉字的是两个字符
        {
            if (c < 0)
                count++;
        }

        printf("%d\n", count / 2);    
    
    return 0;
}

在这里插入图片描述

getchar()函数:从stdio流中读字符,相当于getc(stdin),它从标准输入里读取下一个字符.

getchar有一个int型的返回值.当程序调用getchar时.程序就等着用户按键.用户输入的字符被存放在键盘缓冲区中.直到用户按回车为止(回车字符也放在缓冲区中).当用户键入回车之后,getchar才开始从stdin流中每次读入一个字符.getchar函数的返回值是用户输入的第一个字符的ASCII码,如出错返回-1,且将用户输入的字符回显到屏幕.如用户在按回车之前输入了不止一个字符,其他字符会保留在键盘缓存区中,等待后续getchar调用读取.也就是说,后续的getchar调用不会等待用户按键,而直接读取缓冲区中的字符,直到缓冲区中的字符读完为后,才等待用户按键. 

注意:如果输入的是中文字符,由于汉字是两个字节,所以getchar()函数对汉字要处理两次.比如我输入2个汉字,getchar()处理4次,返回4个值,由于是中文返回的肯定是负数.



版权声明:本文为qq_48204413原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。