1-5-2 字符计数
----------http://www.cnblogs.com/rockics/archive/2010/10/18/1854321.html------------
01 |
#include <stdio.h> |
|
02 |
main() |
03 |
{ |
|
04 |
int c; |
05 |
|
|
06 |
c = getchar(); |
07 |
while(c != EOF) |
|
08 |
{ |
09 |
putchar(c); |
|
10 |
c = getchar(); |
11 |
} |
12 |
} |
而且理解这个代码并不是一件困难的事情,相反,太简单了.但是,如果深究,就会发现一个有意思的事情,如果不考虑重定向,也就是说,我们是从stdin 输入的,那么,我们应该输入什么信息,被认为是EOF呢?细心的读者可能注意到了,我们在声明变量c的时候,并没有将其声明为char类型,原因在于我们的c必须可以容纳所谓的EOF,想象一下,我使用的系统是Fedora,glib里头包含的stdio.h文件中将EOF定义为-1,很显然,将c定义为 char类型的话,他怎么可以容纳EOF呢?
下面我作一下实验,目的就是想找到,到底什么信息可以结束我们的这个程序 , 假设我的得到的可执行文件是test,输入./test,系统等待输入,当我输入“i am rockics”并回车时候,系统输出“i am rockics”,且继续等待输入,显然回车不能让他退出执行 。
于是,我按下组合键“Ctrl+Z”,表面上好像test不执行了,细心点会发现,屏幕的输出信息:
[1]+ Stopped ./test
只是stopped了,但是是否exit了呢?
很容易验证,输入命令ps,查看当前用户进程,我发现一下结果:
[rockics@localhost c]$ ps
PID TTY TIME CMD
3365 pts/1 00:00:00 bash
4471 pts/1 00:00:00 test
4484 pts/1 00:00:00 ps
test还在后台运行呢,呵呵。你必须显示的kill它才可以。
那么,要不试试看“Ctrl+D”,好试试看,我们首先用“ kill -9 4471”将test杀死,然后重新执行之:
[rockics@localhost c]$ kill -9 4471
[1]+ 已杀死 ./test
[rockics@localhost c]$ ./test
i am rockicsi am rockics
嘿,后面那个“i am rockics”是我按下“Ctrl+D”输出的,哈哈,和回车键产生的效果差不多哦,只是没有换行。
这个时候,无论怎么输入回车,都发现test一直在等待用户输入,就是不肯退出来,哎,不乖 。
但是这个时候(按过回车键之后),我再次按下“Ctrl+D”,就发现,test没了,ps,也没发现,也就是说test正常完成任务,退出了 。
[rockics@localhost c]$ ps
PID TTY TIME CMD
3365 pts/1 00:00:00 bash
4502 pts/1 00:00:00 ps
也就是说,输入完成,按下回车,然后“Ctrl+D”,可以结束test。
至于深层次的分析,当然要考虑到系统的实现,首先,输入缓冲是行缓冲。当从键盘上输入一串字符并按回车后,这些字符会首先被送到输入缓冲区中存储。每当按下回车键后,cin.get() 就会检测输入缓冲区中是否有了可读的数据。cin.get() 还会对键盘上是否有作为流结束标志的 “Ctrl+Z”或者 “Ctrl+D”键按下作出检查,其检查的方式有两种:阻塞式以及非阻塞式。
、Unix/Linux系统下一般采用非阻塞式的检查 “Ctrl+D”。非阻塞式样指的是按下“Ctrl+D” 之后立即响应的方式。如果在按 “Ctrl+D”之前已经从键盘输入了字符,则 “Ctrl+D”的作用就相当于回车,即把这些字符送到输入缓冲区供读取使用,此时“Ctrl+D”不再起流结束符的作用。如果按 “Ctrl+D”之前没有任何键盘输入,则 “Ctrl+D”就是流结束的信号
Windows系统中一般采用阻塞式检查 “Ctrl+Z” dows系统下,因此使用阻塞式的 Ctrl+Z 来标识流的结束。 阻塞式检查方式指的是只有在回车键按下之后才对此前是否有“Ctrl+Z” 组合键按下进行检查,
这种阻塞式的方式有一个特点:只有按下回车之后才有可能检测在此之前是否有Ctrl+Z按下。还有一个特点就是:如果输入缓冲区中有可读的数据则不会检测Ctrl+Z(因为有要读的数据,还不能认为到了流的末尾)。还有一点需要知道:Ctrl+Z产生的不是一个普通的ASCII码值,也就是说它产生的不是一个字符,所以不会跟其它从键盘上输入的字符一样能够存放在输入缓冲区。明白了这几点之后就可以来解释楼主提出的问题了。
从键盘上输入abcd^z 加 回车之后在Windows系统上是这样处理的:由于回车的作用,前面的 abcd 等字符被送到输入缓冲区(注意:上面说过了,^z不会产生字符,所以更不会存储到输入缓冲区,缓冲区中没有 ^z 的存在)。这时,cin.get() 检测到输入缓冲区中已经有数据存在(因此不再检查是否有 ^z 的输入),于是从缓冲中读取相应的数据。如果都读取完了,则输入缓冲区重新变为空,cin.get() 等待新的输入。可见,尽管有 ^z 按下,但是由于在此之前还有其它输入字符(abcd),所以流也不会结束。
因此,输入流结束的条件就是:^z 之前不能有任何字符输入(回车除外),否则 ^z 起不到流结束的作用。
实验一:
#include<stdio.h>
main()
{
long nc;
nc=0;
while(getchar()!=EOF)
++nc; // nc++; (等效)
printf("nc=%ld/n",nc);
}