一句最简单的 Hello World,居然也会出 Bug?
倒不是这句代码还能写错,而是运行时找到了许多操作系统对异常处理的漏洞。
在向 /dev/full 输出结果,也就是设备空间不足、任何写入都应失败的情况下,C 语言依然返回了 0,成功退出:
$ gcc hello.c -o hello
$ ./hello > /dev/full
$ echo $?
Bug 的最初发现者表示:这可不是一个小错误,本质上是“打印到标准输出”的任务。
发生了错误但不抛出异常,意味着即使出现数据丢失,进程依然会继续运行。
于是他一不做二不休,又测试了 C++、Python、Java 等热门语言,发了篇博客,很快就在论坛盖起了高楼,讨论度直接爆了:
而评论区网友一通 Debug,综合整理下来,踩中这一 Bug 的语言,竟足足有 16 种之多!
最初的发现者是一名名叫 sunfishcode 的技术博主,他在博客里展示了 C 和 Python 两种语言的详细的 deBug 过程。
主要使用的是 Linux 系统下的一个经典的设备文件,/dev/ full。
/dev/ full 总是在写入时返回设备无剩余空间(错误码为 ENOSPC),常常用于测试程序能否正确处理 I / O 错误。
如果程序正常,那么就会返回错误报告:
$ echo "Hello World!" > /dev/full
bash: echo: write error: No space left on device
$ echo $?
1
而正如我们开头所示的代码,在用 C 语言进行输出时,hello 程序却报告成功,返回了 0。
用 strace 命令跟踪这一进程产生的系统调用可以发现,程序确实出现了故障:
$ strace -etrace=write ./hello > /dev/full
write(1, "Hello World!n", 13) = -1 ENOSPC (No space left on device)
+++ exited with 0 +++
而以“错误不该被悄悄传递”为口号的 Python 也着了道。
程序向 stderr 打印了一条消息,丢失了信息,但最后也返回了 0:
$ python2 hello.py > /dev/full
close failed in file object destructor:
sys.excepthook is missing
lost sys.stderr
$ echo $?
这个 Bug 严重吗?现实世界任何一个程序都不会拿 Hello World 当作关键性安全问题,但“打印到标准输出”却是现实中确实会有的程序任务。
而这也正是 Hello World 这个最简单的程序的本质。
博主 sunfishcode 这样说:
标准输出可能意味着一个具体文件,那么如果这个文件刚好耗尽了空间,程序又因为 Bug 没有检测到这一错误呢?
父进程不会知道子进程失败了,只会继续运行。但期望生成的输出实际上已经丢失了数据。
当然,博主在最后也给出了没有踩雷的语言列表:
目前,博主已经针对这一 Bug 给出了一些解决方案,比如在 C 语言环境中可以采用这样的方法:
#include <stdio.h>
#include <stdlib.h>
int main(void) {
printf("Hello, World!n");
if (fflush(stdout) != 0 || ferror(stdout) != 0) {
return EXIT_FAILURE;
}
return EXIT_SUCCESS;
}
而评论区也贡献了 Java 环境中的解决方案,即添加一个方法来获得底层的、未包装的 OutputStream:
System.out.println("Hello World!");
if (System.out.checkError()) throw new IOException();
下方还有人补充到,Java 已经引入的 RuntimeIOException 就可以用于 I / O 异常出现意外的情况:
因此我们可以引入一个新的类,比如 ErrorCheckingPrintStream,并将“ErrorCheckingPrintStream withErrorChecks ()”方法添加到 PrintStream 中。
而除此之外,评论区热议的一个话题就是:
这位博主所公布的问题到底算不算是一个 Bug?
反对者直言作者是在标题党,还以为是发现了什么 C 语言标准库里的 Bug,但实际上只是处理所有可能的系统调用的失败情况:
Hello World 只是简单地将 API 调用到文本界面,对一个简单的接口进行调用,我在那里没有发现过任何 Bug。
有赞同的评论在下方做了进一步的补充,他认为 C 语言的编写方式里本来就写明:程序不关心任何形式的错误条件。
包括 printf 的返回值被忽略、输出不被刷新、刷新的返回不被检查、不关心 errno 值等等。
所以,用户本就不应该期望给定的系统调用返回额外的 errno 值,而是应该用特殊方法处理特殊情况。
甚至有人表示:程序的失败不是由程序控制结构定义,而是由需求定义,Hello World 程序的需求难道包括主机系统的所有错误边界吗?
也有人更赞同作者,认为 Hello World 不只是接口调用,实际是在要求操作系统在某处写入数据,而这正是简单的程序与现实世界相关联的地方:
这是一个严重的问题,而似乎在大多数时候,这种看似简单的功能中存在的大量复杂性都被忽略了。
还有另辟蹊径,从教育的角度来看的评论:
毕竟 C 语言时很多程序员的入门语言,hello.c 又是其中的第一个程序,要让初学者更好地理解控制结构,块,返回值,缓冲流的,printf 格式化语言等概念,所以还是把它当成一个 Bug 吧。
那么你又怎么看?
参考链接:
[1]https://blog.sunfishcode.online/Bugs-in-hello-world/
[2]https://news.ycombinator.com/item?id=30611367
[3]https://github.com/sunfishcode/hello-world-vs-io-errors