目录
一、文件接口
在探讨文件操作的范畴时,我们确实将文件视为内容加属性的集合。操作文件无非是对其内容或属性的操作。这些操作在底层是通过操作系统(OS)的接口完成的,因为只有操作系统有权直接与硬件交互。当我们编写代码来操作文件时,实际上是通过进程来实现的。进程是操作系统中能够执行操作的实体,它是文件访问的本质执行者。
为什么在学习C/C++时没有听过文件类的系统调用接口?
-
封装的复杂性:操作系统层面的文件接口相对底层且复杂,直接使用它们进行文件操作需要深入理解操作系统的工作原理。为了简化开发过程,不同的编程语言对这些系统调用接口进行了封装,提供了更易于使用的文件操作API。这种封装隐藏了系统调用接口的复杂性,使得开发者在日常开发中很少需要直接接触到这些底层接口。
-
跨平台性的需求:直接使用操作系统的文件接口会使得代码与特定的操作系统绑定,从而失去跨平台的能力。编程语言通过提供封装后的文件操作接口,使得开发的应用可以在不同的操作系统上运行,而无需关心底层的系统调用差异。这种抽象层的存在极大地提高了代码的可移植性。
为什么需要操作系统提供的文件接口?
-
权限限制:直接向硬件写入数据需要特定的权限,这些权限通常仅操作系统拥有。因此,普通用户或应用程序需要通过操作系统提供的接口来进行文件操作。
-
封装和简化:操作系统层面的文件接口通常比较底层且复杂。不同的编程语言通过封装这些系统调用接口,提供了更简单易用的文件操作API,以适应不同的开发需求和习惯。
-
跨平台兼容性:如果直接使用操作系统的文件接口,那么编写的代码将与特定的操作系统绑定,失去跨平台的能力。通过使用编程语言提供的封装接口,可以实现代码的跨平台运行,因为这些语言级别的接口会根据运行平台调用相应的系统接口。
为什么要学习操作系统层面的文件接口?
尽管语言级别的封装提供了便利和跨平台能力,但学习操作系统层面的文件接口仍然有其价值:
-
统一性:操作系统层面的文件接口是统一的,每个操作系统提供的接口虽然固定,但是了解这些接口可以帮助开发者更深入地理解文件操作的本质,以及不同操作系统之间的差异。
-
高级功能和性能优化:某些高级功能或性能优化可能需要直接使用操作系统提供的文件接口来实现,尤其是在需要精细控制文件行为的场景中。
显示器和文件操作的比较
显示器作为硬件,使用printf
进行打印操作时,我们通常不会感到奇怪。这是因为printf
等函数已经封装了向显示器输出的底层细节。实际上,向显示器打印信息与向磁盘文件写入数据在本质上是相似的,都涉及到了操作系统层面的硬件访问接口。这种封装隐藏了底层的复杂性,使得开发者可以更加专注于应用逻辑的实现。
二、感性理解Linux系统下“一切皆文件”
在计算机系统中,文件的概念可以从狭义和广义两个角度来理解:
狭义的文件
狭义上的文件通常指的是存储在磁盘上的数据集合,这些数据可以是文本、图片、视频等任何形式的信息。这类文件可以通过文件系统进行管理,我们可以使用各种编程语言提供的文件操作API(如fopen
, fread
, fwrite
等)来读取或写入这些文件。例如,从文件中读取数据到程序的内存中,或者将程序处理的数据写回到磁盘文件中。
广义的文件
从广义上讲,文件不仅仅局限于磁盘上的数据集合。在类Unix操作系统中,遵循“一切皆文件”的哲学,几乎所有的外设(如显示器、键盘、网卡、声卡等)都可以被抽象为文件。这意味着,这些设备的操作也可以通过读写文件的方式来进行。例如,向显示器输出信息(printf
/cout
)本质上是向一个特殊的文件写入数据;从键盘读取输入(scanf
/cin
)本质上是从一个特殊的文件中读取数据。
文件的读写操作
从程序的角度看,文件操作主要分为读(input)和写(output)两种基本操作。无论是操作磁盘上的普通文件,还是与外设交互,都可以用读写的概念来描述:
- 读操作(Input):将数据从文件(无论是磁盘文件还是代表外设的特殊文件)传输到程序的内存中。
- 写操作(Output):将数据从程序的内存传输到文件中,无论这个文件代表的是磁盘上的数据存储还是某种外设。
总结
因此,从系统的角度来看,任何能够被读取(input)或能夜被写出(output)的设备都可以被抽象为文件。这种广义上的文件概念极大地统一了操作系统对硬件的访问方式,简化了程序与外设之间的交互逻辑。
三、C语言文件接口
1、fopen
- 原型:
FILE *fopen(const char *path, const char *mode);
- 功能:打开名为
path
的文件,并与之关联一个流。 - 模式:
r
:以文本模式打开文件进行读取。文件指针位于文件开头。r+
:打开文件进行读写。文件指针位于文件开头。w
:以文本模式打开文件进行写入。如果文件存在,则长度截为零。文件指针位于文件开头。w+
:打开文件进行读写。如果文件不存在,则创建之。如果文件存在,则长度截为零。文件指针位于文件开头。a
:以追加模式打开文件进行写入。如果文件不存在,则创建之。文件指针位于文件末尾。a+
:打开文件进行读取和追加写入。如果文件不存在,则创建之。读取时文件指针位于文件开头,但写入总是追加到文件末尾。
#include <stdio.h>
int main()
{
FILE*fp=fopen("log.txt","r");
if(fp==NULL)
{
perror("fopen");
return 1;
}
return 0;
}
[hbr@VM-16-9-centos file_system]$ ./myfile
fopen: No such file or directory
#include <stdio.h>
int main()
{
FILE*fp=fopen("log.txt","w");
if(fp==NULL)
{
perror("fopen");
return 1;
}
return 0;
}
[hbr@VM-16-9-centos file_system]$ make
gcc -std=c99 -o myfile myfile.c
[hbr@VM-16-9-centos file_system]$ ./myfile
[hbr@VM-16-9-centos file_system]$ ls
log.txt makefile myfile myfile.c
2、当前路径
当前路径(Current Working Directory, CWD)是指操作系统中一个进程当前所处的目录路径。当一个进程被启动时,它会有一个与之关联的目录,这个目录就是它的当前工作目录。进程在执行文件操作时,如果使用的是相对路径,那么这个相对路径就是基于当前工作目录来解析的。
例如,如果当前路径是 /home/whb
,当进程尝试打开或创建一个名为 log.txt
的文件时,如果没有指定完整路径,操作系统会自动将 log.txt
与当前路径拼接,形成完整的文件路径 /home/whb/log.txt
,然后在该路径下进行文件操作。
在Linux和Unix系统中,可以使用 pwd
命令查看当前工作目录,而在Windows系统中,则可以使用 cd
命令(不带任何参数)来查看。
#include <stdio.h>
int main()
{
FILE*fp=fopen("log.txt","w");
if(fp==NULL)
{
perror("fopen");
return 1;
}
return 0;
}
在名为 file_system
的目录下编译并运行了一个C程序,该程序的作用是创建(或打开,如果已存在)一个名为 log.txt
的文件。由于指定的文件名是相对路径,所以 log.txt
被创建在了当前工作目录下,即 file_system
目录。
接着,将编译好的可执行文件 myfile