现在的位置: 首页 > 综合 > 正文

linux 0.11 内核学习 — main.c,调用函数而已。

2013年07月30日 ⁄ 综合 ⁄ 共 9843字 ⁄ 字号 评论关闭

到了main.c,其实main.c中的大部分的内容是调用函数来实现初始化的工作,但是还是将它看完了。下面就是代码了。主要参考的是linux内核完全注释,在一些不太明白的地方,参考网上的介绍。废话少说。还有很长的路啊。努力啊O(∩_∩)O~。

 

/*
 * main.c功能描述。
 */
//main.c程序的主要功能是利用setup.s程序取得的系统参数设置系统的
// 的根文件设备号和一些全局变量。这些变量至两名了内存的开始地址
// 系统包含的内存容量和作为高速缓存区内存末端地址。如果还定义了
// 虚拟盘,则主存将会相应的减少。整个内存的镜像如下 :
//
// -------------------------------------------
// | kernel | buffer | ramdisk | main memory |
// -------------------------------------------
//
// 高速缓存部分还要扣除显存和rom bios占用的部分。高速缓冲区主要
// 是磁盘等设备的临时存放数据的场所。主存的区域主要是由内存管理
// 模块mm通过分页机制进行内存的管理分配,以4k字节为一个页单位。
// 内核程序可以直接访问自由的高速缓冲区,但是对于页面的访问,则
// 需要通过mm模块才能实现将其分配到内存页面。
//
// 然后内核进行所有方面的硬件初始化工作。设置陷阱门,块设备,字符设备
// 和tty,包括人工创建的第一个任务task 0.待所有的设置工作完成时,开启
// 中断。在阅读这些初始化程序时最好跟着这些被调用函数深入看下去。
//
// 整个内核的初始化完成后,内核将执行权限切换到用户模式,即是cpu从
// 0特权级切换到3特权级。然后系统第一次调用函数fork,创建出第一个用于
// 运行的init子程序。
//
// 在该进程中系统将运行控制台程序。如果控制台环境监理成功,则在生成一
// 个子进程,用于运行/bin/sh.
//
// 对于linux而言,所有的任务都是在用户模式下运行的。包括很多系统应用
// 程序,入Shell程序,网络子程序系统。

/*
 *  linux/init/main.c
 *
 *  (C) 1991  Linus Torvalds
 */

#define __LIBRARY__    // 在unistd.h中使用了如下的预处理命令,#ifdef __LIBRARY__,
        // 所以这里包含这个定义。
#include <unistd.h>   

#include <time.h>    // 时间类型的头文件。其中最主要的是tm
        // 结构的定义。

/*
 * we need this inline - forking from kernel space will result
 * in NO COPY ON WRITE (!!!), until an execve is executed. This
 * is no problem, but for the stack. This is handled by not letting
 * main() use the stack at all after fork(). Thus, no function
 * calls - which means inline code for fork too, as otherwise we
 * would use the stack upon exit from 'fork()'.
 *
 * Actually only pause and fork are needed inline, so that there
 * won't be any messing with the stack from main(), but we define
 * some others too.
 */

/*
 * 我们需要下面这些内嵌语句 - 从内核空间创建进程(forking)将导致没有
 * 写时复制(COPY ON WRITE)!!! 直到一个执行execve 调用。这对堆栈可
 * 能带来问题。处理的方法是在fork()调用之后不让main()使用任何堆栈。
 * 因此就不能有函数调用 - 这意味着fork 也要使用内嵌的代码,否则我
 * 们在从fork()退出时就要使用堆栈了。实际上只有pause 和fork 需要使用
 * 内嵌方式,以保证从main()中不会弄乱堆栈,但是我们同时还定义了其它
 * 一些函数。
 *
 * 下面介绍linux对于堆栈使用,然后介绍对于上述注释的解释。
 * 1.开机初始化时(bootsect.s,setup.s)
 * 当bootsect代码被ROM BIOS引导加载到物理内存0x7c00处时,并没有设置
 * 堆栈段,程序也没有使用堆栈,直到bootsect被移动到0x9000:0处时,才把
 * 堆栈段寄存器SS设置为0x9000,堆栈指针esp寄存器设置为0xff00,所以堆
 * 栈堆栈在0x9000:0xff00处(boot/bootsect.s L61,62)setup.s也使用这个堆栈
 * 2.进入保护模式时候(head.s,L31)
 * 此时堆栈段被设置为内核数据段(0x10),堆栈指针esp设置成指向user_stack
 * 数组(sched.c L67~72)的顶端,保留了1页内存作为堆栈使用.
 * 3.初始化时(main.c)
 * 在执行move_to_user_mode()代码把控制权移交给任务0之前,系统一直使用
 * 上述堆栈,而在执行过move_to_user_mode()之后,main.c的代码被“切换”成
 * 任务0中执行。通过执行fork()系统调用,main.c中的init()将在任务1中执行,
 * 并使用任务1的堆栈,而main()本身则在被“切换”成为任务0后,仍热继续使
 * 用上述内核程序自己的堆栈作为任务0的用户态堆栈
 *
 * 上面的注释不是很清楚,现解释如下 :
 * Linux在内核空间创建进程时不使用写时复制技术。main()在移动到用户模
 * 式(移到任务0)后执行内嵌方式的fork()和pause(),因此可保证不使用任
 * 务0的用户栈。在执行moveto_user_mode(),之后,本程序main()就以任务0
 * 的身份在运行了。而任务0是所有将创建子进程的父进程。当它创建一个子
 * 进程时(init进程),由于任务1代码属于内核空间,因此没有使用写时复制功能。
 * 此时任务0的用户栈就是任务1的用户栈,即它共同使用一个栈空间。因此
 * 希望在main.c运行,在任务0的环境下时不要有对堆栈的任何操作,以免弄
 * 乱堆栈。而在再次执行fork()并执行过execve()函数后,被加载程序已不
 * 属于内核空间,因此可以使用写时复制技术了.由上面的分析可知,使用
 * 内联函数时为了使init进程1不修改main.c进程0不修改堆栈空间。
 *
 */
static inline _syscall0(int,fork)
static inline _syscall0(int,pause)
static inline _syscall1(int,setup,void *,BIOS)
static inline _syscall0(int,sync)   // int sync ()系统调用。

#include <linux/tty.h>   // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。
        // 所谓“串行通信“是指外设和计算机间使用一根数据信号线,
        // 数据在一根数据信号线上按位进行传输,每一位数据都占据一个固定的时间长度。
#include <linux/sched.h>  // 调度程序头文件,定义了任务结构task_struct、第1 个初始任务  
        // 的数据。还有一些以宏的形式定义的有关描述符参数设置和获取的
        // 嵌入式汇编函数程序。
#include <linux/head.h>   // head 头文件,定义了段描述符的简单结构,和几个选择符常量。
#include <asm/system.h>   // 系统头文件。以宏的形式定义了许多有关设置或修改
        // 描述符/中断门等的嵌入式汇编子程序。
#include <asm/io.h>    // io 头文件。以宏的嵌入汇编程序形式定义对io 端口操作的函数。
#include <stddef.h>    // 标准定义头文件。定义了NULL, offsetof(TYPE, MEMBER)。
#include <stdarg.h>    // 标准参数头文件。以宏的形式定义变量参数列表。主要说明了-个
        // 类型(va_list)和三个宏(va_start, va_arg 和va_end),vsprintf
        // vprintf、vfprintf。
#include <unistd.h>    
#include <fcntl.h>    // 文件控制头文件。用于文件及其描述符的操作控制常数符号的定义。
#include <sys/types.h>   // 类型头文件。定义了基本的系统数据类型

#include <linux/fs.h>   // 文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)

static char printbuf[1024];

extern int vsprintf();
extern void init(void);
extern void blk_dev_init(void); // 块设备初始化。
extern void chr_dev_init(void); // 字符设备初始化。
extern void hd_init(void);  // 硬盘初始化程序。
extern void floppy_init(void); // 软盘初始化程序。
extern void mem_init(long start, long end);   // 内存管理程序初始化。
extern long rd_init(long mem_start, int length); // 虚拟盘初始化
extern long kernel_mktime(struct tm * tm);   // 建立内核时间
extern long startup_time;       // 内核启动时间(开机时间)(秒).

/*
 * This is set up by the setup-routine at boot-time
 */
/*
 * 以下这些数据是由setup.s 程序在引导时间设置的.
 */ 
#define EXT_MEM_K (*(unsigned short *)0x90002)  // 1m以后的拓展内存大小。
#define DRIVE_INFO (*(struct drive_info *)0x90080) // 硬盘参数表基址。
#define ORIG_ROOT_DEV (*(unsigned short *)0x901FC) // 根文件系统所在设备号。

/*
 * Yeah, yeah, it's ugly, but I cannot find how to do this correctly
 * and this seems to work. I anybody has more info on the real-time
 * clock I'd be interested. Most of this was trial and error, and some
 * bios-listing reading. Urghh.
 */

#define CMOS_READ(addr) ({ /   // 这段宏读取cmos实时时钟信息。
outb_p(0x80|addr,0x70); /    // 0x70是些端口号,0x80|addr 是要读取的CMOS 内存地址
inb_p(0x71); /       // 0x71 是读端口号。
})

#define BCD_TO_BIN(val) ((val)=((val)&15) + ((val)>>4)*10)   // 将BCD 码转换成数字.

//----------------------------------------------------------------------------------
//        time_init
//------------------------------------------------------------------------------------
static void time_init(void)    // 读取cmos中的信息,初始化全局变量startup_time
{
 struct tm time;

 do {
  time.tm_sec = CMOS_READ(0);
  time.tm_min = CMOS_READ(2);
  time.tm_hour = CMOS_READ(4);
  time.tm_mday = CMOS_READ(7);
  time.tm_mon = CMOS_READ(8);
  time.tm_year = CMOS_READ(9);
 } while (time.tm_sec != CMOS_READ(0));

 BCD_TO_BIN(time.tm_sec);
 BCD_TO_BIN(time.tm_min);
 BCD_TO_BIN(time.tm_hour);
 BCD_TO_BIN(time.tm_mday);
 BCD_TO_BIN(time.tm_mon);
 BCD_TO_BIN(time.tm_year);
 time.tm_mon--;      // months since January - [0,11]
 startup_time = kernel_mktime(&time);
}

static long memory_end = 0;    // 机器具有的内存(字节数)
static long buffer_memory_end = 0;  // 高速缓冲区末端地址
static long main_memory_start = 0;  // 主内存(将用于分页)开始的位置

struct drive_info { char dummy[32]; } drive_info; // 用于存放硬盘信息

//---------------------------------------------------------------------------
//      main
//-------------------------------------------------------------------------
void main(void)  /* This really IS void, no error here. */
     // 此时中断仍然是关着,在必要的设置完成之后。
     // 打开中断。
{   /* The startup routine assumes (well, ...) this */
/*
 * Interrupts are still disabled. Do necessary setups, then
 * enable them
 */
 // 下面这段代码用于保存
 // 根设备号 -- ROOT_DEV; 高速缓存末端地址 -- buffer_memory_end  
 // 机器内存数 -- memory_end;主内存开始地址 -- main_memory_start
  ROOT_DEV = ORIG_ROOT_DEV;
  
 drive_info = DRIVE_INFO;
 
 memory_end = (1<<20) + (EXT_MEM_K<<10);  // 内存大小=1Mb 字节+扩展内存(k)*1024 字节
 memory_end &= 0xfffff000;     // 忽略不到4Kb(1 页)的内存数
 if (memory_end > 16*1024*1024)    // 如果内存超过16Mb,则按16Mb 计
  memory_end = 16*1024*1024;
 if (memory_end > 12*1024*1024)    // 如果内存>12Mb,则设置缓冲区末端=4Mb
  buffer_memory_end = 4*1024*1024;
 else if (memory_end > 6*1024*1024)   // 否则如果内存>6Mb,则设置缓冲区末端=2Mb
  buffer_memory_end = 2*1024*1024;
 else          // 否则则设置缓冲区末端=1Mb
  buffer_memory_end = 1*1024*1024;
 main_memory_start = buffer_memory_end;  // 主内存(用于分页使用)起始位置=缓冲区末端
#ifdef RAMDISK
 main_memory_start += rd_init(main_memory_start, RAMDISK*1024);
#endif

 mem_init(main_memory_start,memory_end);  //
 
 trap_init();        // 陷阱门(硬件中断向量)初始化
 
 blk_dev_init();        // 块设备初始化
 
 chr_dev_init();        // 字符设备初始化
 
 tty_init();         // tty 初始化
 
 time_init();        // 设置开机启动时间,startup_time
 
 sched_init();        // 调度程序初始化
 
 buffer_init(buffer_memory_end);    // 缓冲管理初始化,建内存链表等.
 
 hd_init();         // 硬盘初始化
 
 floppy_init();        // 软盘初始化
 
 sti();          // 设置完成,开启中断。
 
 move_to_user_mode();      // 移到用户模式

 if (!fork()) {  /* we count on this going ok */
  init();
 }
/*
 *   NOTE!!   For any other task 'pause()' would mean we have to get a
 * signal to awaken, but task0 is the sole exception (see 'schedule()')
 * as task 0 gets activated at every idle moment (when no other tasks
 * can run). For task0 'pause()' just means we go check if some other
 * task can run, and if not we return here.
 */

/*
 * 注意!! 对于任何其它的任务,'pause()'将意味着我们必须等待收到一个信号才会返
 * 回就绪运行态,但任务0(task0)是唯一的意外情况(参见'schedule()'),因为任务0 在
 * 任何空闲时间里都会被激活(当没有其它任务在运行时),因此对于任务0'pause()'仅意味着
 * 我们返回来查看是否有其它任务可以运行,如果没有的话我们就回到这里,一直循环执行'pause()'。
 */ 
 for(;;) pause();
}

//----------------------------------------------------------------------------
//     printf
//----------------------------------------------------------------------------
static int printf(const char *fmt, ...)   // 使用变长参数,调用write系统调用。
{
 va_list args;
 int i;

 va_start(args, fmt);
 write(1,printbuf,i=vsprintf(printbuf, fmt, args));
 va_end(args);
 return i;
}

static char * argv_rc[] = { "/bin/sh", NULL };  // 调用执行程序时参数的字符串数组
static char * envp_rc[] = { "HOME=/", NULL };  // 调用执行程序时的环境字符串数组

static char * argv[] = { "-/bin/sh",NULL };   // 同上
static char * envp[] = { "HOME=/usr/root", NULL };

//------------------------------------------------------------------------------
//      init
//------------------------------------------------------------------------------
void init(void)
{
 int pid,i;

 setup((void *) &drive_info);   // 读取硬盘信息
 (void) open("/dev/tty0",O_RDWR,0);  // 用读写访问方式打开设备“/dev/tty0“
 (void) dup(0);       // 复制句柄,产生句柄1 号 -- stdout 标准输出设备
 (void) dup(0);       // 复制句柄,产生句柄2 号 -- stderr 标准出错输出设备

 // 输出一些信息
 printf("%d buffers = %d bytes buffer space/n/r",NR_BUFFERS,
  NR_BUFFERS*BLOCK_SIZE);
 printf("Free mem: %d bytes/n/r",memory_end-main_memory_start);

 /*
  * 下面的代码打开/etc/rc,然后执行/bin/sh。但是这里开辟了
  * ;两个线程。
  */
 if (!(pid=fork())) {
  close(0);
  if (open("/etc/rc",O_RDONLY,0))
   _exit(1);
  execve("/bin/sh",argv_rc,envp_rc);
  _exit(2);
 }
 if (pid>0)
  while (pid != wait(&i))
   /* nothing */;
 
 /*
  * 如果执行到这里,说明刚创建的子进程的执行已停止或终止了。
  * 下面循环中首先再创建一个子进程.如果出错,则显示“初始化
  * 程序创建子进程失败”的信息并继续执行。对于所创建的子进
  * 程关闭所有以前还遗留的句柄(stdin, stdout, stderr),新创
  * 建一个会话并设置进程组号,然后重新打开/dev/tty0 作为stdin,
  * 并复制成stdout 和stderr。再次执行系统解释程序/bin/sh。但
  * 这次执行所选用的参数和环境数组另选了一套。然后父进程再次
  * 运行wait()等待。如果子进程又停止了执行,则在标准输出上显
  * 示出错信息“子进程pid 停止了运行,返回码是i”,然后继续重
  * 试下去…,形成“大”死循环
  *
  */
 while (1) {
  if ((pid=fork())<0) {
   printf("Fork failed in init/r/n");
   continue;
  }
  if (!pid) {
   close(0);
   close(1);
   close(2);
   setsid();
   (void) open("/dev/tty0",O_RDWR,0);
   (void) dup(0);
   (void) dup(0);
   _exit(execve("/bin/sh",argv,envp));
  }
  while (1)
   if (pid == wait(&i))
    break;
  printf("/n/rchild %d died with code %04x/n/r",pid,i);
  sync();
 }
 _exit(0); /* NOTE! _exit, not exit() */
}

/*
 * 至此linux启动已经完成。有上面的代码分析可知,根文件系统只要即可实现。
 */

抱歉!评论已关闭.