现在的位置: 首页 > 综合 > 正文

linux kernel 从入口到start_kernel 的代码分析

2013年10月19日 ⁄ 综合 ⁄ 共 10083字 ⁄ 字号 评论关闭

linux kernel 从入口到start_kernel 的代码分析

本文的很多内容是参考了网上某位大侠的文章写的<<>>,有些东西是直接从他那copy过来的。

最近分析了一下u-boot的源码,并写了分文档, 为了能够衔接那篇文章,这次又把arm linux的启动代码大致分析了一下,特此写下了这篇文档。一来是大家可以看看u-boot到底是如何具体跳转到linux下跑的,二来也为自己更深入的学习linux kernel打下基础。

本文以arm 版的linux为例, kernel的第一条指令开始分析,一直分析到进入start_kernel()函数,也就是kernel启动的汇编部分,我们把它称之为第一部分,
以后有时间在把启动的第二部分在分析一下。我们当前以linux-2.6.18内核版本作为范例来分析,本文中所有的代码前面都会加上行号以便于讲解。

由于启动部分有一些代码是平台相关的,虽然大部分的平台所实现的功能都比较类似,但是为了更好的对code进行说明,对于平台相关的代码,我们选择smdk2410平台, CPUs3c2410(arm核是arm920T)进行分析。
  
另外,本文是以未压缩的kernel来分析的.对于内核解压缩部分的code, arch/arm/boot/compressed,本文不做讨论。

  

. 启动条件
    通常从系统上电执行的boot loader的代码,
而要从boot loader跳转到linux kernel的第一条指令处执行需要一些特定的条件。关于对boot loader的分析请看我的另一篇文档u-boot源码分析。
   
这里讨论下进入到linux kernel时必须具备的一些条件,这一般是boot loader在跳转到kernel之前要完成的:
   1. CPU
必须处于SVC(supervisor)模式,并且IRQFIQ中断都是禁止的;
   2. MMU(
内存管理单元)必须是关闭的, 此时虚拟地址就是物理地址;
   3.
数据cache(Data cache)必须是关闭的
   4.
指令cache(Instruction cache)可以是打开的,也可以是关闭的,这个没有强制要求;
   5. CPU
通用寄存器0 (r0)必须是 0;
   6. CPU
通用寄存器1 (r1)必须是 ARM Linux machine type (关于machine type, 我们后面会有讲解)
   7. CPU
通用寄存器2 (r2) 必须是 kernel parameter list 的物理地址(parameter list 是由boot loader传递给kernel,用来描述设备信息属性的列表)

   更详细的关于启动arm linux之前要做哪些准备工作可以参考,Booting ARM Linux"文档

 

. starting kernel

首先,我们先对几个重要的宏进行说明(我们针对有MMU的情况)

位置

默认值

说明

KERNEL_RAM_ADDR

arch/arm/kernel/head.S +26

0xc0008000

kernelRAM中的虚拟地址

PAGE_OFFSET

include/asm-arm/memeory.h +50

0xc0000000

内核空间的起始虚拟地址

TEXT_OFFSET

arch/arm/Makefile +131

0x00008000

内核在RAM中起始位置相对于

RAM起始地址的偏移

TEXTADDR

arch/arm/kernel/head.S +49 

0xc0008000 

kernel的起始虚拟地址

PHYS_OFFSET

include/asm-arm/arch- *** /memory.h

平台相关

RAM的起始物理地址,对于s3c2410来说在include/asm-arm/arch-s3c2410/memory.h下定义,值为0x30000000(ram接在片选6)

 

内核的入口是stext,这是在arch/arm/kernel/vmlinux.lds.S中定义的:
         00011:
ENTRY(stext)
   
对于vmlinux.lds.S,这是ld script文件,此文件的格式和汇编及C程序都不同,本文不对ld script作过多的介绍,只对内核中用到的内容进行讲解,关于ld的详细内容可以参考ld.info
   
这里的ENTRY(stext) 表示程序的入口是在符号stext.
   
而符号stext是在arch/arm/kernel/head.S中定义的:

下面我们将arm linux boot的主要代码列出来进行一个概括的介绍,然后,我们会逐个的进行详细的讲解

arch/arm/kernel/head.S 72 - 94 ,arm linux boot的主代码:

00072: ENTRY(stext)    
                 
                 
               
00073:         msr        cpsr_c,
#PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode
00074:                    
                     
      @ and irqs disabled        
00075:         mrc        p15, 0, r9,
c0, c0           @ get processor id 
       
00076:         bl       
__lookup_processor_type       @ r5=procinfo r9=cpuid 
   
00077:         movs        r10,
r5                     @
invalid processor (r5=0)?
00078:         beq       
__error_p                   
@ yes, error 'p'           
00079:         bl       
__lookup_machine_type         @ r5=machinfo       
      
00080:         movs        r8, r5 
                    @ invalid
machine (r5=0)?  
00081:         beq       
__error_a                   
@ yes, error 'a' 

00082:         bl 
      __create_page_tables       
     

 

在进入linux kernel前要确保在管理模式下,并且IRQ,FIQ都是关闭的,因此在00073行就是要确保这几个条件成立。

1. 确定 processor type

arch/arm/kernel/head.S:
00075:         mrc        p15, 0, r9,
c0, c0               @ get processor
id         
00076:         bl       
__lookup_processor_type           @ r5=procinfo
r9=cpuid     
00077:         movs        r10,
r5                     
   @ invalid processor (r5=0)?
00078:         beq       
__error_p                   
    @ yes, error 'p'       
   
75
: 通过cp15协处理器的c0寄存器来获得processor id的指令. 关于cp15的详细内容可参考相关的arm手册,也可直接参考s3c2410data sheet
76
: 跳转到__lookup_processor_type.__lookup_processor_type,会把找到匹配的processor type 对象存储在r5中。
77,78
: 判断r5中的processor type是否是0,如果是0,说明系统中没找到匹配当前processor type的对象, 则跳转到__error_p(出错)。系统中会预先定义本系统支持的processor type 对象集。
    __lookup_processor_type
函数主要是根据从cpu中获得的processor id和系统中预先定义的本系统能支持的proc_info集进行匹配,看系统能否支持当前的processor, 并将匹配到的proc_info的基地址存到r5, 0表示没有找到对应的processor type.

下面我们分析__lookup_processor_type函数。
arch/arm/kernel/head-common.S
:

00145:        
.type        __lookup_processor_type, %function
00146: __lookup_processor_type:
00147:         adr        r3, 3f
00148:         ldmda      r3, {r5 - r7}
00149:         sub        r3, r3,
r7                     
  @ get offset between virt&phys
00150:         add        r5, r5,
r3                     
  @ convert virt addresses to
00151:         add        r6, r6,
r3                     
  @ physical address space
00152: 1:      ldmia      r5, {r3, r4} 
                    @ value,
mask
00153:         and        r4, r4,
r9                     
  @ mask wanted bits
00154:         teq        r3, r4
00155:         beq        2f
00156:         add        r5, r5,
#PROC_INFO_SZ             @
sizeof(proc_info_list)
00157:         cmp        r5, r6
00158:         blo        1b
00159:         mov        r5, #0 
                     
        @ unknown processor
00160: 2:      mov        pc, lr
00161:
00162: /*
00163:  * This provides a C-API version of the above function.
00164:  */
00165: ENTRY(lookup_processor_type)
00166:         stmfd        sp!, {r4 -
r7, r9, lr}
00167:         mov        r9, r0
00168:         bl       
__lookup_processor_type
00169:         mov        r0, r5
00170:         ldmfd        sp!, {r4 -
r7, r9, pc}
00171:
00172: /*
00173:  * Look in include/asm-arm/procinfo.h and
arch/arm/kernel/arch.[ch] for
00174:  * more information about the __proc_info and __arch_info
structures.
00175:  */
00176:         .long       
__proc_info_begin
00177:         .long       
__proc_info_end

00178:  3:     .long        .
00179:         .long       
__arch_info_begin
00180:         .long       
__arch_info_end


145, 146行是函数定义
147
: 取地址指令,这里的3f是向前symbol名称是3的位置,即第178,将该地址存入r3. 这里需要注意的是,adr指令取址,获得的是基于pc的一个地址,要格外注意,这个地址是3f处的"运行时地址",由于此时MMU还没有打开,也可以理解成物理地址(实地址).(详细内容可参考arm指令手册)
148
: 因为r3中的地址是178行的位置的地址,因而执行完后:
        r5
存的是176行符号 __proc_info_begin的地址;
        r6
存的是177行符号 __proc_info_end的地址;
        r7
存的是3f处的地址.
    
这里需要注意链接地址和运行时地址的区别. r3存储的是运行时地址(物理地址),r7中存储的是链接地址(虚拟地址).

     __proc_info_begin__proc_info_end是在arch/arm/kernel/vmlinux.lds.S:
00031:                __proc_info_begin
= .;

00032:         
              *(.proc.info.init)
00033:                __proc_info_end =
.;

 

这里是声明了两个变量:__proc_info_begin
__proc_info_end,
其中等号后面的"."location counter(详细内容请参考ld.info)
    
这三行的意思是: __proc_info_begin 的位置上,放置所有文件中的 ".proc.info.init" 段的内容,然后紧接着是 __proc_info_end 的位置.

kernel 使用struct proc_info_list来描述processor
type.

include/asm-arm/procinfo.h :
00029: struct proc_info_list {
00030:         unsigned int       
        cpu_val;
00031:         unsigned int       
        cpu_mask;
00032:         unsigned long       
        __cpu_mm_mmu_flags;        /*
used by head.S */
00033:         unsigned long       
        __cpu_io_mmu_flags;        /*
used by head.S */

00034:         unsigned
long                __cpu_flush; 
              /* used by head.S */
00035:         const char         
        *arch_name;
00036:         const char         
        *elf_name;
00037:         unsigned int       
        elf_hwcap;
00038:         const char         
        *cpu_name;
00039:         struct processor            *proc;
00040:         struct cpu_tlb_fns     
    *tlb;
00041:         struct cpu_user_fns     
   *user;
00042:         struct cpu_cache_fns     
  *cache;
00043:

};

我们当前以s3c2410为例,processor920t.

arch/arm/mm/proc-arm920.S :

00448:      .section ".proc.info.init",
#alloc, #execinstr

00449:

00450: .type   __arm920_proc_info,#object

00451:      __arm920_proc_info:

00452:  
   .long   0x41009200

004523:     .long   0xff00fff0

00454:      .long  
PMD_TYPE_SECT | /

00455:          PMD_SECT_BUFFERABLE
| /

00456:          PMD_SECT_CACHEABLE | /

00457:          PMD_BIT4 | /

00458:          PMD_SECT_AP_WRITE | /

00459:          PMD_SECT_AP_READ

00460:      .long  
PMD_TYPE_SECT | /

00461:           PMD_BIT4
| /

00462:           PMD_SECT_AP_WRITE | /

00463:           PMD_SECT_AP_READ

00464:      b   __arm920_setup

00465:      .long   cpu_arch_name

00466:      .long   cpu_elf_name

00467:      .long   HWCAP_SWP
| HWCAP_HALF | HWCAP_THUMB

00468:      .long   cpu_arm920_name

00469:      .long   arm920_processor_functions

00470:      .long   v4wbi_tlb_fns

00471:      .long   v4wb_user_fns

00472: 
#ifndef CONFIG_CPU_DCACHE_WRITETHROUGH

00473:      .long  arm920_cache_fns

00474:  #else

00475:      .long   v4wt_cache_fns

00476:  #endif

00477:      .size   __arm920_proc_info,
. - __arm920_proc_info

 

448,我们可以看到 __arm920_proc_info 被放到了".proc.info.init"段中.对照struct proc_info_list,我们可以看到 __cpu_flush的定义是在464,__arm920_setup.(我们将在"4. 调用平台特定的__cpu_flush函数"一节中详细分析这部分的内容.)

我们继续分析__lookup_processor_type

149: 从上面的分析我们可以知道r3中存储的是3f处的物理地址,r7存储的是3f处的虚拟地址,这一行是计算当前程序运行的物理地址和虚拟地址的差值,将其保存到r3.
150
: r5存储的虚拟地址(__proc_info_begin)转换成物理地址
151
: r6存储的虚拟地址(__proc_info_end)转换成物理地址
152
: 对照struct proc_info_list,可以得知,这句是将当前proc_infocpu_valcpu_mask分别存

r3, r4
153
: r9中存储了processor
id(arch/arm/kernel/head.S
中的75),r4cpu_mask进行逻辑与得到我们需要的值
154
: 153行中得到的值与r3中的cpu_val进行比较
155
: 如果相等,说明我们找到了对应的processor type,跳到160,返回
156
: 如果不相等, r5指向下一个proc_info,

157: r6比较,检查是否到了__proc_info_end.
158
: 如果没有到__proc_info_end,表明还有proc_info配置,返回152行继续查找
159
: 执行到这里,说明所有的proc_info都匹配过了,但是没有找到匹配的,r5设置成0(unknown
processor)
160
: 返回

 

2. 确定 machine type

继续分析head.S,确定processor type后,就要确定machine type

arch/arm/kernel/head.S:
00079:         bl       
__lookup_machine_type                @
r5=machinfo              
00080:         movs        r8, r5 
                     
        @ invalid machine (r5=0)?  
00081:         beq       
__error_a                   
    @ yes, error 'a'  

79行: 跳转到__lookup_machine_type函数, proc_info一样,在系统中也预先定义好了本系统能支持的machine type集, 在__lookup_machine_type,就是要查找系统中是否有对当前machine type的支持, 如果查找到则会把struct machine_desc的基地址(machine type)存储在r5中。
80,81
: r5中的 machine_desc的基地址存储到r8,并判断r5是否是0,如果是0,说明是无效的machine type,跳转到__error_a(出错)

__lookup_machine_type 函数
下面我们分析__lookup_machine_type 函数:

arch/arm/kernel/head-common.S:

00176:        
.long        __proc_info_begin
00177:         .long       
__proc_info_end
00178: 3:      .long        .
00179:         .long       
__arch_info_begin
00180:         .long       
__arch_info_end
00181:
00182: /*
00183:  * Lookup machine architecture in the linker-build list of
architectures.
00184:  * Note that we can't use the absolute addresses for the
__arch_info
00185:  * lists since we aren't running with the MMU on (and
therefore, we are

00186: 
* not in the correct address space). 
We have to calculate the offset.

00187:  *

00188:  *  r1 =
machine architecture number

00189:  * Returns:

00190:  *  r3,
r4, r6 corrupted

00191:  *  r5 =
mach_info pointer in physical address space

00192:  */

00193:  .type   __lookup_machine_type, %function

00194: __lookup_machine_type:

00195:      adr r3,
3b

00196:      ldmia   r3,
{r4, r5, r6}

00197:      sub r3,
r3, r4         @ get offset between
virt&phys

00198:      add r5,
r5, r3         @ convert virt addresses to

00199:      add r6,
r6, r3         @ physical address space

00200:  1:  ldr r3,
[r5, #MACHINFO_TYPE]   @ get machine type

00201:      teq r3,
r1             @ matches loader number?

00202:      beq 2f                 
@ found

00203:      add r5,
r5, #SIZEOF_MACHINE_DESC   @ next
machine_desc

00204:      cmp r5,
r6

00205:      blo 1b

00206:      mov r5,
#0             @ unknown machine

00207: 2:   mov pc, lr

实际上上面这段代码的原理和确定processor type的原理是一样的。

 

内核中,一般使用宏MACHINE_START来定义machine type

对于smdk2410来说, arch/arm/mach-s3c2410/Mach-smdk2410.c :
MACHINE_START(SMDK2410, "SMDK2410") /* @TODO: request a new
identifier and switch

                    * to SMDK2410 */

    /*
Maintainer: Jonas Dietsche */

    .phys_io    = S3C2410_PA_UART,

    .io_pg_offst    = (((u32)S3C24XX_VA_UART) >> 18) &
0xfffc,

    .boot_params    = S3C2410_SDRAM_PA + 0x100,

    .map_io     = smdk2410_map_io,

    .init_irq   = s3c24xx_init_irq,

    .init_machine   = smdk_machine_init,

抱歉!评论已关闭.