2操作系統(tǒng)是如何工作的委粉?

安大大 + 原創(chuàng)作品轉(zhuǎn)載請(qǐng)注明出處 + 《Linux操作系統(tǒng)分析》MOOC課程


天下大事必作于細(xì)野芒,天下難事必作于易

早期的計(jì)算機(jī)在沒(méi)有中斷的時(shí)候蓄愁,只能執(zhí)行完一個(gè)程序之后,再執(zhí)行另外一個(gè)程序复罐。有了中斷之后涝登,就有了多道程序設(shè)計(jì)。當(dāng)一個(gè)中斷信號(hào)發(fā)生的時(shí)候效诅,CPU把當(dāng)前的eip胀滚,esp,ebp都?jí)旱揭粋€(gè)叫內(nèi)核堆棧的另外一個(gè)堆棧里乱投。然后把eip指向中斷處理程序的入口咽笼。即保存現(xiàn)場(chǎng),執(zhí)行中斷處理程序戚炫。由CPU和內(nèi)核代碼共同實(shí)現(xiàn)了保存現(xiàn)場(chǎng)和恢復(fù)現(xiàn)場(chǎng)剑刑。

實(shí)驗(yàn)

cd LinuxKernel/linux-3.9.4
rm -rf mykernel
patch -p1 < ../mykernel_for_linux3.9.4sc.patch #打補(bǔ)丁
make allnoconfig
make #編譯內(nèi)核請(qǐng)耐心等待
qemu -kernel arch/x86/boot/bzImage
運(yùn)行起來(lái)的情形:

mymain.c文件內(nèi)容:

my_start_kernel之前都是硬件初始化的東西,從my_start_kernel函數(shù)開始双肤,這就是操作系統(tǒng)的入口施掏,開始啟動(dòng)操作系統(tǒng)。每循環(huán)十萬(wàn)次茅糜,打印一次"my_start_kernel here"七芭,值改的越大,打印的速度就越慢蔑赘。改完之后make一下狸驳。


myinterrupt.c文件的內(nèi)容:

每次時(shí)鐘中斷它都調(diào)用一次printk预明。怎樣獲取時(shí)鐘中斷,進(jìn)入始終中斷處理程序入口耙箍,linux內(nèi)核的代碼已經(jīng)處理好了撰糠。只需要在中斷發(fā)生的時(shí)候,做一些實(shí)際的中斷處理辩昆。


C代碼中嵌入?yún)R編代碼

語(yǔ)法格式 asm("匯編語(yǔ)句":"輸出部分":"輸入部分":"破壞描述部分");

例子程序阅酪,實(shí)現(xiàn)val1+val2=val3
#include <stdio.h>
int main()
{
    /* val1+val2=val3 */
    unsigned int val1 = 1;
    unsigned int val2 = 2;
    unsigned int val3 = 0;
    printf("val1:%d,val2:%d,val3:%d\n",val1,val2,val3);
    asm volatile(
    "movl $0,%%eax\n\t" /* clear %eax to 0*/
    "addl %1,%%eax\n\t" /* %eax += val1 */
    "addl %2,%%eax\n\t" /* %eax += val2 */
    "movl %%eax,%0\n\t" /* val2 = %eax*/
    //從輸出部分到輸入部分的變量,從零開始計(jì)卤材,分別是%0遮斥,%1,%2扇丛,數(shù)字表示第幾個(gè)參數(shù)术吗。
    : "=m" (val3) /* output =m mean only write output memory variable*/
    : "c" (val1),"d" (val2) /* input c or d mean %ecx/%edx*/
    );
    printf("val1:%d+val2:%d=val3:%d\n",val1,val2,val3);
    return 0;
}

在mykernel基礎(chǔ)上構(gòu)造一個(gè)簡(jiǎn)單的OS內(nèi)核( 代碼分析在注釋當(dāng)中 )

mypcb.h 進(jìn)程控制塊
#define MAX_TASK_NUM 4 // max num of task in system
#define KERNEL_STACK_SIZE 1024*8

struct Thread {
    unsigned long       ip;//存儲(chǔ)eip 
    unsigned long       sp;//存儲(chǔ)esp 
};
typedef struct PCB{//定義進(jìn)程管理相關(guān)的數(shù)據(jù)結(jié)構(gòu)
    int pid;//進(jìn)程的id 
    volatile long state;//進(jìn)程的狀態(tài)    /* -1 unrunnable, 0 runnable, >0 stopped */
    char stack[KERNEL_STACK_SIZE];//當(dāng)前進(jìn)程的堆棧
    /* CPU-specific state of this task */
    struct Thread thread;
    unsigned long   task_entry;//入口 (指定的) 
    struct PCB *next;//進(jìn)程鏈表 
}tPCB;

void my_schedule(void);//調(diào)度器
mymain.c 內(nèi)核初始化和0號(hào)進(jìn)程啟動(dòng)
#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h>

#include "mypcb.h"

tPCB task[MAX_TASK_NUM];//PCB類型數(shù)組task
tPCB * my_current_task = NULL;//當(dāng)前task的指針
volatile int my_need_sched = 0;//是否需要調(diào)度 

void my_process(void);//函數(shù)聲明

void __init my_start_kernel(void)//初始化 
{
    int pid = 0;
    /* Initialize process 0 初始化0號(hào)進(jìn)程的數(shù)據(jù)結(jié)構(gòu)*/
    task[pid].pid = pid;
    task[pid].state = 0;//狀態(tài)是正在運(yùn)行 /* -1 unrunnable, 0 runnable, >0 stopped */
    // set task 0 execute entry address to my_process
    task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process;//起點(diǎn),入口帆精,my_process實(shí)際上是my_start_kernel
    task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
    task[pid].next = &task[pid];//剛啟動(dòng)较屿,指向自己,系統(tǒng)里只有0號(hào)進(jìn)程卓练,沒(méi)有其他進(jìn)程 
    /*fork more process 創(chuàng)建更多的進(jìn)程*/ 
    for(i=1;i<MAX_TASK_NUM;i++)
    {
        memcpy(&task[i],&task[0],sizeof(tPCB));//把0號(hào)進(jìn)程的狀態(tài)copy過(guò)來(lái)
        task[i].pid = i;
        task[i].state = -1;
        task[i].thread.sp = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-1];//每個(gè)進(jìn)程都有它自己的堆棧
        task[i].next = task[i-1].next;//新fork的進(jìn)程加到進(jìn)程列表的尾部 
        task[i-1].next = &task[i];
    }
    /* start process 0 by task[0] 啟動(dòng)0號(hào)進(jìn)程隘蝎,使0號(hào)進(jìn)程開始執(zhí)行*/
    pid = 0;
    my_current_task = &task[pid];//當(dāng)前的進(jìn)程就是0號(hào)進(jìn)程
    asm volatile(
        "movl %1,%%esp\n\t" /* set task[pid].thread.sp to esp 把第一號(hào)參數(shù)task[pid].thread.sp放入esp */
        "pushl %1\n\t" /* push ebp 當(dāng)前棧是空的,esp=ebp襟企,所以直接push了1號(hào)參數(shù)sp*/
        "pushl %0\n\t" /* push task[pid].thread.ip push當(dāng)前的ip*/
        "ret\n\t" /* pop task[pid].thread.ip to eip ,pop的eip,my_process的頭部*/
        "popl %%ebp\n\t"http:// ret之后0號(hào)進(jìn)程正式啟動(dòng)了,這幾句匯編就按照0號(hào)進(jìn)程設(shè)定的堆棧和0號(hào)進(jìn)程的入口構(gòu)建起來(lái)了CPU的運(yùn)行環(huán)境
        :
        : "c" (task[pid].thread.ip),"d" (task[pid].thread.sp)    /* input c or d mean %ecx/%edx*/
        //到這里my_start_kernel的工作就做完了嘱么,內(nèi)核的初始化工作完成,并且啟動(dòng)了0號(hào)進(jìn)程
);
}
void my_process(void)
{
    int i = 0;
    while(1)
    {
        i++;
        if(i%10000000 == 0)//循環(huán)1000萬(wàn)次判斷一下是否需要調(diào)度 
        {
            printk(KERN_NOTICE "this is process %d -\n",my_current_task->pid);//主動(dòng)調(diào)度 
            if(my_need_sched == 1)
            {
                my_need_sched = 0;
                my_schedule();  
            }
            printk(KERN_NOTICE "this is process %d +\n",my_current_task->pid);
        }
    }
}//end of my_process
myinterrupt.c
#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h>
#include "mypcb.h"

extern tPCB task[MAX_TASK_NUM];
extern tPCB * my_current_task;
extern volatile int my_need_sched;
volatile int time_count = 0;

/*
* Called by timer interrupt.
* it runs in the name of current running process,
* so it use kernel stack of current running process
*/
void my_timer_handler(void)
{
#if 1
    // make sure need schedule after system circle 100 times.
    if(time_count%100 == 0 && my_need_sched != 1)//設(shè)置時(shí)間片的大小顽悼,時(shí)間片用完時(shí)設(shè)置一下調(diào)度標(biāo)志 
    {
        printk(KERN_NOTICE ">>>my_timer_handler here<<<\n");
        my_need_sched = 1;
    }
    time_count ++ ;
#endif
    return;
}

void my_schedule(void)
{
    tPCB * next;
    tPCB * prev; 
    // if there no task running or only a task ,it shouldn't need schedule
    if(my_current_task == NULL
        || my_current_task->next == NULL)
    {
     return;
    }
    printk(KERN_NOTICE ">>>my_schedule<<<\n");
    /* schedule */

    next = my_current_task->next;
    prev = my_current_task;//當(dāng)前進(jìn)程是prev
    if(next->state == 0)/* -1 unrunnable, 0 runnable, >0 stopped */
    {//save current scene
         my_current_task = next; 
        printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);  
     /* switch to next process */
     asm volatile(  //兩個(gè)正在運(yùn)行的進(jìn)程之間做進(jìn)程上下文切換 
         "pushl %%ebp\n\t" /* save ebp */
         "movl %%esp,%0\n\t" /* save esp */
         "movl %2,%%esp\n\t" /* restore esp */
         "movl $1f,%1\n\t" /* save eip  $1f是指接下來(lái)的標(biāo)號(hào)1:的位置*/
         "pushl %3\n\t"
         "ret\n\t" /* restore eip */
         "1:\t" /* next process start here */
         "popl %%ebp\n\t"
         : "=m" (prev->thread.sp),"=m" (prev->thread.ip)
         : "m" (next->thread.sp),"m" (next->thread.ip)
     );
  }
    else//新的進(jìn)程曼振,從來(lái)沒(méi)有執(zhí)行過(guò)
    {
        next->state = 0;//把這個(gè)進(jìn)程置為運(yùn)行時(shí)狀態(tài) 
        my_current_task = next;//這個(gè)進(jìn)程做為當(dāng)前的進(jìn)程 
        printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
     /* switch to new process 切換到一個(gè)新進(jìn)程*/
     asm volatile(  
         "pushl %%ebp\n\t" /* save ebp */
         "movl %%esp,%0\n\t" /* save esp */
         "movl %2,%%esp\n\t" /* restore esp */
         "movl %2,%%ebp\n\t" /* restore ebp 從來(lái)沒(méi)有執(zhí)行過(guò),所以esp和ebp指向同一個(gè)位置蔚龙,棧是空的*/
         "movl $1f,%1\n\t" /* save eip */   
         "pushl %3\n\t"
         "ret\n\t" /* restore eip */
         : "=m" (prev->thread.sp),"=m" (prev->thread.ip)
         : "m" (next->thread.sp),"m" (next->thread.ip)
     );
    }
    return; 
}//end of my_schedule

把mypcb.h,mymain.c,myinterrupt.c放到mykernel目錄下冰评,重新make



運(yùn)行成功:


難點(diǎn)分析:
理解和運(yùn)行mykernel,它是提供初始化好的CPU從my_start_kernel開始執(zhí)行木羹,并提供了時(shí)鐘中斷機(jī)制周期性執(zhí)行my_time_handler中斷處理程序甲雅,執(zhí)行完后中斷返回總是可以回到my_start_kernel中斷的位置繼續(xù)執(zhí)行。當(dāng)然中斷保存現(xiàn)場(chǎng)恢復(fù)現(xiàn)場(chǎng)的細(xì)節(jié)都處理好了坑填,mykernel就是一個(gè)邏輯上的硬件平臺(tái)抛人,具體怎么做到的一般不必深究。
能運(yùn)行mykernel后就可以寫一個(gè)自己的時(shí)間片輪轉(zhuǎn)調(diào)度內(nèi)核了脐瑰,自己寫還是很難的函匕,只需到mykernel的github版本庫(kù)找到代碼復(fù)制過(guò)來(lái)重新編譯Linux3.9.4的源代碼,能按視頻的效果跑起來(lái)蚪黑,這都不難盅惜。
難點(diǎn)是理解基于mykernel實(shí)現(xiàn)的時(shí)間片輪轉(zhuǎn)調(diào)度代碼。
往往系統(tǒng)都有很多進(jìn)程比較復(fù)雜忌穿,我們假定當(dāng)前系統(tǒng)只有兩個(gè)進(jìn)程0和1抒寂,第一次調(diào)度是從0切換到1,也就是prev=0掠剑,next=1屈芜,第二次調(diào)度正好相反。
這時(shí)再看myinterrupt.c中的匯編代碼朴译,保存prev的進(jìn)程(0)上下文井佑,下次調(diào)度是next進(jìn)程就是0了,反之進(jìn)程1是next那它肯定之前作為prev被調(diào)度出去過(guò)眠寿。理解進(jìn)程上下文的保存和恢復(fù)極為關(guān)鍵躬翁。
$1f就是指標(biāo)號(hào)1:的代碼在內(nèi)存中存儲(chǔ)的地址
再來(lái)看特殊一點(diǎn)代碼切換到一個(gè)新的進(jìn)程,也就是next沒(méi)有被保存過(guò)進(jìn)程上下文盯拱,它從沒(méi)有被執(zhí)行過(guò)盒发,這時(shí)稍特殊一點(diǎn)即else部分的匯編代碼。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末狡逢,一起剝皮案震驚了整個(gè)濱河市宁舰,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌奢浑,老刑警劉巖蛮艰,帶你破解...
    沈念sama閱讀 222,104評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異雀彼,居然都是意外死亡壤蚜,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門详羡,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)仍律,“玉大人,你說(shuō)我怎么就攤上這事实柠∷” “怎么了?”我有些...
    開封第一講書人閱讀 168,697評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵窒盐,是天一觀的道長(zhǎng)草则。 經(jīng)常有香客問(wèn)我,道長(zhǎng)蟹漓,這世上最難降的妖魔是什么炕横? 我笑而不...
    開封第一講書人閱讀 59,836評(píng)論 1 298
  • 正文 為了忘掉前任,我火速辦了婚禮葡粒,結(jié)果婚禮上份殿,老公的妹妹穿的比我還像新娘膜钓。我一直安慰自己,他們只是感情好卿嘲,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,851評(píng)論 6 397
  • 文/花漫 我一把揭開白布颂斜。 她就那樣靜靜地躺著,像睡著了一般拾枣。 火紅的嫁衣襯著肌膚如雪沃疮。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,441評(píng)論 1 310
  • 那天梅肤,我揣著相機(jī)與錄音司蔬,去河邊找鬼。 笑死姨蝴,一個(gè)胖子當(dāng)著我的面吹牛俊啼,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播似扔,決...
    沈念sama閱讀 40,992評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼吨些,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了炒辉?” 一聲冷哼從身側(cè)響起豪墅,我...
    開封第一講書人閱讀 39,899評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎黔寇,沒(méi)想到半個(gè)月后偶器,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,457評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡缝裤,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,529評(píng)論 3 341
  • 正文 我和宋清朗相戀三年屏轰,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片憋飞。...
    茶點(diǎn)故事閱讀 40,664評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡霎苗,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出榛做,到底是詐尸還是另有隱情唁盏,我是刑警寧澤,帶...
    沈念sama閱讀 36,346評(píng)論 5 350
  • 正文 年R本政府宣布检眯,位于F島的核電站厘擂,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏锰瘸。R本人自食惡果不足惜刽严,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,025評(píng)論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望避凝。 院中可真熱鬧舞萄,春花似錦眨补、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至把还,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間茸俭,已是汗流浹背吊履。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留调鬓,地道東北人艇炎。 一個(gè)月前我還...
    沈念sama閱讀 49,081評(píng)論 3 377
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像腾窝,于是被迫代替她去往敵國(guó)和親缀踪。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,675評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容