姓名:劉哲寧
學(xué)號(hào):16020520053
【嵌牛導(dǎo)讀】:在中國(guó),嵌入式編程的朋友很少是正兒八經(jīng)從計(jì)算機(jī)專業(yè)畢業(yè)的,都是從自動(dòng)控制啊牌柄,電子相關(guān)的專業(yè)畢業(yè)的。這些童鞋們侧甫,實(shí)踐經(jīng)驗(yàn)雄厚珊佣,但是理論知識(shí)缺乏;計(jì)算機(jī)專業(yè)畢業(yè)的童鞋很大一部分去弄網(wǎng)游披粟、網(wǎng)頁(yè)這些獨(dú)立于操作系統(tǒng)的更高層的應(yīng)用了咒锻。也不太愿意從事嵌入式行業(yè),畢竟這條路不好走守屉。他們理論知識(shí)雄厚惑艇,但缺乏電路等相關(guān)的知識(shí),在嵌入式里學(xué)習(xí)需要再學(xué)習(xí)一些具體的知識(shí)拇泛,比較難走滨巴。
【嵌牛鼻子】:嵌入式,編程俺叭,復(fù)雜性
【嵌牛提問(wèn)】雖然沒(méi)有做過(guò)產(chǎn)業(yè)調(diào)查恭取,但從我所見(jiàn)和所招聘人員,從事嵌入式行業(yè)的工程師熄守,要么缺乏理論知識(shí)蜈垮,要么缺乏實(shí)踐經(jīng)驗(yàn)。很少兩者兼?zhèn)涞脑U铡>科湓蛟芊ⅲ€是中國(guó)的大學(xué)教育的問(wèn)題。這里不探討這個(gè)問(wèn)題晋南,避免口水戰(zhàn)晨继。我想列出我實(shí)踐中的幾個(gè)例子。引起大家在嵌入式中做項(xiàng)目時(shí)對(duì)一些問(wèn)題的關(guān)注搬俊。
【嵌牛正文】:第一個(gè)問(wèn)題:
同事在uC/OS-II下開發(fā)一個(gè)串口的驅(qū)動(dòng)程序紊扬,驅(qū)動(dòng)和接口在測(cè)試中均為發(fā)現(xiàn)問(wèn)題蜒茄。應(yīng)用中開發(fā)了個(gè)通訊程序,串口驅(qū)動(dòng)提供了一個(gè)查詢驅(qū)動(dòng)緩沖區(qū)字符的函數(shù):GetRxBuffCharNum()餐屎。 高層需要接受一定數(shù)量的字符以后才能對(duì)包做解析檀葛。一個(gè)同事撰寫的代碼,用偽代碼表示如下:
bExit = FALSE;
do {
if (GetRxBuffCharNum() >= 30)
? ? ? bExit = ReadRxBuff(buff, GetRxBuffCharNum());
} while (!bExit);
這段代碼判斷當(dāng)前緩沖區(qū)中超過(guò)30個(gè)字符腹缩,就將緩沖區(qū)中全部字符讀到緩沖區(qū)中屿聋,直到讀取成功為止。邏輯清楚藏鹊,思路也清楚润讥。但這段代碼是不能正常工作。如果是在PC機(jī)上盘寡,定然是沒(méi)有任何問(wèn)題楚殿,工作的異常正常。但在嵌入式里真的是不得而知了竿痰。同事很郁悶脆粥,不知道為什么。來(lái)請(qǐng)我解決問(wèn)題影涉,當(dāng)時(shí)我看到代碼变隔,就問(wèn)了他,GetRxBuffCharNum()是怎么實(shí)現(xiàn)的蟹倾?打開一看:
unsigned GetRxBuffCharNum(void)
{
cpu_register reg;
unsigned num;
reg = interrupt_disable();
num = gRxBuffCharNum;
interrupt_enable(reg);
return (num);
}
很明顯匣缘,由于在循環(huán)中,interruput_disable()和interrupt_enable()之間是個(gè)全局臨界區(qū)域鲜棠,保證gRxBufCharNum的完整性肌厨。但是,由于在外層的do { } while() 循環(huán)中岔留,CPU頻繁的關(guān)閉中斷夏哭,打開中斷检柬,這個(gè)時(shí)間非常的短献联。實(shí)際上CPU可能不能正常的響應(yīng)UART的中斷。當(dāng)然這和uart的波特率何址、硬件緩沖區(qū)的大小還有CPU的速度都有關(guān)系里逆。我們使用的波特率非常高,大約有3Mbps用爪。uart起始信號(hào)和停止信號(hào)占一個(gè)比特位原押。一個(gè)字節(jié)需要消耗10個(gè)周期。3Mbps的波特率大約需要3.3us傳輸一個(gè)字節(jié)偎血。3.3us能執(zhí)行多少個(gè)CPU指令呢诸衔?100MHz的ARM盯漂,大約能執(zhí)行150條指令左右。結(jié)果關(guān)閉中斷的時(shí)間是多長(zhǎng)呢笨农?一般ARM關(guān)閉中斷都需要4條以上的指令就缆,打開又有4條以上的指令。接收uart中斷的代碼實(shí)際上是不止20條指令的谒亦。所以竭宰,這樣下來(lái),就有可能出現(xiàn)丟失通信數(shù)據(jù)的Bug份招,體現(xiàn)在系統(tǒng)層面上切揭,就是通信不穩(wěn)定。
修改這段代碼其實(shí)很簡(jiǎn)單锁摔,最簡(jiǎn)單的辦法是從高層修改廓旬。即:
bExit = FALSE;
do {
DelayUs(20); //延時(shí) 20us,一般采用空循環(huán)指令實(shí)現(xiàn)
num = GetRxBuffCharNum();
if (num >= 30)
? ? bExit = ReadRxBuff(buff, num);
} while (!bExit);
這樣鄙漏,讓CPU有時(shí)間去執(zhí)行中斷的代碼嗤谚,從而避免了頻繁關(guān)閉中斷造成的中斷代碼執(zhí)行不及時(shí),產(chǎn)生的信息丟失怔蚌。在嵌入式系統(tǒng)里巩步,大部分的RTOS應(yīng)用都是不帶串口驅(qū)動(dòng)。自己設(shè)計(jì)代碼時(shí)桦踊,沒(méi)有充分考慮代碼與內(nèi)核的結(jié)合椅野。造成代碼深層次的問(wèn)題。RTOS之所以稱為RTOS籍胯,就是因?yàn)閷?duì)事件的快速響應(yīng)竟闪;事件快速的響應(yīng)依賴于CPU對(duì)中斷的響應(yīng)速度。驅(qū)動(dòng)在Linux這種系統(tǒng)中都是與內(nèi)核高度整合杖狼,一起運(yùn)行在內(nèi)核態(tài)炼蛤。RTOS雖然不能抄襲linux這種結(jié)構(gòu),但有一定的借鑒意義蝶涩。
從上面的例子可以看清楚理朋,嵌入式需要開發(fā)人員對(duì)代碼的各個(gè)環(huán)節(jié)需要了解清楚。
第二個(gè)例子:
同事驅(qū)動(dòng)一個(gè)14094串轉(zhuǎn)并的芯片绿聘。串行信號(hào)是采用IO模擬的嗽上,因?yàn)闆](méi)有專用的硬件。同事就隨手寫了個(gè)驅(qū)動(dòng)熄攘,結(jié)果調(diào)試了3兽愤、4天,仍舊是有問(wèn)題。我實(shí)在看不下去了浅萧,就去看了看逐沙,控制的并行信號(hào)有時(shí)候正常有時(shí)候不正常。我看了看代碼洼畅,用偽代碼大概是:
for (i = 0; i < 8; i++)
{
? ? SetData((data >> i) & 0x1);
? ? SetClockHigh();
? ? for (j = 0; j < 5; j++);
? ? SetClockLow();
}
將數(shù)據(jù)的8個(gè)bit在每個(gè)高電平從bit0到bit7依次發(fā)送出去酱吝。應(yīng)該是正常的啊⊥了迹看不出問(wèn)題在哪拔袢取?我仔細(xì)想了想己儒,有看了14094的datasheet崎岂,明白了。原來(lái)闪湾,14094要求clock的高電平持續(xù)10個(gè)ns冲甘,低電平也要持續(xù)10個(gè)ns。這段代碼之做了高電平時(shí)間的延時(shí)途样,沒(méi)有做低電平的延時(shí)江醇。如果中斷插在低電平之間工作,那么這段代碼是可以的何暇。但是如果CPU沒(méi)有中斷插在低電平時(shí)執(zhí)行陶夜,則是不能正常工作的。所以就時(shí)好時(shí)壞裆站。
修改也比較簡(jiǎn)單:
for (i = 0; i < 8; i++)
{
? ? SetData((data >> i) & 0x1);
? ? SetClockHigh();
? ? for (j = 0; j < 5; j++);
? ? SetClockLow();
? ? for (j = 0; j < 5; j++);
}
這樣就完全正常了条辟。但是這個(gè)還是不能很好移植的一個(gè)代碼,因?yàn)榫幾g器一優(yōu)化宏胯,就有可能造成這兩個(gè)延時(shí)循環(huán)的丟失羽嫡。丟失了,就不能保證高電平低電平持續(xù)10ns的要求肩袍,也就不能正常工作了杭棵。所以,真正的可以移植的代碼氛赐,應(yīng)該把這個(gè)循環(huán)做成一個(gè)納秒級(jí)的DelayNs(10);
像Linux一樣魂爪,上電時(shí),先測(cè)量一下鹰祸,nop指令執(zhí)行需要多長(zhǎng)時(shí)間執(zhí)行甫窟,多少個(gè)nop指令執(zhí)行10ns密浑。執(zhí)行一定的nop指令就可以了蛙婴。利用編譯器防止優(yōu)化的編譯指令或者特殊的關(guān)鍵字,防止延時(shí)循環(huán)被編譯器優(yōu)化掉尔破。如GCC中的
__volatile__ __asm__("nop;\n");
從這個(gè)例子中可以清楚的看到街图,寫好一段好代碼浇衬,是需要很多知識(shí)支撐的。你說(shuō)呢餐济?
嵌入式往往沒(méi)有操作系統(tǒng)支撐耘擂,或者因?yàn)橛胁僮飨到y(tǒng)支撐,但因?yàn)榉N種的限制絮姆,操作系統(tǒng)提供的功能少得可憐醉冤。所以,很多代碼不能像PC編程那樣天馬行空篙悯,任意馳騁蚁阳。今天就聊聊內(nèi)存分配的問(wèn)題,內(nèi)存碎片鸽照,可能大家都不陌生螺捐。然而在嵌入式系統(tǒng)里,最怕的就是內(nèi)存碎片矮燎,也是系統(tǒng)穩(wěn)定的頭號(hào)殺手定血。我曾經(jīng)做了一個(gè)項(xiàng)目,系統(tǒng)中有很多的malloc和free诞外,尺寸不一澜沟,從60多個(gè)字節(jié)到64KB的不等。使用一款RTOS作為支撐峡谊。當(dāng)時(shí)我有兩個(gè)選擇倔喂,一個(gè)是使用C系統(tǒng)庫(kù)的malloc和free,另外一個(gè)是使用操作系統(tǒng)提供的固定內(nèi)存分配靖苇。我們系統(tǒng)的設(shè)計(jì)要求要能穩(wěn)定運(yùn)行3個(gè)月以上席噩。實(shí)際上連續(xù)運(yùn)行6天左右就宕機(jī)了。各種問(wèn)題都懷疑過(guò)贤壁,最后定為在內(nèi)存分配上悼枢,其實(shí)就是長(zhǎng)時(shí)間,大量的內(nèi)存分配后脾拆,系統(tǒng)的內(nèi)存變得零散而無(wú)法連續(xù)馒索。雖有大空間,但卻無(wú)法分配連續(xù)的空間名船。當(dāng)有大空間申請(qǐng)時(shí)绰上,只能是宕機(jī)完蛋。為了使系統(tǒng)達(dá)到原先的設(shè)計(jì)需求渠驼,我們?cè)赑C機(jī)上模擬了整個(gè)硬件蜈块,將嵌入式代碼在 PC機(jī)上跑起來(lái),并重載了malloc和free,做了個(gè)復(fù)雜的統(tǒng)計(jì)程序百揭。統(tǒng)計(jì)系統(tǒng)的內(nèi)存行為爽哎。運(yùn)行了若干天以后,將數(shù)據(jù)提取出來(lái)分析器一,雖然申請(qǐng)的內(nèi)存5花八門课锌,還是有些規(guī)律,我們把100個(gè)字節(jié)以下的歸為一類祈秕,512B的歸為一類渺贤,1KB的歸為一類,2KB歸為一類请毛,64KB一下歸為一類癣亚。統(tǒng)計(jì)出每類的數(shù)量,在原先的基礎(chǔ)上加上30%的余量获印。做成固定內(nèi)存申請(qǐng)述雾,使得系統(tǒng)穩(wěn)定連續(xù)運(yùn)行的時(shí)間大大加長(zhǎng)。嵌入式就這樣兼丰,不怕方法原始玻孟,就怕性能不達(dá)要求。
內(nèi)存溢出問(wèn)題鳍征,內(nèi)存溢出問(wèn)題嵌入式系統(tǒng)比PC系統(tǒng)更可怕! 往往是沒(méi)有察覺(jué)的就溢出了黍翎。都很難想到,尤其是C/C++的初學(xué)者艳丛,對(duì)指針不熟悉匣掸,查都沒(méi)法查。由于PC系統(tǒng)有MMU氮双,內(nèi)存發(fā)生嚴(yán)重的越界時(shí)碰酝,有MMU的保護(hù),不會(huì)產(chǎn)生嚴(yán)重的災(zāi)難后果戴差。而嵌入式往往沒(méi)有MMU送爸,差別很大,系統(tǒng)代碼都被破壞了還能跑暖释。只是只有上帝和那個(gè)CPU才知道跑得是什么袭厂。我們來(lái)看看這段代碼:
char? *strcpy(char *dest, const char * src)
{
? ? ? ? ? assert(dest != NULL && src != NULL);
? ? ? ? ? while (*src != '\0')
? ? ? ? ? {
? ? ? ? ? ? ? ? ? *dest++ = *src++;
? ? ? ? ? }
? ? ? ? ? *dest = '\0';
? ? ? ? return (dest);
}
這個(gè)代碼是一個(gè)字符串拷貝的代碼,PC機(jī)這樣寫球匕,基本上就可以了纹磺。但嵌入式要提防一件事情,那就是 src真的以'\0'結(jié)束的亮曹。要不是得話橄杨,那就悲劇了秘症。到什么時(shí)候能結(jié)束,呵呵讥珍,只有上帝老人家才知道。這段代碼僥幸能跑完成的話窄瘟,估計(jì)也別想程序能正常的跑了衷佃。因?yàn)閐est指向的內(nèi)存區(qū)域都被破壞的差不多了。為了和標(biāo)準(zhǔn)C/C++的庫(kù)兼容蹄葱,還真的沒(méi)什么好辦法氏义,所以這個(gè)問(wèn)題只能留給程序員自己檢查。
相同的图云,
memcpy( dest, src, n);
內(nèi)存拷貝同樣的問(wèn)題惯悠,要提防n傳遞個(gè)負(fù)值進(jìn)去。這個(gè)是拷貝多少個(gè)字節(jié)竣况,負(fù)值被強(qiáng)制類型轉(zhuǎn)換成正的克婶。變成一個(gè)很大的正數(shù),造成dest之后的內(nèi)存全部被破壞……
嵌入式里的內(nèi)存指針必須做嚴(yán)格的檢查才能使用丹泉,內(nèi)存的尺寸也必須進(jìn)行嚴(yán)格的調(diào)試情萤。不然的話,悲劇是很難避免的摹恨。如一個(gè)函數(shù)指針筋岛,雖然在嵌入式里賦了個(gè)NULL,0。若是ARM的話晒哄,連個(gè)異常錯(cuò)誤都沒(méi)有睁宰,直接復(fù)位了,因?yàn)檎{(diào)用這個(gè)函數(shù)指針即便是讓代碼從0開始運(yùn)行寝凌。而0是ARM上電后運(yùn)行的第一條代碼的位置柒傻。在ARM7上尤其如此。這種悲劇比PC上悲情多了较木,MMU 定然給一個(gè)無(wú)定義指令的錯(cuò)誤诅愚。引起程序員的重視。在嵌入式里劫映,全部都留給了程序員去尋找了违孝。
內(nèi)存溢出發(fā)生在任何一個(gè)不經(jīng)意的時(shí)刻,你給整個(gè)前后臺(tái)的系統(tǒng)(或操作系統(tǒng))分配了多大的堆泳赋?多大的棧雌桑?在通常情況下系統(tǒng)的調(diào)用深度是多少(最大是多少),占用多少棧祖今?光看程序的功能正確還不夠校坑,還需要統(tǒng)計(jì)這些參數(shù)拣技。不然,只要有一個(gè)地方有溢出耍目。對(duì)系統(tǒng)都是致命的膏斤。嵌入式系統(tǒng)要求系統(tǒng)連續(xù)工作時(shí)間長(zhǎng),穩(wěn)定性可靠性要求苛刻邪驮。是需要一些時(shí)間仔細(xì)的磨這些系統(tǒng)的莫辨。
嵌入式系統(tǒng)的調(diào)試往往很復(fù)雜,可用的手段并不像PC編程那么多毅访,開發(fā)成本較PC系統(tǒng)也要大很多沮榜。嵌入式系統(tǒng)調(diào)試主要手段只有JTAG為代表的單步追蹤、printf夾殺大法等喻粹。
這兩種調(diào)試方法在嵌入式中也不盡然全部能解決問(wèn)題蟆融。Jtag需要調(diào)試者有一個(gè)調(diào)試設(shè)備(有可能很昂貴),和目標(biāo)系統(tǒng)相連守呜。使用類似GDB Client等軟件登錄調(diào)試設(shè)備型酥,跟蹤運(yùn)行程序。說(shuō)實(shí)話查乒,這個(gè)方法對(duì)嵌入式來(lái)講是終極的調(diào)試辦法冕末,也是比較好的調(diào)試方法。但仍然有幾個(gè)不足,當(dāng)斷點(diǎn)過(guò)多時(shí)侣颂,超出硬件的限制档桃,某些低檔的CPU不支持更多的斷點(diǎn),就需要JTAG利用軟件模擬憔晒,或采用軟件陷阱(軟中斷或異常)等辦法實(shí)現(xiàn)斷點(diǎn)藻肄。機(jī)理比較復(fù)雜,簡(jiǎn)單點(diǎn)說(shuō)拒担,1.不能進(jìn)行長(zhǎng)時(shí)間調(diào)試嘹屯,不太穩(wěn)定; 2.有可能影響程序的運(yùn)行時(shí)刻的行為,通過(guò)時(shí)序影響从撼。掛接JTAG系統(tǒng)后州弟,利用硬件實(shí)現(xiàn)的斷點(diǎn)不會(huì)影響系統(tǒng)運(yùn)行的速度,但是軟件實(shí)現(xiàn)的斷點(diǎn)是必定犧牲一些性能的低零∑畔瑁可靠性也要打折扣的。當(dāng)斷點(diǎn)太多掏婶,而系統(tǒng)又進(jìn)入臨界區(qū)域啃奴,可能會(huì)造成斷點(diǎn)不起作用。因?yàn)榍度胧綄?shí)現(xiàn)全局臨界區(qū)域往往需要關(guān)閉中斷雄妥,有些CPU沒(méi)有非屏蔽中斷最蕾,當(dāng)斷點(diǎn)超過(guò)一定數(shù)量依溯,使用軟件斷點(diǎn),而軟件斷點(diǎn)又需要在中斷工作的情況下使用……
特別調(diào)試時(shí)序問(wèn)題和高速通信類的代碼瘟则,JTAG幫助并不大黎炉。通信過(guò)程往往很快,通信包也是接二連三醋拧,才能完成一個(gè)完整的動(dòng)作慷嗜。如果是高速通訊,斷點(diǎn)是無(wú)法讓程序完成工作的趁仙。所以只能使用printf夾殺的辦法洪添,printf夾殺辦法很好垦页。但是也要注意幾個(gè)問(wèn)題:嵌入式系統(tǒng)往往沒(méi)有屏幕雀费,printf輸出是通過(guò)串口輸出。而串口工作模式有兩種痊焊,一種是查詢盏袄,另外一種是中斷,或DMA薄啥。不管哪種辕羽,調(diào)試輸出的printf只能使用查詢的辦法輸出,千萬(wàn)不要使用中斷或DMA的辦法垄惧。不管是前后臺(tái)程序也好刁愿,還是操作系統(tǒng)也好谅畅,都有不方便的時(shí)候起愈,也許在全局臨界內(nèi)需要打印(關(guān)閉了中斷),也許需要在中斷里打印(不允許嵌套中斷)偶器,也許要在一些驅(qū)動(dòng)里打印(很多配合的設(shè)備沒(méi)有初始化觉壶,內(nèi)存分配和中斷并不能很好的工作)脑题。在這些情況下,利用Uart中斷輸出字符是不明智的铜靶。所以調(diào)試輸出只能使用查詢的辦法叔遂。不要幻想著使用什么牛叉的辦法,不必了争剿。一句話已艰,不可靠!既然做調(diào)試蚕苇,那可靠的輸出結(jié)果是第一要求旗芬。也就是因?yàn)槿绱耍琾rintf也會(huì)影響代碼的工作效率捆蜀,串口最高的波特率115200bps疮丛,越快速的CPU越是浪費(fèi)時(shí)間幔嫂,因?yàn)樾枰却弦粋€(gè)字符輸出完畢,這段時(shí)間完全是通過(guò)空轉(zhuǎn)消耗這部分時(shí)間誊薄。所以使用printf要有一些技巧履恩,在不影響一些關(guān)鍵時(shí)序的位置下再打印,而不是隨意爛打……淹沒(méi)了bug呢蔫。
以上這兩種辦法并不能很好的解決全部的問(wèn)題切心,在實(shí)際中如果嵌入式系統(tǒng)有一兩個(gè)LED燈,嘗試用IO口將其在特殊的情況下點(diǎn)亮熄滅的辦法片吊,也可表示程序的狀態(tài)绽昏。這種辦法適合調(diào)試中斷、臨界區(qū)域這些問(wèn)題俏脊。點(diǎn)量LED燈需要的時(shí)間是非常短的全谤,基本上是一條內(nèi)存讀寫命令,如果IO口寄存器是CPU統(tǒng)一編址的話爷贫∪先唬基本上造成的影響微乎其微。在調(diào)試一些復(fù)雜的時(shí)序的時(shí)候漫萄,還可以使用空閑的IO口卷员,將其在特殊的情況下拉低,拔高腾务,然后利用數(shù)字示波器或者邏輯分析儀抓取再具體分析毕骡。特別是分析一段代碼的執(zhí)行頻度,執(zhí)行時(shí)間岩瘦,優(yōu)化效果等未巫。對(duì)整體的性能提升等,有非常大的意義担钮。對(duì)于簡(jiǎn)單的單片機(jī)橱赠,廠商開發(fā)軟件都有個(gè)時(shí)序統(tǒng)計(jì)的功能。但對(duì)于有cache和MMU的單片機(jī)箫津,時(shí)序統(tǒng)計(jì)并不準(zhǔn)狭姨,往往不如用示波器測(cè)得的準(zhǔn)。如果沒(méi)有示波器利用CPU內(nèi)部的時(shí)間計(jì)數(shù)器也可以實(shí)現(xiàn)時(shí)間的統(tǒng)計(jì)苏遥,需要結(jié)合printf使用饼拍。
我一個(gè)同事,調(diào)試飛利浦的ARM7田炭,由于飛利浦ARM7外擴(kuò)的RAM全部是靜態(tài)RAM师抄,即使在CPU死機(jī)情況下,只要不斷電教硫,SRAM里的數(shù)據(jù)也不會(huì)丟失叨吮,由于SRAM和內(nèi)部的SRAM統(tǒng)一編址辆布,所以,訪問(wèn)起來(lái)也就是一條讀寫指令茶鉴,速度很快锋玲。利用這個(gè)特性,他把程序的模塊和點(diǎn)全部標(biāo)記上涵叮,當(dāng)系統(tǒng)運(yùn)行不正常惭蹂,將ARM7復(fù)位以后,ARM7上電第一個(gè)工作就是取出復(fù)位前的數(shù)據(jù)打印出來(lái)割粮。由此可調(diào)試ARM7的代碼盾碗,非常巧妙的辦法。如果只有SDRAM的朋友們是不能用這種辦法的舀瓢,因?yàn)橹灰到y(tǒng)復(fù)位廷雅,SDRAM沒(méi)有刷新,數(shù)據(jù)即會(huì)丟失氢伟。
地球人都知道榜轿,嵌入式的最大挑戰(zhàn)在于硬件和軟件同時(shí)成熟幽歼;出了個(gè)問(wèn)題朵锣,不知道是軟件問(wèn)題還是硬件問(wèn)題。當(dāng)然甸私,可以通過(guò)虛擬的方式解決大部分問(wèn)題诚些,但虛擬終歸是虛擬。不是實(shí)際皇型,上了實(shí)際的板子诬烹,還是有不少問(wèn)題。嵌入式領(lǐng)域弃鸦,特別是底層技術(shù)绞吁,由軟件(驅(qū)動(dòng))和硬件兩個(gè)部分組成。解決起來(lái)唬格,需要兩個(gè)部分的知識(shí)家破,對(duì)人員的素質(zhì)要求更高。我曾經(jīng)遇到很多棘手的問(wèn)題购岗,都是復(fù)雜的系統(tǒng)問(wèn)題汰聋。
1.一個(gè)系統(tǒng)要求連續(xù)不斷的24小時(shí)工作,即使斷電喊积,也要保存斷電狀態(tài)烹困。在電源正常時(shí),就必須恢復(fù)斷電前的狀態(tài)乾吻,繼續(xù)工作髓梅。
實(shí)際中拟蜻,我們也這樣做了軟件,但是實(shí)際效果并不是所想得那樣枯饿。一萬(wàn)次斷電瞭郑,總有那么幾十次不正常;又沒(méi)辦法重現(xiàn)鸭你,只能是猜來(lái)猜去屈张。因?yàn)橄到y(tǒng)斷電,這個(gè)也不好調(diào)試袱巨,掛著JTAG阁谆,系統(tǒng)現(xiàn)在斷電了,目標(biāo)板也就沒(méi)電了愉老。也就沒(méi)辦法調(diào)試跟蹤單步了场绿。本來(lái)的設(shè)計(jì)思路是,控制電路利用電容存儲(chǔ)的一些些能量在斷電后繼續(xù)工作嫉入,保存狀態(tài)焰盗,保存好后,進(jìn)入待機(jī)狀態(tài)咒林。測(cè)試檢測(cè)斷電的信號(hào)后熬拒,也是沒(méi)有問(wèn)題的。后來(lái)垫竞,這個(gè)問(wèn)題變成懸疑問(wèn)題了……
這個(gè)系統(tǒng)分為兩個(gè)模塊澎粟,工作模塊和控制模塊』兜桑控制模塊有電容繼續(xù)供電活烙,而工作模塊沒(méi)有電容工作;所以當(dāng)發(fā)生斷電時(shí)遣鼓,全系統(tǒng)不是同一時(shí)間斷電的啸盏。當(dāng)控制模塊檢測(cè)到斷電時(shí),實(shí)際上工作模塊早都沒(méi)電了骑祟,所以工作模塊不能正確的傳遞相關(guān)的數(shù)據(jù)回來(lái)回懦,造成控制模塊不能正確的工作。兩個(gè)斷電的時(shí)序非常的接近曾我,無(wú)法判斷其先后粉怕。解決的方法也很簡(jiǎn)單,就是把斷電檢測(cè)模塊以工作模塊為主進(jìn)行同步抒巢,就沒(méi)有問(wèn)題了贫贝。
2.還是斷電保護(hù)的問(wèn)題,我們用繼電器模擬斷電的情況上萬(wàn)次正常后,終于上整機(jī)實(shí)驗(yàn)了稚晚,結(jié)果經(jīng)常發(fā)現(xiàn)斷電無(wú)法正常保護(hù)的現(xiàn)象崇堵。仔細(xì)查看電路也沒(méi)有什么異常,都是一樣的客燕。結(jié)果工程部指責(zé)我們研發(fā)部沒(méi)有仔細(xì)測(cè)試鸳劳,發(fā)出來(lái)的東西都是有問(wèn)題的東西。哎也搓,傷心啊赏廓。后來(lái)經(jīng)過(guò)仔細(xì)的分析,我們認(rèn)為傍妒,軟件異常的可能性很小幔摸。主要問(wèn)題還是在硬件上,硬件上的超級(jí)電容可能在頻繁的斷電下颤练,沒(méi)有存儲(chǔ)夠足夠的能量既忆,使得系統(tǒng)完成保護(hù)過(guò)程。那么究竟是什么造成頻繁的斷電呢嗦玖?按照設(shè)計(jì)要求患雇,超級(jí)電容在3~5s內(nèi)就會(huì)充滿到80%的能量,理論上足夠了宇挫。又有什么會(huì)不到3~5s鐘頻繁的斷電呢苛吱?
說(shuō)出來(lái)都匪夷所思,使用數(shù)字示波器不間斷跟蹤控制板的電源捞稿,才發(fā)現(xiàn)又谋。原來(lái)是三相交流電需要接一個(gè)相位保護(hù)器拼缝,相位保護(hù)在系統(tǒng)工作時(shí)會(huì)頻繁的開關(guān)(可能和系統(tǒng)的狀態(tài)有關(guān))娱局。解決方法是,簡(jiǎn)單的把控制器的電源接在相位保護(hù)器前面就好了咧七。
這些問(wèn)題看似都是硬件問(wèn)題衰齐,也是在產(chǎn)品的調(diào)試過(guò)程中經(jīng)常碰到的問(wèn)題。這些問(wèn)題继阻,需要軟件工作人員確認(rèn)軟件中的Bug是否能造成這種情況耻涛,然后,還需要硬件工程師確認(rèn)硬件瘟檩。當(dāng)然抹缕,硬件的確認(rèn)過(guò)程漫長(zhǎng)復(fù)雜,并且調(diào)試手段非常有限;嵌入式軟件的調(diào)試相對(duì)于硬件來(lái)講墨辛,成本和收效都會(huì)好一些卓研。所以往往需要嵌入式軟件人員花很多時(shí)間確認(rèn)軟件問(wèn)題,最后才懷疑硬件。作為嵌入式開發(fā)人員奏赘,能了解硬件的基本原理寥闪,結(jié)合軟件的工作原理,和硬件工程師一起配合實(shí)驗(yàn)定位錯(cuò)誤磨淌,是非常有效的辦法疲憋。
網(wǎng)上有些朋友經(jīng)常問(wèn)我一些問(wèn)題。有關(guān)于底層的知識(shí)梁只,其中不乏一些多處理器的問(wèn)題缚柳。關(guān)于多處理器的問(wèn)題,我也才疏學(xué)淺搪锣,說(shuō)來(lái)與大家討論一下喂击,關(guān)于嵌入式領(lǐng)域的 多CPU的應(yīng)用。嵌入式說(shuō)來(lái)說(shuō)去是計(jì)算機(jī)科學(xué)的應(yīng)用領(lǐng)域之一淤翔。既然是計(jì)算科學(xué)的應(yīng)用領(lǐng)域之一翰绊,那么要做好這個(gè)領(lǐng)域,必須有過(guò)硬的計(jì)算機(jī)理論知識(shí)旁壮。
首先多處理器分為好幾種监嗜,
處理器是同一型號(hào),大家完全一樣抡谐,通過(guò)一種通訊方式連接裁奇,如多口的RAM,rapidIO麦撵,千兆級(jí)以太網(wǎng)刽肠,或者PCI-E等;
處理器不同型號(hào)免胃,甚至架構(gòu)都完全不一樣音五。之間通過(guò)一種通訊方式連接,同上羔沙,如多口RAM躺涝、RapidIO等;
同一個(gè)芯片中集成了多個(gè)CPU扼雏。這幾個(gè)CPU什么都共享坚嗜,屬于比多口RAM還要緊耦合的系統(tǒng)。
為什么要用多處理器诗充?
大規(guī)模的并行運(yùn)算苍蔬;
想利用多個(gè)CPU的特點(diǎn),如DM642這樣的方案蝴蜓,應(yīng)用于復(fù)雜的視頻方案碟绑。想利用DSP的浮點(diǎn)計(jì)算能力,同時(shí)也使用ARM的事務(wù)計(jì)算能力;
單純的提高系統(tǒng)的性能蜈敢。
對(duì)于普通的應(yīng)用辜荠,提高系統(tǒng)性能是基本出發(fā)點(diǎn)。但嵌入式系統(tǒng)應(yīng)用多處理器并不是一個(gè)簡(jiǎn)單的事情抓狭。多處理器的軟件設(shè)計(jì)難度很大伯病,調(diào)試也是很大的問(wèn)題。
如果不采用操作系統(tǒng)處理否过,采用前后臺(tái)系統(tǒng)午笛。那么自己還要設(shè)計(jì)一個(gè)通信算法,還要設(shè)計(jì)一個(gè)結(jié)果整合系統(tǒng)苗桂。這樣的系統(tǒng)自己設(shè)計(jì)很多東西药磺,其中總線的可靠和容錯(cuò)設(shè)計(jì)至關(guān)重要。 所以可能的話煤伟,利用成熟穩(wěn)定的操作系統(tǒng)來(lái)支持多處理器可以減少不少的開發(fā)難度癌佩。然而,尋找這樣的一個(gè)操作系統(tǒng)并非易事便锨。
首先要明確自己的應(yīng)用围辙,需要線程進(jìn)程遷移嗎?需要處理器平衡嗎? 對(duì)于多處理器放案,如果不支持線程進(jìn)程遷移姚建,那也就談不上處理器任務(wù)的動(dòng)態(tài)平衡,不然只能事前指定好線程進(jìn)程運(yùn)行于哪個(gè)處理器吱殉。對(duì)于異構(gòu)型多處理器掸冤,線程遷移和進(jìn)程遷移并沒(méi)有多大的實(shí)際意義。對(duì)于追求利益的公司來(lái)說(shuō)友雳,目前還談不上實(shí)用價(jià)值稿湿。所以,遷移只限于對(duì)稱處理器沥阱。然而缎罢,對(duì)稱處理器也不是什么進(jìn)程可遷移。對(duì)于對(duì)稱處理器考杉,操作系統(tǒng)封裝好底層,讓用戶開發(fā)起來(lái)像是對(duì)一個(gè)CPU再做開發(fā)舰始,當(dāng)然不可能與單個(gè)CPU完全一致崇棠,但起碼減輕了許多難度。
很多朋友問(wèn)我RTEMS可以跑在x86這樣的CMP的多處理器上嗎丸卷?當(dāng)然枕稀。但是,設(shè)計(jì)起來(lái)又不同于普通的對(duì)稱多處理器。因?yàn)槲溃珻MP處理器上的CPU共享了許多東西凹联,中斷,內(nèi)存哆档,總線蔽挠,他們的編址空間基本上都是一致的。對(duì)于RTEMS這樣的RTOS來(lái)說(shuō)瓜浸,它采用的是異構(gòu)型的方式支持對(duì)稱處理器澳淑,即有幾個(gè)CPU就得跑幾個(gè)RTEMS。那么通訊顯得尤為重要插佛,多個(gè)RTEMS需要多個(gè)系統(tǒng)的TICK杠巡,那么TICK從哪里來(lái),CMP共享著很多資源雇寇,那么就要求氢拥,使用者必須為RTEMS手動(dòng)的指定中斷源,劃分內(nèi)存空間锨侯,這就造成了兄一,CMP上的多個(gè)CPU雖然都是跑RTEMS,但是想關(guān)于CPU的驅(qū)動(dòng)很多都是不一樣的识腿。這種緊耦合的系統(tǒng)是非常難辦的出革。
相對(duì)于CMP,同 種CPU組成的SMP就要簡(jiǎn)單一些渡讼,因?yàn)槿框?qū)動(dòng)都是一樣的骂束,可能會(huì)因?yàn)橥ㄐ欧绞降膯?wèn)題,通信驅(qū)動(dòng)要特殊處理一下成箫,但這會(huì)極大的減輕了開發(fā)的壓力和調(diào)試的難度展箱。總好比每個(gè)CPU一個(gè)Core蹬昌,那是要崩潰了混驰。特別是調(diào)試問(wèn)題,所以從經(jīng)濟(jì)角度的問(wèn)題考慮皂贩,還是比較喜歡這種多個(gè)相同的單個(gè)CPU組成的多處理器系統(tǒng)栖榨。
很多時(shí)候,對(duì)于那個(gè)異構(gòu)型的處理器明刷,當(dāng)然用RTEMS也可以輕松擺平婴栽,但是還是一個(gè)問(wèn)題,多個(gè)核心需要自己的RTEMS支持辈末,開發(fā)多有不便愚争。況且映皆,操作系統(tǒng)的調(diào)試還是比較復(fù)雜的。所以現(xiàn)實(shí)版的方案都是轰枝,異構(gòu)型處理器當(dāng)中負(fù)責(zé)事務(wù)運(yùn)算的處理器跑操作系統(tǒng)捅彻,而負(fù)責(zé)計(jì)算的處理器采用前后臺(tái)系統(tǒng),簡(jiǎn)單的通過(guò)共享內(nèi)存通訊鞍陨,響應(yīng)操作系統(tǒng)的計(jì)算請(qǐng)求步淹。這樣大大的減小了開發(fā)難度,反正操作系統(tǒng)把DSP當(dāng)作了個(gè)硬件的寄存器湾戳,寫幾個(gè)寄存器就能得到結(jié)果贤旷,或者是輸入一組天文一樣的數(shù)據(jù),得到一個(gè)復(fù)雜的結(jié)果砾脑。Anyway幼驶,總之這樣的反應(yīng)式的處理方式是絕大部分工程中采用的方式。就是簡(jiǎn)單韧衣、可靠盅藻、實(shí)用。
看來(lái)畅铭,嵌入式系統(tǒng)中的多處理器還是與應(yīng)用高度的相關(guān)