引言:
編寫高效簡潔的c語言代碼,是許多軟件工程師追求的目標。本文就工作中的一些體會和經驗做相關的闡述,不對的地方請各位指教。
第一招:以空間換時間
計算機程序中最大的矛盾是空間和時間的矛盾,那么,從這個角度出發逆向思維來考慮程序的效率問題,我們就有了解決問題的第1招--以空間換時間。
例如:字符串的賦值。
方法a:通常的辦法:
#define len 32
char string1 [len];
memset (string1,0,len);
strcpy (string1,"this is a example!!");
方法b:
const char string2[len] ="this is a example!";
char * cp;
cp = string2 ;
使用的時候可以直接用指針來操作。
從上面的例子可以看出,a和b的效率是不能比的。在同樣的存儲空間下,b直接使用指針就可以操作了,而a需要調用兩個字符函數才能完成。b的缺點在于靈活性沒有a好。在需要頻繁更改一個字符串內容的時候,a具有更好的靈活性;如果采用方法b,則需要預存許多字符串,雖然占用了大量的內存,但是獲得了程序執行的高效率。
如果系統的實時性要求很高,內存還有一些,那我推薦你使用該招數。該招數的變招--使用宏函數而不是函數。舉例如下:
方法c:
#define bwmcdr2_address 4
#define bsmcdr2_address 17
int bit_mask(int __bf)
{
return ((1u << (bw ## __bf)) - 1) << (bs ## __bf);
}
void set_bits(int __dst, int __bf, int __val)
{
__dst = ((__dst) & ~(bit_mask(__bf))) |
(((__val) << (bs ## __bf)) & (bit_mask(__bf))))
}
set_bits(mcdr2, mcdr2_address, registernumber);
方法d:
#define bwmcdr2_address 4
#define bsmcdr2_address 17
#define bmmcdr2_address bit_mask(mcdr2_address)
#define bit_mask(__bf) (((1u << (bw ## __bf)) - 1) << (bs ## __bf))
#define set_bits(__dst, __bf, __val)
((__dst) = ((__dst) & ~(bit_mask(__bf))) |
(((__val) << (bs ## __bf)) & (bit_mask(__bf))))
set_bits(mcdr2, mcdr2_address, registernumber);
函數和宏函數的區別就在于,宏函數占用了大量的空間,而函數占用了時間。大家要知道的是,函數調用是要使用系統的棧來保存數據的,如果編譯器里有棧檢查選項,一般在函數的頭會嵌入一些匯編語句對當前棧進行檢查;同時,cpu也要在函數調用時保存和恢復當前的現場,進行壓棧和彈棧操作,所以,函數調用需要一些cpu時間。而宏函數不存在這個問題。宏函數僅僅作為預先寫好的代碼嵌入到當前程序,不會產生函數調用,所以僅僅是占用了空間,在頻繁調用同一個宏函數的時候,該現象尤其突出。
d方法是我看到的最好的置位操作函數,是arm公司源碼的一部分,在短短的三行內實現了很多功能,幾乎涵蓋了所有的位操作功能。c方法是其變體,其中滋味還需大家仔細體會。
第二招:數學方法解決問題
現在我們演繹高效c語言編寫的第二招--采用數學方法來解決問題。數學是計算機之母,沒有數學的依據和基礎,就沒有計算機的發展,所以在編寫程序的時候,采用一些數學方法會對程序的執行效率有數量級的提高。舉例如下,求 1~100的和。
方法e:
int i , j;
for (i = 1 ;i<=100; i ++)
{
j += i;
}
方法f:
int i;
i = (100 * (1+100)) / 2
這個例子是我印象最深的一個數學用例,是我的計算機啟蒙老師考我的。當時我只有小學三年級,可惜我當時不知道用公式 n×(n+1)/ 2 來解決這個問題。方法e循環了100次才解決問題,也就是說最少用了100個賦值,100個判斷,200個加法(i和j);而方法f僅僅用了1個加法,1次乘法,1次除法。效果自然不言而喻。所以,現在我在編程序的時候,更多的是動腦筋找規律,最大限度地發揮數學的威力來提高程序運行的效率。
第三招:使用位操作
實現高效的c語言編寫的第三招--使用位操作。減少除法和取模的運算。在計算機程序中,數據的位是可以操作的最小數據單位,理論上可以用"位運算"來完成所有的運算和操作。一般的位操作是用來控制硬件的,或者做數據變換使用,但是,靈活的位操作可以有效地提高程序運行的效率。舉例如下:
方法g:
int i,j;
i = 257 /8;
j = 456 % 32;
方法h:
int i,j;
i = 257 >>3;
j = 456 - (456 >> 4 << 4);
在字面上好像h比g麻煩了好多,但是,仔細查看產生的匯編代碼就會明白,方法g調用了基本的取模函數和除法函數,既有函數調用,還有很多匯編代碼和寄存器參與運算;而方法h則僅僅是幾句相關的匯編,代碼更簡潔,效率更高。當然,由于編譯器的不同,可能效率的差距不大,但是,以我目前遇到的ms c ,arm c 來看,效率的差距還是不小。相關匯編代碼就不在這里列舉了。
運用這招需要注意的是,因為cpu的不同而產生的問題。比如說,在pc上用這招編寫的程序,并在pc上調試通過,在移植到一個16位機平臺上的時候,可能會產生代碼隱患。所以只有在一定技術進階的基礎下才可以使用這招。
第四招:匯編嵌入
高效c語言編程的必殺技,第四招--嵌入匯編。"在熟悉匯編語言的人眼里,c語言編寫的程序都是垃圾"。這種說法雖然偏激了一些,但是卻有它的道理。匯編語言是效率最高的計算機語言,但是,不可能*著它來寫一個操作系統吧?所以,為了獲得程序的高效率,我們只好采用變通的方法 --嵌入匯編,混合編程。舉例如下,將數組一賦值給數組二,要求每一字節都相符。
char string1[1024],string2[1024];
方法i:
int i;
for (i =0 ;i<1024;i++)
*(string2 + i) = *(string1 + i)
方法j:
#ifdef _pc_
int i;
for (i =0 ;i<1024;i++)
*(string2 + i) = *(string1 + i);
#else
#ifdef _arm_
__asm
{
mov r0,string1
mov r1,string2
mov r2,#0
loop:
ldmia r0!, [r3-r11]
stmia r1!, [r3-r11]
add r2,r2,#8
cmp r2, #400
bne loop
}
#endif
方法i是最常見的方法,使用了1024次循環;方法j則根據平臺不同做了區分,在arm平臺下,用嵌入匯編僅用128次循環就完成了同樣的操作。這里有朋友會說,為什么不用標準的內存拷貝函數呢?這是因為在源數據里可能含有數據為0的字節,這樣的話,標準庫函數會提前結束而不會完成我們要求的操作。這個例程典型應用于lcd數據的拷貝過程。根據不同的cpu,熟練使用相應的嵌入匯編,可以大大提高程序執行的效率。
雖然是必殺技,但是如果輕易使用會付出慘重的代價。這是因為,使用了嵌入匯編,便限制了程序的可移植性,使程序在不同平臺移植的過程中,臥虎藏龍,險象環生!同時該招數也與現代軟件工程的思想相違背,只有在迫不得已的情況下才可以采用。切記,切記。
|