史丹利部落格: 編程秘笈篇：C語言高效編程的四大絕招

編程秘笈篇：C語言高效編程的四大絕招
編寫高效簡潔的C語言代碼，是許多軟體工程師追求的目標。本文就是針對編程工作中的一些體會和經驗做相關的闡述。

第一招：以空間換時間

電腦程式中最大的矛盾是空間和時間的矛盾，那麼，從這個角度出發逆向思維來考慮程式的效率問題，我們就有了解決問題的第1招--以空間換時間。比如說字串的賦值：

方法A：通常的辦法

#define LEN 32
char string1 [LEN];
memset (string1,0,LEN);
strcpy (string1,"This is a example!!"）;

方法B：

const char string2[LEN] ="This is a example!";
char * cp;
cp = string2 ;

使用的時候可以直接用指標來操作。
從上面的例子可以看出，A和B的效率是不能比的。在同樣的存儲空間下，B直接使用指標就可以操作了，而A需要調用兩個字元函數才能完成。B的缺點在於靈活性沒有A好。在需要頻繁更改一個字串內容的時候，A具有更好的靈活性；如果採用方法B，則需要預存許多字串，雖然佔用了大量的記憶體，但是獲得了程式執行的高效率。
如果系統的即時性要求很高，記憶體還有一些，那我推薦你使用該招數。該招數的變招--使用巨集函數而不是函數。舉例如下：
方法C：

#define bwMCDR2_ADDRESS 4
#define bsMCDR2_ADDRESS 17
int BIT_MASK(int __bf) 
{
　return ((1U << (bw ## __bf)) - 1)
<< (bs ## __bf);
}
void SET_BITS(int __dst, 
int __bf, int __val)
{
　__dst = ((__dst) & ~(BIT_MASK(__bf))) |
\
　(((__val) << (bs ## __bf)) 
& (BIT_MASK(__bf))))
}

SET_BITS(MCDR2, MCDR2_ADDRESS,
RegisterNumber);

方法D：

#define bwMCDR2_ADDRESS 4
#define bsMCDR2_ADDRESS 17
#define bmMCDR2_ADDRESS BIT_MASK(MCDR2_ADDRESS)
#define BIT_MASK(__bf) 
(((1U << (bw ## __bf)) - 1)
<< (bs ## __bf))
#define SET_BITS(__dst, __bf, __val)
\
((__dst) = ((__dst) & ~(BIT_MASK(__bf)))
| \
(((__val) << (bs ## __bf))
& (BIT_MASK(__bf))))

SET_BITS(MCDR2, MCDR2_ADDRESS,
RegisterNumber);

函數和巨集函數的區別就在於，巨集函數佔用了大量的空間，而函數佔用了時間。大家要知道的是，函數調用是要使用系統的棧來保存資料的，如果編譯器裏有棧檢查選項，一般在函數的頭會嵌入一些彙編語句對當前棧進行檢查；同時，CPU也要在函數調用時保存和恢復當前的現場，進行壓棧和彈棧操作，所以，函數調用需要一些CPU時間。
而巨集函數不存在這個問題。巨集函數僅僅作為預先寫好的代碼嵌入到當前程式，不會產生函數調用，所以僅僅是佔用了空間，在頻繁調用同一個巨集函數的時候，該現象尤其突出。
D方法是我看到的最好的置位元操作函數，是ARM公司源碼的一部分，在短短的三行內實現了很多功能，幾乎涵蓋了所有的位操作功能。C方法是其變體，其中滋味還需大家仔細體會。

第二招：數學方法解決問題

現在我們演繹高效C語言編寫的第二招--採用數學方法來解決問題。數學是電腦之母，沒有數學的依據和基礎，就沒有電腦的發展，所以在編寫程式的時候，採用一些數學方法會對程式的執行效率有數量級的提高。舉例如下，求 1~100的和。

方法E：

int I , j;
for (I = 1 ;I<=100; I ++）
{
　j += I;
}

方法F

int I;
I = (100 * (1+100)) / 2

這個例子是我印象最深的一個數學用例，是我的電腦啟蒙老師考我的。當時我只有小學三年級，可惜我當時不知道用公式 N×（N+1）/ 2 來解決這個問題。方法E迴圈了100次才解決問題，也就是說最少用了100個賦值，100個判斷，200個加法（I和j）；而方法F僅僅用了1個加法，1次乘法，1次除法。效果自然不言而喻。所以，現在我在編程式的時候，更多的是動腦筋找規律，最大限度地發揮數學的威力來提高程式運行的效率。
第三招：使用位操作
實現高效的C語言編寫的第三招——使用位操作。減少除法和取模的運算。在電腦程式中資料的位元是可以操作的最小資料單位，理論上可以用"位運算"來完成所有的運算和操作。一般的位元操作是用來控制硬體的，或者做資料變換使用，但是，靈活的位操作可以有效地提高程式運行的效率。舉例如下：
方法G

int I,J;
I = 257 /8;
J = 456 % 32;

方法H

int I,J;
I = 257 >>3;
J = 456 - (456 >> 4 << 4);

在字面上好像H比G麻煩了好多，但是，仔細查看產生的彙編代碼就會明白，方法G調用了基本的取模函數和除法函數，既有函數調用，還有很多彙編代碼和寄存器參與運算；而方法H則僅僅是幾句相關的彙編，代碼更簡潔，效率更高。當然，由於編譯器的不同，可能效率的差距不大，但是，以我目前遇到的MS C ,ARM C 來看，效率的差距還是不小。相關彙編代碼就不在這裏列舉了。
運用這招需要注意的是，因為CPU的不同而產生的問題。比如說，在PC上用這招編寫的程式，並在PC上調試通過，在移植到一個16位機平臺上的時候，可能會產生代碼隱患。所以只有在一定技術進階的基礎下才可以使用這招。
第四招：彙編嵌入
高效C語言編程的必殺技，第四招——嵌入彙編。"在熟悉組合語言的人眼裏，C語言編寫的程式都是垃圾"。這種說法雖然偏激了一些，但是卻有它的道理。組合語言是效率最高的電腦語言，但是，不可能靠著它來寫一個作業系統吧?所以，為了獲得程式的高效率，我們只好採用變通的方法--嵌入彙編，混合編程。舉例如下，將陣列一賦值給陣列二,要求每一位元組都相符。
char string1[1024],string2[1024];
方法I

int I;
for (I =0 ;I<1024;I++)
　*(string2 + I) = *(string1 + I)

方法J

#ifdef _PC_
int I;
for (I =0 ;I<1024;I++)
*(string2 + I) = *(string1 + I);
#else
#ifdef _ARM_
__asm
{ 
　MOV R0,string1
　MOV R1,string2
　MOV R2,#0
loop:
　LDMIA R0!, [R3-R11]
　STMIA R1!, [R3-R11]
　ADD R2,R2,#8
　CMP R2, #400
　BNE loop
}
#endif

方法I是最常見的方法，使用了1024次迴圈；方法J則根據平臺不同做了區分，在ARM平臺下，用嵌入彙編僅用128次迴圈就完成了同樣的操作。這裏有朋友會說，為什麼不用標準的記憶體拷貝函數呢?這是因為在源資料裏可能含有資料為0的位元組，這樣的話，標準庫函數會提前結束而不會完成我們要求的操作。這個常式典型應用於LCD資料的拷貝過程。根據不同的CPU，熟練使用相應的嵌入彙編，可以大大提高程式執行的效率。
雖然是必殺技，但是如果輕易使用會付出慘重的代價。這是因為，使用了嵌入彙編，便限制了程式的可攜性，使程式在不同平臺移植的過程中，臥虎藏龍，險象環生！同時該招數也與現代軟體工程的思想相違背，只有在迫不得已的情況下才可以採用。

史丹利部落格

2007年4月3日星期二

編程秘笈篇：C語言高效編程的四大絕招

沒有留言:

一個小故事讓我們明白資金流通的意義

搜尋此網誌

2007年4月3日 星期二

編程秘笈篇：C語言高效編程的四大絕招

沒有留言:

一個小故事讓我們明白資金流通的意義

2007年4月3日星期二