硬件乘法器不占用CPU周期,有硬件實現,速度比軟件實現的乘法速度快很多。msp430f14x、msp430f16x中都含有硬件乘法器模塊,方便用戶需要速度的時候使用。
- 硬件介紹:在MSP430系列單片機中,硬件乘法器是外圍模塊,而不是CPU內核的一部分;所以它的活動與否與CPU的活動與否無關,它的寄存器和其他的外圍寄存器一樣通過CPU指令讀寫。
硬件乘法器模塊支持一下功能:無符號乘法、有符號乘法、無符號乘加、有符號乘加;可以支持16*16 16*8 8*16 8*8bits的乘法。
硬件乘法器的模塊框圖如下:

硬件乘法器模塊的四種操作類型(無符號乘法、有符號乘法、無符號乘加、有符號乘加)是由寫入的第一個操作數的位置決定的。這個模塊有兩個操作數寄存器:OP1和OP2、三個結果寄存器RESLO, RESHI, 和SUMEXT。RESLO寄存器存儲結果的低字(低16位);RESHI寄存器存儲結果的高字(高16位);SUMEXT寄存器存儲結果的有關信息。結果在3個時鐘周期后即可完成;寫入OP2后的下一條指令即可讀取結果,有一種情況例外:用間接尋址方式訪問結果。用間接尋址方式訪問結果時,讀取結果之前需要有一條NOP指令。
操作數OP1有四個地址(MPY:0130h MPYS:0132h MAC:0134h MACS:0136h),這四個寄存器用來選擇乘法的操作模式。寫入第一個操作數寄存器決定用哪種操作:無符號 用符號等,但是不啟動相乘操作;寫入第二個操作數寄存器啟動相乘的操作。計算完成后結果存入寄存器RESLO,RESHI, 和SUMEXT。
操作數1的四個地址對應的操作:
OP1 Address Register Name Operation0130h MPY Unsigned multiply(無符號乘法)0132h MPYS Signed multiply(有符號乘法)0134h MAC Unsigned multiply accumulate(無符號乘加)0136h MACS Signed multiply accumulate(有符號乘加)四種操作模式下高位結果寄存器的內容如下:
Mode RESHI ContentsMPY Upper 16-bits of the resultMPYS The MSB is the sign of the result. The remaining bits are the upper 15-bits of the result. Two’s complement notation is usedfor the result.MAC Upper 16-bits of the resultMACS Upper 16-bits of the result. Two’s complement notation is used for the result.四種操作模式SUMEXT 寄存器的內容:
Mode SUMEXTMPY SUMEXT is always 0000hMPYS SUMEXT contains the extended sign of the result 00000h Result was positive or zero 0FFFFh Result was negativeMAC SUMEXT contains the carry of the result 0000h No carry for result 0001h Result has a carryMACS SUMEXT contains the extended sign of the result 00000h Result was positive or zero 0FFFFh Result was negative連續乘法運算時,如果操作數1不需改變就可以運算,則可以不需要重新寫入和以保存內容相同的數;但OP2必須重新寫入以啟動乘法運算。
MACS Underflow and Overflow(MACS時的上溢和下溢):硬件乘法器不檢測有符號乘加時運算結果的上溢出和下溢出。結果的正數范圍:0到7FFF FFFFh;負數范圍:0FFFF FFFFh到8000 0000h。下溢出是兩個負數的和結果寄存器得到的是正數,上溢出是兩個正數的和結果寄存器得到的是負數。SUMEXT寄存器存儲有結果的符號,可以根據它判斷是否溢出(0000h 負數和 則上溢 0FFFFh 正數和 則下溢)。使用時 程序必須合適的檢測、處理MACS的溢出情況。
程序示例(用戶指南上給出的匯編示例):
所有乘數模式的例子如下。所有的8x8模式使用的寄存器的絕對地址,因為匯編器將不允許B訪問到字寄存器時使用標準定義的文件標簽。
; 16x16 Unsigned MultiplyMOV #01234h,&MPY ; Load first operandMOV #05678h,&OP2 ; Load second operand; ... ; Process results; 8x8 Unsigned Multiply. Absolute addressing.MOV.B #012h,&0130h ; Load first operandMOV.B #034h,&0138h ; Load 2nd operand; ... ; Process results; 16x16 Signed MultiplyMOV #01234h,&MPYS ; Load first operandMOV #05678h,&OP2 ; Load 2nd operand; ... ; Process results; 8x8 Signed Multiply. Absolute addressing.MOV.B #012h,&0132h ; Load first operandSXT &MPYS ; Sign extend first operandMOV.B #034h,&0138h ; Load 2nd operandSXT &OP2 ; Sign extend 2nd operand; (triggers 2nd multiplication); ... ; Process results; 16x16 Unsigned Multiply AccumulateMOV #01234h,&MAC ; Load first operandMOV #05678h,&OP2 ; Load 2nd operand; ... ; Process results; 8x8 Unsigned Multiply Accumulate. Absolute addressingMOV.B #012h,&0134h ; Load first operandMOV.B #034h,&0138h ; Load 2nd operand; ... ; Process results; 16x16 Signed Multiply AccumulateMOV #01234h,&MACS ; Load first operandMOV #05678h,&OP2 ; Load 2nd operand; ... ; Process results; 8x8 Signed Multiply Accumulate. Absolute addressingMOV.B #012h,&0136h ; Load first operandSXT &MACS ; Sign extend first operandMOV.B #034h,R5 ; Temp. location for 2nd operandSXT R5 ; Sign extend 2nd operandMOV R5,&OP2 ; Load 2nd operand; ... ; Process results上面的程序雖然和標準的匯編差異比較大,但是有一定匯編基礎的人還是很容易就能夠看懂。這里的程序給出了多種方式寫入操作數寄存器。
間接尋址結果寄存器時,在寫入OP2操作數啟動乘法后,至少需要一個指令的延遲后才能訪問結果寄存器RESLO等;直接尋址時可以寫入OP2后,下一條指令即可讀取結果。示例程序(匯編):
; Access multiplier results with indirect addressingMOV #RESLO,R5 ; RESLO address in R5 for indirectMOV &OPER1,&MPY ; Load 1st operandMOV &OPER2,&OP2 ; Load 2nd operandNOP ; Need one cycle 寫入兩個操作數 乘法運算開始后 需要一個NOPMOV @R5+,&xxx ; Move RESLOMOV @R5,&xxx ; Move RESHI如果在寫入OP1和寫入OP2之間產生了中斷,中斷響應后,源操作數的計算模式丟失;運算結果不確定。為了避免這種情況的發生,在寫入操作數時禁止中斷或在中斷響應函數中不使用硬件乘法器。如:
; Disable interrupts before using the hardware multiplierDINT ; Disable interruptsNOP ; Required for DINTMOV #xxh,&MPY ; Load 1st operandMOV #xxh,&OP2 ; Load 2nd operandEINT ; Interrupts may be enable before; Process results硬件部分就說這么多了,有什么不大明白的可以參考用戶指南。
- 使用示例:我的程序僅僅是用C語言演示硬件乘法器的使用。程序主要內容如下:
#include <msp430x16x.h>/***************************************************************************** 名 稱:main主程序* 功 能:硬件乘法器程序庫使用演示* 入口參數:無* 出口參數:無****************************************************************************/void main( void ){ // Stop watchdog timer to prevent time out reset WDTCTL = WDTPW + WDTHOLD; ClkInit(); /*把 硬件乘法器的寄存器放到watch窗口 觀察是否變化 int a = 0; a= 5*6; */ //測試無符號乘法 MPY = 65535; OP2 = 2; //有符號乘法 MPYS = 65535; OP2 = 2; //無符號乘加 MAC = 65535; OP2 = 2; //有符號乘加 MACS = 65535; OP2 = 2; LPM0;}程序演示了4中乘法模式:使用時單步調試,觀察硬件乘法器的有關寄存器。如:

硬件乘法器運算速度很快,只需3個時鐘周期;這里IAR單步調試時,OP2賦值結束,在watch窗口馬上就可以看到運算結果。其他三種模式類似。
注釋掉的這部分是我用來檢測IAR編譯程序是否使用硬件乘法器進行測試。默認情況下,乘法應該是用硬件乘法器運算的。默認的設置如下:

硬件乘法器是選中的,這時應該是使用硬件乘法器的,但是我的調試結果顯示它沒有使用硬件乘法器,截圖下:

運行后乘法器相關位沒有對應變化,如果使用的話,應該變化。
硬件乘法器不選中時,寄存器也沒有相應變化,從這看,IAR沒有使用硬件乘法器;也許程序沒有優化太多或是debug版本不使用硬件乘法器。
如果需要直接使用硬件乘法器,有必要時把設置的硬件乘法器去掉,以防沖突。
下面是直接使用硬件乘法器的一個實例:
#include "msp430x16x.h"unsigned int Result[7];unsigned char Data1[7];unsigned char Data2[7];void main(void){ unsigned char i; WDTCTL = WDTPW + WDTHOLD; // 關看門狗 for(i=0; i<7; i++) { Data1 = 10 * i; // 對兩數組賦值 Data2 = 25 * i; } for(i=0; i<7; i++) { MPY = Data1; OP2 = Data2; _NOP(); // 延遲 _NOP(); _NOP(); Result = RESLO; // 保存結果,由于是8×8型,所以未用到RESHI; }}這個程序用無符號乘法運算,結果存入結果數組中。值的注意的是程序中的3個NOP,這里NOP不需要,根據頭文件推測,IAR編譯器應該使用的是直接尋址方式,可以不要。如果不太放心,一個NOP即可,即便用的是間接尋址,一個NOP的延遲已經足夠。
硬件乘法器一般不會像上面的程序那么使用,如果這樣就太浪費了;還不如直接用 *操作符來的簡便;硬件乘法器主要用來對時間要求苛刻的情況。如:用430進行數字濾波,快速傅里葉變換等。ti有一篇應用筆記介紹的就是用msp430f169實現數字濾波方案。 硬件乘法器就到這里了,希望對大家有所幫助。有什么不足之處,歡迎拍磚討論。
|