国产强伦姧在线观看无码,中文字幕99久久亚洲精品,国产精品乱码在线观看,色桃花亚洲天堂视频久久,日韩精品无码观看视频免费

      您現(xiàn)在的位置:智能制造網(wǎng)>技術(shù)中心>基于ARM的除法運(yùn)算優(yōu)化策略

      直播推薦

      更多>

      企業(yè)動(dòng)態(tài)

      更多>

      推薦展會(huì)

      更多>

      基于ARM的除法運(yùn)算優(yōu)化策略

      2009年03月24日 17:51:37人氣:974來源:浙江啟揚(yáng)智能科技有限公司

       與傳統(tǒng)的4/8位單片機(jī)相比,ARM的性能和處理能力是遙遙的。但與之相應(yīng),ARM的系統(tǒng)設(shè)計(jì)復(fù)雜度和難度,較之傳統(tǒng)的設(shè)計(jì)方法也大大提升了,同時(shí)也大大拓展了針對(duì)ARM芯片特性進(jìn)行優(yōu)化的空間,例如針對(duì)指令流水線的優(yōu)化、針對(duì)寄存器分配進(jìn)行的優(yōu)化等。 

             ARM在硬件上不支持除法指令,編譯器是通過調(diào)用C庫(kù)函數(shù)來實(shí)現(xiàn)除法運(yùn)算的,有許多不同類型的除法程序來適應(yīng)不同的除數(shù)和被除數(shù)。但直接利用C庫(kù)函數(shù)中的標(biāo)準(zhǔn)整數(shù)除法程序,根據(jù)執(zhí)行情況和輸入操作數(shù)的范圍,要花費(fèi)20~100個(gè)周期,消耗較多的軟件運(yùn)行時(shí)間。在實(shí)時(shí)嵌入式應(yīng)用中,對(duì)時(shí)間參數(shù)較為敏感,故可以考慮如何優(yōu)化避免除法消耗過多的CPU運(yùn)行時(shí)間。 

             除法和模運(yùn)算(/和%)執(zhí)行起來比較慢,所以應(yīng)盡量避免使用。但是,除數(shù)是常數(shù)的除法運(yùn)算和用同一個(gè)除數(shù)的重復(fù)除法,執(zhí)行效率會(huì)比較高。在ARM中,可以利用單條MUL指令實(shí)現(xiàn)乘法操作。本文將闡述如何用乘法運(yùn)算代替除法運(yùn)算,以及如何使除法的次數(shù)zui少化。 

      1 避免除法運(yùn)算 

             在非嵌入式領(lǐng)域,因?yàn)镃PU運(yùn)算速度快、存儲(chǔ)器容量大,除法操作通常都是不加考慮直接使用的。但在嵌入式領(lǐng)域,首先需要考慮的是這些除法操作是否是必須的。以對(duì)環(huán)形緩沖區(qū)操作為例,經(jīng)常要用到除法,其實(shí)*可以避免這些除法運(yùn)算。 

             假定有一個(gè)buffer_size大小的環(huán)形緩沖區(qū),如圖1所示,0ffset目前所在的位置。通過increment字節(jié)來增加offset的值,一般是這樣寫的:

      0ffset=(Offset+increment)%buffer_size;

      效率更高的寫法是:

      offset+=increment;

      if(offset>=buffer_size){

      offset一=buffer_size;




             *種寫法要花費(fèi)50個(gè)周期,而第二種因?yàn)闆]有除法運(yùn)算,只須花費(fèi)3個(gè)周期。這里假定increment
             如果不能避免除法運(yùn)算,那么就應(yīng)盡量使除數(shù)和被除數(shù)是無符號(hào)的整數(shù)。有符號(hào)的除法程序執(zhí)行起來更加慢,因?yàn)樗鼈兿纫〉贸龜?shù)和被除數(shù)的值,再調(diào)用無符號(hào)除法運(yùn)算,zui后再確定結(jié)果的符號(hào)。

      2 充分利用商和余數(shù) 

             許多C語(yǔ)言庫(kù)中的除法函數(shù)返回商和余數(shù)。換句話說,每一個(gè)除法運(yùn)算,余數(shù)是可以無償?shù)玫降?,反之亦然。例如,要在屏幕緩沖區(qū)找到偏移量為offset的屏幕位置(x,y),可以這樣寫:

      typeclef struct{

      int x;

      int y;

      }point;

      point getxy_v1(unsigned int offset,unslgned int bytes_per_line){

      point p;

      p.y=offset/lt)ytes_per_line;

      p.x=offset - p.y* bytcs_per_line;

      return p;

             這里,似乎對(duì)p.x使用減法和乘法,少了一次除法運(yùn)算;但是,實(shí)際上使用模運(yùn)算或者取余操作效率更高,對(duì)

      getxy_vl改進(jìn)如下:

      point getxy_v2(unsigned int offset,unsigned int bytes_per_line){

      point P;

      P.x=offset%bytes_per_1ine;

      P.y=offset/bytes_per_line;

      return P; 


             從下面編譯器的輸出結(jié)果可以看到,只有一次除法調(diào)用。實(shí)際上,這個(gè)程序要比前面的getxy_vl少4條指令(注意,并不是對(duì)所有的編譯器和C庫(kù)都有這樣的結(jié)果)。getxy_v2

      STMFD r13!,{r4,r14};保存r4,lr人堆棧

      MOV r4,rO ;賦值后r4保存的為點(diǎn)P基址

      MOV rO,r2 ;rO=bytes_per_line

      BL rt_udiv ;調(diào)用無符號(hào)除法例程

      (r0.;r1)=(rl/rO,rl%rO)

      STR r0,[r4,#4] ;P.y=offset/bytes_per_line

      STR rl,[r4,#o] ;P.x=offset%bytes_per_line

      LDMFD r13!,(r4,pc);恢復(fù)上下文,返回

      3 把除法轉(zhuǎn)換為乘法 

             在程序中,同一個(gè)除數(shù)的除法經(jīng)常會(huì)出現(xiàn)很多次。在前面的例子中,bytes_per_line的值在整個(gè)程序中都是固定不變的。又如3到2笛卡爾坐標(biāo)變換,其中就使用了同一個(gè)除數(shù)兩次:

      (x,Y,x)→(x/z,y/z) 

             這種情況下,使用cache指令中的值1/z,并使用1/z的乘法來代替除法運(yùn)算,效率會(huì)更高。另外,要盡可能使用int類型的運(yùn)算,避免使用浮點(diǎn)運(yùn)算。 

             下面將更加偏重于從數(shù)學(xué)和理論的角度分析,把重復(fù)除法轉(zhuǎn)換成乘法運(yùn)算。 

             下面來區(qū)分?jǐn)?shù)學(xué)意義上的除法和整型除法運(yùn)算:

      ◇n/d,即整數(shù)n被分成整數(shù)d份,結(jié)果趨向于O(與C語(yǔ)言相同);

      ◇n%d,即n被d除之后的余數(shù),就是n--d(n/d);

      ◇n/d=n·d-1,即真正數(shù)學(xué)意義上的n被d除。 


             當(dāng)使用整型除法時(shí),zui容易估算d-1值的方法是計(jì)算232/d。然后,就可以估算n/d為:

      (n(232/d))/232 (1) 


             在執(zhí)行n的乘法時(shí),需要到64位。對(duì)于這種方法,會(huì)出現(xiàn)如下問題:

      ◇為了計(jì)算232/d,由于一個(gè)unsigned int類型的數(shù)據(jù)放不下232,編譯器要使用64位long long類型的數(shù),而且必須除法為(1 ull<<32)/d。這種64位的除法比32位的除法執(zhí)行起來要慢得多。

      ◇如果d碰巧是1,那么232/d就不再適合于un—signed int數(shù)據(jù)類型。 


             上面的做法似乎很好,而且解決了這兩個(gè)問題。那么,再來看一下用(232一1)/d代替232/d。



      s=0xffffffff ul/d (2) 

             以上n/d-2,q,n/d+1為整數(shù)值,所以可得q=n/d或q=(n/d)一1,即初步估計(jì)的結(jié)果q與正確值n/d有可能存在偏差1??梢园l(fā)現(xiàn),通過計(jì)算余數(shù)r=n—q·d(O≤r<2d)是比較容易的。下面的代碼糾正了這個(gè)結(jié)果:

      r=n--q*d;/*初步估計(jì)結(jié)果余數(shù)r的范圍為O≤r<2d*/

      if(r>=d){/*若需要校正*/

      r-=d;/*校正r,使O≤r
      n++;/*相應(yīng)商加1進(jìn)行校正*/

      } /*得正確結(jié)果q=n/d和r=n%d*/ 


             下面給出一個(gè)實(shí)例,用上面的算法完成了N個(gè)元素的數(shù)組被d除。首先,計(jì)算上面所說的s值,然后用乘以5來代替每個(gè)被d除的除法。64位的乘是很容易實(shí)現(xiàn)的,因?yàn)锳RM中有一條指令UMULL,可以進(jìn)行2個(gè)32位數(shù)相乘,給出一個(gè)64位的結(jié)果。

      void scale(

      unsigned int*dest; /*目的數(shù)據(jù)*/

      unsigned int*src; /*源數(shù)據(jù)*/

      unsignedInt d; /*分母d*/

      urlslglaedInt N;) /*數(shù)據(jù)長(zhǎng)度*/

      {

      unsigned int s=0xFFFFFFFFu/d;

      do{

      unsigned int n,q,r;

      n=*(src++);

      q=(urtslgrted int)(((unsined tong long)n*s)>>32);

      r=n*d;

      if(r>=d){ /*若需要對(duì)商進(jìn)行校正*/

      q++;

      }

      *(dest++)=q;

      }while(一一N);



             這里假定除數(shù)和被除數(shù)都是32位的無符號(hào)整數(shù)。當(dāng)然,使用32位乘法進(jìn)行16位的無符號(hào)數(shù)計(jì)算,或者使用1 28位乘法進(jìn)行64位數(shù)計(jì)算,運(yùn)算規(guī)則是一樣的??梢詾樘囟ǖ臄?shù)據(jù)選擇zui窄的運(yùn)算寬度。如果數(shù)據(jù)是16位的,那么就設(shè)置s=(216一1)/d,然后用標(biāo)準(zhǔn)的整型乘法來求值q。

      4 結(jié) 論 

             在嵌入式軟件編程中,為了節(jié)省CPU運(yùn)行時(shí)間,應(yīng)盡可能避免使用除法。對(duì)環(huán)形緩沖區(qū)的處理可以不用除法。如果不能避免除法運(yùn)算,那么應(yīng)盡可能使用除法程序同時(shí)產(chǎn)生商n/d和余數(shù)n%d的好處。對(duì)于重復(fù)對(duì)一除數(shù)d的除法.預(yù)先計(jì)算好s=(2k一1)/d,用乘以s的2k位乘法來代替除以d的k位無符號(hào)整數(shù)除法,可大大減少由于直接使用除法操作引入的指令周期數(shù)。

      全年征稿/資訊合作 聯(lián)系郵箱:1271141964@qq.com

      免責(zé)聲明

      • 凡本網(wǎng)注明"來源:智能制造網(wǎng)"的所有作品,版權(quán)均屬于智能制造網(wǎng),轉(zhuǎn)載請(qǐng)必須注明智能制造網(wǎng),http://www.towegas.com。違反者本網(wǎng)將追究相關(guān)法律責(zé)任。
      • 企業(yè)發(fā)布的公司新聞、技術(shù)文章、資料下載等內(nèi)容,如涉及侵權(quán)、違規(guī)遭投訴的,一律由發(fā)布企業(yè)自行承擔(dān)責(zé)任,本網(wǎng)有權(quán)刪除內(nèi)容并追溯責(zé)任。
      • 本網(wǎng)轉(zhuǎn)載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品來源,并自負(fù)版權(quán)等法律責(zé)任。
      • 如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

      <
      更多 >

      工控網(wǎng)機(jī)器人儀器儀表物聯(lián)網(wǎng)3D打印工業(yè)軟件金屬加工機(jī)械包裝機(jī)械印刷機(jī)械農(nóng)業(yè)機(jī)械食品加工設(shè)備制藥設(shè)備倉(cāng)儲(chǔ)物流環(huán)保設(shè)備造紙機(jī)械工程機(jī)械紡織機(jī)械化工設(shè)備電子加工設(shè)備水泥設(shè)備海洋水利裝備礦冶設(shè)備新能源設(shè)備服裝機(jī)械印染機(jī)械制鞋機(jī)械玻璃機(jī)械陶瓷設(shè)備橡塑設(shè)備船舶設(shè)備電子元器件電氣設(shè)備


      我要投稿
      • 投稿請(qǐng)發(fā)送郵件至:(郵件標(biāo)題請(qǐng)備注“投稿”)1271141964.qq.com
      • 聯(lián)系電話0571-89719789
      工業(yè)4.0時(shí)代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務(wù)平臺(tái)
      智能制造網(wǎng)APP

      功能豐富 實(shí)時(shí)交流

      智能制造網(wǎng)小程序

      訂閱獲取更多服務(wù)

      微信公眾號(hào)

      關(guān)注我們

      抖音

      智能制造網(wǎng)

      抖音號(hào):gkzhan

      打開抖音 搜索頁(yè)掃一掃

      視頻號(hào)

      智能制造網(wǎng)

      公眾號(hào):智能制造網(wǎng)

      打開微信掃碼關(guān)注視頻號(hào)

      快手

      智能制造網(wǎng)

      快手ID:gkzhan2006

      打開快手 掃一掃關(guān)注
      意見反饋
      關(guān)閉
      企業(yè)未開通此功能
      詳詢客服 : 0571-87858618