<dfn id="w48us"></dfn><ul id="w48us"></ul>
  • <ul id="w48us"></ul>
  • <del id="w48us"></del>
    <ul id="w48us"></ul>
  • 連續實時信號處理器的性能分析

    時間:2024-10-09 17:55:49 理工畢業論文 我要投稿
    • 相關推薦

    連續實時信號處理器的性能分析

    摘要:對AD公司的TigerSHARC DSP(ADSP-TS101S)和摩托羅拉公司的具有AltiVec矢量處理器核的PowerPC系列MPC7410和MPC7455處理器,在連續實時信號處理領域的應用進行了評估。

    對于復雜、實時信號算是系統的設計人員來講,最嚴峻的挑戰是針對給定任何選擇一個最有效的處理器。因為處理器效率依賴于應用,涉及到結構和應用等各個方面,因此折中的辦法很難定義和評估。用通常使用的方法評價處理器,往往誤導人們。因為它掩蓋了許多依賴應用并使實際性能下降因素;在不同的處理器上執行應用,然后評估每個處理器執行的實際性能,這種方法費用昂貴、花費時間,不切合實際。

    1 處理器概況

    AD公司的TigerSHARC DSP(ADSP-TS101S)和摩托羅位公司PowerPC系列處理器代表了獲得高性能計算能力的不同結構和方法。TigerSHARC代表DSP的傳統做法,它具有低開銷、確定性和DMA引擎等特點,專門用于開發嵌入式實時應用系統,例如雷達、聲納、無線通信和圖像處理。相反,PowerPC是一種RISC處理器,用于開發副蘋果計算機最高性能的G4工作站;具有很高的時鐘頻率以及強大的AltiVec矢量處理引擎,在一些嵌入式信號處理應用方面也取得了很大的成功。

    很明顯,具有AltiVec核的PowerPC G4(74xx)具有較高的核時鐘速率與性能。PowerPC的核時鐘速率幾乎是目前TigerSHARC的3.3倍(不久更快版本的TigerSHARC將發布)。AltiVec核每個周期執行單條指令,每128位向量包含4個獨立的32位數據單元,這就是眾所周知的SIM-D(單指令多數據)結構。當執行一次乘加(MAC)矢量運算時,達到峰值處理能力,每周期可完成8次浮點操作。對于1GHz的MPC7455,峰值處理能力可達8000M次/s浮點運算。AltiVec每周期能執行8次整數或定點操作,峰值整數運算能力為8000MOPS(百萬次操作/s)。

    相反,TigerSHARC有兩個獨立的32閏處理器核,或稱MIMD(多指令多數據)結構。每個計算單元每周期能執行一次乘法以及和差分運算,對于300MHz ADSP-TS101S每周期完成6次浮點運算或1800MFLOPS峰值運算能力。當執行16位數據運算時,TigerSHARC可以利用它的超標量體系結構,分離兩個獨立32位計算單元成2個單獨的16位SIMD單元,這樣每個操作在兩個數據單元,每個周期可以增加超過12次的操作。另外,TigerSHARC有另外兩個專門的16位整數引擎,每個周期可以增加超過12次的操作,這樣每個周期共計24次整數運算,7200MOPS。

    2 I/O帶寬與處理能力的比值

    在許多信號處理的應用中,受限于數據流而不是處理能力,因此理解處理器I/O能力以及與處理器內核的數據交換的性能十分重要。衡量的尺度是I/O帶寬與處理率之比(BPR),即處理器峰值I/O帶寬(MB/s)除以峰值處理能力(MFLOPS)。1B/FLOP的BPR指示它是一個比較平衡的連續信號處理結構,意味著處理器對每個浮點操作能完成1B數據傳輸。一個處理器的BPR明顯高于或低于1B/FLOP,表示這種結構比連續信號處理器更適合數據流搬移或后向數據處理。

    圖1所示為PowerPC處理器節點方框圖。從圖中可以看出所有處理器I/O的訪問必須通過MPC和控制器/橋芯片之間的64位,128MHz(對于MPC7455為133MHz)系統總線。對于MPC7410任何一個處理器的最高I/O帶寬是1000MB/s,對MPC7455的最高I/O帶寬是1064 MB/s。

    然而由于Altivec很強大,這種適宜的高帶寬不一定總能跟上核的速度。當MPC7455執行8000MFLOPS時,數據搬移的速度僅為1064MB/s。BPR值只有0.13,說明這種結構的I/O帶寬和處理能力是不平衡的。因此,PowerPC對塊處理是有效的(比如具有高的計算和相對低的數據流動),但對連續的、高數據流動、較少計算的連續信號處理,是低效率的。

    TigerSHARC是為多處理器設計的,而且提供了64位、100MHz共享系統總線以及4個8位,250MHz的Link口作I/O和處理器之間的數據通信,簇總線的搬移數據速率為800MB/s。數據還可以通過Link口以50MB/s速度進行傳送,每個TigerSHRC提供總的I/O帶寬可達1800MB/s。TigerSHARC的BPR是0.1,表明對連續的信號處理是平衡的優化結構。

    3 信號處理能力—cFFT

    1024點復數FFT(cFFT)是評價信號處理性能使用最廣泛的基準。原因如下:第一,清晰而且容易易化;第二,在大多數應用中,它是最普遍使用的信號處理函數;第三,cFFT可以評估處理器的數據處理能力和處理速度。

    值得注意的是,由于PwerPC的速度和性能,在計算1024點cFFT有明顯優越性;然而TigerSHARC是為DSP裁剪定制的,在執行信號處理算法時會更加有效。這是由于芯片具有極好的數據搬移的能力、平衡以及單周期執行蝶形運算能力(乘法、加法、差分)。AltiVec核比TigerSHARC核快3.3倍,潛在處理速率是TIgerSHARC的4.4倍,然而它執行一個1024點cFFT僅比TIgerSHARC快2.5倍。TigerSHARC在9750周期可以完成CFFT運算,而PowerPC必須用13000個周期,因此,在執行一個1024點CFFT時,TigerSHARC的計算效率比PowerPC高33%。換句話說,如果以相同的時鐘頻率運行,TIgerSHARC會超過PowerPC 33%。隨著TigerSHARC時鐘速率繼續提升,考慮成本和功耗等問題,當它執行FFT信號處理應用時,它的能力要顯明超過AltiVec。

    4 連續的cFFT

    評價處理器能力時,通常考慮它的處理能力、I/O帶寬,甚至算法的執行,但遺憾的是這些評估沒有一個能真實反映實際應用。實際應用時,這些因素往往相互影響。數據必須按所希望的那樣同時輸入、處理、輸出。每個1024點cFFT需要8KB數據輸入(1024個樣本×2個樣

    【連續實時信號處理器的性能分析】相關文章:

    MIDI信號的解碼及實時音符顯示03-20

    建立實時企業的策略分析03-20

    電視信號的實時監測與數字化處理03-20

    數字信號處理器中D/A功能的實現03-19

    媒體信號處理器MAP-CA及其應用實例03-21

    DLX處理器流水線性能優化(一)03-07

    DSP和CPLD的空間瞬態光輻射信號實時探測研究12-07

    基于凌陽單片機的語音信號實時采集03-18

    Motorola微處理器的bootloader分析與應用03-19

    主站蜘蛛池模板: 国产精品自产拍在线观看| 日韩人妻无码精品无码中文字幕| 国精品产露脸自拍| 国内精品久久久久久99蜜桃| 精品久久综合1区2区3区激情| 97在线精品视频| 亚洲国产精品成人久久| 精品国产毛片一区二区无码| 国产午夜精品一区理论片| 国产精品无码永久免费888 | 亚洲国产精品久久电影欧美| 精品久久久久中文字幕一区| 911亚洲精品国产自产| 国产精品免费看久久久| 中文字幕久久精品无码| 精品国产91久久久久久久a | 久久久这里有精品中文字幕| 99免费精品国产| 久久精品国产半推半就| 2048亚洲精品国产| 精品国产粉嫩内射白浆内射双马尾 | 91亚洲精品自在在线观看| 538国产精品一区二区在线| 精品一区二区三区无码免费视频| 亚洲精品无码av天堂| 久久国产精品免费| 国产精品香蕉在线观看| 99久久99久久精品国产片果冻| 久久精品国产亚洲沈樵| 久久久精品一区二区三区| 国产高清国产精品国产专区| 国产精品99精品久久免费| 精品黑人一区二区三区| 精品人妻久久久久久888| 久久99精品国产自在现线小黄鸭| 色欲国产麻豆一精品一AV一免费| 亚洲精品无码永久在线观看你懂的 | 蜜芽亚洲av无码精品色午夜| 无码人妻精品一区二区三区66| 亚洲AV无码久久精品成人| 欧洲精品色在线观看|