計算機系統(tǒng)結構(第二版)尹朝慶主編第1章計算機系統(tǒng)結構導論

上傳人:仙*** 文檔編號:34111067 上傳時間:2021-10-20 格式:PPT 頁數(shù):98 大?。?37.50KB
收藏 版權申訴 舉報 下載
計算機系統(tǒng)結構(第二版)尹朝慶主編第1章計算機系統(tǒng)結構導論_第1頁
第1頁 / 共98頁
計算機系統(tǒng)結構(第二版)尹朝慶主編第1章計算機系統(tǒng)結構導論_第2頁
第2頁 / 共98頁
計算機系統(tǒng)結構(第二版)尹朝慶主編第1章計算機系統(tǒng)結構導論_第3頁
第3頁 / 共98頁

下載文檔到電腦,查找使用更方便

15 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《計算機系統(tǒng)結構(第二版)尹朝慶主編第1章計算機系統(tǒng)結構導論》由會員分享,可在線閱讀,更多相關《計算機系統(tǒng)結構(第二版)尹朝慶主編第1章計算機系統(tǒng)結構導論(98頁珍藏版)》請在裝配圖網上搜索。

1、1第第1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論1.1 計算機系統(tǒng)結構的基本概念計算機系統(tǒng)結構的基本概念 1.2 計算機系統(tǒng)結構中并行性的發(fā)展翻譯計算機系統(tǒng)結構中并行性的發(fā)展翻譯 1.3 計算機系統(tǒng)的分類計算機系統(tǒng)的分類 1.4 計算機性能的評價計算機性能的評價 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 21.1 計算機機系統(tǒng)結構的基本概念計算機機系統(tǒng)結構的基本概念 1.1.1 計算機系統(tǒng)的層次結構計算機系統(tǒng)的層次結構 計算機系統(tǒng)由硬件和軟件組成。從計算機語言的角度,可以把計算機系統(tǒng)按功能劃分成多級層次結構,如圖1.1所示。 這個層次模型中的每一級都對應一個機器。這里的“機器”只

2、對一定的觀察者而存在,它的功能體現(xiàn)在廣義語言上,對該語言提供解釋手段,然后作用在信息處理或控制對象上,并從對象上獲得必要的狀態(tài)信息。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 3圖1.1 計算機系統(tǒng)層次結構 圖1.2一級機器的組成 層次模型中的每一級所對應的機器,其組成如圖1.2所示。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 4M0 級為硬聯(lián)邏輯M1級是微程序機器級M2級是傳統(tǒng)機器級M3級是操作系統(tǒng)機器M4級是匯編語言機器M5級是高級語言機器M6級是應用語言機器 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 5 某級機器能將本級機器的語言轉換為下級機器能夠識別

3、和處理的形式,就完成了本級機器的實現(xiàn)。層次結構中的M0級機器為硬聯(lián)邏輯,M1級機器由硬聯(lián)邏輯實現(xiàn),M2級機器由微程序(固件)實現(xiàn),M3級至M6級主要由軟件實現(xiàn)。我們將主要由軟件實現(xiàn)的機器稱為虛擬機器,以區(qū)別由硬件或固件實現(xiàn)的實際機器。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 6 各虛擬機器級的實現(xiàn)有兩種主要的方法,即翻譯和解釋,或者是這兩者的結合。 翻譯:是用轉換程序將N1級程序全部變換成N級程序后,再去執(zhí)行新產生的N級程序,執(zhí)行過程中N1級程序不再被訪問。 解釋:是每當一條N1級指令被譯碼后,就在N級機器級上用它的一串語句或指令來仿真N1級機器級上的一條語句或指令的功能,依此重

4、復,通過對高一級程序中的每條語句或指令逐條解釋來實現(xiàn)的技術。在這個過程中不產生翻譯出來的程序。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 7 軟件和硬件在邏輯功能上是等效的。從原理上同一邏輯功能既能用軟件實現(xiàn),也可以用硬件或固件實現(xiàn),只是性能、價格以及實現(xiàn)的難易程度不同而已。一般來說,硬件實現(xiàn)的特點是速度快,但靈活性較差,增加硬件成本;軟件實現(xiàn)的特點是靈活性較好,硬件成本低,但實現(xiàn)速度慢。計算機統(tǒng)采用何種實現(xiàn)方式,要從效率、速度、價格、資源狀況、可靠性等多方面因素全盤考慮,對軟件、硬件及固件的取舍進行綜合平衡,使計算機系統(tǒng)達到較高的性能價格比。 第第1 1章章 計算機系統(tǒng)結構導論計

5、算機系統(tǒng)結構導論 81.1.2 計算機系統(tǒng)結構、組成與實現(xiàn)計算機系統(tǒng)結構、組成與實現(xiàn) 1. 計算機系統(tǒng)結構 所謂“系統(tǒng)結構”是指計算機系統(tǒng)中各級之間界面的定義及其上、下級的功能分配。本課程中計算機系統(tǒng)結構研究的是對傳統(tǒng)機器級界面的確定以及軟、硬件之間的功能分配,即機器語言程序設計者或編譯程序設計者所看到的計算機物理系統(tǒng)的抽象或定義。 在一個計算機系統(tǒng)中,低層機器的概念性結構和功能特性對高層機器的程序設計者往往是透明的。在計算機技術中,對這種本來存在的事物或屬性,但從某種角度看卻好象不存在的概念稱為透明性 。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 9 對于目前的通用型機器,計算機

6、系統(tǒng)結構研究的內容一般包括: (1)數(shù)據表示 (2)尋址方式 (3)寄存器組織 (4)指令系統(tǒng) (5)存儲系統(tǒng) (6)中斷機構 (7)機器工作狀態(tài) (8)I/O系統(tǒng) (9)信息保護 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 102. 計算機組成 計算機組成是計算機系統(tǒng)結構的邏輯實現(xiàn),包括機器內部的數(shù)據流和控制流的組成以及邏輯設計等。 計算機組成的任務是在計算機系統(tǒng)結構確定分配給硬件系統(tǒng)的功能及其概念結構之后,研究各組成部分的內部構造和相互之間的聯(lián)系,以實現(xiàn)機器指令級要求的各種功能和性能。這種相互聯(lián)系包括各功能部件的配置、相互連接和相互作用。 第第1 1章章 計算機系統(tǒng)結構導論計算機

7、系統(tǒng)結構導論 11 計算機組成的設計是按希望達到的性能價格比,最佳、最合理地把各種設備和部件組成計算機,以實現(xiàn)所確定的計算機系統(tǒng)結構。對傳統(tǒng)機器程序員來說,計算機組成的設計內容一般是透明的。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 12 計算器組成設計要確定的內容應包括: (1)數(shù)據通路的寬度 (2)專用部件的設置 (3)各種操作對部件的共享程度 (4)功能部件的并行度 (5)控制機構的組成方式 (6)緩沖和排隊技術 (7)預估、預判技術 (8)可靠性技術 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 133. 計算機實現(xiàn) 計算機實現(xiàn)是計算機組成的物理實現(xiàn),包括處理機、主

8、機等部件的物理結構,器件的集成度和速度,器件、模塊、插件、底板的劃分與連接,專用器件的設計,微組裝技術,信號傳輸,電源、冷卻及整機裝配技術等。它著眼于器件技術和微組裝技術,其中,器件技術在實現(xiàn)技術中起著主導作用。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 144. 計算機系統(tǒng)結構、組成和實現(xiàn)三者的關系 計算機系統(tǒng)結構、計算機組成和計算機實現(xiàn)是三個互不相同的概念。計算機系統(tǒng)結構是計算機系統(tǒng)的軟、硬件的界面;計算機組成是計算機系統(tǒng)結構的邏輯實現(xiàn);計算機實現(xiàn)是計算機組成的物理實現(xiàn)。它們各自包含不同的內容,但又相互聯(lián)系且相互影響。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 15

9、 具有相同系統(tǒng)結構的計算機可因性價比要求不同而采用不同的組成技術。 而計算機組成也會影響計算機系統(tǒng)結構。 一種計算機組成也可以采用多種不同的計算機實現(xiàn)。 計算機實現(xiàn)是計算機系統(tǒng)結構和計算機組成的基礎。而計算機組成也會影響計算機系統(tǒng)結構。 系統(tǒng)結構的設計必須結合應用考慮,為軟件和算法的實現(xiàn)提供更多更好的支持,還應考慮減少對各種組成及實現(xiàn)技術的使用限制。 系統(tǒng)結構、組成和實現(xiàn)所包含的具體內容在不同時期或隨不同的計算機系統(tǒng)會有所變化。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 161.1.3 計算機系統(tǒng)的特性計算機系統(tǒng)的特性計算機等級 計算機系統(tǒng)通常被分為巨型、大型、中型、小型、微型等若

10、干等級。但隨著技術進步,各等級的計算機性能指標都不斷提高,如果按性能指標來劃分計算機等級,那么一臺計算機的等級將隨時間而下移。各型機器的性能、價格隨時間變化的趨勢大致可用圖1.3示意說明,其中虛線稱為等性能線。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 17圖1.3 計算機性能下移示意圖 計算機工業(yè)在處理性能和價格的關系上可以有兩種途徑:一是維持價格不變,充分利用器件技術等的進展不斷提高機器的性能,即沿圖中的水平實線發(fā)展;另一是在性能基本不變的情況下,利用器件技術等的進展不斷降低機器的價格,即沿圖中虛線往下發(fā)展。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 18 基于這種

11、思想,不同等級的計算機可采用不同的發(fā)展策略: 在同等級范圍內以合理的價格獲得盡可能好的性能,逐漸向高檔機發(fā)展,稱為最佳性能價格比設計。 維持一定適用的基本性能而爭取最低價格,稱為最低價格設計。 以獲取最高性能為主要目標而不惜增加價格,稱為最高性能設計。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 19 從系統(tǒng)結構的觀點來看,各型計算機的性能隨時間下移,實質上是在低檔(型)機上引用甚至照搬高檔(型)機的系統(tǒng)結構和組成。這種低檔機承襲高檔機系統(tǒng)結構的狀況正符合小型機和微型機的設計原則,即充分發(fā)揮器件技術的進步,以盡可能低的價格在低檔機上實現(xiàn)高檔機已有的結構和組成,而不是花很大力量專門去研

12、究和采用新的系統(tǒng)結構和組成技術。這將有利于計算機工業(yè)的快速發(fā)展和計算機應用的廣泛普及。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 20. 系列計算機 所謂系列機的概念,是在軟、硬件界面上設計好一種系統(tǒng)結構,然后軟件設計者按此系統(tǒng)結構設計系統(tǒng)的軟件;硬件設計者根據機器速度、性能、價格的不同,選擇不同的器件,采用不同的硬件技術和組成與實現(xiàn)技術,研制并提供不同檔次的機器。在系列機上必須保證用戶看到一致的機器屬性。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 21 系列機之間必須保持軟件兼容。這是指同一個軟件(目標程序)可以不加修改地運行于系統(tǒng)結構相同的各檔次機器,而且所得結果一

13、致。軟件兼容包括向上兼容和向下兼容。向上兼容是指在低檔機器上編制的軟件,不加修改就可以運行于高檔機器上;向下兼容則相反。軟件兼容還有向前兼容和向后兼容之分。向后兼容是指在某個時期投入市場的該型號機器上編制的軟件,不加修改就可以運行于在它之后投入市場的機器上;向前兼容則相反。對系列機而言,必須保證做到軟件向后兼容,力爭做到軟件向上兼容。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 22 為了減少編制軟件的工作量,降低軟件開發(fā)成本,延長成熟軟件的生命周期,應在研究新的系統(tǒng)結構時,解決好軟件的可移植性問題。所謂軟件的可移植性,是指軟件不用修改或只需少量加工就能由一臺機器搬到另一臺機器上運行

14、,即同一軟件用于不同的環(huán)境。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 23 系列機為了保證軟件兼容,要求系統(tǒng)結構的一致,這成為妨礙計算機系統(tǒng)結構發(fā)展的重要因素。若允許系列機中后面推出的各檔機的系統(tǒng)結構有所發(fā)展和變化。則這種改變只能是為提高機器總的性能所作的必要擴充,且主要是為改進系統(tǒng)軟件的性能來修改系統(tǒng)軟件,盡可能不要影響高級語言應用軟件的兼容。因此,可以對系列機的軟件向下兼容和向前兼容不作要求,向上兼容在某種情況下也可能做不到,但向后兼容是肯定要做到的。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 24 把不同公司廠家生產的具有相同系統(tǒng)結構的計算機稱為兼容機,它的思想

15、與系列機的思想是一致的。兼容機還可以對原有的系統(tǒng)結構進行某種擴充,使之具有更強的功能。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 25. 模擬與仿真 為了實現(xiàn)軟件在不同系統(tǒng)結構的機器之間移植,就必須做到能在一種機器的系統(tǒng)結構上實現(xiàn)另一種機器的系統(tǒng)結構。從計算機系統(tǒng)結構的層次模型來看,就是要在一種機器的系統(tǒng)結構上實現(xiàn)另一種機器的指令系統(tǒng)。一般可采用模擬方法或仿真方法。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 26 在機器上用虛擬機的概念實現(xiàn)機器的指令系統(tǒng),即由機器的一段機器語言程序去解釋執(zhí)行機器的每一條機器指令,從而可使機器的程序能在機器上運行,如圖1.4所示。這種用機

16、器語言程序解釋實現(xiàn)軟件移植的方法稱為模擬被模擬的機器稱為虛擬機A機器稱為宿主機。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 27圖1.4 用模擬方法實現(xiàn)軟件的移植 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 28 如果機器采用微程序控制,則直接用機器的微程序去解釋機器的機器指令就會加快解釋過程,如圖1.5所示。這種用微程序直接解釋另一種機器指令系統(tǒng)實現(xiàn)軟件移植的方法稱為仿真進行仿真工作的機器稱為宿主機,被仿真的機器稱為目標機為仿真所編寫的解釋微程序稱為仿真微程序。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 29圖1.5 用仿真方法實現(xiàn)軟件的移植 第第1 1章章

17、 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 30 為了使虛擬機的應用軟件能在宿主機上運行,除了模擬虛擬機的機器語言外,還得模擬其存儲體系、I/O系統(tǒng)、控制臺的操作,以及形成虛擬機的操作系統(tǒng)。即把虛擬機操作系統(tǒng)作為宿主機的應用程序來看待。所有為模擬所編制的解釋程序統(tǒng)稱為模擬程序。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 31 用仿真方法可以提高被移植軟件的運行速度,但由于微程序機器級結構深度依賴于機器的系統(tǒng)結構,所以當兩種機器結構差別較大時,就很難依靠仿真來實現(xiàn)軟件移植,特別是當其I/O系統(tǒng)結構差別較大時更是如此。 在實際應用中,不同系列機之間的軟件移植往往通過仿真和模擬兩種方法并用來

18、實現(xiàn)。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 32 1.2 計算機系統(tǒng)結構中并行性的發(fā)展計算機系統(tǒng)結構中并行性的發(fā)展 研究計算機體系結構的目的是提高計算機系統(tǒng)的性能。開發(fā)計算機系統(tǒng)的并行性,是計算機體系結構的重要研究內容之一。本節(jié)首先對馮諾依曼系統(tǒng)結構進行分析,然后敘述體系結構中的并行性概念,再從單機系統(tǒng)和多機系統(tǒng)兩個方面對并行性的發(fā)展進行歸納,得到對計算機系統(tǒng)結構中并行性發(fā)展全面的了解和認識。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 331.2.1 馮馮諾依曼型計算機系統(tǒng)結構諾依曼型計算機系統(tǒng)結構 馮諾依曼型計算機由運算器、控制器、存儲器、輸入設備和輸出設備個部

19、分組成。其在結構上有以下特點: 機器以運算器為中心,各部件的操作及相互之間的聯(lián)系都由控制器集中控制。 采用存儲程序的思想。將存儲器中的指令和數(shù)據同等對待,因此,由指令組成的程序可以在運行過程中被修改。 存儲器按地址訪問。它是一個順序、線性編址的一維空間,每個存儲單元的位數(shù)是固定的。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 34 由指令計數(shù)器指明要執(zhí)行的指令在存儲器中的地址,可以改變指令計數(shù)器的值,以改變指令執(zhí)行順序。 指令由操作碼和操作數(shù)地址碼組成,操作數(shù)的數(shù)據類型由操作碼指明,操作數(shù)不能判定它是何種數(shù)據類型。 數(shù)據以二進制編碼,并采用二進制運算。 軟件與硬件完全分開,硬件邏輯結

20、構固定,其功能是不變的,依靠編制軟件來適應不同的應用需要。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 35 人們已逐漸認識到早期計算機所采用的馮諾依曼型結構存在問題,其主要問題和改進發(fā)展的主要表現(xiàn)有: 由于機器以運算器為中心,使得低速的輸入/輸出和高速的運算必須互相等待、串行進行。而所有部件的操作由控制器集中控制,將使控制器的負擔過重,從而嚴重影響機器速度和設備利用率的提高。后將機器的結構改為以主存為中心,讓系統(tǒng)的輸入/輸出與CPU的操作并行,多種輸入和輸出并行,并進一步發(fā)展為分布處理和并行處理。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 36 存儲程序和程序控制的思想

21、,使機器各部分的操作是在指令順序執(zhí)行的控制下完成的。難以最大限度地發(fā)揮系統(tǒng)的并行處理能力,影響計算機性能的提高。故人們發(fā)展了數(shù)據流計算機。在數(shù)據流計算機中,只要指令所需要的操作數(shù)都準備好了,這一條或一批指令就馬上可被激發(fā)執(zhí)行,完全不需要程序計數(shù)器控制,指令的執(zhí)行與指令在程序中出現(xiàn)的次序完全無關。數(shù)據流計算機能最大限度地滿足程序的并行性。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 37 指令和數(shù)據混存于同一存儲器中,可因共用一套存儲器外圍電路而節(jié)省硬件,并因對指令和數(shù)據不加區(qū)別同等對待而簡化了存儲管理,但由于程序執(zhí)行過程中,指令可像操作數(shù)一樣被修改,因此不利于程序調試和排錯,不利于實

22、現(xiàn)程序的可再入性和程序的遞歸調用,不利于指令和數(shù)據的并行存取以及在組成上采用重疊、流水方式來提高速度。所以,絕大多數(shù)計算機已改為指令在執(zhí)行過程中不準修改的工作方式,有的機器還將指令和數(shù)據分別存放在兩個獨立編址且可以同時被訪問的不同存儲器中。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 38 存儲器構成按地址訪問的順序、一維線性空間,雖然有結構簡單、價格便宜、訪問速度快等優(yōu)點,但存儲器的一維線性空間表示與應用中需要的棧、樹、圖、多維數(shù)組等非線性、多維、離散的數(shù)據結構相矛盾。經軟件變換的方法使軟件復雜,效率降低,且不適合對大量數(shù)據的快速并行查找。改進技術包括使存儲器同時具有多種編址方式;

23、采用虛擬存儲技術;構成多體交叉編址的并行存儲器;采用相聯(lián)存儲器實現(xiàn)高速相聯(lián)查找;采用增設通用寄存器來減少訪存的次數(shù);在CPU和主存之間設置高速緩沖存儲器;使計算機具有高級尋址能力的數(shù)據表示等等。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 39 為了進一步開發(fā)利用求解問題和程序隱含的并行性,提高運行的速度和效率,將原來CPU的順序執(zhí)行組成方式改為先行控制、重疊、流水等組成方式。同時開發(fā)指令內、指令間、任務間、作業(yè)間等不同級別上的并行性,出現(xiàn)了向量處理機、并行處理機、多處理機、分布處理系統(tǒng)等計算機系統(tǒng)結構。進一步發(fā)展以非控制流方式驅動的數(shù)據流計算機,并研究開發(fā)更為復雜的并行算法。 第第

24、1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 40 機器指令中的操作數(shù)不表示本身的數(shù)據類型,而由操作碼指出,因此每增加一種操作數(shù)類型,就要增加一組處理這種類型操作數(shù)的指令,這將導致指令系統(tǒng)日益龐大復雜。在高級語言中操作符與數(shù)據類型無關,操作數(shù)的類型是由數(shù)據類型說明語句說明的。機器語言與高級語言之間存在的這種語義差別通過編譯程序來彌補,加重了編譯的負擔,增大了輔助開銷。為此,人們?yōu)橛嬎銠C系統(tǒng)增設了許多高級數(shù)據表示,使指令具有對多種數(shù)據類型操作的通用性從而簡化機器指令系統(tǒng)和編譯。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 41 軟件與硬件截然分開,硬件結構完全固定,會導致無法更合理

25、地進行軟硬功能分配,難以優(yōu)化系統(tǒng)結構的設計。當求解的問題和應用要求變化時,會使機器性能價格比明顯下降。現(xiàn)在特別強調軟硬結合,比如采用可以靈活地選擇和改變指令系統(tǒng)和結構的動態(tài)自適應機器。要求研制出智能計算機系統(tǒng)結構來有效地支持知識和信息處理,對知識進行邏輯推理,特別是能利用經驗性知識對不完全確定的事實進行非精確性的推理。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 421.2.2 并行性概念并行性概念 所謂并行性是指在同一時刻或是同一時間間隔內完成兩種或兩種以上性質相同或不相同的工作。只要時間上是相互重疊,就存在并行性。嚴格來講,把兩個或多個事件在同一時刻發(fā)生的并行性叫做同時性而把兩個

26、或多個事件在同一時間間隔內發(fā)生的并行性叫做并發(fā)性。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 43 所謂并行處理,是指一種開發(fā)計算過程中存在的并發(fā)事件的信息處理方式。在進行并行處理時,每次處理的規(guī)模大小可用并行性顆粒度來表示。 顆粒度用于衡量軟件進程所含計算量的大小,用程序段中指令的條數(shù)來表示。顆粒度可分為細粒度、中粒度和粗粒度三種,若程序段中指令條數(shù)小于500條,則稱為細粒度,5002000條指令之間則稱為中粒度,大于2000條則稱為粗粒度。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 44 假定系統(tǒng)中共有n個處理器,顆粒度大小G還可用以下公式來表示: 式中,Tw表示所

27、有處理器工作負載的總和,即 這里的工作負載實際上就是進行計算的時間;Tc表示所有處理器的通信開銷的總和,即 這里的通信開銷實際上就是進行通信的時間。 TTGCWTTGCWTTCWG niwiWtT1nicictT1 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 45 計算機系統(tǒng)中的并行性有不同的等級。根據顆粒度的不同來觀察程序的執(zhí)行過程。并行性等級從低到高可分為: ()指令內部并行 ()指令級并行(ILP) ()任務級或過程級并行 ()作業(yè)或程序級并行 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 46 從處理數(shù)據的角度,并行性等級從低到高可以分為: ()字串位串 ()字串位并

28、 ()字并位串 ()全并行 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 47 并行處理是指在這些層次的一級或多級上的并行性開發(fā)。層次越高的并行處理粒度就越粗,而低層上的并行處理粒度就較細。粗粒度并行性主要開發(fā)功能并行性。而細粒度并行性主要開發(fā)的是數(shù)據并行性。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 48 在一個計算機系統(tǒng)中,可同時采取多種并行性措施。既可以有執(zhí)行程序方面的并行性,又可以有處理數(shù)據方面的并行性。當并行性提高到一定級別時則稱之為進入并行處理領域。如執(zhí)行程序的并行性達到任務或過程級,或處理數(shù)據的并行性達到字并位串一級,即可認為進入并行處理領域。并行處理是硬件、

29、系統(tǒng)結構、軟件、算法、語言等多方面綜合研究的領域。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 491.2.3 提高并行性的技術途徑提高并行性的技術途徑 提高計算機系統(tǒng)并行性的措施很多,但其基本思想均可納入下列三種技術途徑: 1. 時間重疊 在并行性概念中引入時間因素,即多個處理過程在時間上相互錯開,輪流重疊地使用同一套硬件設備的各個部分,以加快硬件周轉來提高處理速度。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 50 2. 資源重復 在并行性概念中引入空間因素,是根據“以數(shù)量取勝”的原則,通過重復設置資源,尤其是硬件資源,大幅度提高計算機系統(tǒng)的性能。 3. 資源共享 這是

30、一種軟件方法,它使多個任務按一定時間順序輪流使用同一套資源。資源共享既降低了成本,以提高系統(tǒng)資源利用率,也可以相應提高整個系統(tǒng)的性能。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 51 計算機結構設計中并行性技術的應用使計算機系統(tǒng)結構發(fā)展形成不同類型的多處理機系統(tǒng)。并行處理的發(fā)展過程可從單處理機系統(tǒng)和多計算機系統(tǒng)兩個方向來實現(xiàn) 。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 52單機系統(tǒng)中并行性的發(fā)展單機系統(tǒng)中并行性的發(fā)展 高性能單處理機的發(fā)展過程中,起著主導作用的技術途徑是時間重疊,實現(xiàn)的基礎是部件功能專用化思想。即把一種工作按功能分割為若干相互聯(lián)系的部分,把每一部分指定

31、給專門的部件完成,然后按時間重疊原則把各部分執(zhí)行過程在時間上重疊起來,讓所有部件依次分工完成一組同樣的工作。這可使多個處理過程在時間上相互錯開,輪流重疊地使用同一套硬件設備的各個部分。在處理機內部可以同時處理多條指令,從而提高處理機的速度。時間重疊開發(fā)的是并行性中的并發(fā)行。圖1.7所示為指令順序執(zhí)行和流水執(zhí)行的情況。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 53圖1.7 指令順序執(zhí)行和流水執(zhí)行 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 54 按時間重疊的技術途徑進一步發(fā)展到采用專門的流水線處理機時,就進入了并行處理的領域。還可以進一步發(fā)展到處理機一級,形成以任務重疊為

32、特征的宏流水線,就由單處理機發(fā)展到了多處理機系統(tǒng)。構成由多個不同類型,至少是擔負不同功能的處理機組成的非對稱型或異構型多處理機系統(tǒng)。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 55 資源重復的途徑來看,單處理機向高性能發(fā)展,最初是將按位串行改為按字并行,后來在非流水線處理機或流水線處理機中,發(fā)展了多操作部件和多體存儲器。進一步可以重復設置多個相同的處理單元,在同一個控制器指揮下,按照同一條指令的要求對向量的各元素同時進行操作,這就是所謂的并行處理機。從指令和數(shù)據處理的角度看,它用一條指令處理多個數(shù)據,屬于按單指令流多數(shù)據流(SIMD)方式工作的多處理器系統(tǒng)。使處理機進入了并行處理領

33、域。資源重復開發(fā)的是并行性中的同時性。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 56 如果提高并行性,使其達到數(shù)據集級并行,多個處理單元同時處理一組數(shù)據,就構成陣列處理機。進一步提高并行性,使其達到任務級并行,則每個處理單元都有自己的控制器,能獨立地解釋指令而成為獨立處理機,這就進入多處理機范疇,即同時有多條指令處理多個數(shù)據。這就進入了并行處理領域。由于此多處理機中的每個處理(器)機都是同類型的,且完成同樣的功能,所以構成的是一種對稱型或同構型多處理機系統(tǒng) 。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 57 同構型多處理機系統(tǒng)也可以是基于處理機一級冗余的容錯多處理機,

34、讓多個處理機中的一部分作為備用處理機以隨時頂替出故障的工作處理機,從而提高系統(tǒng)工作的可靠性。還可以進一步發(fā)展成為一種可變結構的系統(tǒng)或可重構系統(tǒng)。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 58 從資源共享的途徑來看,最初在單處理機上采用多道程序和分時操作,形成所謂虛擬機的概念。類似的思想發(fā)展了虛擬存儲器、虛擬處理機。隨著遠程終端、計算機網絡和微型機小型機的發(fā)展,可采用真正的處理機代替虛擬處理機,構成以分散為特征的多處理機系統(tǒng),以此代替以集中為特征的分時系統(tǒng),這就進入到并行處理領域。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 59 這種有大量分散、重復的處理機資源(一般是

35、具有獨立功能的單處理機)相互連接在一起,在操作系統(tǒng)(可以是集中的也可以是分散的)的全局控制下統(tǒng)一協(xié)調工作而最少依賴于集中的程序、數(shù)據或硬件的系統(tǒng)稱為分布處理系統(tǒng)。 以近距離、寬頻帶、快響應為特點的計算機局域網作支持環(huán)境發(fā)展起來的機群系統(tǒng)就是分布處理系統(tǒng)的一個很好的例子。顯然,分時系統(tǒng)實現(xiàn)的是并行性中的并發(fā)性,而分布處理系統(tǒng)實現(xiàn)的是并行性中的同時性。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 60 再看多機系統(tǒng)中并行性的發(fā)展。多機系統(tǒng)也遵循著時間重疊。資源重復和資源共享的技術途徑,向著三種不同的多處理機方向發(fā)展。但在采取的技術措施上與單機系統(tǒng)稍有些差別。 第第1 1章章 計算機系統(tǒng)結

36、構導論計算機系統(tǒng)結構導論 61 為了反映多機系統(tǒng)各機器之間物理連接的緊密程度和交互作用能力的強弱,引入耦合度的概念。多機系統(tǒng)的耦合度可分為: ()最低耦合系統(tǒng) ()松散耦合或間接耦合系統(tǒng) ()緊密耦合系統(tǒng)或直接耦合系統(tǒng) 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 62 在單機系統(tǒng)中,時間重疊是通過功能部件專用化實現(xiàn)。而在多處理機中則是將處理功能分散給各專用處理機去完成,即功能專用化。各處理機之間按照時間重疊原理工作。如輸入/輸出功能的分離,導致由通道向專用外圍處理機發(fā)展。這種趨勢的發(fā)展,使許多主要功能,如數(shù)組運算。高級語言編譯、數(shù)據庫管理等,也逐漸分離出來交由專用處理機完成,機間的耦

37、合程度也逐漸加強,發(fā)展成異構型多處理機系統(tǒng)。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 63 為了提高系統(tǒng)的可靠性,開始由單機系統(tǒng)的部件級冗余上升到處理機一級的冗余,設置多臺相同類型的計算機構成容錯多處理機系統(tǒng)。繼而提高機間互連網絡的靈活性和可重構性,發(fā)展為可重構系統(tǒng)?,F(xiàn)在更多的是通過進一步改進多處理機間的互連網絡,使之具有實現(xiàn)進程或程序一級的高速并行處理能力來提高整個系統(tǒng)的速度,演變成各種緊密耦合系統(tǒng)。為使并行處理的任務能在處理機之間隨機地進行調度,必須使各個處理機具有同等的功能,這樣就發(fā)展成同構型的多處理機系統(tǒng)。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 64 要實

38、現(xiàn)遠距離多臺計算機之間的資源共享,只有網絡化,將通信功能從主機中分離出來,由專用通信處理機完成。計算機網絡按其通信距離可劃分為遠程網(WAN)和局域網(LAN)。 遠程網距離遠,通信速率較低。局域網距離近,通信速率高。局域網成為分布處理系統(tǒng)發(fā)展的基礎。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 65表1.1 三種類型多處理機比較項目同構型多處理機異構型多處理機分布處理系統(tǒng)目的提高系統(tǒng)性能(可靠性、速度)提高系統(tǒng)使用效率兼顧效率與性能技術途徑資源重復(機間互連)時間重疊(功能專用化)資源共享(網絡化)組成同類型(同等功能)不同類型(不同功能)不限制分工方式任務分布功能分布硬件、軟件、

39、數(shù)據等各種資源分布工作方式一個作業(yè)由多機協(xié)同并行地完成一個作業(yè)由多機協(xié)同串行地完成一個作業(yè)由一臺處理機完成,必要時才請求它機協(xié)作控制形式常采用浮動控制方式采用專用控制方式分布控制方式耦合度緊密耦合松散耦合松散、緊密耦合對互連網絡的要求快速性、靈活性、可重構性專用性快速、靈活、簡單、通用 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 661.3 計算機系統(tǒng)的分類計算機系統(tǒng)的分類. Flynn 分類法分類法 Michael.J.Flynn于1966年提出按指令流和數(shù)據流的多倍性對計算機系統(tǒng)結構進行分類的方法。指令流是指機器執(zhí)行的指令序列。數(shù)據流是指由指令流調用的數(shù)據序列,包括輸入數(shù)據和中間

40、結果。多倍性是指在系統(tǒng)瓶頸部件上,同時處于同一執(zhí)行階段的指令或數(shù)據的最大可能個數(shù)。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 67 Flynn分類法按照指令流和數(shù)據流的不同組織方式,把計算機系統(tǒng)的結構分為類。 ()單指令流單數(shù)據流(SISD) ()單指令流多數(shù)據流(SIMD) ()多指令流單數(shù)據流(MISD) ()多指令流多數(shù)據流(MIMD) 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 68 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 692. 馮氏分類法馮氏分類法 1972年,美籍華人馮澤云提出用最大并行度對計算機系統(tǒng)結構進行分類。所謂最大并行度Pm是指計算機

41、系統(tǒng)在單位時間內能夠處理的最大的二進制位數(shù)。平均并行度取決于系統(tǒng)的運用程度,它與應用程序有關。最大并行度Pm定量地反映了對數(shù)據處理的并行性。 Pm=n m式中,n 表示同時處理時一個字中的二進制位數(shù);m 表示能同時處理的字數(shù)。TTiiapP1TTiiapP1 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 70 按計算機對數(shù)據處理方式,由Pm值可得下列種計算機系統(tǒng)結構類型。 字串位串(WSBS) 字串位并(WSBP) 字并位串(WPBS) 字并位并(WPBP) 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 711.4 計算機性能的評價計算機性能的評價1.4.1 計算機系統(tǒng)設計和測

42、評的基本原則計算機系統(tǒng)設計和測評的基本原則 . 經常性事件優(yōu)先原則 經常性事件優(yōu)先原則的基本思想是:對于經常發(fā)生的事件,賦予它優(yōu)先的處理權和資源使用權,加快它的處理速度,可以提高整個系統(tǒng)的性能。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 72Amdahl定律 Amdahl 定律指出:系統(tǒng)中某部件由于采用某種更快的執(zhí)行方式后,整個系統(tǒng)性能的提高與這種執(zhí)行方式在系統(tǒng)中使用頻率或占總執(zhí)行時間的比例有關。 Amdahl定律定義了加速比的概念。假設對機器進行某種改進,那么機器系統(tǒng)的加速比就是:總執(zhí)行時間總執(zhí)行時間系統(tǒng)性能系統(tǒng)性能系統(tǒng)加速比改進后改進前改進前改進后 第第1 1章章 計算機系統(tǒng)結

43、構導論計算機系統(tǒng)結構導論 73系統(tǒng)加速比依賴于兩個因素:(1)可改進部分在原系統(tǒng)執(zhí)行時間中所占的比例。用“可改進比例(Fe)”表示,F(xiàn)e總是小于或等于的。1FFee總執(zhí)行時間可改進執(zhí)行時間可改進比例改進前改進前(2)可改進部分改進以后的性能提高。用“部件加速比(Se)”表示性能提高比一般Se是大于的。1SSee改進部分執(zhí)行時間改進部分執(zhí)行時間部件加速比改進后改進前 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 74由此,得到下列結論;(1)改進后系統(tǒng)的總執(zhí)行時間TnSFFTSTFTFTeeeoeoeoen11 式中,To為改進前系統(tǒng)的總執(zhí)行時間。(2)改進前后整個系統(tǒng)的加速比Sn SF

44、FTTSeeenon11式中,(1Fe ) 表示不可改進比例,當Fe0無改進部分時,Sn1,所以系統(tǒng)性能提高幅度受改進部分所占比例限制。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 75 當Se 時,有Sn1/ (1Fe )。得到Amdahl定律的一個重要推論:若只針對整個系統(tǒng)的一部分進行優(yōu)化,則系統(tǒng)獲取的性能改善極限值受Fe的約束,系統(tǒng)加速比不大于1/ (1Fe )。 例1.1設系統(tǒng)中某部件原處理時間占整個運行時間的30%,現(xiàn)加快速度到15倍,則整個系統(tǒng)性能提高多少?解:由題可知:Fe0.3,Se15,則39.172.01153 .03 .011nS 第第1 1章章 計算機系統(tǒng)結構

45、導論計算機系統(tǒng)結構導論 76 例1.2若在整個測試程序的執(zhí)行時間中,求浮點數(shù)平方根FPSQR的操作占10?,F(xiàn)有兩種改進方案:一種是采用FPSQR硬件,使其速度加快到10倍;另一種是使所有浮點數(shù)指令FP速度加快到4倍,并設FP指令占整個程序執(zhí)行時間的40。請比較兩種方案的優(yōu)劣。 解:硬件方案:Fe0.1,Se10,則FP加速方案:Fe0.4,Se4,則 由結果比較可知,F(xiàn)P加速方案更優(yōu)。需注意結論的前提是程序量的40%為FP指令。10.191.01101 .01 .011nS43.17 .0144 .04 .011nS 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 77程序訪問的局部性原

46、理 所謂程序訪問的局部性原理,是指程序在執(zhí)行過程中所訪問地址的分布有相對簇聚的傾向,這種簇聚表現(xiàn)在指令和數(shù)據兩方面。程序局部性包括時間上的局部性和空間上的局部性。前者是指程序即將用到的信息很可能是目前正在使用的信息。后者是指程序即將用到的信息很可能與目前正在使用的信息在程序空間上是相鄰或相近的。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 781.4.2 CPU性能公式性能公式 一個程序在計算機上運行所花費的CPU時間可表示為f時鐘頻率時鐘周期數(shù)總時間CPUCPU或 CPU時間總CPU時鐘周期數(shù)時鐘周期T 若將程序執(zhí)行過程中所處理的指令數(shù)記為IC??梢垣@得一個與計算機系統(tǒng)結構有關的參

47、數(shù),即每條指令的平均時鐘周期數(shù)CPI :CICPI時鐘周期總CPU 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 79程序執(zhí)行的CPU時間可寫為TICCPIfICCPI時間CPU 這個公式通常稱為CPU性能公式,它表明CPU性能與三種系統(tǒng)結構技術相關: (1)時鐘頻率f :反映了計算機實現(xiàn)技術和計算機組織。 (2)機器指令的平均時鐘周期數(shù)CPI:反映了計算機系統(tǒng)結構組織和指令集的設計與實現(xiàn)。 (3)程序使用的指令條數(shù)IC:反映了計算機指令集的結構和編譯技術。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 80 假設計算機系統(tǒng)有n種指令,ICi表示第i種指令在程序中執(zhí)行的次數(shù),C

48、PIi表示執(zhí)行一條第 i 種指令所需的平均時鐘周期數(shù),則程序執(zhí)行的CPU時間為fniiiICCPI1CPU 時間niiiniiiICICCPIICCPIICCPI11則CPI 可表示為式中 表示了第i 種指令在程序中所占比例。上面這些公式均稱為CPU性能公式。ICICi 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 81 例1.3若浮點數(shù)指令FP占全部指令的30%,其中浮點數(shù)平方根FPSQR指令占全部指令的4%,F(xiàn)P操作的CPI為5,F(xiàn)PSQR操作的CPI為20,其他指令的平均CPI為1.25?,F(xiàn)提出兩種改進方案,一種是把FPSQR操作的CPI減至3,另一種是把所有FP操作的CPI減至

49、3,試比較兩種方案對系統(tǒng)性能的提高程度。 解:改進之前,系統(tǒng)的指令平均時鐘周期數(shù)為: 38. 2%7025. 1%3051niiiICICCPICPI 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 82 方案A:如果使 FPSQR 操作的時鐘周期數(shù)由CPIFPSQR20降至CPIFPSQR3,則系統(tǒng)的CPI為 : 方案:如果使所有FP操作的平均時鐘周期數(shù)由 CPIFP5降至CPIFP3,則整個系統(tǒng)的CPI為: 從降低整個系統(tǒng)的指令平均時鐘周期數(shù)的程度來看,方案 A優(yōu)于方案B 。7 . 1%432038. 2%4FPSQRFPSQRAICPCPICPICPI78. 1%303538. 2

50、%30FPFPBICPCPICPICPI 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 83計算兩種方案的加速比: 從加速比來看,同樣得出方案優(yōu)于方案的結論。4 . 17 . 138. 2CPUACPUAAACPICPICPIICCPIICS時鐘周期時鐘周期執(zhí)行時間的方案執(zhí)行時間改進前的34. 178. 138. 2BBCPICPIS 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 84 例1.4設有兩臺機器A和B,對條件轉移采用不同方法。CPUA采用比較指令和條件轉移指令處理方法,實現(xiàn)一次條件轉移需執(zhí)行兩條指令,條件轉移指令和比較指令各占執(zhí)行指令總數(shù)的15%。CPUB采用比較和

51、條件轉移指令合一方法,實現(xiàn)一次條件轉移只需執(zhí)行一條指令。若規(guī)定兩臺機器執(zhí)行條件轉移指令需2個時鐘周期,其他指令只需1個時鐘周期。CPUB的時鐘周期比CPUA慢20%。請比較: (1)CPUA和CPUB哪個工作速度更快? (2)若CPUB的時鐘周期只比CPUA慢10%,哪個CPU工作速度更快? 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 85解:(1)計算機器A CPIA0.1520.8511.15CPUA時間ICACPIATA1.15TAICA ICA是CPUA的指令條數(shù)。因CPUB無比較指令ICB0.85ICA使CPUB的轉移指令所占比例為15%85%17.65%18% 計算機器B

52、 CPIB0.1820.8211.18又因CPUB的TB比CPUA的TA慢20%,所以TB1.2TA CPUB時間ICBCPIBTB1.2 TAICA 比較可知, CPUA時間CPUB時間,故CPUA比CPUB工作速度快。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 86(2)此時有TB1.1TA,據前結論 CPUA時間1.15TAICA CPUB時間0.85ICA1.181.1TA 1.1 TAICA 因CPUB時間CPUA時間,故CPUB的工作速度更快些。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 871.4.3 系統(tǒng)結構的性能評價標準系統(tǒng)結構的性能評價標準 衡量計算

53、機性能的標準是機器真正執(zhí)行程序的時間。這里的執(zhí)行時間是計算機在完成一個任務時所花費的全部時間,也稱為計算機的響應時間。 CPU時間是指CPU工作的時間,不包括I/O等待時間。它可分為CPU執(zhí)行用戶程序的用戶CPU時間和CPU花費在操作系統(tǒng)上的系統(tǒng)CPU時間。 因此,計算機性能可分為基于響應時間的“系統(tǒng)性能”度量方法和基于用戶CPU時間的“CPU性能”度量方法。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 881. MIPS和MFLOPS MIPS是目前較為流行的描述計算機性能的替代標準之一。對于一個給定的程序,MIPS定義為:101066MIPSCPI時鐘頻率程序執(zhí)行時間指令條數(shù) M

54、IPS是單位時間內執(zhí)行指令的次數(shù)。若用Te表示程序的執(zhí)行時間,則Te的表達式為:106eMIPS 指令條數(shù)T 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 89 例1.5 已知某處理機的CPI0.5,鐘頻率為450 MHz,試計算該處理機的運算速度。 解:由于處理機的時鐘頻率為fc450 MHz,可求得運算速度為:MIPS9005 .0450101010666cCPIf 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 90 MIPS可從一定程度上反映了機器的性能。但是用MIPS評價機器的性能存在以下問題。 MIPS依賴于機器的指令集,所以用MIPS來衡量指令集不同的機器性能優(yōu)劣是

55、很不準確的。 在同一臺機器上,MIPS會因程序不同而發(fā)生變化,有時其差異會很大。 MIPS的評價結果可能與采用正確的性能評價方法的評價結果相反。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 91 如具有可選硬件浮點運算部件的機器。因為浮點運算速度低于整數(shù)運算,所以很多機器提供可選的硬件浮點運算部件。結果是用硬件實現(xiàn)浮點運算的時間少,而用軟件實現(xiàn)浮點運算的MIPS高,導致MIPS評價結果與機器實際性能相反。 因此MIPS標準只適宜于評價標量機,用MIPS來衡量向量機是不合適的。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 92 另一種替代標準是MFLOPS,即每秒百萬浮點操作

56、次數(shù)。MFLOPS定義為:106MFLOPS程序執(zhí)行時間程序中的浮點操作次數(shù) 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 93MFLOPS衡量機器性能時存在下述缺陷: MFLOPS只能衡量機器浮點操作的性能,而不能體現(xiàn)機器的整體性能。 MFLOPS的衡量是基于浮點操作而非指令來進行的,因此它可以用來比較不同指令集的機器之間的浮點操作性能,但比較的結果并非可靠。由于不同機器的浮點運算集可能不同。因此難以按MFLOPS評價它們的性能優(yōu)劣。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 94 MFLOPS取決于機器和程序兩個方面,不同程序在同一機器上的MFLOPS會不相同。因此用單

57、個程序的MFLOPS值不能反映機器的性能。 MFLOPS和MIPS之間的量值關系沒有統(tǒng)一標準,一般認為在標量計算機中執(zhí)行一次浮點運算需要條指令,平均約需條指令,故有1 MFLOPSMIPS。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 95 例1.6用一臺50MHz處理機執(zhí)行標準測試程序,程序所含的混合指令數(shù)和每類指令的CPI如表1. 4所示,求有效CPI、MIPS速率和程序的執(zhí)行時間。表1.4 標準測試程序的混合指令數(shù)和相應所需的時鐘周期數(shù)指令類型 整數(shù)運算 數(shù)據傳送 浮點操作 控制傳送 指令數(shù) 43 000 34 000 17 000 6 000 CPI 1222 解:總的指令數(shù)

58、為43 00034 000十17 000十6 000100 000條 因此各類指令所占的比例分別是:整數(shù)運算為43,數(shù)據傳送為34,浮點操作為17,控制傳送為6。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 96(1)有效CPI為 10.4320.34 20.1720.061.57CPI()MIPS速率為()程序的執(zhí)行時間為MIPS85.315057.11s3140s14003.0105057.10001006 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 972. 性能測試 機器的性能需要采用基準測試程序來測試評價,衡量計算機性能的標準是程序的執(zhí)行時間。基準測試程序是為比較測試機器性能而專門編制的程序,它考慮了各種操作和各種程序的比例,它可以是一組或多組程序。將 n 個測試程序在機器上運行,記錄它們的執(zhí)行時間,然后可按下述方法對n個執(zhí)行時間進行處理來評價機器性能。 第第1 1章章 計算機系統(tǒng)結構導論計算機系統(tǒng)結構導論 98(1)平均執(zhí)行時間 平均執(zhí)行時間是各測試程序執(zhí)行時間的算術平均值。niimTAn11niiimTWA1其中 Ti 為第 i 個測試程序的執(zhí)行時間。(2)加權執(zhí)行時間 加權執(zhí)行時間是各測試程序執(zhí)行時間的加權平均值其中權因子i 是第 i 個測試程序在總共 n 個測試程序中所占的比重, 。11niiW

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關資源

更多
正為您匹配相似的精品文檔
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網版權所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對上載內容本身不做任何修改或編輯。若文檔所含內容侵犯了您的版權或隱私,請立即通知裝配圖網,我們立即給予刪除!