文档详情

计算机组成原理作业

wuli****0220
实名认证
店铺
DOCX
309.99KB
约26页
文档ID:166949394
计算机组成原理作业_第1页
1/26

第 1 章 习 题 答 案5.若有两个基准测试程序P1和P2在机器M1和M2上运行,假定M1和M2的价格分别是5000元和8000元,下表给出了P1和P2在M1和M2上所花的时间和指令条数程序M1M2指令条数执行时间(ms)指令条数执行时间(ms)P1200×10610000150×1065000P2300×1033420×1036请回答下列问题:(1) 对于P1,哪台机器的速度快?快多少?对于P2呢?(2) 在M1上执行P1和P2的速度分别是多少MIPS?在M2上的执行速度又各是多少?从执行速度来看,对于P2,哪台机器的速度快?快多少?(3) 假定M1和M2的时钟频率各是800MHz和1.2GHz,则在M1和M2上执行P1时的平均时钟周期数CPI各是多少? (4) 如果某个用户需要大量使用程序P1,并且该用户主要关心系统的响应时间而不是吞吐率,那么,该用户需要大批购进机器时,应该选择M1还是M2?为什么?(提示:从性价比上考虑)(5) 如果另一个用户也需要购进大批机器,但该用户使用P1和P2一样多,主要关心的也是响应时间,那么,应该选择M1还是M2?为什么?参考答案:(1) 对于P1,M2比M1快一倍;对于P2,M1比M2快一倍。

2) 对于M1,P1的速度为:200M/10=20MIPS;P2为300k/0.003=100MIPS对于M2,P1的速度为:150M/5=30MIPS;P2为420k/0.006=70MIPS从执行速度来看,对于P2,因为100/70=1.43倍,所以M1比M2快0.43倍 (3) 在M1上执行P1时的平均时钟周期数CPI为:10×800M/(200×106)=40在M2上执行P1时的平均时钟周期数CPI为:5×1.2G/(150×106)=404) 考虑运行P1时M1和M2的性价比,因为该用户主要关心系统的响应时间,所以性价比中的性能应考虑执行时间,其性能为执行时间的倒数故性价比R为:R=1/(执行时间×价格)R越大说明性价比越高,也即,“执行时间×价格”的值越小,则性价比越高因为10×5000 > 5×8000,所以,M2的性价比高应选择M25) P1和P2需要同等考虑,性能有多种方式:执行时间总和、算术平均、几何平均若用算术平均方式,则:因为 (10+0.003)/2×5000 > (5+0.006)/2×8000,所以M2的性价比高,应选择M2若用几何平均方式,则:因为sqrt(10×0.003) ×5000 < sqrt(5×0.006) ×8000,所以M1的性价比高,应选择M1。

8.假设某机器M的时钟频率为4GHz,用户程序P在M上的指令条数为8×109,其CPI为1.25,则P在M上的执行时间是多少?若在机器M上从程序P开始启动到执行结束所需的时间是4秒,则P占用的CPU时间的百分比是多少?参考答案:程序P在M上的执行时间为:1.25×8×109×1/4G = 2.5 s,从启动P执行开始到执行结束的总时间为4秒,其中2.5秒是P在CPU上真正的执行时间,其他时间可能执行操作系统程序或其他用户程序程序P占用的CPU时间的百分比为:2.5/4 = 62.5%10.假定机器M的时钟频率为1.2GHz,某程序P在机器M上的执行时间为12秒钟对P优化时,将其所有的乘4指令都换成了一条左移2位的指令,得到优化后的程序P’已知在M上乘法指令的CPI为5,左移指令的CPI为2,P的执行时间是P’执行时间的1.2倍,则P中有多少条乘法指令被替换成了左移指令被执行?参考答案:显然,P’的执行时间为10秒,因此,P比P’多花了2秒钟,因此,执行时被换成左移指令的乘法指令的条数为1.2G×2/(5–2) = 800M第 二 章 习 题 答 案3.实现下列各数的转换3) (0101 1001 0110.0011)8421 = (?)10= (?) 2= (?) 16参考答案:4. 假定机器数为8位(1位符号,7位数值),写出下列各二进制数的原码和补码表示。

0.1001,–0.1001,+1.0,–1.0,+0.010100,–0.010100,+0,–0参考答案: 原码 补码+0.1001: 0.1001000 0.1001000–0.1001: 1.1001000 1.0111000+1.0: 溢出 溢出–1.0: 溢出 1.0000000+0.010100: 0.0101000 0.0101000–0.010100: 1.0101000 1.1011000+0: 0.0000000 0.0000000–0: 1.0000000 0.00000005. 假定机器数为8位(1位符号,7位数值),写出下列各二进制数的补码和移码表示1001,–1001,+1,–1,+10100,–10100,+0,–0参考答案: 移码 补码+1001: 10001001 00001001–1001: 01110111 11110111+1: 10000001 00000001–1: 011111111 11111111+10100: 10010100 00010100–10100: 01101100 11101100+0: 10000000 00000000–0: 10000000 000000007.假定一台32位字长的机器中带符号整数用补码表示,浮点数用IEEE 754标准表示,寄存器R1和R2的内容分别为R1:0000108BH,R2:8080108BH。

不同指令对寄存器进行不同的操作,因而,不同指令执行时寄存器内容对应的真值不同假定执行下列运算指令时,操作数为寄存器R1和R2的内容,则R1和R2中操作数的真值分别为多少?(1) 无符号数加法指令(2) 带符号整数乘法指令(3) 单精度浮点数减法指令参考答案: R1 = 0000108BH = 0000 0000 0000 0000 0001 0000 1000 1011b R2 = 8080108BH = 1000 0000 1000 0000 0001 0000 1000 1011b(1)对于无符号数加法指令,R1和R2中是操作数的无符号数表示,因此,其真值分别为R1:108BH, R2:8080108BH2)对于带符号整数乘法指令,R1和R2中是操作数的带符号整数补码表示,由最高位可知, R1为正数, R2为负数R1的真值为+108BH, R2的真值为–(0111 1111 0111 1111 1110 1111 0111 0100b + 1b) = –7F7FEF75H3)对于单精度浮点数减法指令,R1和R2中是操作数的IEEE754单精度浮点数表示在IEEE 754 标准中,单精度浮点数的位数为32位,其中包含1位符号位,8位阶码,23位尾数。

由R1中的内容可知,其符号位为0,表示其为正数,阶码为0000 0000,尾数部分为000 0000 0001 0000 1000 1011,故其为非规格化浮点数,指数为–126,尾数中没有隐藏的1,用十六进制表示尾数为+0.002116H,故R1表示的真值为+0.002116H × 10-126由R2中的内容可知,其符号位为1,表示其为负数,阶码为0000 0001, 尾数部分为000 0000 0001 0000 1000 1011,故其为规格化浮点数,指数为1–127 = –126,尾数中有隐藏的1,用十六进制表示尾数为–1.002116H,故R2表示的真值为–1.002116H × 10-1269.以下是一个C语言程序,用来计算一个数组a中每个元素的和当参数len为0时,返回值应该是0,但是在机器上执行时,却发生了存储器访问异常请问这是什么原因造成的,并说明程序应该如何修改 1 float sum_elements(float a[], unsigned len) 2 { 3 int i; 4 float result = 0; 5 6 for (i = 0; i <= len–1; i++) 7 result += a[i]; 8 return result; 9 }参考答案:参数len的类型是unsigned,所以,当len=0时,执行len-1的结果为11…1,是最大可表示的无符号数,因而,任何无符号数都比它小,使得循环体被不断执行,引起数组元素的访问越界,发生存储器访问异常。

只要将len声明为int型,或循环的测试条件改为i

参考答案:–0.125 = –0.001B = –1.0 × 2-3x在机器内部的机器数为:1 01111100 00…0 (BE00 0000H)7.5= +111.1B= +1.111 × 22y在机器内部的机器数为:0 10000001 11100…0 (40F0 0000H)100=64+32+4=1100100Bi在机器内部表示的机器数为:0000 0000 0110 0100(0064H)大端机 小端机地址 内容 内容 100 BEH 00H 101 00H 00H 102 00H 00H 103 00H BEH 108 40H 00H 109 F0H 00H 110 00H F0H 111 00H 40H 112 00H 64H 113 64H 00H18.假定某计算机的总线采用奇校验,每8位数据有一位校验位,若在32位数据线上传输的信息是8F 3C AB 96H,则对应的4个校验位应为什么?若接受方收到的数据信息和校验位分别为87 3C AB 96H和0101B,则说明发生了什么情况,并给出验证过程。

参考答案: 传输信息8F 3C AB 96H展开为1000 1111 0011 1100 1010 1011 1001 0110,每8位有一个奇校验位,因此,总线上发送方送出的4个校验位应该分别为0、1、0、1 接受方的数据信息为87 3C AB 96H,展开后为1000 0111 0011 1100 1010 1011 1001 0110;接收到的校验位分别为0、1、0、1在接受方进行校验判断如下: 根据接收到的数据信息计算出4个奇校验位分别为1、1、0、1,将该4位校验位分别和接收到的4位校验位进行异或,得到1、0、0、0,说明数据信息的第一个字节发生传输错误对照传输前、后的数据信息,第一字节8FH变成了87H,说明确实发生了传输错误,验证正确第 3 章 习 题 答 案3.考虑以下C语言程序代码:int func1(unsigned word){ return (int) (( word <<24) >> 24);}int func2(unsigned word){ return ( (int) word <<24 ) >> 24;}假设在一个32位机器上执行这些函数,该机器使用二进制补码表示带符号整数。

无符号数采用逻辑移位,带符号整数采用算术移位请填写下表,并说明函数func1和func2的功能Wfunc1(w)func2(w)机器数值机器数值机器数值0000 007FH1270000 007FH+1270000 007FH+1270000 0080H1280000 0080H+128FFFF FF80H–1280000 00FFH2550000 00FFH+255FFFF FFFFH–10000 0100H2560000 0000H00000 0000H0 函数func1的功能是把无符号数高24位清零(左移24位再逻辑右移24位),结果一定是正的有符号数;而函数func2的功能是把无符号数的高24位都变成和第25位一样,因为左移24位后进行算术右移,高24位补符号位(即第25位)5.以下是两段C语言代码,函数arith( )是直接用C语言写的,而optarith( )是对arith( )函数以某个确定的M和N编译生成的机器代码反编译生成的根据optarith( ),可以推断函数arith( ) 中M和N的值各是多少?#define M #define N int arith (int x, int y){ int result = 0 ; result = x*M + y/N; return result;}int optarith ( int x, int y){ int t = x; x << = 4; x - = t; if ( y < 0 ) y += 3;y>>2; return x+y;参考答案:可以看出x*M和“int t = x; x << = 4; x-=t;”三句对应,这些语句实现了x乘15的功能(左移4位相当于乘以16,然后再减1),因此,M等于15;y/N与“if ( y < 0 ) y += 3; y>>2;”两句对应,功能主要由第二句“y右移2位”实现,它实现了y除以4的功能,因此N是4。

而第一句“if ( y < 0 ) y += 3;”主要用于对y=–1时进行调整,若不调整,则–1>>2=–1而–1/4=0,两者不等;调整后 –1+3=2,2>>2=0,两者相等7.用SN74181和SN74182器件设计一个16位先行进位补码加/减运算器,画出运算器的逻辑框图,并给出零标志、进位标志、溢出标志、符号标志的生成电路 参考答案(图略):逻辑框图参见教材中的图3.15和图3.16,将两个图结合起来即可,也即只要将图3.15中的B输入端的每一位Bi取反,得到Bi,和原码Bi一起送到一个二路选择器,由进位C0作为选择控制信号当C0为1时做减法,此时,选择将Bi作为SN74181的B输入端;否则,当C0为1时,做加法零标志ZF、进位标志CF、溢出标志OF、符号标志SF的逻辑电路根据以下逻辑表达式画出即可ZF=F15+F14+F13+F12+F11+F10+F9+F8+F7+F6+F5+F4+F3+F2+F1+F0CF=C16OF= C0(A15B15F15 + A15B15F15)+ C0(A15B15F15 + A15B15F15)SF= F159.已知x = 10,y = – 6,采用6位机器数表示。

请按如下要求计算,并把结果还原成真值1) 求[x+y]补,[x–y]补2) 用原码一位乘法计算[x×y]原4) 用不恢复余数法计算[x/y]原的商和余数参考答案:[10]补 = 001010 [–6]补 = 111010   [6]补 = 000110 [10]原 = 001010 [–6]原 = 100110 (1) [10+(– 6)]补= [10]补+[– 6]补= 001010+111010 = 000100 (+4) [10–(–6)]补= [10]补+[– (–6)]补 = 001010+000110 = 010000 (+16) (2) 先采用无符号数乘法计算001010× 000110的乘积,原码一位乘法过程(前面两个0省略)如下: C P Y 说明 0 0 0 0 0 0 1 1 0 P0 = 0 + 0 0 0 0 y4 = 0,+0 0 0 0 0 0 C, P 和Y同时右移一位 0 0 0 0 0 0 0 1 1 得P1+ 1 0 1 0 y3 = 1,+X 0 1 0 1 0 C, P 和Y同时右移一位 0 0 1 0 1 0 0 0 1 得P2 + 1 0 1 0 y2 = 1,+X 0 1 1 1 1 0 0 0 0 C, P 和Y同时右移一位 0 0 1 1 1 1 0 0 0 得P3 + 0 0 0 0 y1 = 0,+0 0 0 1 1 1 C, P 和Y同时右移一位 0 0 0 1 1 1 1 0 0 得P4 若两个6位数相乘的话,则还要右移两次,得 000000 111100符号位为:0 Å 1 = 1,因此,[X×Y]原 = 1000 0011 1100即X × Y = –11 1100B = – 60 (4) 因为除法计算是2n位数除n位数,所以[6]原=0110,[10]原=0000 1010,[–6]补=1010,商的符号位:0 Å 1 = 1,运算过程(前面两个0省略)如下: 余数寄存器R 余数/商寄存器Q 说 明 0 0 0 0 1 0 1 0 开始R0 = X+ 1 0 1 0 R1 = X–Y1 0 1 0 1 0 1 0 0 R1< 0,则q 4 = 0,没有溢出 0 1 0 1 0 1 0 0 2R1(R和Q同时左移,空出一位商)+ 0 1 1 0 R2 = 2R1+Y 1 0 1 1 0 1 0 0 0 R2 < 0,则q 3 = 0 0 1 1 0 1 0 0 0 2R2 (R和Q同时左移,空出一位商)+ 0 1 1 0 R3 = 2R2 +Y 1 1 0 0 1 0 0 0 0 R3 < 0,则q 2 = 0 1 0 0 1 0 0 0 0 2R3 (R和Q同时左移,空出一位商)+ 0 1 1 0 R3 = 2R2 +Y 1 1 1 1 0 0 0 0 0 R4 < 0,则q1 = 0 1 1 1 0 0 0 0 0 2R4 (R和Q同时左移,空出一位商)+ 0 1 1 0 R5 = 2R4 +Y 0 1 0 0 0 0 0 0 1 R5 > 0,则q 0 = 1商的数值部分为:00001。

所以,[X/Y]原=00001 (最高位为符号位),余数为010013.假设浮点数格式为:阶码是4位移码,偏置常数为8,尾数是6位补码(采用双符号位),用浮点运算规则分别计算在不采用任何附加位和采用2位附加位(保护位、舍入位)两种情况下的值假定对阶和右规时采用就近舍入到偶数方式)(1)(15/16) ×27 +(2/16) ×25 (2)(15/16) ×27–(2/16) ×25 参考答案(假定采用隐藏位): X= (15/16) ×27 = 0.111100B ×27= (1.111000)2 × 26 Y1= (2/16) ×25 = 0.001000B ×25= (1.000000)2 × 22 Y2= (–2/16) ×25 = –0.001000B ×25= (–1.000000)2 × 22 K= (15/16) ×25 = 0.111100B ×25= (1.111000)2 × 24J1= (2/16) ×27 = 0.001000B ×27= (1.000000)2 × 24J2= (–2/16) ×27 = –0.001000B ×27= (–1.000000)2 × 24根据题目所给的各种位数,可以得到在机器中表示为: [X]浮 = 00 1110 (1)111000 [Y1]浮 = 00 1010 (1)000000 [Y2]浮 = 11 1010 (1)000000 [K]浮 = 00 1100 (1)111000 [J1]浮 = 00 1100 (1)000000 [J2]浮 = 11 1100 (1)000000 所以,E x = 1110,Mx = 00 (1). 111000 ,E y1 = 1010,My = 00(1).000000,E y2 = 1010,My = 11(1).000000Ek = 1100,MK = 00 (1). 111000 ,E J1 = 1100,MJ1 = 00(1).000000,E J2 = 1100,MJ2 = 11(1).000000 尾数M中小数点前面有三位,前两位为数符,表示双符号,第三位加了括号,是隐藏位“1”。

没有附加位时的计算:(1) X+Y1[ΔE]补 = [E x]移 + [–[E y1]移]补 (mod 2n) = 1110 + 0110 = 0100ΔE = 4,根据对阶规则可知需要对y1进行对阶,结果为:E y1 = E x = 1110,My 1= 000.000100尾数相加:Mb = Mx + My1 = 001. 111000+ 000.000100 = 001.111100,两位符号相等,数值部分最高位为1,不需要进行规格化,所以最后结果为:E=1110,M=00(1).111100, 即(31/32) ×27(2) X+Y2[ΔE]补 = [E x]移 + [–[E y2]移]补 (mod 2n) = 1110 + 0110 = 0100;ΔE = 4,根据对阶规则可知需要对y2进行对阶,结果为:E y2 = E x = 1110,My2= 111.111100尾数相加:Mb = Mx + My2 = 001. 111000+ 111.111100=001.110100,两位符号相等,数值部分最高为1,不需要进行规格化,所以最后结果为:E=1110,M=00(1).110100, 即(29/32) ×2714.采用IEEE 754单精度浮点数格式计算下列表达式的值。

1)0.75+(– 65.25) (2)0.75–(– 65.25)参考答案:x = 0.75 = 0.110...0B = (1.10...0)2 × 2-1 y = – 65.25 = – 1000001.01000...0B = (–1.00000101...0) 2 × 26 用IEEE 754标准单精度格式表示为: [x]浮 = 0 01111110 10...0 [y]浮 = 1 10000101 000001010...0 所以,E x = 01111110,Mx = 0 (1). 1...0 ,E y = 10000101,My = 1(1).000001010...0 尾数Mx和My中小数点前面有两位,第一位为数符,第二位加了括号,是隐藏位“1”以下是计算机中进行浮点数加减运算的过程(假定保留2位附加位:保护位和舍入位)(1)0.75+ (– 65.25)① 对阶: [ΔE]补 = [E x]移 + [–[E y]移]补 (mod 2n) = 0111 1110 + 0111 1011 = 1111 1001 ΔE = –7,根据对阶规则可知需要对x进行对阶,结果为:Ex = E y = 10000101,Mx = 00.000000110...000x的尾数Mx右移7位,符号不变,数值高位补0,隐藏位右移到小数点后面,最后移出的2位保留② 尾数相加:Mb = Mx + My = 00.000000110...000+ 11.000001010 ...000 (注意小数点在隐藏位后)根据原码加/减法运算规则,得:00.000000110...000+ 11.000001010...000 = 11.000000100…000上式尾数中最左边第一位是符号位,其余都是数值部分,尾数后面两位是附加位(加粗)。

③ 规格化:根据所得尾数的形式,数值部分最高位为1,所以不需要进行规格化 ④ 舍入:把结果的尾数Mb中最后两位附加位舍入掉,从本例来看,不管采用什么舍入法,结果都一样,都是把最后两个0去掉,得:Mb = 11.000000100…0 ⑤ 溢出判断:在上述阶码计算和调整过程中,没有发生“阶码上溢”和“阶码下溢”的问题因此,阶码Eb = 10000101 最后结果为Eb = 10000101,Mb = 1(1).00000010…0,即:– 64.52) 0.75–(– 65.25)① 对阶: [ΔE]补 = [E x]移 + [–[E y]移]补 (mod 2n) = 0111 1110 + 0111 1011 = 1111 1001 ΔE = -7,根据对阶规则可知需要对x进行对阶,结果为:Ex = E y = 10000110,Mx = 00.000000110...000x的尾数Mx右移一位,符号不变,数值高位补0,隐藏位右移到小数点后面,最后移出的位保留② 尾数相加:Mb = Mx – My = 00.000000110...000 – 11.000001010...000 (注意小数点在隐藏位后)根据原码加/减法运算规则,得:00.000000110...000 – 11.000001010...000=01.00001000…000上式尾数中最左边第一位是符号位,其余都是数值部分,尾数后面两位是附加位(加粗)。

③ 规格化:根据所得尾数的形式,数值部分最高位为1,不需要进行规格化 ④ 舍入:把结果的尾数Mb中最后两位附加位舍入掉,从本例来看,不管采用什么舍入法,结果都一样,都是把最后两个0去掉,得:Mb = 01.00001000…0 ⑤ 溢出判断:在上述阶码计算和调整过程中,没有发生“阶码上溢”和“阶码下溢”的问题因此,阶码Eb = 10000101 最后结果为Eb = 10000101,Mb = 0(1).00001000…0,即:+66第 4 章 习 题 答 案3. 已知某机主存空间大小为64KB,按字节编址要求:(1)若用1K×4位的SRAM芯片构成该主存储器,需要多少个芯片?(2)主存地址共多少位?几位用于选片?几位用于片内选址?(3)画出该存储器的逻辑框图参考答案:(1)64KB / 1K×4位 = 64×2 = 128片2)因为是按字节编址,所以主存地址共16位,6位选片,10位片内选址3)显然,位方向上扩展了2倍,字方向扩展了64倍下图中片选信号CS为高电平有效4. 用64K×1位的DRAM芯片构成256K×8位的存储器要求:(1) 计算所需芯片数,并画出该存储器的逻辑框图。

2) 若采用异步刷新方式,每单元刷新间隔不超过2ms,则产生刷新信号的间隔是多少时间?若采用集中刷新方式,则存储器刷新一遍最少用多少读写周期?参考答案:(1)256KB / 64K×1位 = 4×8 = 32片存储器逻辑框图见下页(图中片选信号CS为高电平有效)2)因为每个单元的刷新间隔为2ms,所以,采用异步刷新时,在2ms内每行必须被刷新一次,且仅被刷新一次因为DRAM芯片存储阵列为64K=256×256,所以一共有256行因此,存储器控制器必须每隔2ms/256=7.8µs产生一次刷新信号采用集中刷新方式时,整个存储器刷新一遍需要256个存储(读写)周期,在这个过程中,存储器不能进行读写操作6. 某计算机中已配有0000H~7FFFH的ROM区域,现在再用8K×4位的RAM芯片形成32K×8位的存储区域,CPU地址总线为A0-A15,数据总线为D0-D7,控制信号为R/W#(读/写)、MREQ#(访存)要求说明地址译码方案,并画出ROM芯片、RAM芯片与CPU之间的连接图假定上述其他条件不变,只是CPU地址线改为24根,地址范围000000H~007FFFH为ROM区,剩下的所有地址空间都用8K×4位的RAM芯片配置,则需要多少个这样的RAM芯片?参考答案:CPU地址线共16位,故存储器地址空间为0000H~FFFFH,其中,8000H~FFFFH为RAM区,共215=32K个单元,其空间大小为32KB,故需8K×4位的芯片数为32KB/8K×4位= 4×2 = 8片。

因为ROM区在0000H~7FFFH,RAM区在8000H~FFFFH,所以可通过最高位地址A15来区分,当A15为0时选中ROM芯片;为1时选中RAM芯片,此时,根据A14和A13进行译码,得到4个译码信号,分别用于4组字扩展芯片的片选信号图略,可参照图4.15)若CPU地址线为24位,ROM区为000000H~007FFFH,则ROM区大小为32KB,总大小为16MB=214KB=512×32KB,所以RAM区大小为511×32KB,共需使用RAM芯片数为511×32KB/8K×4位=511×4×2个芯片7. 假定一个存储器系统支持4体交叉存取,某程序执行过程中访问地址序列为3, 9, 17, 2, 51, 37, 13, 4, 8, 41, 67, 10,则哪些地址访问会发生体冲突?参考答案:对于4体交叉访问的存储系统,每个存储模块的地址分布为:Bank0: 0、4、8、12、16 … …Bank1: 1、5、9、13、17 …37 …41…Bank2: 2、6、10、14、18 … …Bank3: 3、7、11、15、19…51…67如果给定的访存地址在相邻的4次访问中出现在同一个Bank内,就会发生访存冲突。

所以,17和9、37和17、13和37、8和4发生冲突10. 假定某机主存空间大小1GB,按字节编址cache的数据区(即不包括标记、有效位等存储区)有64KB,块大小为128字节,采用直接映射和全写(write-through)方式请问:(1)主存地址如何划分?要求说明每个字段的含义、位数和在主存地址中的位置2)cache的总容量为多少位? 参考答案:(1)主存空间大小为1GB,按字节编址,说明主存地址为30位cache共有64KB/128B=512行,因此,行索引(行号)为9位;块大小128字节,说明块内地址为7位因此,30位主存地址中,高14位为标志(Tag);中间9位为行索引;低7位为块内地址2)因为采用直接映射,所以cache中无需替换算法所需控制位,全写方式下也无需修改(dirty)位,而标志位和有效位总是必须有的,所以,cache总容量为512×(128×8+14+1)=519.5K位11. 假定某计算机的cache共16行,开始为空,块大小为1个字,采用直接映射方式CPU执行某程序时,依次访问以下地址序列:2,3,11,16,21,13,64,48,19,11,3,22,4,27,6和11。

要求:(1)说明每次访问是命中还是缺失,试计算访问上述地址序列的命中率2)若cache数据区容量不变,而块大小改为4个字,则上述地址序列的命中情况又如何?参考答案(1) cache采用直接映射方式,其数据区容量为16行×1字/行=16字;主存被划分成1字/块,所以,主存块号 = 字号因此,映射公式为:cache行号 = 主存块号 mod 16 = 字号 mod 16开始cache为空,所以第一次都是miss,以下是映射关系(字号-cache行号)和命中情况2-2: miss,3-3: miss,11-11: miss,16-0: miss, 21-5: miss,13-13: miss,64-0: miss、replace,48-0: miss、replace,19-3: miss、replace,11-11: hit, 3-3: miss、replace,22-6: miss,4-4: miss,27-11: miss、replace,6-6: miss、replace,11-11: miss、replace 只有一次命中!(2)cache采用直接映射方式,数据区容量不变,为16个字,每块大小为4个字,所以,cache共有4行;主存被划分为4个字/块,所以,主存块号 = [字号/4]。

因此,映射公式为:cache行号 = 主存块号 mod 4 = [字号/4] mod 4以下是映射关系(字号-主存块号-cache行号)和命中情况2-0-0: miss,3-0-0: hit,11-2-2: miss,16-4-0: miss、replace,21-5-1、13-3-3: miss,64-16-0、48-12-0、19-4-0: miss, replace,11-2-2: hit,3-0-0: miss、replace,22-5-1: hit,4-1-1: miss、replace,27-6-2: miss、replace,6-1-1: hit,11-2-2: miss、replace 命中4次 由此可见,块变大后,能有效利用访问的空间局部性,从而使命中率提高!17. 假设某计算机的主存地址空间大小为64MB,采用字节编址方式其cache数据区容量为4KB,采用4路组相联映射方式、LRU替换和回写(write back)策略,块大小为64B请问:(1)主存地址字段如何划分?要求说明每个字段的含义、位数和在主存地址中的位置2)该cache的总容量有多少位?(3)若cache初始为空,CPU依次从0号地址单元顺序访问到4344号单元,重复按此序列共访问16次。

若cache命中时间为1个时钟周期,缺失损失为10个时钟周期,则CPU访存的平均时间为多少时钟周期?参考答案:(1)cache的划分为:4KB = 212B = 24组×22行/组×26字节/行,所以,cache组号(组索引)占4位 主存地址划分为三个字段:高16位为标志字段、中间4位为组号、最低6位为块内地址即主存空间划分为:64MB = 226B = 216组群×24块/组群×26字节/块(2)cache共有64行,每行中有16位标志、1位有效位、1位修改(dirty)位、2位LRU位,以及数据64B故总容量为64×(16+1+1+2+64×8)=34048位3)因为每块为64B,CPU访问的单元范围为0~4344,共4345个单元,4345/64=67.89,所以CPU访问的是主存前68块(第0~67块),也即CPU的访问过程是对前68块连续访问16次,总访存次数为16×4345 = 695200631434412842886416次1#2#67#0#6568#4352cache共有16组,每组4行,采用LRU算法的替换情况如下图所示:根据图中所示可知,第一次循环的每一块只有第一次未命中,其余都命中;以后15次循环中,有20块的第一字未命中,其余都命中。

所以命中率p为(69520–68–15×20)/69520 = 99.47%平均访存时间为:Hit Time + (1–p) × Miss Penalty=1+10×(1–p) = 1+0.0053×10 = 1.053个时钟周期23. 假定一个虚拟存储系统的虚拟地址为40位,物理地址为36位,页大小为16KB,按字节编址若页表中有有效位、存储保护位、修改位、使用位,共占4位,磁盘地址不在页表中,则该存储系统中每个进程的页表大小为多少?如果按计算出来的实际大小构建页表,则会出现什么问题?参考答案:因为每页大小有16KB,所以虚拟页数为240B/16KB=2(40-14)=226页物理页面和虚拟页面大小相等,所以物理页号的位数为36–14=22位页表项位数为:有效位+保护位+修改位+使用位+物理页号位数=4+22=26位为简化页表访问,每项大小取32位因此,每个进程的页表大小为:226×32b=256MB如果按实际计算出的页表大小构建页表,则页表过大而导致页表无法一次装入内存24. 假定一个计算机系统中有一个TLB和一个L1 data cache该系统按字节编址,虚拟地址16位,物理地址12位;页大小为128B,TLB为四路组相联,共有16个页表项;L1 data cache采用直接映射方式,块大小为4B,共16行。

在系统运行到某一时刻时,TLB、页表和L1 data cache中的部分内容(用十六进制表示)如下:组号 标记 页框号 有效位 标记 页框号 有效位 标记 页框号 有效位 标记 页框号 有效位003–0090D100–0070211032D102–004–00A–0202–008–006–003–0307–0630D10A34172–0(a) TLB(四路组相联):四组、16个页表项虚页号 页框号 有效位 行索引 标记 有效位 字节3 字节2 字节1 字节00008101911256C9AC010311150––––0214121B1034512CD030213360––––04–043212334C22A0516150D14667233D06–06–0––––070717161125465DC0813182412362123A0917192D0––––0A091A2D1436223C30B–0B–0––––0C191C121768321350D–0D161A3F423110E111E3312D4A45550F0D1F140––––(b) 部分页表:(开始16项) (c) L1 data cache:直接映射,共16行,块大小为4B请回答下列问题:(1)虚拟地址中哪几位表示虚拟页号?哪几位表示页内偏移量?虚拟页号中哪几位表示TLB标记?哪几位表示TLB索引?(2)物理地址中哪几位表示物理页号?哪几位表示页内偏移量?(3)主存(物理)地址如何划分成标记字段、行索引字段和块内地址字段?(4)CPU从地址067AH中取出的值为多少?说明CPU读取地址067AH中内容的过程。

参考答案:(1)16位虚拟地址中低7位为页内偏移量,高9位为虚页号;虚页号中高7位为TLB标记,低2位为TLB组索引2)12位物理地址中低7位为页内偏移量,高5位为物理页号3)12位物理(主存)地址中,低2位为块内地址,中间4位为cache行索引,高6位为标记4)地址067AH=0000 0110 0111 1010B,所以,虚页号为0000011 00B,映射到TLB的第00组,将0000011B=03H与TLB第0组的四个标记比较,虽然和其中一个相等,但对应的有效位为0,其余都不等,所以TLB缺失,需要访问主存中的慢表直接查看0000011 00B =00CH处的页表项,有效位为1,取出物理页号19H=11001B,和页内偏移111 1010B拼接成物理地址:11001 111 1010B根据中间4位1110直接找到cache第14行(即:第E行),有效位为1,且标记为33H=110011B,正好等于物理地址高6位,故命中根据物理地址最低两位10,取出字节2中的内容4AH=01001010B第 5 章 习 题 答 案3. 假定某计算机中有一条转移指令,采用相对寻址方式,共占两个字节,第一字节是操作码,第二字节是相对位移量(用补码表示),CPU每次从内存只能取一个字节。

假设执行到某转移指令时PC的内容为200,执行该转移指令后要求转移到100开始的一段程序执行,则该转移指令第二字节的内容应该是多少?参考答案:因为执行到该转移指令时PC为200,所以说明该转移指令存放在200单元开始的两个字节中因为CPU每次从内存只能取一个字节,所以每次取一个字节后PC应该加1该转移指令的执行过程为:取200单元中的指令操作码并译码→PC+1→取201单元的相对位移量→PC+1→计算转移目标地址假设该转移指令第二字节为Offset,则100=200+2+Offset,即Offset = 100–202 = –102 = 10011010B (注:没有说定长指令字,所以不一定是每条指令占2个字节4. 假设地址为1200H的内存单元中的内容为12FCH,地址为12FCH的内存单元的内容为38B8H,而38B8H单元的内容为88F9H说明以下各情况下操作数的有效地址和操作数各是多少?(1)操作数采用变址寻址,变址寄存器的内容为12,指令中给出的形式地址为1200H (2)操作数采用一次间接寻址,指令中给出的地址码为1200H3) 操作数采用寄存器间接寻址,指令中给出的寄存器编号为8,8号寄存器的内容为1200H。

参考答案:(1) 有效地址EA=000CH+1200H=120CH,操作数未知2) 有效地址EA=(1200H)=12FCH,操作数为38B8H3) 有效地址EA=1200H,操作数为12FCH6. 某计算机指令系统采用定长指令字格式,指令字长16位,每个操作数的地址码长6位指令分二地址、单地址和零地址三类若二地址指令有k2条,无地址指令有k0条,则单地址指令最多有多少条?参考答案:设单地址指令有k1条,则 ((16 – k2) ×26 – k1) ×26 = k0,所以 k1= (16 – k2) ×26 – k0/26 7. 某计算机字长16位,每次存储器访问宽度16位,CPU中有8个16位通用寄存器现为该机设计指令系统,要求指令长度为字长的整数倍,至多支持64种不同操作,每个操作数都支持4种寻址方式:立即(I)、寄存器直接(R)、寄存器间接(S)和变址(X),存储器地址位数和立即数均为16位,任何一个通用寄存器都可作变址寄存器,支持以下7种二地址指令格式(R、I、S、X代表上述四种寻址方式):RR型、RI型、RS型、RX型、XI型、SI型、SS型请设计该指令系统的7种指令格式,给出每种格式的指令长度、各字段所占位数和含义,并说明每种格式指令需要几次存储器访问? 参考答案: 指令格式可以有很多种,只要满足以下的要求即可。

操作码字段:6位;寄存器编号:3位;直接地址和立即数:16位;变址寄存器编号:3位;总位数是8的倍数 指令格式例1:0000OP (6位)R t (3位)Rs (3位)RR型0010OP (6位)Rt (3位)Imm16 (16位)RI型0100OP (6位)R t (3位)Rs (3位)RS型0110OP (6位)Rt (3位)Offset16 (16位)RX型。

下载提示
相关文档
正为您匹配相似的精品文档