(自考02325李学干版)计算机系统结构课后习题 联系客服

发布时间 : 星期五 文章(自考02325李学干版)计算机系统结构课后习题更新完毕开始阅读e5be4c29bcd126fff7050b39

法均需5拍;

(2)与(1)基本相同,只是乘法部件和加法部件可并行;

(3)处理器有一个乘、加法双功能静态流水线,乘、加法均由5个流水段构成,各段经过时间要1拍; (4)处理器有乘、加法两条流水线,可同时工作,各由5段构成,每段经过时间为1拍。 解答:

(1)在这种结构的处理器上求点积A*B的时空图如图0510所示: 图0510

完成全部运算最少需要75拍。

(2)在这种结构的处理器上求点积A*B的时空图如图0511所示: 图0511

完成全部运算最少需要45拍。

(3)在这种结构的处理器上求点积A*B的时空图如图0512所示: 图0512

完成全部运算最少需要30拍。

25

(4)在这种结构的处理器上求点积A*B的时空图如图0513所示: 图0513

完成全部运算最少需要26拍。 剖析:

向量A*B的点积为A*B=(8)∑(i=1)ai*bi=a1*b1+a2*b2+a3*b3+a4*b4+a5*b*+a6*b*+a7*b7+a8*b8,共需8次乘法和7次加法。

8.试总结IBM 360/91解决流水线控制的一般方法、途径和特点。 在流水线中设置相关直接通路解决局部相关; 用猜测法解决全局相关;

设置\向后8条\检查,加快短循环程序的处理; 对流水线的中断处理用\不精确断点法\。

9.在一个5段的流水线处理机上需经9拍才能完成一个任务,其预约表为: s1 s2 s3 s4 s5 t0 ∨ t1 ∨ t2 ∨ t3 ∨ ∨ t4 ∨ t5 ∨ t6 ∨ ∨ t7 ∨ t8 ∨ 分别写出延迟禁止表F、冲突向量C;画出流水线状态转移图;求出最小平均延迟及流水线的最大吞吐率及其高度方案。按此流水高度方案输入6个任务,求实际吞吐率。 解:

根据预约表,延迟禁止表F={1,3,4,8} 冲突向量为C:10001101 状态转移图如图0514所示 图0514

26

各种方案的平均延迟表: 调度方案 平均延迟 (2,5) 3.5 (2,7) 4.5 5 5 (5,6) 5.5 (6) 6 (6,7) 6.5 (7) 7 最小延迟为3.5拍,其调度方案为(2,5)。

按调度方案(2,5)输入6个任务时的时空图如图0515所示: 图0515

实际吞吐率TP=6/25(任务/拍)。 剖析:

求延迟禁止表F={1,3,4,8},第一行间隔8,第二行间隔1,第三行间隔1,3,4,然后间隔都为1,合并。

求冲突向量,写一个8位两进制数,根据禁止表倒着写。 由于初始冲突向量的c2,c5,c6,c7为0,所以第二个任务可以距第一个任务2,5,6或7拍流入流水线。

10.求向量D=A*(B+C),各向量元素均为N,参照CRAY-1方式分解为3条向量指令: 1:V3<-存储器{访存取A送入V3寄存器组} 2:V2<-V0+V1{B+C->K}

27

3:V4<-V2+V3{K*A->D}

当采用下列3种方式工作时需多少拍才能得到全部结果? (1)1、2、3、串行执行;

(2)1和2并行执行完后,再执行3; (3)采用链接技术。

解: (1)每条指令所需拍数为:

指令1:1(启动访存)+6(访存)+1(存V3)+N-1(第一个分量后每隔1拍出一个结果)=7+N 指令2:1(送浮加部件)+6(浮加)+1(存V2)+N-1=7+N 指令3:1(送浮乘部件)+7(浮乘)+1(存V4)+N-1=8+N 串行:7+N+7+N+8+N=22+3N

(2)指令1和2并行执行:1(启动访存,送浮加部件)+6(访存,浮加)+1(存V3,存V2)+N-1=7+N 1,2并行:7+N+8+N=15+2N (3)1+6+1+1++7+1+N-1=16+N

11.设向量长度为64,以CRAY-1机上所用浮点功能部件的执行时间分别为:相加6拍,相乘7拍,求倒数近似值14拍;从存储器读数6拍,打入寄存器及启动功能部件各1拍。问下列各指令组内的哪些指令可以链接?哪些指令不能链接?不能链接的原因是什么?分别计算出各指令组全部完成所需的拍数。 (1) V0←存储器 V1←V2+V3 V4←V5*V6

解:

(1)3条向量指令之间既没有发生源Vi冲突,也没有Vi的先写后读相关,又不存在功能部件的使用冲突,所以这3条向量指令可以同时并行流水。max{(1+6(访存)+1+64-1),(1+6(浮加)+1+64-1),(1+(7浮乘)+1+64-1)}=72拍。所以向量指令组全部完成需要72(拍)。

(2)3条向量指令之间没有功能部件的使用冲突,但是在第1、2两条向量指令与第3条向量指令之间有V2及V3的先写后读相关。只要让第1条向量指令较第2条向量指令提前1拍启动,则第1,2两条向量指令的第1个结果元素就可以被同时链接到第3条向量指令中。max{(1+(7浮乘)+1+64-1),(1+6(访存)+1+64-1)}+(1+6(浮加)+1+64-1)=80(拍)。

(3)第1条向量指令与第2条向量指令之间有V0的先写后读相关,两者可以链接。第3条向量指令与第2条向量指令之间有源向量寄存器V0的冲突,它们之间只能串行。第3条向量指令与第4条向量指令之间有加法功能部件的使用冲突,它们之间也只能串行。(1+6(访存)+1+1+(7浮乘)+1+64-1)+(1+6(访存)+1+64-1)(1+6(浮加)+1+64-1)=222(拍)。

(4)4条向量指令均依次有Vi的先写后读相关,但无源Vi冲突,也无功能部件的使用冲突,所以,这4条向量指令可以全部链接在一直,进行流水。(1+6(访存)+1)+(1+14(求倒数)+1)+(1+(7浮乘)+1)+(1+6(浮加)+1)+64-1=104拍。

12.设指令由取指、分析、执行三个子部件组成。每个子部件经过时间为△t,连续执行12条指令。请分别画出在常规标量流水处理机及度m均为4的超标量处理机、超长指令字处理机、超流水线处理机上工作的时空图,分别计算它们相对常规标量流水处理机的加速比Sp。 解:

常规标量处理机的时空图:

(2) V2←V0*V1 V3←存储器 V4←V2+V3 (3) V0←存储器 V2←V0*V1 V3←V2+V0 V5←V3+V4 (4) V0←存储器 V1←1/V0 V3←V1*V2 V5←V3+V4 28