7.真题
(1)①可见:通用寄存器(R0 - R3),PC
不可见:MAR,MDR,IR,T,移位寄存器
②在单总线结构下,总线只能在同一时刻提供一个输入,而ALU需要同时有两个输入,故需要将一个数据先输入到暂存寄存器中,然后通过暂存寄存器和总线各输入一个数据的方式满足ALU两个输入的要求
(2)①ALU支持七种操作,故需要至少3位的控制信号,即ALUop至少为3位
②SR支持三种操作,故需要至少2位的控制信号,即SRop至少为2位
(3)三态门:作用是控制移位寄存器和总线之间的数据通路是否连通
(4)①:控制移位寄存器和总线之间的数据通路是否连通
②:控制移位寄存器进行何种操作
③:控制ALU进行何种操作
⑤:控制T和总线之间的数据通路是否连通
⑧:控制MUX的0还是1端口选通
(5)取值阶段:(PC)→ MAR;M(MAR)→ MDR;(MDP)op→IR
PC + 2(指令字长为16位,按字节编码,故PC + "1" = PC + 2) :PC先经过总线输入到T中,然后通过MUXop = 0使op = 0,再给ALU施加加法命令,得到PC + 2再输入回PC中
进行其他运算时,一个数据先放在T中,然后从T输入ALU,另一个数据经过多路选择器(MUXop = 1)输入ALU
⑥→⑨
⑦→④
(1)①寻址方式位分别为0/1:Md、Ms1、Ms2都为1bit
②寄存器有4个:Rd、Rs1、Rs2为2bit
③指令字长为16bit → OP = 16 - 3 * (1 + 2) = 7 → 最多可以定义 2 ^ 7 = 128条指令
(2)①OP为7bit,则操作码分别取后七位,最高位舍去:000 0001,000 0010,000 0011
②inc:0000 001(OP)0(直接寻址)01(R1)000 000(单地址指令)
shl:0000 010(OP)0(直接寻址)10(R2)0(直接寻址)01(R1)000(二地址指令)
sub:0000 011(OP)0(直接寻址)11(R3)1(间接寻址)01(R1)0(直接寻址)10(R2)
即0240H、0488H、06EA
(3)①取值阶段:((PC))→IR(即将PC所指的指令,取到IR中);PC + "1"
第一步:PCout = 1,MARin = 1,Tin = 1,MEMop = read:PC中的数据输入到总线中,MAR和T同时读入PC的数据,并且对主存进行读操作(完成以PC值为地址取值,并PC+"1"做准备)
第二步:MUXop = 0,ALUop = add,SRop = mov:T寄存器中的内容和MUX0端一起输入ALU的两端,同时将SR的操作设置为直送(实现PC + "1")
第三步:SRout = 1,PCin = 1:将SR寄存器中的内容输出到总线中,并输入PC
第四部:MDRout = 1,IRin = 1:将从主存中取出的指令从MDR输入IR中
②执行阶段:shl R2,R1
第一步:R1out = 1,Tin = 1,ALUop = mova,SRop = left:先将R1寄存器中的数据经过总线输入到T寄存器中,给ALU一个直送的控制信号(即不对数据进行处理,因为题中的ALU没有左移功能),数据经过ALU到了SR后,SR对该数据进行左移处理
第二步:SRout = 1,R2in = 1:将SR中的数据经过总线输入R2寄存器中
执行阶段:sub R0、R2,R1
第一步:R1out = 1,MARin = 1,MEMop = read:寄存器间接寻址,将R1中的内容作作为地址,放入MAR中,再读取该地址的数据
第二步:R2out = 1,Tin = 1:将R2寄存器中的数据经过总线输入到T寄存器中(ALU的计算需要两个输入)
第三步:MDRout = 1,MUXop = 1,ALUop = sub,SRop = mov,SRout = 1,R0in =1:第一步根据R1地址从主存读入的数据存放在MDR中;MDR中的数据经过总线输入到MUX中,MUX的1端连通,故数据经过MUX和T寄存器中的数据一起输入ALU;给ALU一个sub控制信号,使其进行减法操作,结果输出到SR中;给SRmov的控制信号,使其不对数据进行任何处理,并通过总线输入到R0
C5:(R1)→ MAR R1out,MARin
C6:M(MAR)→ MDR MemR,MDRinE
C7:(MDR)→ A MDRout,Ain
C8:(R0)+(A)→ AC R0out,ADD,Cin
C9:(AC)→ MDR ACout,MDRin
C10:(MDR)→ M(MAR) MemW,MDRoutE
(1)①16位定长指令字格式 + 下条指令地址为(PC)+ 2 :按字节编址
②OFFSET用补码表示,8bit补码的表示范围为-128到+127,目标地址为2 * OFFSET,即OFFSET的值就代表其偏移的指令条数,而PC每次执行后会自动指向下一条指令,故最多可以向后偏移128 - 1 = 127条指令
(2)①NF = 1,则需要检查NF的值,而指令中NF的值为1,故需要发生转移,OFFSET的值为1110 0011,即E3H,负数符号扩展后为FFE3H,乘以二即左移1位 = FFC6H,故PC = 200CH + 0002H + FFC6H = 1FD4H
②CF = 1,则需要检查CF的值,而该指令中CF的值不为1,则不需要发生转移,故PC = 200CH + 0002H = 200EH
(3)无符号数比较小于等于即发生借位或者等于0,故检查CF和ZF,故C = 1,Z = 1 ,N = 0
(4)1.①中由OP、CF、ZF、NF、OFFSET组成,与指令的组成部分一致,故①是指令寄存器
2.每条指令的执行结果有两种:PC + 2和PC + 2 + OFFSET * 2,这两种结果的输出分别是多路选择器左端和右端的输出(通过IR寄存器C、Z、N位和标志寄存器输出的CF、ZF、NF相与得到多路选择器的控制信号,即选择多路选择器的哪个端口输出):
右端:PC输出在加法器的右端,在经过加法器后,和加法器左端的2进行加法操作,得到PC + 2
故右端的输出为PC + 2 + OFFSET * 2:在经过③前已经得到了PC + 2,还需要OFFSET * 2,故②为移位寄存器,实现移位操作,即通过左移得到OFFSET * 2;③为加法器,实现PC + 2和OFFSET * 2的相加,得到左端的最终输出PC + 2 + OFFSET * 2
①(R2)<< 2 → R4:R2寄存器中存放的是变量i,变量i左移2位,即变量i = i * 4,再将结果放回R4中;该指令的作用是得到A[i]的相对于A[0]的地址偏移量;从此处可知,数组A的每个元素的单位大小为4B
②(R4)+(R3)→ R4:R3寄存器存放的是数组A的首地址,R4寄存器存放的是A[i]地址相对于数组A的首地址的偏移量,两者相加得到A[i]的地址;A[i] = 始址 + 下标 * 元素大小
③((R4)+ 0)→ R5:R4寄存器存放的是A[i]的地址,根据此地址从主存中取出数据,即取出数组A的第i个元素放入R5中
④(R1)+(R5)→ R1:R1寄存器存放的是当前A数组前i - 1个元素总和的变量sum,R1 + R5得到数组A前i个元素的和,并结果放回R1中,即完成sum += A[i]
⑤(R2)+ 1 → R2:R2寄存器存放的是每轮i的取值,即完成i++
⑥if(R2)! = (R6)goto loop:R6寄存器存放的是变量N,即判断R2和R6是否满足循环结束的条件,若不满足,则跳转回LOOP处执行指令;若满足则,顺序执行指令,即实现for循环
(1)每行的机器代码是4B,每行指令地址相差4,故编制单位为字节
(2)①②③的作用是得到A[i]的地址,在①中i左移两位即i = i * 4,说明每个元素占用4B
(3)①bne指令为1446 FFFAH,根据指令格式可知末尾2B为OFFSET,FFFA = -6,即该指令实现向后偏移6个单位
②根据bne指令的地址0804 8114H和LOOP地址0804 8100H对比可知,该OFFSET的单位并不是字节,而
③oop指令和bne指令相差5个指令,PC在执行bne指令时实现PC + “1”,即指向bne的下条指令,故执行bne指令时,loop的地址和PC的值相差6个指令,满足向后偏移6个单位,可知OFFSET的单位是指令字长
④得到bne指令的转移目标地址计算公式:PC + 4 + (OFFSET * 4)::PC + 4实现指向PC + "1",OFFSET * 4表示按指令字长为单位进行偏移
(4)①(R2)<< 2 → R4:结果写回R4
②(R4)+(R3)→ R4:①写入R4,②读出R4,但②是①的相邻第一条指令,数据冒险
③((R4))+ 0 → R5:②写入R4,③读出R4,但③是②的相邻第一条指令,数据冒险
④(R1)+(R5)→ R1:③写入R5,④读出R5,但④是③的相邻第一条指令,数据冒险
⑤(R2)+ 1 → R2:①写入R2,⑤读出R2,⑤不是①的相邻三条指令其中之一,不会数据冒险
⑥if(R2)!= (R6)goto loop:⑤写入R2,⑥读出R2,但⑥是⑤的相邻指令,数据冒险
故②③④⑥发生数据冒险
⑥只有转移指令才会发生控制冒险,只有⑥为条件转移指令,故⑥发生控制冒险
分支指令(bxxx,ARM架构下的条件转移指令)的执行均引起3个时钟周期(停三个时钟周期)的阻塞,故执行⑥后,将会阻塞三个时钟周期,而不管是有条件转移指令还是无条件转移指令,至多只需要停三个时钟周期就不会发生阻塞,满足不阻塞条件
(5)①loop指令可以完整的执行IF、ID、EX、M、WB五个周期(第一条指令)
②add指令的IF阶段因为loop指令并不是条件转移指令,故不会发生控制冒险,即PC发生除+"1"外的改变,可以正常执行IF阶段;ID阶段需要取出R4的内容,但是loop指令在WB阶段会改变R4的内容,因此需要等待直到loop执行执行完WB阶段add指令才能继续执行ID阶段;EX、M、WB阶段按顺序执行
③load指令的IF阶段因为在第三个机器周期时,add指令并没有入时进入ID阶段,故IF阶段的IR寄存器中存放的是待进入ID阶段的add指令,如果此时load指令进入IF阶段,则将会覆盖IR寄存器中的add指令,因此load指令需要等待add指令进入ID阶段后,才能进入自己的IF阶段;同理②,load指令也需要等待add完成WB阶段后,才能进入ID阶段
④同理③,add指令需要等待load指令进入ID阶段才能进入自己的IF阶段;add指令需要等待load指令完成WB阶段才能进入自己的ID阶段;
⑤add指令需要等待add指令进入ID阶段才能进入自己的IF阶段;但其ID阶段并不会产生数据冒险,故可以顺序执行
⑥add指令可以顺序执行IF、ID,故bne指令可以在add指令执行完IF的下一个时钟周期执行自己的IF阶段,在执行IF阶段时,计算机只是完成了取指令的操作,并不知道当前取的指令是条件转移指令;其ID阶段需要等待add指令的WB阶段完成才能开始(数据冒险),在执行ID阶段时,计算机知道当前执行的是条件转移指令,根据题目所给的条件,执行分支指令时,阻塞三个时钟周期,故ID阶段开始阻塞三个时钟周期;bne指令的第四个周期(M)可能会修改自己的PC值,下条指令开始前,通过阻塞三个时钟周期的方式,已经执行了bne指令的M阶段,故不会引起控制冒险