首发公众号:Rand_cs
CPU
NES 使用的 CPU 为 6502,但与标准的 6502 有些许不同,最大的不同在于 NES 使用的芯片拥有一个 pAPU(pseudo-Audio Processing Unit),使其能够处理声音。本文主要来介绍 6502,废话不多说,直接来看
内存布局
前文简要介绍了 CPU 和 PPU 的地址空间,再来看看:
CPU 的地址空间主要分为三部分,CPU RAM,内存映射寄存器,卡带中的内存 这三部分。
由前文任天堂给出的总线图知道,地址总线有 16 位,所以可以寻址 $2^{16}=64KB$ 的空间,来看看这 64KB 详细的布局情况:
6502 的汇编里 16 进制使用 \$ 来表示,\$0000-$07ff 这 2KB 是其内部的 RAM,而后的 \$0800-\$1fff 都是 \$0000-\$07ff 的镜像,意思是说 \$0000, \$0800, \$1000, \$1800 这 4 个地址映射到同一块物理内存
\$2000-\$2007 是 CPU 与 PPU(Picture Process Unit) 交互的寄存器,PPU 是用来处理图像的,可以看作是 NES 的显卡,这在后面的 PPU 中再详述。\$2008-\$3FFF 为 \$2000-\$2007 的镜像
\$4000-\$4020 这部分是其他的 I/O 寄存器,这在后面的文章中介绍。
\$4020-\$6000 是卡带中的一块内存,不是每个卡带都会用到。
\$6000-\$8000 映射到卡带的一个 RAM 芯片,这块区域主要用来存档,有的卡带支持此选项,但据我的经历,还没有遇到过这种可以存档的卡带(小时候一个游戏每次只能从头开始,有时玩着是真的心累啊)。另外 RAM 保存信息需要定时刷新,所以这块芯片肯定也是会配有电池。
\$8000-\$10000 这 32KB 来存放游戏代码,其中游戏的代码又分为高低 bank,映射到不同的区域。另外 \$FFFA-\$FFFF 是拿来存放中断向量的(不是所有空间),只有三种中断也就只有三个中断向量,这在后面中断详述。
关于 6502 地址空间的大致布局就先说那么多,有关 PPU,卡带 留待后面详述,本篇主要讲述 CPU 6502,那就先来仔细看看,其内部的 RAM 的布局情况。
RAM 布局
6502 下将 256 字节称为 Page,Zero Page 是内存的第一页,它主要通过特定的寻址方式(零页寻址)来使得 CPU 执行速度更快,具体的寻址方式后面再论。
\$0100-\$0200 用作栈使用,也是向下扩展的,栈就不多说了,大家应该都很熟悉了,
其他部分就没什么了,就是当作普通的内存使用,另外虽然一些手册资料里面没有明确说明,但我看了一些 NES 游戏编程,\$200-\$2ff 这 256 字节用作精灵条目,这对应着 PPU 关于精灵的 256 字节空间。
寄存器
Program Counter
16 bit,程序计数器 PC,存放下一条指令的地址,一条指令执行时就会更新这个寄存器的值,使它指向下一条指令的地址,与我们熟悉的 PC 一样,可以被分支指令修改等等,不再多说。
Stack Pointer
栈指针 SP,6502 架构下的栈也是上下颠倒向下扩展的,即 push 一个元素 SP 减小,POP 一个元素 SP 增加。
这个栈指针并不是直接指向栈内存的地址,而是一个最大值为 \$FF 的偏移量。6502 的栈没有溢出检测,栈指针的值就是从 \$00 到 \$FF 之间回绕(wrap around),意思就是说 当前值为 \$FF 时再往下移时就变成了 \$00
Accumulator(A)
8 bit,用来存放运算结果或者从内存取回来的数据
Index Register X(X)
8 bit,用来作为循环的计数器或者特定寻址下的偏移量,也可以存放从内存取出来的数据,还能用来设置或者获取栈指针
Index Register Y(Y)
基本同 X,但是 Y 不能影响栈指针,就是不能用 Y 的值来设置栈指针
Processor Status(P)
状态寄存器,同 x86 下的 EFLAGS 寄存器,来看 6502 的状态寄存器记录了哪些信息:
- Carry Flag(C),进位标志(一般对于无符号数来说),如果最近一条指令有溢出——上溢:超出了 255,下溢:低于 0,则设置该 bit 为 1,比如说执行 255 + 1 会上溢,将 Carry Flag 置 1。有了 Carry Flag,使得可以进行长度超过 8 位的运算。
- Zero Flag(Z),最近一条指令的结果是否为 0,如果是,则置 1,否则清零
- Interrupt Disable(I),置 1 会使得系统忽略 IRQ 中断,清零则响应,SEI(Set Interrupt Disable) 指令将该位置 1,CLI(Clear Interrupt Disable)将该位清 0
- Decimal Mode(D),该位用来将 6502 切换到 BCD 模式,但 NES 里面不用
- Break Command(B),该位用来表示一个 BRK(Break) 指令在执行,该指令就是发出一个 IRQ 中断,类似 x86 下的 INT
- Overflow Flag(V),溢出标志(一般对于有符号数来说),如果运算有溢出,则置 1
- Negative Flag(N),该位就是运算结果的最高位
寻址方式
下面主要来说说寻址方式,6502 的寻址方式很多,感觉有些乱,来看:
指令格式:操作码 + 操作数
操作码占用 1 个字节
Accumulator
累加器寻址,操作数在累加器中,CPU 直接操作累加器,只有移位指令会使用该寻址模式,比如说 ASL(算数左移)
ASL A ;A << 1
Implied
隐式寻址,使用隐含寻址的指令不要额外“显式”的操作数,比如说 PHA,将 累加器压栈,这个操作数 累加器是隐式的,所以叫做隐式寻址
Immediate
立即数寻址,即指令指出操作数的部分 给出的 不是操作数地址,而是操作数本身,这就是立即数寻址,也就是说这条指令需要的操作数没有在内存或者寄存器中,而是在指令本身里面,使用汇编指令时,在立即数的前面加上 # 表示“这是个立即数”,举个例子:
LDA #$01 ;A = 0x01
Absolute
绝对寻址,指令中操作数部分为 操作数的绝对地址,举个例子:
AND $1234 ;将地址为1234的数据取出来与A相与
;A = A & [1234]
Zero Page
绝对寻址的地址高字节为 0 的话,就是零页寻址,零页寻址指令的操作数部分只有 1 个字节,所以使用零页寻址的指令更短,执行更快,因为只用取一个操作数。因此经常使用的数据通常都放在零页。
LDA $12 ;将$0012地址处的值加载到A
Relative
相对寻址,只用于分支指令,操作数是一个有符号数,相对于当前 PC 的偏移量。
BEQ $12 ;如果状态寄存器Z位为0,则PC+=(2+$12),加2是因为跳过当前指令
Indirect
间接寻址,只有 jmp 跳转指令会使用间接寻址,此寻址方式有两操作数,比如说 aa 和 bb,它们形成一个 16 位地址 bbaa,aabb 上包含 xx,aabb + 1 上包含 yy,形成地址 yyxx,那么这个 jmp 指令会跳转到 yyxx,注意存放的位置顺序
$6C $34 $12 ;指令的机器码
JMP ($1234) ;跳转到$1234开始的两字节组成的地址
Zero Page X Indexed
零页 X 变址寻址,只有一个操作数,假如为 aa,则操作数的地址为 X + aa,所得地址一定要在零页之内,所以要作回绕处理。即 $addr = (X+aa)\%FF$
AND $12, X ;将(X+$12)%$FF处的数据与A相与
Zero Page Y Indexed
用法同上,不过只有 LDX(Load X Register) 和 STX(Store X Register) 指令会用这种寻址方式,看名字应知道这指令是什么作用,不再赘述
Absolute X Indexed
绝对 X 变址,在绝对寻址获得的地址基础上再加上 X 的值,就是操作数的地址
LDA $1234, X ;将$1234+X处的值加载到A
Absolute Y Indexed
绝对 Y 变址,同上,只是 X 换为 Y
Indexed Indirect
X 变址间接寻址,有些复杂,来看任天堂的 NES 文档中给出的图:
先变址后间接,变址部分同 零页 X 变址(有回绕),只不过获得的地址是个间接地址,还要再进行间接寻址,如上面的例子,操作码为 aa,操作数为 bb,则间接地址为 bb + X,bb + X 开始的两字节形成的地址 yyxx 才是最终操作数的地址,操作数为 zz。
Indirect Indexed
间接 Y 变址寻址,同样来看图:
基本与上面相反,直接来说这个图的意思,指令 aa bb,aa 为操作码,bb 为操作数部分,是一个间接地址,这个地址开始的两字节形成一个新地址 yyxx,再做变址 yyxx+Y 得到的地址即为操作数 zz 的地址。
上述就是所有的寻址方式,13 种,属实有些多,不过也还是有规律可循,基本上就是基址,变址,间接这些的组合。
中断
中断的概念就不说了,由什么疑惑的可以看看我之前写的关于中断的文章:################,这里直接来看 6502 如何处理中断。
NES 有三种形式的中断,NMI,IRQ,RESET。
中断向量表放在 \$FFFA-\$FFFF,中断向量表存放的是中断处理程序(Interrupt Handler) 的地址。
IRQ
IRQ,Interrupt Request,Maskable Interrupts,主要是由一些卡带里的 Mapper 发起,Mapper 主要用来突破游戏 40KB 的限制(32KB的PRG+8KB的CHR),现下可以简单理解为指导卡带里的数据如何映射到 CPU 的地址空间,后面再详述这方面的内容。另外 BRK 指令也可以发起一个 IRQ,前面说过就跟 x86 下的 INT 一样的。
IRQ 类型的中断处理程序的地址位于 \$FFFE 和 \$FFFF,这两个地址上存放的内容合起来才是真正的处理程序的地址
NMI
NMI,Non-Maskable Interrupt,不可屏蔽中断,其实可以屏蔽的,只是不会被 CPU 的状态寄存器的 I 位屏蔽,但是可以设置 $2000(PPU Control Register) 来屏蔽该中断 。
NMI 是当 V-Blank 发生时产生的一种中断,前文也简要说过 V-Blank,我们玩游戏时,整个屏幕大小为 $256 \times 240$,每一帧的图像都是从上到下一行一行的渲染,我们可见的部分有 256 行,渲染的每一行叫做 Scanline,当渲染完可见部分的 256 行之后回到最左上角准备渲染下一帧的这一段时间我们就叫做 V-Blank。而这段时间就要发起 NMI 中断,关于图像是 NES 最难的一部分,具体情况讲述 PPU 时再详述。
NMI 的中断处理程序的地址位于 \$FFFA 和 \$FFFB
Reset
重置,第一次启动或者按下重置按钮时发生的中断,中断处理程序的地址位于 \$FFFC 和 \$FFFD
中断处理过程
上述就是 NES 的三种类型中断,下面来看中断的处理过程,下面的步骤来自任天堂的文档,当个翻译工:
- 识别发生了哪种中断,查了查 6502 的 一个手册,虽然看不太懂里面的电路,但是明确表示了里面有相应的 detector,比如说 NMI edge detector,所以是能够检测识别出发生了哪一种中断
- 完成当前指令,不会一检测到中断就立马停下手头事务取处理中断
- 程序计数器,状态寄存器 压栈
- 设置状态寄存器的 I 位关中断
- PC 设置为中断处理程序的地址
- 执行中断处理程序
- 执行 RTI(Return From Interrupt) 指令从中断返回,程序计数器,状态寄存器出栈
- 回到原任务继续执行
这就是 6502 的中断处理过程,比较简单,过程和了解的 x86,MIPS 等等都差不多,中断处理需要花费 CPU 7 个 clock。
指令
下面来说说 6502 的指令,前面有说过一些,基本格式为 操作码 + 操作数,操作码占据一个字节,操作数部分要视寻址方式而定。
具体的指令我就不再本文叙述了,太多了,这个东西还是查手册为好。有兴趣的可以戳这个链接:
https://wiki.nesdev.org/w/index.php?title=CPU_unofficial_opcodes
https://wusiyu.me/6502-cpu汇编语言指令集/
只是再多说一点,操作码有官方给出的,还有一些非官方的,有一些游戏它是要使用非官方的操作码,所以再写 NES 模拟器的时候,若想要支持绝大多数游戏,则要将所有的指令,不论官方还是非官方的全都实现了
NES 的 CPU 6502 或者说 2A03 就说到这,有什么问题还请批评指正,也欢迎大家来同我交流讨论学习。下一篇讲述最困难也是最令人兴奋的 PPU 部分。
首发公众号:Rand_cs