



# 《计算机组成原理实验》

# 实验报告

(实验二)

学院名称 : 数据科学与计算机学院

专业(班级) : 17级计科教务一班

学生姓名 : 陈鸿峥

学号 : 17341015

时间 : 2018 年 11 月 12 日

# 成绩：

---

## 实验二：单周期CPU设计与实现

### 一、 实验目的

1. 掌握单周期CPU数据通路图的构成、原理及其设计方法
2. 掌握单周期CPU的实现方法，代码实现方法
3. 认识和掌握指令与CPU的关系
4. 掌握测试单周期CPU的方法

### 二、 实验内容

设计一个单周期CPU，使其至少能实现以下指令功能操作。指令与格式如下：

表 1: 基本MIPS指令及其格式

|      | 指令                | 功能                                                                 | op     | rs       | rt     | rd     | sham/func                             |
|------|-------------------|--------------------------------------------------------------------|--------|----------|--------|--------|---------------------------------------|
| 算术运算 | add rd, rs, rt    | $rd \leftarrow rs + rt$                                            | 000000 | rs(5位)   | rt(5位) | rd(5位) | reserved                              |
|      | sub rd, rs, rt    | $rd \leftarrow rs - rt$                                            | 000001 | rs(5位)   | rt(5位) | rd(5位) | reserved                              |
|      | addiu rt, rs, imm | $rt \leftarrow rs + \text{SignExt}(imm)$                           | 000010 | rs(5位)   | rt(5位) |        | imm16                                 |
| 逻辑运算 | andi rt, rs, imm  | $rt \leftarrow rs \& \text{ZeroExt}(imm)$                          | 010000 | rs(5位)   | rt(5位) |        | imm16                                 |
|      | and rd, rs, rt    | $rd \leftarrow rs \& rt$                                           | 010001 | rs(5位)   | rt(5位) | rd(5位) | reserved                              |
|      | ori rt, rs, imm   | $rt \leftarrow rs   \text{ZeroExt}(imm)$                           | 010010 | rs(5位)   | rt(5位) |        | imm16                                 |
|      | or rd, rs, rt     | $rd \leftarrow rs   rt$                                            | 010011 | rs(5位)   | rt(5位) | rd(5位) | reserved                              |
| 移位   | sll rd, rt, sa    | $rd \leftarrow rt \ll \text{ZeroExt}(sa)$                          | 011000 | reserved | rt(5位) | rd(5位) | sa(5位)                                |
| 比较   | slti rt, rs, imm  | $rs < \text{SignExt}(imm) ? rt=1 : rt=0$                           | 011100 | rs(5位)   | rt(5位) |        | imm16                                 |
| 访存   | sw rt, imm(rs)    | $\text{mem}[rs + \text{SignExt}(imm)] \leftarrow rt$               | 100110 | rs(5位)   | rt(5位) |        | imm16                                 |
|      | lw rt, imm(rs)    | $rt \leftarrow \text{mem}[rs + \text{SignExt}(imm)]$               | 100111 | rs(5位)   | rt(5位) |        | imm16                                 |
| 分支   | beq rs, rt, imm   | $rs == rt$<br>? $pc + 4 + \text{SignExt}(imm) \ll 2$<br>: $pc + 4$ | 110000 | rs(5位)   | rt(5位) |        | imm16                                 |
|      | bne rs, rt, imm   | $rs != rt$<br>? $pc + 4 + \text{SignExt}(imm) \ll 2$<br>: $pc + 4$ | 110001 | rs(5位)   | rt(5位) |        | imm16                                 |
|      | bltz rs, imm      | $rs < \$0$<br>? $pc + 4 + \text{SignExt}(imm) \ll 2$<br>: $pc + 4$ | 110010 | rs(5位)   | 00000  |        | imm16                                 |
| 跳转   | j addr            | $pc \leftarrow \{(pc+4)[31:28], addr[27:2], 2'b00\}$               | 111000 |          |        |        | addr[27:2]                            |
| 停机   | halt              | halt                                                               | 111111 |          |        |        | 00000000000000000000000000000000(26位) |

注意：reserved为预留部分，一般用0填充

### 三、 实验器材

电脑一台、Xilinx Vivado软件一套、Basys3板一块

### 四、 实验原理

#### I. 基本概念

##### i. 单周期CPU

单周期CPU是指CPU的每条指令都在一个时钟周期内完成，通常在每个时钟周期的上升沿触发。

CPU在处理指令时一般要经过以下五个阶段：

1. 取指(IF): 根据程序计数器PC中的指令地址，从存储器中取出一条指令，同时，PC根据指令字长度自动递增产生下一条指令所需要的指令地址；但遇到“地址转移”指令时，则需要对“转移地址”进行处理后送入PC。
2. 译码(ID): 对取指操作中得到的指令进行译码，确定该指令需要完成的操作，从而产生相应的操作控制信号，用于下一步的执行。
3. 执行(EXE): 根据指令译码得到的操作控制信号，执行指令动作。
4. 访存(MEM): 所有需要访问存储器的操作都将在这个步骤中执行，该步骤给出存储器的数据地址，把数据写入到存储器中数据地址所指定的存储单元，或者从存储器中得到数据地址单元中的数据。
5. 写回(WB): 将指令执行的结果或者访问存储器得到的数据写回相应的目标寄存器。

##### ii. 数据通路及控制信号

表 2: 控制信号

| 控制信号名    | 状态0           | 状态1           |
|----------|---------------|---------------|
| Reset    | 初始化PC为0       | PC接收新地址       |
| PCWre    | PC不更改, halt   | PC更改          |
| RegDst   | 写入寄存器地址来自rt字段 | 写入寄存器地址来自rd字段 |
| RegWrite | 寄存器不可写        | 寄存器可写         |
| ALUSrcA  | 寄存器rs内容       | 立即数sa         |
| ALUSrcB  | 寄存器rt内容       | 立即数imm        |
| ExtOp    | 零扩展           | 符号扩展          |
| ALUOp    | 见表4           |               |
| MemToReg | ALU输出         | 内存读取          |
| MemWrite | 内存不可写         | 内存可写          |
| Branch   | 非分支           | 分支            |
| Jump     | 非跳转           | 跳转            |



图 1: 基本数据通路

### iii. MIPS指令格式

MIPS指令可分为以下三种格式： 其中各字段缩写含义如表3所示。

|        |        |        |        |        |           |        |   |
|--------|--------|--------|--------|--------|-----------|--------|---|
| R-type | 31     | 26     | 21     | 16     | 11        | 6      | 0 |
|        | op     | rs     | rt     | rd     | shamt     | funct  |   |
|        | 6 bits | 5 bits | 5 bits | 5 bits | 5 bits    | 6 bits |   |
| I-type | 31     | 26     | 21     | 16     |           |        | 0 |
|        | op     | rs     | rt     |        | immediate |        |   |
|        | 6 bits | 5 bits | 5 bits |        | 16 bits   |        |   |
| J-type | 31     | 26     |        |        | immediate |        | 0 |
|        | op     |        |        |        | immediate |        |   |
|        | 6 bits |        |        |        | 26 bits   |        |   |

图 2: MIPS 指令类型

## II. 各指令数据通路分析

公共的数据通路为取指和PC+4，见图3最左红色通路，下文将不再提及。

### i. 算术逻辑运算

1. add/sub/and/or指令均为R类型，数据通路相同，唯一不同为ALU操作码的选择。见图3，执行阶段从指令中读入rs、rt、rd三个寄存器的地址，然后从寄存器堆中读出rs和rt寄存器的内容，送至ALU进行运算，最后写回rd寄存器。
  2. addiu/andi/ori/slti指令均为I类型，数据通路相同，同样是ALU操作码不同。见图4，执行阶段从指令中读入rs、rt寄存器的地址，但rt是作为写入寄存器(RegDst=0)；指令低16位进行扩充，将rs的内容和立即数送入ALU运算，最后写回rt寄存器。注意addiu/slti进行

表 3: MIPS指令各字段缩写含义

|                  |                                   |
|------------------|-----------------------------------|
| op               | 操作码                               |
| rs               | 只读, 第一个源操作数寄存器地址/编号, 范围为0x00~0x1F |
| rt               | 可读可写, 第二个源操作数地址或目标操作数寄存器地址        |
| rd               | 只写, 目的操作数寄存器地址                    |
| shamt(shift amt) | 位移量, 在移位指令中用于指定移多少位               |
| funct            | 功能码, 在R类型指令中配合op一起使用              |
| immediate        | 16位立即数                            |
| address          | 目标转移地址                            |

符号扩展, andi/ori进行零扩展。

3. sll指令为R类型, 但是指令格式比较特殊。见图5, 执行阶段从指令中读入rt寄存器的地址并取出, 取指令的[10:6]位读出立即数sa并进行零扩展(ALUSrcA=1), 利用ALU对rt的内容及sa进行移位操作, 结果写回rd寄存器。



图 3: Add/sub/and/or通路

## ii. 访存

- sw为I类型。见图6, 执行阶段从指令中读入rs、rt寄存器的地址, 对偏移量(imm)进行符号扩展, 与rs寄存器的内容相加得到内存地址, 将rt寄存器的内容写入内存。
- lw为I类型。见图7, 执行阶段从指令中读入rs、rt寄存器的地址, rt作为写入寄存器(RegDst=0), 对偏移量(imm)进行符号扩展, 与rs寄存器的内容相加得到内存地址, 将内存的内容写



图 4: Addiu/andi/ori/slti通路



图 5: sll通路

入rt寄存器。



图 6: `sw`通路

### iii. 分支跳转

由于MIPS指令为32位(4字节)，一般情况下PC每次自增都加4，即PC末两位一定为0，放在指令中（PC偏移/转移地址）即可省略末两位。指令读出时则要左移2位，将末尾的0补齐。为最大程度利用指令的每一位，跳转指令也是将高4位和低2位都省略掉了，读出时要补回。

1. `beq/bne/bltz`为I类型。见图8，执行阶段从指令中读入rs、rt寄存器的地址，利用ALU对rs、rt寄存器的内容进行相减(`beq/bne`)或有符号比较(`bltz`)，若结果为0，则Zero标志置1，否则置0；同时，立即数imm进行符号扩展，并左移两位，与原有的PC+4再相加，得到是否执行分支跳转指令(`beq: PCSrc=Zero, bne/bltz: PCSrc=~Zero`)。
2. `jump`为j类型。见图9，执行阶段直接对指令的低26位左移2位，补上PC+4的高4位，得到跳转地址，更新PC。

### iv. 停机指令

PCWrite置为0，不改变PC的值，PC不再变化

## III. 各组件实现

各组件实现详情见第8章节，均有详细注释。在这里仅仅提一些需要注意的点。

1. 指令存储器和数据存储器均采用小端(little endian)存储，并且位宽为8位，故生成的指令文件需要进行预处理，最先读入的应该是指令的低8位。这里用Python进行预处理并生成指令二进制代码文件，读入时直接将其初始化到指令存储器中。



图 7: lw通路



图 8: beq/bne/bltz通路



图 9: jump通路

2. 程序计数器(PC)需要初始化置零(0x0000000), 遇到reset信号时同样置零, 而且只有在PCWrite=1时才更新PC。
  3. 多路选择器(MUX)需要实现一个32位和一个5位的, 32位可以复用 (创建多个实例)。
  4. ALU的功能见表4。
  5. 控制单元的设计见第4.4节。

IV. 控制单元

由前面的分析，可以得到控制单元的编码表，见表5。

## 五、实验步骤

## I. 仿真模拟

采用表6给出的汇编程序代码段进行测试。注意指令的二进制编码应该对应到MIPS的每一个字段上，特别注意sll的书写，负数用补码表示等。生成二进制指令文件后，CPU将其读入指令存储器并执行，看波形结果。

## II. 上板

使用Basys3板运行所设计的CPU时，需要通过4个七段数码管来查看当前CPU的执行情况。

只考虑指令和数据的低8位，即指令存储器中的指令地址范围和数据存储器中的数据地址范围均为 0x00~ 0xFF。

通过Basys3板上的开关SW15、SW14选择七段数码管显示的内容，具体显示的功能码如表7所示。

表 4: ALU功能码

| ALUOp[2:0] | 功能                                                                                      | 描述     |
|------------|-----------------------------------------------------------------------------------------|--------|
| 000        | $Y = A + B$                                                                             | 加      |
| 001        | $Y = A - B$                                                                             | 减      |
| 010        | $Y = B \ll A$                                                                           | 左移     |
| 011        | $Y = A \vee B$                                                                          | 逻辑或    |
| 100        | $Y = A \wedge B$                                                                        | 逻辑与    |
| 101        | $Y = (A < B) ? 1 : 0$                                                                   | 比较无符号数 |
| 110        | $Y = (((A < B) \&\& (A[31] == B[31])) \\    ((A[31] == 1 \&\& B[31] == 0))) \\ ? 1 : 0$ | 比较有符号数 |
| 111        | $Y = A \oplus B$                                                                        | 逻辑异或   |

### III. 七段数码管显示电路

基本实现步骤如下：

- 对Basys3板系统时钟信号(100MHz)进行分频，使得数码管内容能够正常显示。频率不宜过快，过快会导致全部数码管显示的都是8；也不宜过慢，否则数码管会出现暂留现象，无法连续显示。在本次实现中采用10kHz的频率进行显示。
- 用上面得到的频率生成4进制计数器，用于产生4个数位选信号AN3-AN0。这4个数可控制哪个数码管亮，一共四组编码(1110、1101、1011、0111)，每组编码中只有一位为0（亮），其余都为1（灭），在每一个位选信号到来之时更新数码管显示。其实前两步可以一并完成，见第8章分频计数器一节。
- 将从CPU接收到的相应数据转换为数码管显示信号，与位选信号一起送往数码管显示输出。

### IV. 其他注意事项

#### 1. 共阳极数码管

Basys3板的数码管均为共阳极，故设置七段数码管和位选信号时都要考虑0为亮，1为灭。

#### 2. 两个时钟信号

CPU工作时钟和Basys3板系统时钟是两个不同的时钟，但是FPGA只支持单一全局时钟，否则在routing阶段会报错

Poor placement for routing between an IO pin and BUFG

故需要采取其他方法。只设置全局时钟为clk，并将CPU工作时钟clk\_cpu与其同步，即在每一个clk上升沿时，赋值in<=clk\_cpu，通过下面消抖处理后，将in作为真正的CPU工作时钟。

表 5：指令控制器编码

|      | 指令                | op     | RegDst | ExtSel | RegWrite | ALUSrcA/B | ALUOp | MemToReg | MemWrite | Branch | Jump |
|------|-------------------|--------|--------|--------|----------|-----------|-------|----------|----------|--------|------|
| 算术运算 | add rd, rs, rt    | 000000 | 1      | x      | 1 0      | 0         | 000   | 0        | 0        | 0      | 0    |
|      | sub rd, rs, rt    | 000001 | 1      | x      | 1 0      | 0         | 001   | 0        | 0        | 0      | 0    |
|      | addiu rt, rs, imm | 000010 | 0      | 1      | 1 0      | 1         | 000   | 0        | 0        | 0      | 0    |
|      | andi rt, rs, imm  | 010000 | 0      | 0      | 1 0      | 1         | 100   | 0        | 0        | 0      | 0    |
| 逻辑运算 | and rd, rs, rt    | 010001 | 1      | x      | 1 0      | 0         | 100   | 0        | 0        | 0      | 0    |
|      | ori rt, rs, imm   | 010010 | 0      | 0      | 1 0      | 1         | 011   | 0        | 0        | 0      | 0    |
|      | or rd, rs, rt     | 010011 | 1      | x      | 1 0      | 0         | 011   | 0        | 0        | 0      | 0    |
| 移位   | sll rd, rt, sa    | 011000 | 1      | x      | 1 1      | 0         | 010   | 0        | 0        | 0      | 0    |
|      | slti rt, rs, imm  | 011100 | 0      | 1      | 1 0      | 1         | 110   | 0        | 0        | 0      | 0    |
| 访存   | sw rt, imm(rs)    | 100110 | x      | 1      | 0 0      | 1         | 000   | x        | 1        | 0      | 0    |
|      | lw rt, imm(rs)    | 100111 | 0      | 1      | 1 0      | 1         | 000   | 1        | 0        | 0      | 0    |
|      | beq rs, rt, imm   | 110000 | x      | 1      | 0 0      | 0         | 001   | x        | 0        | 1      | 0    |
| 分支   | bne rs, rt, imm   | 110001 | x      | 1      | 0 0      | 0         | 001   | x        | 0        | 1      | 0    |
|      | bltz rs, imm      | 110010 | x      | 1      | 0 0      | 0         | 110   | x        | 0        | 1      | 0    |
| 跳转   | j addr            | 111000 | x      | x      | 0 x      | x         | x     | x        | 0        | 0      | 1    |
| 停机   | halt              | 111111 | x      | x      | x x      | x         | x     | x        | x        | x      | x    |

表 6: 测试代码段指令

| address    | instruction                   | op     | rs    | rt    | rd/imm              | hex        |
|------------|-------------------------------|--------|-------|-------|---------------------|------------|
| 0x00000000 | addiu \$1,\$0,8               | 000010 | 00000 | 00001 | 0000 0000 0000 1000 | 0x08010008 |
| 0x00000004 | ori \$2,\$0,2                 | 010010 | 00000 | 00010 | 0000 0000 0000 0010 | 0x48020002 |
| 0x00000008 | add \$3,\$2,\$1               | 000000 | 00010 | 00001 | 0001 1000 0000 0000 | 0x00411800 |
| 0x0000000C | sub \$5,\$3,\$2               | 000001 | 00011 | 00010 | 0010 1000 0000 0000 | 0x04622800 |
| 0x00000010 | and \$4,\$5,\$2               | 010001 | 00101 | 00010 | 0010 0000 0000 0000 | 0x44A22000 |
| 0x00000014 | or \$8,\$4,\$2                | 010011 | 00100 | 00010 | 0100 0000 0000 0000 | 0x4C824000 |
| 0x00000018 | sll \$8,\$8,1                 | 011000 | 00000 | 01000 | 0100 0000 0100 0000 | 0x60084040 |
| 0x0000001C | bne \$8,\$1,-2 ( $\neq$ ,转18) | 110001 | 01000 | 00001 | 1111 1111 1111 1110 | 0xC501FFFE |
| 0x00000020 | slti \$6,\$2,4                | 011100 | 00010 | 00110 | 0000 0000 0000 0100 | 0x70460004 |
| 0x00000024 | slti \$7,\$6,0                | 011100 | 00110 | 00111 | 0000 0000 0000 0000 | 0x70c70000 |
| 0x00000028 | addiu \$7,\$7,8               | 000010 | 00111 | 00111 | 0000 0000 0000 1000 | 0x08e70008 |
| 0x0000002C | beq \$7,\$1,-2 (=,转28)        | 110000 | 00111 | 00001 | 1111 1111 1111 1110 | 0xC0E1FFFE |
| 0x00000030 | sw \$2,4(\$1)                 | 100110 | 00001 | 00010 | 0000 0000 0000 0100 | 0x98220004 |
| 0x00000034 | lw \$9,4(\$1)                 | 100111 | 00001 | 01001 | 0000 0000 0000 0100 | 0x9C290004 |
| 0x00000038 | addiu \$10,\$0,-2             | 000010 | 00000 | 01010 | 1111 1111 1111 1110 | 0x080AFFFE |
| 0x0000003C | addiu \$10,\$10,1             | 000010 | 01010 | 01010 | 0000 0000 0000 0001 | 0x094A0001 |
| 0x00000040 | bltz \$10,-2 (< 0,转3C)        | 110010 | 01010 | 00000 | 1111 1111 1111 1110 | 0xC940FFFE |
| 0x00000044 | andi \$11,\$2,2               | 010000 | 00010 | 01011 | 0000 0000 0000 0010 | 0x404B0002 |
| 0x00000048 | j 0x00000050                  | 111000 | 00000 | 00000 | 0000 0000 0001 0100 | 0xE0000014 |
| 0x0000004C | or \$8,\$4,\$2                | 010011 | 00100 | 00010 | 0100 0000 0000 0000 | 0x4C824000 |
| 0x00000050 | halt                          | 111111 | 00000 | 00000 | 0000 0000 0000 0000 | 0xFC000000 |

表 7: 数码管显示功能码

| SW15 | SW14 | 左边      | 右边      |
|------|------|---------|---------|
| 0    | 0    | 当前PC    | 下条PC    |
| 0    | 1    | rs寄存器地址 | rs寄存器数据 |
| 1    | 0    | rt寄存器地址 | rt寄存器数据 |
| 1    | 1    | ALU结果输出 | DB总线数据  |

### 3. 消抖处理

如果一次触发持续一段时间不改变状态（如原状态是0，变更为1且保持100ns），则该触发是有效的人为触发，否则则视为抖动。故可以设置一个按键状态的历史记录(16位)，如果连续14位都为1，则将clk\_cpu设为高电平，否则为无效触发。具体实施细节见第8章写板电路一节。

## V. 引脚分配

见表8。

表 8: 引脚分配表

| 引脚    | 名称        | 作用           |
|-------|-----------|--------------|
| W5    | clk       | 全局时钟         |
| T17   | clk_cpu   | CPU时钟（单脉冲信号） |
| V17   | reset     | 复位信号         |
| R2/T1 | SW_in     | 数码管显示内容选择    |
| W4-U2 | AN3-AN0   | 数码管位选信号      |
| W7-U7 | seg6-seg0 | 七段数码管内容      |

## VI. 代码层次结构

见图10。

## 六、结果与分析

### I. 仿真模拟

设置时钟周期为100ns，初始30ns为准备时间，然后将Reset设为1使其开始工作。仿真结果见图11到图15，每条指令的说明均已附在波形图之下。可以看见仿真结果与预期结果相同。

### II. 上板

几条代表性指令的Basys3板结果如下，其他指令结果见具体实现。从左到右从上到下四幅图依次是：当前/下条PC、rs寄存器地址/值、rt寄存器地址/值、ALU结果输出/DB总线数据。可以看见上板结果与前面仿真分析的结果相同，成功证明了程序的正确性。

1. 0x00: addiu \$1, \$0, 8



图 16: 0x00结果

✓ Show (Show.v) (6)

- counter : Counter (Counter.v)
- ✓ ● cpu : CPU (CPU.v) (16)
  - pc : PC (PC.v)
  - add\_pc4 : Adder (Adder.v)
  - im : InstructionMemory (InstructionMemory.v)
  - control : ControlUnit (ControlUnit.v)
  - reg\_file : Registers (Registers.v)
  - mux\_regdst : MUX5 (MUX.v)
  - mux\_srcA : MUX (MUX.v)
  - extender : Extender (Extender.v)
  - mux\_srcB : MUX (MUX.v)
  - alu : ALU (ALU.v)
  - dm : DataMemory (DataMemory.v)
  - mux\_memToReg : MUX (MUX.v)
  - sl : ShiftLeft (ShiftLeft.v)
  - add\_target : Adder (Adder.v)
  - mux\_branch : MUX (MUX.v)
  - mux\_jump : MUX (MUX.v)
- seg1 : SegDisplay (SegDisplay.v)
- seg2 : SegDisplay (SegDisplay.v)
- seg3 : SegDisplay (SegDisplay.v)
- seg4 : SegDisplay (SegDisplay.v)

图 10: 代码层次结构



图 11: 波形图1



图 12: 波形图2



图 13: 波形图3



图 14: 波形图4



图 15: 波形图5

2. 0x0C: sub \$5, \$3, \$2



图 17: 0x0C结果

3. 0x14: or \$8, \$4, \$2



图 18: 0x14结果

4. 0x18: sll \$8, \$8, 1



图 19: 0x18结果

5. 0x1C: bne \$8, \$1, -2



图 20: 0x1C结果

6. 0x30: sw \$2, 4(\$1)



图 21: 0x30结果

## 七、 实验心得

本次实验可以算是从大一入学到现在做过的最大型的项目了，单单是代码文件就有十几个，虽然弄清数据通路后并不难实现，但是其中的小细节却得十分小心。

Verilog代码编写阶段：

1. 区分非阻塞赋值<=和阻塞赋值=。简单理解，非阻塞赋值可以并行执行，而阻塞赋值只能串行执行，这里就考虑到指令之间相关性的问题了。如果指令之间不相关，则可直接并行，否则只能串行。
2. 区分**wire**和**reg**类型。简单来说，**wire**主要起信号间连接作用，由于它不保存状态，故它的值可以随时改变，不受时钟信号的限制，有点像Python里对象的引用赋值。而**reg**顾名思义为寄存器，类似于高级程序语言的变量，可以存储数值、保存输出状态。
3. 由于所有**module**的输入输出均默认为**wire**类型，写代码的时候常常会忘记加**reg**导致出错。不过这个错误较为明显，在静态代码检查时即被检查出来。
4. 在模块输入参数最后常常多了一个，报错(**ISE port connections mix**)。
5. **always** @写时序逻辑确定好上升沿和下降沿通常没有问题，而组合逻辑常常忘记写部分输入参数，导致该输入改变了，但寄存器的值并没有改变。
6. 要在每个模块合适的位置对寄存器进行初始化**initial**，否则在仿真中会输出XXXX。
7. 位宽[x:y]要记清楚，对应好模块接口，否则多的位宽在跑实施时会报错。
8. 应在时钟下降沿才进行写入操作

Vivado模拟仿真上板阶段：

1. 由于本实验采用小端存储数据，在读入时也要小心。第一次测试时因为测试指令写入文件的顺序不对，导致读入的指令全部都是反的，进而没法正常执行。通过Python重新对指令文件处理后才正常执行。
2. 前面提及的双时钟问题，折腾了非常久的时间。
3. 写限制文件时，漏了一个端口设置，导致到最后一步生成二进制位流才报错，又得重新跑实施综合，很费时间。
4. 可能是电脑驱动的问题，一直报No hardware target is open，没法将程序写入FPGA板，只能连着电脑运行程序。这个问题最终也没有解决。

总的来说，本次实验收获非常多，更加熟悉了Verilog的语法，熟悉Vivado的使用，同时也了解了硬件设计与软件设计的巨大区别。如FPGA要考虑指令之间是否存在依赖关系、是否可以并行等问题，而平时我们在程序设计课或数据结构课上写的算法或项目往往是不需要考虑并行的问题的，这一点在硬件设计时要考虑清楚。当然了，更好地了解硬件也能够让我们编写出更高质量的软件代码，这两者应该相辅相成相互促进。

## 八、 程序清单

## I. CPU主模块

## II. 指令存储器

### III. 程序计数器(PC)

```

1 module PC (
2     input clk,
3     input reset,
4     input PCWrite,
5     input [31:0] nextPC,
6     output reg [31:0] currPC
7 );
8
9     initial currPC = 0;
10
11    always @(posedge clk or posedge reset) begin
12        if (reset == 0)
13            currPC <= 0;
14        else if (PCWrite == 1)
15            currPC <= nextPC;
16    end
17
18 endmodule

```

IV. 寄存器堆

```

1 module Registers (
2     input clk,
3     input [4:0] r1, // read reg #1 address
4     input [4:0] r2, // read reg #2 address
5     input [4:0] wr, // write reg address
6     input RegWrite,
7     input [31:0] wd, // write data
8     output [31:0] d1, // read data 1
9     output [31:0] d2 // read data 2
10 );
11
12 reg [31:0] register [0:31]; // 32 bits (
13 * #32 (address)
14
15 // initialization
16 integer i;
17 initial begin
18     for (i = 0; i < 32; i = i + 1)
19         register[i] = 0;
20 end
21
22 // read data
23 assign d1 = (r1 == 0) ? 0 : register[r1];
24 assign d2 = (r2 == 0) ? 0 : register[r2];
25
26 // write data
27 always @ (posedge clk) begin
28     if (wr != 0 && RegWrite == 1)
29         register[wr] <- wd;

```

## V. 数据存储器

```

1 module DataMemory (
2     input clk,
3     input [31:0] address,
4     input MemWrite,
5     input [31:0] dataIn, // write data
6     output [31:0] dataOut // read data
7 );
8
9     reg [7:0] memory [0:255]; // 8 bits (bandwidth) *
10    #256 (address)
11
12    // initialization
13    integer i;
14    initial begin
15        for (i = 0; i < 256; i = i + 1)
16            memory[i] = 0;
17    end
18
19    // read data
20    assign dataOut = {memory[address + 3],
21                     memory[address + 2],
22                     memory[address + 1],
23                     memory[address]};
24
25    // write data
26    always @ (negedge clk) begin
27        if (MemWrite == 1 && address >= 1 && address <=
28            255) begin
29            // little endian
30            memory[address + 3] <= dataIn[31:24];
31            memory[address + 2] <= dataIn[23:16];
32            memory[address + 1] <= dataIn[15:8];
33            memory[address] <= dataIn[7:0];
34        end
35    end
36
37 endmodule

```

VI. 控制单元

```

1 module ControlUnit (
2     input [5:0] opcode,
3     input Zero,
4     output reg RegDst,
5     output reg ExtSel,
6     output reg RegWrite,
7     output reg ALUSrcA,
8     output reg ALUSrcB,
9     output reg [2:0] ALUOp,
10    output reg MemToReg,
11    output reg MemWrite,
12    output reg Branch,
13    output reg Jump,
14    output reg PCWrite
15 );
16
17 always @ (opcode or Zero) begin // Zero!
18     RegDst   <= 0;
19     ExtSel   <= 0;
20     RegWrite <= 1;
21     ALUSrcA <= 0;
22     ALUSrcB <= 0;
23     ALUOp    <= 3'b000;
24     MemToReg <= 0;
25     MemWrite <= 0;
26     Branch   <= 0;
27     Jump     <= 0;
28     PCWrite  <= 1;
29     case (opcode)
30         6'b000000: begin // add rd, rs, rt
31             RegDst <= 1;
32             end
33         6'b000001: begin // sub rd, rs, rt
34             RegDst <= 1;
35             ALUOp  <= 3'b001;

```

```

36      end
37  6'b0000010: begin // addiu rt, rs, imm
38      ExtSel <= 1; // ???
39      ALUSrcB <= 1;
40      end
41  6'b010000: begin // andi rt, rs, imm
42      ALUSrcB <= 1;
43      ALUOp <= 3'b100;
44      end
45  6'b010001: begin // and rd, rs, rt
46      RegDst <= 1;
47      ALUOp <= 3'b100;
48      end
49  6'b010010: begin // ori rt, rs, imm
50      ALUSrcB <= 1;
51      ALUOp <= 3'b011;
52      end
53  6'b010011: begin // or rd, rs, rt
54      RegDst <= 1;
55      ALUOp <= 3'b011;
56      end
57  6'b011000: begin // sll rd, rt, sa
58      RegDst <= 1;
59      ALUSrcA <= 1;
60      ALUOp <= 3'b010;
61      end
62  6'b011100: begin // slti rt, rs, imm
63      ExtSel <= 1;
64      ALUSrcB <= 1; // remember!
65      ALUOp <= 3'b110;
66      end
67  6'b100110: begin // sw rt, imm(rs)
68      ExtSel <= 1;
69      RegWrite <= 0;
70      ALUSrcB <= 1;
71      MemWrite <= 1;
72      end
73  6'b100111: begin // lw rt, imm(rs)
74      ExtSel <= 1;
75      ALUSrcB <= 1;
76      MemToReg <= 1;
77      end
78  6'b110000: begin // beq rs, rt, imm
79      ExtSel <= 1;
80      RegWrite <= 0;
81      ALUOp <= 3'b001;
82      Branch <= Zero;
83      end
84  6'b110001: begin // bne rs, rt, imm
85      ExtSel <= 1;
86      RegWrite <= 0;
87      ALUOp <= 3'b001;
88      Branch <= ~Zero; // (rs - rt == 0)
89      ? 1 : 0 Not equal!
90      end
91  6'b110010: begin // bltz rs, imm
92      ExtSel <= 1;
93      RegWrite <= 0;
94      ALUOp <= 3'b110; // compare sign
95      Branch <= ~Zero; // a < 0 ? 1 : 0
96      end
97  6'b111000: begin // j addr
98      RegWrite <= 0;
99      Jump <= 1;
100     end
101    6'b111111: begin // halt
102        PCWrite <= 0;
103    end
104  endcase
105 end
106 endmodule

```

```

8      initial begin
9          res = 0;
10         end
11
12         always @ (op or A or B) begin
13             case (op)
14                 3'b000: res = A + B;
15                 3'b001: res = A - B;
16                 3'b010: res = B << A; // B first!
17                 3'b011: res = A | B;
18                 3'b100: res = A & B;
19                 3'b101: res = (A < B) ? 8'h00000001 : 0;
20                 3'b110: res = ((A < B && A[31] == B[31]) ||
21                                both pos/neg num
22                                || (A[31] == 1 && B[31] == 0))
23                                // A neg B pos
24                                ? 8'h00000001 : 0;
25                 3'b111: res = A ^ B;
26             endcase
27             zero <= (res == 0) ? 1 : 0;
28         end
29     endmodule
30
31 module Adder (
32     input [31:0] A,
33     input [31:0] B,
34     output [31:0] res
35 );
36
37     assign res = A + B;
38
39 endmodule
40
41 module ShiftLeft (
42     input [31:0] dataIn,
43     output [31:0] dataOut
44 );
45
46     assign dataOut = dataIn << 2;
47
48 endmodule

```

## VIII. 多路选择器(MUX)

```

1  module MUX (
2      input Sel,
3      input [31:0] A,
4      input [31:0] B,
5      output reg [31:0] res
6  );
7
8      always @ (Sel or A or B) begin
9          res <= (Sel == 0) ? A : B;
10         end
11
12 endmodule
13
14 module MUX5 (
15     input Sel,
16     input [4:0] A,
17     input [4:0] B,
18     output reg [4:0] res
19 );
20
21     always @ (Sel or A or B) begin
22         res <= (Sel == 0) ? A : B;
23     end
24
25 endmodule

```

## VII. 算术逻辑单元(ALU)

```

1  module ALU (
2      input [2:0] op,
3      input [31:0] A,
4      input [31:0] B,
5      output reg [31:0] res,
6      output reg zero
7  );

```

```

1  module Extender (
2      input Sel,
3      input [15:0] dataIn,
4      output reg [31:0] dataOut
5  );
6
7      initial dataOut = 0;

```

```

8     always @(Sel or dataIn) begin // dataIn!!!
9         if (Sel == 0) // ZeroExt
10            dataOut = {{16{1'b0}},dataIn[15:0]};
11        else // SignExt
12            dataOut = {{16{dataIn[15]}},dataIn[15:0]};
13    end
14
15 endmodule

```

## X. 仿真代码

```

1 module CPU_sim (
2     output RegDst,
3     output ExtSel,
4     output RegWrite, MemWrite,
5     output ALUSrcA, ALUSrcB,
6     output [2:0] ALUOp,
7     output MemToReg,
8     output Branch, Jump, Zero,
9     output PCWrite,
10    output [31:0] currPC, nextPC, instruction, alu_res,
11    output wire [31:0] d1, d2
12 );
13
14 reg clk;
15 reg reset;
16
17 CPU cpu(
18     .clk(clk),
19     .reset(reset),
20     .RegDst(RegDst),
21     .ExtSel(ExtSel),
22     .RegWrite(RegWrite),
23     .MemWrite(MemWrite),
24     .ALUSrcA(ALUSrcA),
25     .ALUSrcB(ALUSrcB),
26     .ALUOp(ALUOp),
27     .MemToReg(MemToReg),
28     .Branch(Branch),
29     .Jump(Jump),
30     .Zero(Zero),
31     .PCWrite(PCWrite),
32     .currPC(currPC),
33     .nextPC(nextPC),
34     .instruction(instruction),
35     .alu_res(alu_res),
36     .d1(d1),
37     .d2(d2)
38 );
39
40 initial begin
41     clk = 1;
42     reset = 0;
43     // wait for initialization
44     #30;
45     reset = 1;
46 end
47
48 always #50 clk = ~clk;
49
endmodule

```

## XI. 分频计数器

```

1 module Counter(
2     input clr, // clear, say reset
3     input clk, // original clock
4     output reg [1:0] count_4,
5     output reg clk_seg
6 );
7
8 // display 10kHz
9 reg [16:0] count_dis; // 26 bits to store count:
10    2^17 > 10^5
11 always @ (posedge clk or posedge clr)
12 begin
13     if (clr == 1) // reset
14     begin
15         clk_seg <= 0;
16         count_dis <= 0;
17
18     end
19     else
20         count_dis <= count_dis + 1;
21
22 end
23
24 endmodule

```

```

16
17     end
18     else if (count_dis == 50_000 - 1) // return 0
19     begin
20         clk_seg <= ~clk_seg;
21         count_dis <= 0;
22     end
23     else
24     begin
25         clk_seg <= clk_seg;
26         count_dis <= count_dis + 1;
27     end
28
29 always @ (posedge clk_seg or posedge clr)
30 begin
31     if (clr == 1 || count_4 == 4)
32         count_4 <= 0;
33     else
34         count_4 <= count_4 + 1;
35 end
36
37 endmodule

```

## XII. 七段数码管

```

1 module SegDisplay (
2     input [3:0] data,
3     output reg [6:0] dispcode
4 );
5
6     always @ (data)
7         case (data)
8             // 0: on 1: off
9             1: dispcode = 7'b100_1111;
10            2: dispcode = 7'b001_0010;
11            3: dispcode = 7'b000_0110;
12            4: dispcode = 7'b100_1100;
13            5: dispcode = 7'b010_0100;
14            6: dispcode = 7'b010_0000;
15            7: dispcode = 7'b000_1111;
16            8: dispcode = 7'b000_0000;
17            9: dispcode = 7'b000_0100;
18            10: dispcode = 7'b000_1000; // A
19            11: dispcode = 7'b110_0000; // b
20            12: dispcode = 7'b011_0001; // C
21            13: dispcode = 7'b100_0010; // d
22            14: dispcode = 7'b001_0000; // e
23            15: dispcode = 7'b011_1000; // F
24
25     endcase
26 endmodule

```

## XIII. 写板电路

```

1 module Show(
2     input clk,
3     input clk_cpu,
4     input reset,
5     input [1:0] SW_in,
6     output reg [6:0] dispcode,
7     output reg [3:0] out
8 );
9
10    // synchronize
11    reg in = 1'b0;
12    always @ (posedge clk) begin
13        in <= clk_cpu;
14    end
15    wire in_syn = in;
16
17    // reduce jitter
18    reg [15:0] inhistory = 16'h0000;
19    reg in_detected = 1'b0;
20    always @ (posedge clk) begin
21        inhistory <= { inhistory[14:0], in_syn };
22        if (inhistory == 16'b0001111111111111)
23            in_detected <= 1'b1;
24        else
25            in_detected <= 1'b0;
26    end
27

```

```

28     wire seg_num; // not reg!
29
30     Counter counter(
31         .clk(clk),
32         // output clock/counter
33         .count_4(seg_num)
34     );
35
36     reg [31:0] firstNum;
37     reg [31:0] secondNum;
38
39     initial firstNum = 0;
40     initial secondNum = 0;
41
42     wire [31:0] currPC, nextPC, rsData, rtData, dbData;
43     wire [4:0] rs, rt;
44
45     CPU cpu(
46         // input
47         .clk(in_detected),
48         .reset(reset),
49         // output
50         .currPC(currPC),
51         .nextPC(nextPC),
52         .rs(rs),
53         .rt(rt),
54         .rsData(rsData),
55         .rtData(rtData),
56         .dbData(dbData),
57         .alu_res(alu_res)
58     );
59
60     always @ (SW_in) begin
61         case (SW_in)
62             2'b00: begin
63                 firstNum <= currPC;
64                 secondNum <= nextPC;
65             end
66             2'b01: begin
67                 firstNum <= {27{1'b0}}, rs;
68                 secondNum <= rsData;
69             end
70             2'b10: begin
71                 firstNum <= {27{1'b0}}, rt;
72                 secondNum <= rtData;
73             end
74             2'b11: begin
75                 firstNum <= alu_res;
76                 secondNum <= dbData;
77             end
78         endcase
79     end
80
81     SegDisplay seg1(
82         .data(firstNum[7:4])
83         // .dispcode
84     );
85
86     SegDisplay seg2(
87         .data(firstNum[3:0])
88         // .dispcode
89     );
90
91     SegDisplay seg3(
92         .data(secondNum[7:4])
93         // .dispcode
94     );
95
96     SegDisplay seg4(
97         .data(secondNum[3:0])
98         // .dispcode
99     );
100
101    always @ (seg_num or firstNum or secondNum)
102        case (seg_num)
103            0: begin
104                out = 4'b1110;
105                dispcode = seg4.dispcode;
106            end
107            1: begin
108                out = 4'b1101;
109                dispcode = seg3.dispcode;
110            end
111            2: begin
112                out = 4'b1011;
113                dispcode = seg2.dispcode;
114            end
115            3: begin
116                out = 4'b0111;
117                dispcode = seg1.dispcode;
118            end
119        endcase
120
121    endmodule

```

#### XIV. 限制文件(constraints.xdc)

```

1 set_property PACKAGE_PIN W5 [get_ports clk]
2 set_property PACKAGE_PIN T17 [get_ports clk_cpu]
3 set_property PACKAGE_PIN V17 [get_ports reset]
4 set_property PACKAGE_PIN R2 [get_ports {SW_in[1]}]
5 set_property PACKAGE_PIN T1 [get_ports {SW_in[0]}]
6 set_property PACKAGE_PIN W4 [get_ports {out[3]}]
7 set_property PACKAGE_PIN V4 [get_ports {out[2]}]
8 set_property PACKAGE_PIN U4 [get_ports {out[1]}]
9 set_property PACKAGE_PIN U2 [get_ports {out[0]}]
10 set_property PACKAGE_PIN W7 [get_ports {dispcode[6]}]
11 set_property PACKAGE_PIN W6 [get_ports {dispcode[5]}]
12 set_property PACKAGE_PIN U8 [get_ports {dispcode[4]}]
13 set_property PACKAGE_PIN V8 [get_ports {dispcode[3]}]
14 set_property PACKAGE_PIN U5 [get_ports {dispcode[2]}]
15 set_property PACKAGE_PIN V5 [get_ports {dispcode[1]}]
16 set_property PACKAGE_PIN U7 [get_ports {dispcode[0]}]
17
18 set_property IOSTANDARD LVCMOS33 [get_ports clk]
19 set_property IOSTANDARD LVCMOS33 [get_ports clk_cpu]
20 set_property IOSTANDARD LVCMOS33 [get_ports reset]
21 set_property IOSTANDARD LVCMOS33 [get_ports {SW_in[1]}]
22 set_property IOSTANDARD LVCMOS33 [get_ports {SW_in[0]}]
23 set_property IOSTANDARD LVCMOS33 [get_ports {out[3]}]
24 set_property IOSTANDARD LVCMOS33 [get_ports {out[2]}]
25 set_property IOSTANDARD LVCMOS33 [get_ports {out[1]}]
26 set_property IOSTANDARD LVCMOS33 [get_ports {out[0]}]
27 set_property IOSTANDARD LVCMOS33 [get_ports {dispcode
28 [6]}]
29 set_property IOSTANDARD LVCMOS33 [get_ports {dispcode
30 [5]}]
31 set_property IOSTANDARD LVCMOS33 [get_ports {dispcode
32 [4]}]
33 set_property IOSTANDARD LVCMOS33 [get_ports {dispcode
34 [3]}]
35 set_property IOSTANDARD LVCMOS33 [get_ports {dispcode
36 [2]}]
37 set_property IOSTANDARD LVCMOS33 [get_ports {dispcode
38 [1]}]
39 set_property IOSTANDARD LVCMOS33 [get_ports {dispcode
40 [0]}]

```