

“计算机组成与设计”课程设计  
**RISC-V CPU的流水线实现**

龚奕利

[yiligong@whu.edu.cn](mailto:yiligong@whu.edu.cn)

2021年春季

# 实验目的

- 融会贯通计算机组成与设计课程所教授的知识，通过对知识的综合应用，加深对CPU系统各模块的工作原理及相互联系的认识。
- 学习采用EDA (Electronic Design Automation) 技术设计RISC-V流水线CPU的技术与方法。
- 培养科学的研究的独立工作能力，获得CPU设计、仿真、综合、实现、运行的实践和经验。
- 了解SOC系统，并在FPGA开发板上实现简单的SOC系统。

# 实验内容

- 用硬件描述语言 (Verilog) 设计RISC-V流水线CPU，支持 RV32I中的大部分指令
- 用仿真软件Modelsim对有数据冒险和控制冒险的汇编程序进行仿真
- 用vivado下载到N4 FPGA板上进行综合、实现和运行

# RISC-V指令集

- 4个基本的ISA：
  - RV32I：32位地址空间整数指令
  - RV64I：64位地址空间整数指令
  - RV32E：RV32I的子集，更少的整数寄存器，用以支持微小控制器
  - RV128I：128位地址空间整数指令
- 还有很多extensions
  - Standard, reserved, and custom
  - E.g. the standard integer multiplication and division extension is named “M”
  - The standard atomic instruction extension, denoted by “A”
  - The standard single-precision floating-point extension, denoted by “F”
  - The standard double-precision floating-point extension, denoted by “D”
  - The standard “C” compressed instruction extension provides narrower 16-bit forms of common instructions

# 待实现指令

- I0={LUI, AUIPC}
- I1={JAL, JALR, BEQ, BNE, BLT, BGE, BLTU, BGEU}
- I2={LB, LH, LW, LBU, LHU, SB, SH, SW}
- I3={ADDI, SLTI, SLTIU, XORI, ANDI, ALLI, SRLI, SRALI, SRAI}
- I4={ADD, SUB, SLL, SLT, SLTU, XOR, SRL, SRA, OR, AND}
- See to RISC-V spec “Chapter 24 RV32/64G Instruction Set Listings”

# 考核方式

- 考勤：10%
- 课堂检查：10%
- CPU功能测试、实验报告及面试：80%

| 功能                  | 内容                                         | 分值 |
|---------------------|--------------------------------------------|----|
| ModelSim仿真测试通过      | S1={sb, sh, sw, lb, lh, lw, lbu, lhu}      | 8  |
|                     | S2={add, sub, xor, or, and, srl, sra, sll} | 5  |
|                     | S3={xori, ori, andi, srli, srai, slli}     | 8  |
|                     | S4={slt, sltu, slti, sltiu}                | 8  |
|                     | S5={jal, jalr}                             | 8  |
|                     | S6={beq, bne, blt, bge, bltu, bgeu}        | 8  |
|                     | 冒险检测与冲突解决                                  | 35 |
| Vivado+N4 FPGA板测试通过 | 测试程序                                       | 20 |

# 提交方式

- 代码及实验报告
  - Due on 5月9日 24:00
  - 发送至coecswu@163.com
  - 邮件标题必须为“2021SpringCOE-学号-姓名”
  - 代码压缩成zip文件(将Modelsim项目和Vivado项目 (若下板子通过) ), 实验报告(pdf文件)不压缩, 一起作为附件发送, 文件名格式分别为“学号\_姓名\_modelsim实验代码.zip”, “学号\_姓名\_vivado实验代码.zip”和“学号\_姓名\_实验报告.pdf”。
  - 用你的学号和姓名替换文件名中的“学号”和“姓名”
- 面试
  - 面试内容包括但不限于代码调试、运行操作、结果展示、现场实现新增指令等
  - 时间待定

# 工具使用：ModelSim

- ModelSim教程
  - Modelsim详细使用教程（一看就会）.pdf
  - Modelsim精选入门教程.pdf
- 项目导入 / 打开
  - ModelSim使用的是绝对路径，而不是相对路径。提供的源文件如果直接放在C:盘下，可直接使用
  - 否则，要点击File->Change Directory，更改路径到你的目录位置，再打开工程文件
  - 推荐重新创建工程文件，减少不必要的麻烦
- 参见[附录一](#)和网盘文件夹中的解说视频  Modelsim使用介绍.mp4

# RISC-V编译器：Venus

- <https://venus.cs61c.org/>
- 汇编代码→RISC-V机器代码，仿真执行

# RISC-V流水线CPU的设计与实现



**FIGURE 4.62 The final datapath and control for this chapter.**

Note that this is a stylized figure rather than a detailed datapath, so it's missing the ALUsrc Mux from Figure 4.55 and the multiplexor controls from Figure 4.49.



FIGURE 4.55 A close-up of the datapath in Figure 4.52 shows a 2:1 multiplexor, which has been added to select the signed immediate as an ALU input.



**FIGURE 4.49** The pipelined datapath of Figure 4.44, with the control signals connected to the control portions of the pipeline registers.

The control values for the last three stages are created during the instruction decode stage and then placed in the ID/EX pipeline register. The control lines for each pipe stage are used, and remaining control lines are then passed to the next pipeline stage.

# LUI&AUIPC

| 31                                             | 12 11             | 7 6               | 0 |
|------------------------------------------------|-------------------|-------------------|---|
| imm[31:12]                                     | rd                | opcode            |   |
| 20<br>U-immediate[31:12]<br>U-immediate[31:12] | 5<br>dest<br>dest | 7<br>LUI<br>AUIPC |   |

- **U-type format**

- LUI (load upper immediate) is used to build 32-bit constants and uses the U-type format. LUI places the 32-bit U-immediate value into the destination register rd, filling in the lowest 12 bits with zeros.
- IMM模块: 20位立即数+12个0, ALU做加法, srca选0, srcb选immout
- AUIPC (add upper immediate to pc) is used to build pc-relative addresses and uses the U-type format. AUIPC forms a 32-bit offset from the U-immediate, filling in the lowest 12 bits with zeros, adds this offset to the address of the AUIPC instruction, then places the result in register rd.
- IMM模块: 20位立即数+12个0, ALU做加法, srca选pc, srcb选immout

# JAL



- **J-type format**
- The J-immediate encodes a signed offset in multiples of 2 bytes. The offset is sign-extended and added to the address of the jump instruction to form the jump target address.
- Stores the address of the instruction following the jump ( $pc+4$ ) into register rd.
- IMM模块有符号扩展立即数, pcadder2做 $pc+immout$ 左移1位后的结果, WB阶段 $pc+4$ 被写入rd

# JALR

| 31                 | 20 19     | 15 14  | 12        | 11 | 7 6       | 0 |
|--------------------|-----------|--------|-----------|----|-----------|---|
| imm[11:0]          | rs1       | funct3 | rd        |    | opcode    |   |
| 12<br>offset[11:0] | 5<br>base | 3<br>0 | 5<br>dest |    | 7<br>JALR |   |

- **I-type format**
- The target address is obtained by adding the sign-extended 12-bit I-immediate to the register rs1, then setting the least-significant bit of the result to zero.
- The address of the instruction following the jump ( $pc+4$ ) is written to register rd.
- IMM模块有符号扩展立即数，pcadder2做rs1和immout的加法，然后结果最低位置0； WB阶段pc+4被写入rd

# Conditional Branch

| 31              | 30        | 25 24 | 20 19 | 15 14   | 12 11          | 8       | 7 | 6      | 0 |
|-----------------|-----------|-------|-------|---------|----------------|---------|---|--------|---|
| imm[12]         | imm[10:5] | rs2   | rs1   | funct3  | imm[4:1]       | imm[11] |   | opcode |   |
| 1               | 6         | 5     | 5     | 3       | 4              | 1       |   | 7      |   |
| offset[12 10:5] |           | src2  | src1  | BEQ/BNE | offset[11 4:1] |         |   | BRANCH |   |
| offset[12 10:5] |           | src2  | src1  | BLT[U]  | offset[11 4:1] |         |   | BRANCH |   |
| offset[12 10:5] |           | src2  | src1  | BGE[U]  | offset[11 4:1] |         |   | BRANCH |   |

- B-type format
- IMM模块有符号扩展立即数， pcadder2 做pc+immout左移1位后的结果
- srca选rs1, srcb选rs2, 根据是否带U, cmp比较器相应地做（有/无符号数）减法，根据减法结果相应地设置zero, lt和ge信号

# 合并所有的指令行为

| 指令 (类型) | IMM   | srca | srcb   | ALUctrl | MEM   | WB        | pc                           |
|---------|-------|------|--------|---------|-------|-----------|------------------------------|
| load    | itype | rs1  | immout | +       | read  | memout→rd | pc+4                         |
| store   | stype | rs1  | immout | +       | write | 不写        | pc+4                         |
| LUI     | utype | 0    | immout | +       | 无     | aluout→rd | pc+4                         |
| AUIPC   | utype | pc   | immout | +       | 无     | aluout→rd | pc+4                         |
| JAL     | jtype | pc+4 | 无关     | MOVEA   | 无     | pc+4→rd   | pcadder2的计算结果                |
| JALR    | itype | pc+4 | 无关     | MOVEA   | 无     | pc+4→rd   | pcadder2的计算结果                |
| Branch  | btype | 无关   | 无关     | 无关      | 无     | 不写        | 根据cmp的比较结果决定选择pcadder2或者pc+4 |

# pcadder2

| 指令 (类型)    | srcA | srcB           | pcbranch (output)     |
|------------|------|----------------|-----------------------|
| JAL/Branch | pc   | shifted immout | srcA + srcB           |
| JALR       | rs1  | immout         | srcA + srcB<br>最后一位置0 |

# 代码目录

- xgriscv-初始3指令版
- 已实现: lui, auipc, addi

```
riscv32_sim1.dat  
xgriscv_alu.v  
xgriscv_controller.v  
xgriscv_datapath.v  
xgriscvDefines.v  
xgriscv_mem.v  
xgriscv_parts.v  
xgriscv_pipelined.v  
xgriscv_Regfile.v  
xgriscv_tb.v
```

- riscv测试代码



# 从仿真代码到FPGA代码

1. 删除module imem的定义，后面会用系统提供的IP实现imem
2. 删除module xgriscv\_pipeline的定义
3. 修改fpga\_top.v和你的cpu实现：
  1. 在你的cpu文件中添加这几行：
    - Reg\_sel: 数码管显示寄存器编号
    - Reg\_data: 数码管显示寄存器数据
  2. 在fpga\_top.v文件里把cpu模块名替换成你的cpu模块名



```
Project Summary x sccpu.v x
Q | B | ← | → | X | ⌂ | D | // | M | ? |
10   output      MemWrite; // memory write
11   output [31:0] aluout; // ALU output
12   output [31:0] writedata; // data to data memory
13
14   input [4:0] reg_sel; // register selection (for debug use)
15   output [31:0] reg_data; // selected register data (for debug use)
16
17   wire      RegWrite; // control signal to register write
18   wire      EXTOp; // control signal to signed extension
19   wire [2:0] ALUOp; // ALU operation
20   wire [1:0] NPCOp; // next PC operation
21
```

# 从仿真代码到FPGA代码

```
Project Summary x sccpu.v x

Q | H | ← | → | X | C | F | // | E | ? |

10    output      MemWrite; // memory write
11    output [31:0] aluout; // ALU output
12    output [31:0] writedata; // data to data memory
13
14    input  [4:0] reg_sel;   // register selection (for debug use)
15    output [31:0] reg_data; // selected register data (for debug use)
16
17    wire      RegWrite;   // control signal to register write
18    wire      EXTOp;      // control signal to signed extension
19    wire [2:0] ALUOp;     // ALU operation
20    wire [1:0] MPCOp;    // next PC operation
21
```

在你的cpu文件中添加这几行：

Reg\_sel: 数码管显示寄存器编号  
Reg\_data: 数码管显示寄存器数据

在fpga\_top.v文件里把cpu模块名替换成你的cpu模块名

# 附录一：Modelsim使用























## 附录二：vivado使用

# FPGA基本概念

- 全称： Filed Programmable Gate Device，现场可编程逻辑器件
- 架构：基于内嵌SRAM工艺的查找表加触发器架构
- 组成：可编程I/O、可编程逻辑单元、内嵌RAM单元、时钟管理单元、DSP单元、内嵌硬核等



主要产品线：Virtex系列、Zynq系列、Kintex系列、Artix系列和Spartan系列。



主要产品线：Stratix系列、Arria系列、Cyclone系列和MAX系列。已被Intel收购。

# FPGA常用术语

- ◆ IP核 (Intellectual Property)

- 即知识产权，是一段具有特定电路功能的硬件描述语言程序

- ◆ 软核 (Soft Core)

- 用HDL语言建立的数字系统模型

- ◆ 硬核 (Hard Core)

- 在芯片内部已完成特定布局布线、具备特定功能的数字系统模型

- ◆ 网表 (netlist)

- 是一个电路的雏形、电路之间硬件的连接形式

- ◆ 综合 (Synthesis)

- 是在所给的标准单元库和设计约束的前提下，将对电路的HDL高级语言描述，转化成优化过的门级网表的处理过程

# FPGA开发工具

- ◆ 编程语言  
Verilog或VHDL硬件逻辑描述语言
- ◆ 开发工具  
VIVADO 2017.1
- ◆ 开发板卡  
NEXYS4 DDR
- ◆ 芯片型号  
XC7A100TCSG324-1



# Nexys 4 DDR 硬件

- Nexys4-DDR采用了xilinx Artix-7 FPGA芯片，它是一款简单易用的数字电路开发平台，可以支持在课堂环境中来设计一些行业应用。
- 大规模、高容量的FPGA，大容量外部存储，各种USB、以太网、以及其他接口，让Nexys4-DDR 能够满足从入门级组合逻辑电路到强大的嵌入式系统的设计。
- 板上集成的加速度、温度传感器、MEMS数字麦克风、扬声器放大器以及大量的I/O设备，让Nexys4-DDR不需要增添额外组件而用于各种各样的设计。

# Nexys 4 DDR 示意图



| 序号 | 描述                   | 序号 | 描述                 |
|----|----------------------|----|--------------------|
| 1  | 选择供电跳线               | 13 | FPGA 配置复位按键        |
| 2  | UART/ JTAG 共用 USB 接口 | 14 | CPU 复位按键 (用于软核)    |
| 3  | 外部配置跳线柱(SD / USB)    | 15 | 模拟信号 Pmod 端口(XADC) |
| 4  | Pmod 端口              | 16 | 编程模式跳线柱            |
| 5  | 扩音器                  | 17 | 音频连接口              |
| 6  | 电源测试点                | 18 | VGA 连接口            |
| 7  | 16 个 LED             | 19 | FPGA 编程完成 LED      |
| 8  | 16 个拨键开关             | 20 | 以太网连接口             |
| 9  | 8 位 7 段数码管           | 21 | USB 连接口            |
| 10 | 可选用于外部接线的 JTAG 端口    | 22 | (工业用) PIC24 编程端口   |
| 11 | 5 个按键开关              | 23 | 电源开关               |
| 12 | 板载温度传感器              | 24 | 电源接口               |

# Vivado软件

- Vivado设计套件，是FPGA厂商赛灵思（Xilinx）公司2012年发布的集成设计环境。
- 包括高度集成的设计环境和新一代从系统到IC级的工具，这些均建立在共享的可扩展数据模型和通用调试环境基础上。
- 基于AMBA AXI4 互联规范、IP-XACT IP封装元数据、工具命令语言（TCL）、Synopsys 系统约束（SDC）以及其他有助于根据客户需求量身定制设计流程并符合业界标准的开放式环境。
- 赛灵思构建的Vivado 工具把各类可编程技术结合在一起，能够扩展多达1 亿个等效ASIC 门的设计。

# Vivado的安装

- 安装路径不能包含中文
- 选择第二项Vivado HL Design Edition



# 新建工程

- 在vivado主界面中， File->New Project



输入项目名称

注意工程路径及工程名不要有中文字符



# 选择项目类型

New Project X

**Project Type**  
Specify the type of project to create.

**RTL Project**  
You will be able to add sources, create block designs in IP Integrator, generate IP, run RTL analysis, synthesis, implementation, design planning and analysis.  
 Do not specify sources at this time

**Post-synthesis Project**: You will be able to add sources, view device resources, run design analysis, planning and implementation.  
 Do not specify sources at this time

**I/O Planning Project**  
Do not specify design sources. You will be able to view part/package resources.

**Imported Project**  
Create a Vivado project from a Synplify, XST or ISE Project File.

**Example Project**  
Create a new Vivado project from a predefined template.

? <上一步(B) Next > Finish Cancel

# 选择FPGA型号

New Project X

**Default Part**  
Choose a default Xilinx part or board for your project. This can be changed later.

Select:  Parts  Boards

Filter

Product category: All Speed grade: -1  
Family: Artix-7 Temp grade: All Remaining  
Package: csg324

Reset All Filters

Search:

| Part             | I/O Pin Count | Available IOBs | LUT Elements | FlipFlops | Block RAMs | Ultra RAMs | DSPs | Gb Transceivers | GTPE2 Transceivers |
|------------------|---------------|----------------|--------------|-----------|------------|------------|------|-----------------|--------------------|
| xc7a15tcsg324-1  | 324           | 210            | 10400        | 20800     | 25         | 0          | 45   | 0               | 0                  |
| xc7a35tcsg324-1  | 324           | 210            | 20800        | 41600     | 50         | 0          | 90   | 0               | 0                  |
| xc7a50tcsg324-1  | 324           | 210            | 32600        | 65200     | 75         | 0          | 120  | 0               | 0                  |
| xc7a75tcsg324-1  | 324           | 210            | 47200        | 94400     | 105        | 0          | 180  | 0               | 0                  |
| xc7a100tcsg324-1 | 324           | 210            | 63400        | 126800    | 135        | 0          | 240  | 0               | 0                  |

?

<上一步(B) Next > Finish Cancel

New Project

X



### New Project Summary

A new RTL project named 'PCPU' will be created.

The default part and product family for the new project:

Default Part: xc7a100tcsg324-1

Product: Artix-7

Family: Artix-7

Package: csg324

Speed Grade: -1



To create the project, click Finish



<上一步(B)

Next >

Finish

Cancel

# 项目管理器——添加文件



 Add Sources

X



## Add Sources

This guides you through the process of adding and creating sources for your project

- Add or create constraints
- Add or create design sources
- Add or create simulation sources



&lt;上一步(回)

Next &gt;

Finish

Cancel



添加给你的代码CPU实现文件  
再添加给你的FPGA相关的所有文件



# 添加设计文件后的项目管理器



# ROM IP核生成





双击“Distributed Memory Generator”

# 配置ROM IP核 – memory config

Component Name  
必须为 imem

其他选项也按照  
此处的配置进行  
选择



# 配置ROM IP核 – Port config

选择“Port config”  
标签



# 配置ROM IP核 - RST & Initialization

- 选择“RST&Initialization”标签
- “Load COE File”处选择给你的coe目录下的riscv-studentnosorting.coe
- COE(Coefficient)文件是ROM的初始化需要使用来传递参数



# COE文件

1. 写汇编代码
2. Venus生成机器代码
3. prep-machine-code.py去除开头的0x
4. prep-coe-code.py将之变为coe文件：

- 在机器代码的开头加上两行

```
memory_initialization_radix=16;
```

```
memory_initialization_vector=
```

- 其余各行末尾添加 “,”
- 最后一行末尾添加 “;”



```
mipstestloop_fpga.coe
1 memory_initialization_radix=16;
2 memory_initialization_vector=
3 20020005,
4 2003000c,
5 2067ffff7,
6 00e22025,
7 00642824,
8 00a42820,
9 10a7000a,
10 0064202a,
11 10800001,
12 20050000,
13 00e2202a,
14 00853820,
15 00e23822,
16 ac670044,
17 8c020050,
18 08000011,
19 20020001,
20 ac020054,
21 200affff,
22 014a5020,
23 014a5020,
24 014a5020,
25 014a5020,
26 014a5020,
27 014a5020,
28 014a5020,
29 014a5020,
30 014a5020,
31 014a5020,
32 014a5020,
33 014a5020,
34 014a5020,
35 014a5020,
36 014a5020,
37 014a5020,
38 214c0004,
39 214e000c,
40 8d8d0000,
41 adcd0000,
42 08000025;
43
```

# 产生ROM IP核



# 添加约束文件

Flow Navigator->Project Manager->Add Sources





添加给你的代码目录下的Nexys4DDR\_CPU.xdc



Project Manager->Sources窗口中  
 双击Constraints下constrs\_1下Nexys4DDR\_CPU.xdc  
 FPGA板上的各个部件特性可参考发给你们的Nexys4-DDR\_rm.pdf

# 约束文件

- 约束文件将verilog中定义的端口号与FPGA板子上的IO口建立起联系

```

##7 segment display
set_property -dict { PACKAGE_PIN T10 IOSTANDARD LVCMOS33 } [get_ports { disp_seg_o[0] }]; #IO_L24P_T3_A00_D16_14 Sch=an[0]
set_property -dict { PACKAGE_PIN R10 IOSTANDARD LVCMOS33 } [get_ports { disp_seg_o[1] }]; #IO_25_14 Sch=cb
set_property -dict { PACKAGE_PIN K16 IOSTANDARD LVCMOS33 } [get_ports { disp_seg_o[2] }]; #IO_25_15 Sch=cc
set_property -dict { PACKAGE_PIN K13 IOSTANDARD LVCMOS33 } [get_ports { disp_seg_o[3] }]; #IO_L7P_T2_A26_15 Sch=cd
set_property -dict { PACKAGE_PIN P15 IOSTANDARD LVCMOS33 } [get_ports { disp_seg_o[4] }]; #IO_L13P_T2_MRCC_14 Sch=ce
set_property -dict { PACKAGE_PIN T11 IOSTANDARD LVCMOS33 } [get_ports { disp_seg_o[5] }]; #IO_L19P_T3_A10_D26_14 Sch=cf
set_property -dict { PACKAGE_PIN L18 IOSTANDARD LVCMOS33 } [get_ports { disp_seg_o[6] }]; #IO_L4P_T0_D04_14 Sch=cg
set_property -dict { PACKAGE_PIN H15 IOSTANDARD LVCMOS33 } [get_ports { disp_seg_o[7] }]; #IO_L19N_T3_A21_VREF_15 Sch=ch

set_property -dict { PACKAGE_PIN J17 IOSTANDARD LVCMOS33 } [get_ports { disp_an_o[0] }]; #IO_L23P_T3_FOE_B_15 Sch=an[0]
set_property -dict { PACKAGE_PIN J18 IOSTANDARD LVCMOS33 } [get_ports { disp_an_o[1] }]; #IO_L23N_T3_FWE_B_15 Sch=an[1]
set_property -dict { PACKAGE_PIN T9 IOSTANDARD LVCMOS33 } [get_ports { disp_an_o[2] }]; #IO_L24P_T3_A01_D17_14 Sch=an[2]
set_property -dict { PACKAGE_PIN J14 IOSTANDARD LVCMOS33 } [get_ports { disp_an_o[3] }]; #IO_L19P_T3_A22_15 Sch=an[3]
set_property -dict { PACKAGE_PIN P14 IOSTANDARD LVCMOS33 } [get_ports { disp_an_o[4] }]; #IO_L8N_T1_D12_14 Sch=an[4]
set_property -dict { PACKAGE_PIN T14 IOSTANDARD LVCMOS33 } [get_ports { disp_an_o[5] }]; #IO_L14P_T2_SRCC_14 Sch=an[5]
set_property -dict { PACKAGE_PIN K2 IOSTANDARD LVCMOS33 } [get_ports { disp_an_o[6] }]; #IO_L23P_T3_35 Sch=an[6]
set_property -dict { PACKAGE_PIN U13 IOSTANDARD LVCMOS33 } [get_ports { disp_an_o[7] }]; #IO_L23N_T3_A02_D18_14 Sch=an[7]

```

```

# Clock signal
set_property -dict { PACKAGE_PIN E3 IOSTANDARD LVCMOS33 } [get_ports { clk }]; #IO_L12P_T1
create_clock -add -name sys_clk_pin -period 100.00 -waveform {0 50} [get_ports {clk}]
set_property -dict { PACKAGE_PIN C12 IOSTANDARD LVCMOS33 } [get_ports { rstn }]; #IO_L3P_T0

##Switches

set_property -dict { PACKAGE_PIN J15 IOSTANDARD LVCMOS33 } [get_ports { sw_i[0] }]; #IO_L24N
set_property -dict { PACKAGE_PIN L16 IOSTANDARD LVCMOS33 } [get_ports { sw_i[1] }]; #IO_L3N
set_property -dict { PACKAGE_PIN M13 IOSTANDARD LVCMOS33 } [get_ports { sw_i[2] }]; #IO_L6N
set_property -dict { PACKAGE_PIN R15 IOSTANDARD LVCMOS33 } [get_ports { sw_i[3] }]; #IO_L13N
set_property -dict { PACKAGE_PIN R17 IOSTANDARD LVCMOS33 } [get_ports { sw_i[4] }]; #IO_L12N
set_property -dict { PACKAGE_PIN T18 IOSTANDARD LVCMOS33 } [get_ports { sw_i[5] }]; #IO_L7N
set_property -dict { PACKAGE_PIN U18 IOSTANDARD LVCMOS33 } [get_ports { sw_i[6] }]; #IO_L17N
set_property -dict { PACKAGE_PIN R13 IOSTANDARD LVCMOS33 } [get_ports { sw_i[7] }]; #IO_L5N
set_property -dict { PACKAGE_PIN I8 IOSTANDARD LVCMOS18 } [get_ports { sw_i[8] }]; #IO_L24N
set_property -dict { PACKAGE_PIN U8 IOSTANDARD LVCMOS18 } [get_ports { sw_i[9] }]; #IO_25_3
set_property -dict { PACKAGE_PIN R16 IOSTANDARD LVCMOS33 } [get_ports { sw_i[10] }]; #IO_L15N
set_property -dict { PACKAGE_PIN T13 IOSTANDARD LVCMOS33 } [get_ports { sw_i[11] }]; #IO_L3N
set_property -dict { PACKAGE_PIN H6 IOSTANDARD LVCMOS33 } [get_ports { sw_i[12] }]; #IO_L24N
set_property -dict { PACKAGE_PIN U12 IOSTANDARD LVCMOS33 } [get_ports { sw_i[13] }]; #IO_L20N
set_property -dict { PACKAGE_PIN U11 IOSTANDARD LVCMOS33 } [get_ports { sw_i[14] }]; #IO_L19N
set_property -dict { PACKAGE_PIN V10 IOSTANDARD LVCMOS33 } [get_ports { sw_i[15] }]; #IO_L21N

```

# 综合 (Synthesis)

综合是将HDL语言等设计输入翻译成由与、或、非门和RAM、触发器等基本逻辑单元组成的逻辑连接（网表），并根据目标和要求（约束条件）优化生成的RTL层连接。

点击Run Synthesis  
然后点OK



点击Run Synthesis  
然后点OK



综合所需时间可能较长，注意观察窗口右上角的状态变化



# 实现 (Implementation)

综合完成后会出现如上窗口

实现是综合输出的逻辑网表翻译成所选器件的低层模块和硬件原语，将设计映射到器件结构上，进行布局布线，达到在所选器件上实现设计的目的。

点击Run Implementation，也可以选择Cancel后在左侧Flow Navigator中选择同样的，这个过程也有可能比较慢，注意观察窗口右上角状态变化



# 生成bit文件(Generate Bitstream)

实现完成后会出现如上窗口

选择Generate Bitstream，点击OK

也可以选择Cancel后在左侧Flow Navigator中选择

若在综合和实现之前点击Generate Bitstream会先执行综合、实现，再生成比特流文件。

同样的，这个过程也有可能比较慢，注意观察窗口右上角状态变化



# Open Target

位流生成后会出现如上窗口

选择Open Hardware Manager，点击OK

也可以选择Cancel后在左侧Flow

Navigator中选择

同样的，这个过程也有可能比较慢，注意  
观察窗口右上角状态变化



# 下载 (Program)

- 如果此前没有连接硬件，则在Open Hardware Manager中选择Open Target
- 选择Auto Connect
- 注意：这时要物理上将设备连接到你的计算机，并打开开关
- 然后再点击Program Device->xc7a100t\_0





如果到这里都没有错误，恭喜你，你的设计已经成功地下载到FPGA板上运行起来了！

接下来，了解一下如何查看结果吧！

# 运行结果检查



CPU复位按钮，按下后PC从0开始执行程序

- SW5-SW0为0时，七段数码管显示CPU数据；
- 拨动开关(SW15-SW6)，16个开关的状态被写入右边四个七段数码管（左边四个为0）
  - 例如当SW15, SW14, SW7为1，其他开关为0时，七段数码管上显示为0000C080

开发板复位按钮，按下后加载Out of Box Demo

- SW5为1表示查看寄存器的值
- SW4-SW0为寄存器编号，当SW1为1时，其他为0时，表示R2
- 其他开关均为0
- R2 = 7
- 将SW15置1，CPU慢速运行；按下CPU复位按钮，程序从0地址开始执行，可以看到R2的值开始为5，后来变为7

# 测试开关设置

- 开关作为输入 (lw)，对应地址为 0xFFFF0004，
- 七段数码管作为输出 (sw)，对应地址为 0xFFFF000C

| 开关设置 |        |     |     |     |     | 功能                                                                     |
|------|--------|-----|-----|-----|-----|------------------------------------------------------------------------|
| SW15 | 0      |     |     |     |     | CPU全速运行                                                                |
|      | 1      |     |     |     |     | CPU慢速运行                                                                |
| SW5  | SW4    | SW3 | SW2 | SW1 | SW0 | 七段数码管的内容                                                               |
| 0    | 0      | 0   | 0   | 0   | 0   | CPU数据（指令中写入七段数码管的数据，即sw指令写入地址0xFFFF000C的值）；如果代码中没有该指令，则显示默认值0xAA5555AA |
| 0    | 0      | 0   | 0   | 0   | 1   | 指令编号 (PC>>2)                                                           |
| 0    | 0      | 0   | 0   | 1   | 0   | 指令地址 (PC)                                                              |
| 0    | 0      | 0   | 0   | 1   | 1   | 指令 (IR)                                                                |
| 0    | 0      | 0   | 1   | 0   | 0   | CPU访问存储器或外设的地址                                                         |
| 0    | 0      | 0   | 1   | 0   | 1   | CPU写入存储器或外设的数据                                                         |
| 0    | 0      | 0   | 1   | 1   | 0   | 数据存储器读出的数据                                                             |
| 0    | 0      | 0   | 1   | 1   | 1   | 数据存储器的访问地址                                                             |
| 0    | x      | 1   | x   | x   | x   | 0xFFFFFFFF                                                             |
| 0    | 1      | x   | x   | x   | x   | 0xFFFFFFFF                                                             |
| 1    | 寄存器的编号 |     |     |     |     | 对应寄存器的值                                                                |

左侧Flow Navigator窗口中，RTL Analysis->Open Elaborated Design

可以看到项目的顶层设计，右击每个方块可以view Source , View Definition



# 注意事项

- 没有单步的功能
- 但是可以慢速运行
- 也可以运行完后再看寄存器的值
- 需记录下实验中遇到的问题是怎么解决的，并体现在实验报告中