

### 第三批作业:

9. 对不同微处理器架构进行性能分析和对比时，主要从其运行速度和功耗出发。影响CPU运行速度的指标包括时钟周期、Cache容量、指令系统、流水线等。

① 时钟周期：对于相同架构处理器，通常时钟速度越高，CPU运行速度越快；但即使时钟周期更低，若新架构能够更高效处理指令集，性能可能会更好。

② 指令系统：从过去的CISC到如今的RISC，二者取长补短，不同的指令架构会影响CPU性能。

③ Cache：缓存的工作效率远远大于系统内存和硬盘，缓存结构的优化和大小的增加可以提高系统的性能。

④ 功耗：随着晶体管尺寸越来越小，芯片的电压却难以持续下降，形成“功耗墙”；通过新架构的设计，开辟蹊径优化处理器的性能。

Dhrystone 是衡量处理器运算能力的基本程序之一，常用于整型运算和逻辑运算性能的测量，输出每秒运行 Dhrystone 的次数。

CoreMark 综合测量 CPU 性能：列表处理、矩阵操作、状态机和 CRC。

10. 层次化：  
① 软件  $\leftarrow$  指令集  $\leftarrow$  硬件，使软件和硬件相互透明，实现处理器可编程。  
② 微架构（冯·诺依曼 / 哈佛）  
③ 内存层次结构，实现更快更大的存储。

### 2. 读后感：

通用处理器固有的低效率，无论是由 ICP 技术还是多核所致，加上 Dennard 缩放定律和摩尔定律的终结，使我们认为处理器架构师和设计人员在一般情况下难以继续保持通用处理器性能的提升。

对此，我们可以研究领域特定结构(DAS)，是设计针对特定问题定制的体系。

结构，并为该领域提供显著的能效和性能增益。与ASIC不同，FPGA通常用于单一功能，代码很少发生变化的场景；而DSA是一种可编程且固灵完备的，但与通用CPU相比，它们只会加速某些应用程序。DSA能实现更好的性能和更高的能效，主要有以下4点原因：

- ① 利用了特定领域中更有效的并行形式。
- ② 更高效地利用内存层次结构。
- ③ 适度使用较低的精度。
- ④ 负益于以DSL编写的目標程序。