

# CS222

# Operating Systems

## Lecture 11

## Memory Management

(Section 100001)

ผศ. ดร. กษิิดิศ ชาญเชี่ยว

[ckasidit@tu.ac.th](mailto:ckasidit@tu.ac.th)

# Textbook

- Avi Silberschatz, Peter B. Galvin and Greg Gagne; Operating System Concepts, 9<sup>th</sup> Edition; John Wiley & Sons, Inc; 2012; ISBN 978-1118063330



- Chapter 9 (10th edition)  
Memory Management
- Original Slides
- <https://www.os-book.com/OS9/slide-dir/index.html>
- <https://www.os-book.com/OS10/slide-dir/index.html>

# เกี่ยวกับ cosmic rays

- อนุภาค ที่มาจากการอุบัติเหตุในอวกาศ
- ชนกับชั้นบรรยากาศ แล้วทำให้เกิดอนุภาคอื่นตามyaingพื้นโลก
- อนุภาคเช่น นิวตรอน อิเลคตรอน ส่งผลต่อระบบ ดิจิตอล
- ตย. คงแน่ผลการเลือกตั้งในเบลเยี่ยมเพิ่มหรือ ผู้เล่นเกมส์ Supermario สามารถกระโดดได้เกินกว่าชั้นที่โปรแกรมกำหนด
- บน Space Shuttle ต้องใช้ คอม 4 เครื่องพร้อมกันและนำผลจากการคำนวณทุกอย่างมา vote เป็นค่าผลลัพธ์
- Astronaut เห็นแสงสว่าง Light Flash ในตา



# เกี่ยวกับ Radiation กับอุปกรณ์ Electronics

- ใน MARS rover ต้องใช้ Mem น้อย และซีพียูป้องกัน Radiation (รวมทั้งจาก cosmic rays)

Comparison of embedded computer systems on board the Mars rovers

| Rover (mission, organization, year) ▾                                                          | CPUs ▾                           | RAM ▾  | Flash ▾ | EEPROM ▾ | Operating system ▾                     |
|------------------------------------------------------------------------------------------------|----------------------------------|--------|---------|----------|----------------------------------------|
| <i>Sojourner</i> Rover (Pathfinder, NASA, 1997) <sup>[1][3][4][5]</sup>                        | 2 MHz <sup>[6]</sup> Intel 80C85 | 512 KB | 176 KB  | None     | Custom cyclic executive                |
| Pathfinder Lander (NASA, 1997) <sup>[1]</sup><br>(Base station for <i>Sojourner</i> rover)     | 20 MHz MFC                       | 128 MB | None    | 6 MB     | VxWorks <sup>[7]</sup> (multitasking)  |
| <i>Spirit</i> and <i>Opportunity</i> (Mars Exploration Rover (MER), NASA, 2004) <sup>[1]</sup> | 20 MHz BAE RAD6000               | 128 MB | 256 MB  | 3 MB     | VxWorks (multitasking)                 |
| <i>Curiosity</i> (Mars Science Laboratory (MSL), NASA, 2011) <sup>[1][8][9]</sup>              | 200 MHz BAE RAD750               | 256 MB | 2 GB    | 256 KB   | VxWorks (multitasking)                 |
| <i>Perseverance</i> (Mars 2020, NASA, 2020) <sup>[10]</sup>                                    | 200 MHz BAE RAD750               | 256 MB | 2 GB    | 256 KB   | VxWorks (multitasking) <sup>[11]</sup> |



- ระดับของ Radiation สูงกว่าบนโลกหลายเท่า
- อุปกรณ์อิเลคโทรนิกจะทนต่อ Radiation

ได้พอกสมควร ได้ในระดับหนึ่ง

→



300 MHz Motorola PowerPC 750 processor with off-die L2 cache on the CPU module from a Power Mac G3.



# เกี่ยวกับ Memory (terms)

- แบ่งเป็นสองแบบได้แก่ ECC Memory และ Non-ECC Memory
- ECC Memory หรือ Error Correction Code (ECC) เป็นอุปกรณ์ฮาร์ดแวร์หน่วยความจำที่สามารถตรวจจับและแก้ไขข้อผิดพลาด หากเกิด BIT FLIP จำนวน 1 bit ได้
  - มักใช้บน Server ที่รันเป็นเวลานาน หรือ Mission Critical Computer ที่มีโอกาสที่จะถูกชนโดย ฝนอนุภาคที่เกิดจาก การที่ cosmic rays ชนชั้นบรรยากาศโลก
- Non-ECC Memory คืออุปกรณ์หน่วยความจำธรรมด้า ที่ไม่สามารถตรวจจับความผิดพลาดได้ มักใช้บน Desktop หรือ Notebook
- Soft error คือความผิดพลาดที่เกิดจากข้อมูลผิด อาจเกิดเพราะอุปกรณ์ผิดพลาด หรือ ไม่ได้เกิดจากสิ่งอื่นเช่น cosmic rays
- ECC ไม่สามารถป้องกันการโจมตีแบบ Row Hammer ที่ใช้วิธีการเขียน DRAM ในรูปแบบหนึ่งซ้ำแล้วซ้ำอีกและส่งผลให้ข้อมูลของ RAM ที่อยู่ใกล้เคียงตำแหน่งที่เกิดการเขียนบ่อยเปลี่ยนได้ ถ้ามี bitflips มากกว่า 1 bit

# ความรู้ทั่วไป

อ้างอิง: ภาพและข้อมูลจาก Wikipedia

<https://www.metalearth.com/mars-rover-perseverance-ingenuity-helicopter>

<https://astronomy.com/news/2021/01/the-history-of-cosmic-rays-is-buried-beneath-our-feet>

[https://www.youtube.com/watch?v=AaZ\\_RSt0KP8](https://www.youtube.com/watch?v=AaZ_RSt0KP8)

<https://www.cashify.in/best-processor-for-mobile-phone-ranking-list>

<https://www.iaea.org/newscenter/news/cosmic-radiation-why-we-should-not-be-worried>

<https://docs.kernel.org/scheduler/sched-energy.html>

<https://docs.kernel.org/scheduler/sched-capacity.html>

# Chapter 9: Memory Management

- Background
- Contiguous Memory Allocation
- Paging
- Structure of the Page Table
- Swapping
- Example: The Intel 32 and 64-bit Architectures
- Example: ARMv8 Architecture

# Objectives

- To provide a detailed description of various ways of organizing memory hardware
- To discuss various memory-management techniques,

# โจทย์ที่เราต้องการศึกษา

1. เราจัดเก็บชุดคำสั่งและข้อมูลในไฟล์ใน Disk/SSD อย่างไร
2. เราจะเอาข้อมูลจาก Disk/SSD มาใส่ในหน่วยความจำอย่างไร
3. CPU จะเข้าถึงข้อมูลใน Memory ได้อย่างไร
4. การบริหารจัดการ Memory



# การจัดการ **Memory** แบบพื้นฐาน

# Background

- **Program must be brought (from disk) into memory and placed within a process for it to be run**
- Main memory and registers are only storage CPU can access directly
- Memory unit only sees a stream of:
  - addresses + read requests, or
  - address + data and write requests

# Background

- Register access is done in one CPU clock (or less)
- แต่ Main memory can take many cycles, causing a **stall**
- **Cache** sits between main memory and CPU registers
  - การบริหารจัดการ cache ทำโดย hardware
- **Protection of memory required to ensure correct operation**
  - ทุก Process มี Separate Memory Space
  - hardware ป้องกันการเข้าถึงข้อมูลของ Process หนึ่ง โดย Process อื่น

# Protection

- Protection of memory required to ensure correct operation
  - ทุก Process มี Separate Memory Space
  - hardware ป้องกันการเข้าถึงข้อมูลของ Process หนึ่ง โดย Process อื่น



# Protection

- Need to ensure that a process can access only those addresses in its address space.
- We can provide this protection by using a pair of **base** and **limit registers** define the logical address space of a process



# Hardware Address Protection

- CPU must check every memory access generated in user mode to be sure it is between base and limit for that user



- the instructions to loading the base and limit registers are privileged
  - CPU ต้องอยู่ใน System Mode เท่านั้น ถึงจะรันคำสั่ง Privileged Instruction ได้
  - CPU อยู่ใน System Mode เมื่อ OS Kernel ประมวลผล

# CPU timeline



# **Address Binding**

# ระดับชั้นของ นามธรรม (abstraction)

- CPU ประมวลผลชุดคำสั่งแบบ binary code หรือชุดคำสั่งภาษาเครื่อง
- การออกคำสั่งด้วย binary code ทำได้ยากจึงเกิดการพัฒนาภาษาโปรแกรมขึ้น
- ภาษา Assembly ใช้ลัญลักษณ์ขั้นพื้นฐาน
  - เราใช้ Assembler แปลงโปรแกรม Assembly ให้เป็น binary code
  - one statement ต่อ 1 machine instruction
- จากโปรแกรม C, C++, Java และ python เป็น High-level language (HLL)
  - เราสามารถใช้ Compiler แปลงโปรแกรมให้เป็น assembly code
  - และใช้ assembler แปลงโปรแกรมให้เป็น binary code
  - 1 statement มักจะถูกแปลงเป็น หลาย machine instruction
- นามธรรมของส่วนประกอบของโปรแกรมมีหลายระดับ

# Multistep Processing of a User Program



# ระดับชั้นของ นามธรรม (abstraction)

- ในภาษา มีการให้ตัวตนกับสรรพสิ่ง ถ้าสิ่งนั้นมีตัวตน ก็ต้องมีนาม (สัญลักษณ์)
- การให้ชื่อเกิดขึ้นในต่างระดับของนามธรรม

| ตัวอย่าง | สัญลักษณ์ภาษาชั้นสูง | สัญลักษณ์ภาษา assembly (ตย. RISC-V, MIPS)                                                                                                                   |
|----------|----------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1        | int x, y, z;         | ตำแหน่งหน่วยความจำ (address) ที่ 01014<br>(x ใช้พื้นที่จากนั้น 4 bytes)<br>ตำแหน่งหน่วยความจำ (address) ที่ 01018<br>ตำแหน่งหน่วยความจำ (address) ที่ 01022 |
| 2        | int f1(void){...}    | ตำแหน่งหน่วยความจำ (address) ที่ 01234                                                                                                                      |
| 3        | z = x+y;             | lw t0 0(01014)<br>lw t1 0(01018)<br>add t2 t0 t1<br>sw t2 0(01022)                                                                                          |
| 4        | f1();                | jal 01234                                                                                                                                                   |

# Address Binding

- Programs on disk, ready to be brought into memory to execute from an **input queue**
  - Without support, must be loaded into address 0000
- Inconvenient to have first user process physical address always at 0000
  - How can it not be?
- Addresses represented in different ways at different stages of a program's life
  - Source code addresses usually symbolic
  - Compiled code addresses **bind** to relocatable addresses
    - ▶ i.e., “14 bytes from beginning of this module”
  - Linker or loader will **bind** relocatable addresses to absolute addresses
    - ▶ i.e., 74014
  - Each binding maps one address space to another



# Binding of Instructions and Data to Memory

- ในการรัน Process เนื้อหาของโปรแกรมจะต้องอยู่ใน main memory
- binding จาก Address in exe file on disk → Address in memory
- ทำได้สามตอน: ตอนคอมไฟล์โปรแกรม ตอนโหลดโปรแกรม และตอน รันโปรแกรม
- หมายความว่า คุณจะรู้ค่า physical mem addr ของ ชื่อของตัวแปร หรือคำสั่งในโปรแกรมของคุณตอนไหน ตอนคอมไฟล์ ตอนโหลด หรือตอนรันโปรแกรม

- Address binding of instructions and data to memory addresses can happen at three different stages
  - **Compile time:** If memory location known a priori, **absolute code** can be generated; must recompile code if starting location changes
    - ต้องรู้ memory address ตั้งแต่ตocomไฟล์โปรแกรม
    - ใช้ในโปรแกรม MSDOS ในอดีต

# ตัวอย่าง compile time binding



# Binding of Instructions and Data to Memory

- Address binding of instructions and data to memory addresses can happen at three different stages
  - **Compile time:** If memory location known a priori, **absolute code** can be generated; must recompile code if starting location changes
  - **Load time:** Must generate **relocatable code** if memory location is not known at compile time
  - การกำหนดค่า address จริง จะเกิดตอน **โหลดโปรแกรมเข้าสู่ memory**
  - ถ้า starting address เปลี่ยนก็ต้อง reload โปรแกรมใหม่ ให้ค่า address ของ ส่วนประกอบของโปรแกรมเปลี่ยนตาม starting address ที่เปลี่ยนไป

# relocatable address

- ชื่อของส่วนประกอบของโปรแกรม ในระดับ Assembly และ Machine Code ล้วนแต่เป็น relocatable address
- compiler จะแปลงทุกชื่อในภาษาชั้นสูงให้เป็น “relocatable address” เหล่านี้ในไฟล์ executable
- เมื่อโปรแกรมประมวลผล โปรแกรมจะต้องถูกโหลดเข้ามาใน Hardware ที่ใช้เก็บข้อมูลแบบ array อุปกรณ์หนึ่งที่เรียกว่า Main Memory  $M[n]$  ที่ประกอบไปด้วย  $i$  คือ index และ  $M[i]$  คือค่าจำนวน 1 bytes จำนวน  $n$  ค่า



- การแปลง “relocatable address” ให้เป็นค่า  $i$  คือ Address Binding

# ตัวอย่าง load time binding



# ตัวอย่าง load time binding (reload)



# Binding of Instructions and Data to Memory

- Address binding of instructions and data to memory addresses can happen at three different stages
  - **Compile time:** If memory location known a priori, **absolute code** can be generated; must recompile code if starting location changes
  - **Load time:** Must generate **relocatable code** if memory location is not known at compile time
  - **Execution time:** Binding delayed until run time if the process can be moved during its execution from one memory segment to another
    - ▶ Need hardware support for address maps (e.g., **base** and **limit registers**)
    - การกำหนดค่า address จริง จะเกิดตอน **โปรแกรมรัน** แต่ละคำสั่ง
    - ในเรื่องของ “address” Process แต่ละ Process จะมีโลกเสมือน เป็นของตนเองแยกจาก Process

# ตัวอย่าง execution time binding (1)

(1) OS load Pgm  
To memory  
(Pgm ยังไม่ประมวลผล)

Pgm  
(relocatable code)

1014  
0004  
0000

x

Lw t0 0(1014)

Pgm  
size

physical  
Address  
(paddr)

OS

Pgm  
(relocatable code)

75014  
74004  
74000

x

Lw t0 0(1014)

0000

base Register = 74000

Disk

memory

# ตัวอย่าง execution time binding (2)



# ตัวอย่าง execution time binding (3)

(3) ระหว่าง Pgm ประมวลผล มันอาจถูกขัดจังหวะ และ OS จำเป็นต้องย้ายโปรแกรมไปพื้น mem ใหม่

Virtual  
Address  
(vaddr)



physical  
Address  
(paddr)

95014  
94004  
94000

0000

base Register = 94000

OS

Pgm (relocatable code)

x

Lw t0 0(1014)

memory

# ตัวอย่าง execution time binding (4)



# Logical vs. Physical Address Space

- ซีพีyu อ่านคำสั่งและข้อมูลจาก Memory เข้ามา\_rัน
- The concept of a logical address space that is bound to a separate **physical address space** is central to proper memory management
  - **Logical address** – generated by the CPU; also referred to as **virtual address** (ซีพีyuทำงานกับ vaddr)
  - **Physical address** – address seen by the memory unit  
(MMU ทำงานกับ paddr)



# Logical vs. Physical Address Space

- The concept of a logical address space that is bound to a separate **physical address space** is central to proper memory management
  - **Logical address** – generated by the CPU; also referred to as **virtual address**
  - **Physical address** – address seen by the memory unit
- Logical and physical addresses are the same in compile-time and load-time address-binding schemes; logical (virtual) and physical addresses differ in execution-time address-binding scheme
  - หมายความว่า ซีพียูใช้ vaddr ค่าเดียวกันกับ psaddr ในกรณี compile-time & load time binding
  - ซีพียูใช้ vaddr ที่แตกต่างจาก paddr ในกรณี execution time binding

# ตัวอย่าง compile time binding

Logical and physical addresses are the same in compile-time and load-time address-binding schemes

CPU อ่าน Instruction  
จาก Memory เข้ามารัน

อ่านคำสั่งจาก 0000

อ่านคำสั่งจาก 0004

อ่านข้อมูลจาก 1014

อ่านคำสั่งจาก 0008

โหลดค่าตัวแปร x ที่ address 1014  
มาไว้ที่ register t0

physical  
Address  
(paddr)

1014

0004

0000



# ตัวอย่าง load time binding

Logical and physical addresses are the same in compile-time and load-time address-binding schemes

CPU อ่าน Instruction  
จาก Memory เข้ามารัน

อ่านคำสั่งจาก 74000

อ่านคำสั่งจาก 74004

อ่านข้อมูลจาก 75014

อ่านคำสั่งจาก 74008



# ตัวอย่าง execution time binding (1)

logical (virtual) and physical addresses  
differ in execution-time address-binding  
scheme



CPU  
รัน 0004  
อ่าน 1014



# ตัวอย่าง execution time binding (2)

logical (virtual) and physical addresses  
differ in execution-time address-binding  
scheme

CPU อ่าน Instruction  
จาก Memory เข้ามารัน

อ่านคำสั่งจาก 0000

อ่านคำสั่งจาก 0004

อ่านข้อมูลจาก 1014

อ่านคำสั่งจาก 0008



# **Logical Address และ Physical Address และ Memory Management Unit (MMU)**

# Logical vs. Physical Address Space

- **Logical address space** is the set of all logical addresses generated by a program
- **Physical address space** is the set of all physical addresses generated by a program
- ในปัจจุบัน OS และ HW ส่วนใหญ่เป็น Exe time binding
- ใช้ MMU ช่วย

# Memory-Management Unit (MMU)

- Hardware device that at run time maps virtual to physical address



- Many methods possible, covered in the rest of this chapter

# Memory-Management Unit (Cont.)

- Consider simple scheme. which is a generalization of the base-register scheme.
- The base register now called **relocation register**
- The value in the relocation register is added to every address generated by a user process at the time it is sent to memory
- The user program (และ CPU) deals with *logical* addresses; it never sees the *real* physical addresses
  - Execution-time binding occurs when reference is made to location in memory
  - Logical address bound to physical addresses

# Memory-Management Unit (Cont.)

- Consider simple scheme. which is a generalization of the base-register scheme.
- The base register now called **relocation register**
- The value in the relocation register is added to every address generated by a user process at the time it is sent to memory



# การโหลดโปรแกรมเข้าสู่ Memory

- **Dynamic Loading**
- **Dynamic Linking**

# Multistep Processing of a User Program



# Dynamic Loading

- The entire program does need to be in memory to execute
- Routine is not loaded until it is called
- Better memory-space utilization; unused routine is never loaded
- All routines kept on disk in relocatable load format
- Useful when large amounts of code are needed to handle infrequently occurring cases
- No special support from the operating system is required
  - Implemented through program design
  - OS can help by providing libraries to implement dynamic loading

# Dynamic Loading

- โปรแกรมต้องถูก load เข้ามาใน Memory เพื่อ Execute
- Routine จะไม่ถูก load จนกระทั่งโปรแกรมเรียกใช้ routine นั้น
- ประหยัดพื้นที่หน่วยความจำ routine ที่ไม่ถูกใช้ก็ไม่ถูกนำเข้ามาใน mem
- ทุก routine จะถูกเก็บใน disk/ssd ในรูปแบบ relocatable load format
- โหลดเฉพาะ routine และ dependency ของ routine นั้น ไม่ใช่ทั้ง library
- มีประโยชน์ เพราะโปรแกรมอาจไม่ได้ใช้ routine ป้อนนักแต่เมื่อต้องใช้ก็โหลดได้
- ไม่ต้องใช้กลไกของ operating system (OS ไม่ใช่คนจัดการให้)
  - การโหลดเป็นส่วนหนึ่งของการออกแบบโปรแกรม เช่น เมื่อผู้ใช้เลือก option อันใดอันหนึ่งใน menu ก็ค่อยโหลด
  - OS จะให้บริการ libraries หรือเครื่องมือเพื่อให้โปรแกรมเรียกใช้ routine ใน libraries เพื่อทำ dynamic loading ด้วยตัวโปรแกรมเอง

# Dynamic Loading (wikipedia)

- ใช้ใน IBM mainframe ตั้งแต่ IBM System/360 ใน OS/360
- ในเป็น plugin ของ Apache Web Server \*.dso เป็นไฟล์ plugin แบบ “dynamic shared object”
- ใน UNIX-like OS และ Windows ใน C/C++ ก็มี dl library ให้โปรแกรมเรียกใช้เพื่อ โหลด dynamic library หรือ shared library เมื่อต้องการ

| Name                   | Standard POSIX/UNIX API                                    | Microsoft Windows API        |
|------------------------|------------------------------------------------------------|------------------------------|
| Header file inclusion  | #include <dlfcn.h>                                         | #include <windows.h>         |
| Definitions for header | dl<br>( libdl.so , libdl.dylib , etc. depending on the OS) | kernel32.dll                 |
| Loading the library    | dlopen                                                     | LoadLibrary<br>LoadLibraryEx |
| Extracting contents    | dlsym                                                      | GetProcAddress               |
| Unloading the library  | dlclose                                                    | FreeLibrary                  |

[https://en.wikipedia.org/wiki/Dynamic\\_loading](https://en.wikipedia.org/wiki/Dynamic_loading)

# ตัวอย่าง Dynamic Loading (wikipedia)

## ■ UNIX

Most UNIX-like operating systems (Solaris, Linux, \*BSD, etc.) [edit]

```
void* sdl_library = dlopen("libSDL.so", RTLD_LAZY);
if (sdl_library == NULL) {
    // report error ...
} else {
    // use the result in a call to dlsym
```



## ■ Windows

Windows [edit]

```
HMODULE sdl_library = LoadLibrary(TEXT("SDL.dll"));
if (sdl_library == NULL) {
    // report error ...
} else {
    // use the result in a call to GetProcAddress
```



## ■ java

```
Class type = ClassLoader.getSystemClassLoader().loadClass(name);
Object obj = type.newInstance();
```

```
Class type = Class.forName(name);
Object obj = type.newInstance();
```

■ โหลดเฉพาะ routine และ dependency ของ routine นั้น ไม่ใช่ทั้ง library

■ โหลดเฉพาะ routine และ dependency ของ routine นั้น ไม่ใช่ทั้ง library

# ตัวอย่าง dynamic loading

Disk



shell load  
Pgm1 to mem



Virtual  
Address  
space

0000



# ตัวอย่าง dynamic loading

Disk



Physical  
Address  
space

shell load  
Pgm1 to mem



74000

0000



Physical memory

# ตัวอย่าง dynamic loading

Disk



pgm1 call  
dlopen(Mylib.so)  
...  
Call routineA

Virtual  
Address  
space

0000



# ตัวอย่าง dynamic loading

Disk



physical  
Address  
space

pgm1 call  
dlopen(Mylib.so)  
...  
Call routineA



95100

74000

0000



Virtual memory

# ตัวอย่าง dynamic loading

Disk



Virtual  
Address  
space

pgm1 call  
dlopen(Mylib.so)  
...  
Call routineA  
Call routineB

0000



# ตัวอย่าง dynamic loading

Disk



physical  
Address  
space

pgm1 call  
dlopen(Mylib.so)  
...  
Call routineA  
Call routineB



177100

95100

74000

0000



Virtual memory

# Dynamic Linking

- **Static linking** – system libraries and program code combined by the loader into the binary program image
- **Dynamic linking** –linking postponed until execution time
- Small piece of code, **stub**, used to locate the appropriate memory-resident library routine
- Stub replaces itself with the address of the routine, and executes the routine
- Operating system checks if routine is in processes' memory address
  - If not in address space, add to address space
- Dynamic linking is particularly useful for libraries
- System also known as **shared libraries**
- Consider applicability to patching system libraries
  - Versioning may be needed

# Dynamic Linking

- Static linking คอมไพล์เรอร์จะรวมโค้ดของ routines ที่มันต้องใช้พร้อมทั้ง dependencies ของ routine เหล่านั้นใน library ที่ statically link เข้ามาในโปรแกรม executable code
- Dynamic linking จะ link routines ที่ต้องการเข้ามาตอน execution time
- คอมไпал์เรอร์จะใส่ routine ปลอมที่ไม่มีเนื้อหาจริงเรียกว่า stub เข้าไปใน executable code
- เมื่อมีการเรียกใช้ routine ที่เป็น stub OS จะเช็คว่า มี routine นี้ใน (virtual) memory ของ process หรือไม่ ถ้ามีก็จะแทน stub ด้วย (virtual) memory address ของ routine แต่ถ้าไม่มี ก็จะเพิ่ม routine นั้นใน virtual memory ของ process
- OS เป็นผู้จัดการ load และ link dynamic linking library ให้

# Dynamic Linking

- Dynamic linking มีประโยชน์มาก เพราะช่วยประหยัดพื้นที่ของ executable library มากจะเป็น shared library
- Shared library เป็น dynamic library ที่ Process หลาย Process สามารถแชร์ร่วมกันได้ โดยโอลูจะเป็นคนจัดการๆ share ให้
- ถ้า Process เรียกใช้ routine และ OS พบว่า Process นั้นไม่มี routine นั้นใน process memory space OS ก็จะเช็คว่า routine นี้มีอยู่ใน memory space ของ Process อื่นหรือไม่ ถ้ามีมันจะขอแซฟ์ฟิล์ดด้วย แต่ถ้าไม่มี OS จะโหลด routine นั้นให้ Process นั้น
- ต้องมีการระบุเวอร์ชันของ shared library ที่ process ด้วยเพื่อความถูกต้องในการประมวลผล

# ตัวอย่าง static linking



# ตัวอย่าง dynamic linking

Disk



Virtual  
Address  
space

...  
Call routineA (stub)



pc →  
0000



# ตัวอย่าง dynamic linking

Disk



# ตัวอย่าง dynamic linking

Disk



Virtual  
Address  
space



# ตัวอย่าง dynamic linking

Disk



# ตัวอย่าง dynamic linking

Disk



Physical  
Address  
space

...  
Call routineA (stub)



74000

0000



Physical memory

# ตัวอย่าง dynamic linking

Disk



Physical Address space

pgm1  
Call routineA

74000

0000



Physical memory

# ตัวอย่าง dynamic linking

Disk



# ตัวอย่าง static vs dynamic linking

```
[kasidit@vm:~/Research/CS435-2566/socket]$ gcc -o serv pgm2-echo-server.c
[kasidit@vm:~/Research/CS435-2566/socket$]
[kasidit@vm:~/Research/CS435-2566/socket$]
[kasidit@vm:~/Research/CS435-2566/socket$ gcc -o serv2 -static pgm2-echo-server.c
[kasidit@vm:~/Research/CS435-2566/socket$]
[kasidit@vm:~/Research/CS435-2566/socket$]
[kasidit@vm:~/Research/CS435-2566/socket$ ls -l
total 672
-rw-rw-r-- 1 kasidit kasidit 2208 Apr 24 03:46 pgm10-2-echo-server-select.c
-rw-rw-r-- 1 kasidit kasidit 1279 Apr 24 03:46 pgm1-echo-client.c
-rw-rw-r-- 1 kasidit kasidit 1302 Apr 24 03:46 pgm2-echo-server.c
-rw-rw-r-- 1 kasidit kasidit 2169 Apr 24 03:46 pgm8-2-echo-server-concur-thread.c
-rwxrwxr-x 1 kasidit kasidit 13744 Apr 24 03:46 serv
-rwxrwxr-x 1 kasidit kasidit 651904 Apr 24 03:46 serv2
[kasidit@vm:~/Research/CS435-2566/socket$]
```

ขนาดของ statically link executable file จะใหญ่กว่าของ dynamically linked file

# ตัวอย่าง static vs dynamic linking

```
kasidit@vm:~/Research/CS435-2566/socket$ size serv
text      data      bss      dec      hex filename
3297      776       32      4105     1009 serv
kasidit@vm:~/Research/CS435-2566/socket$ size serv2
text      data      bss      dec      hex filename
515573    22520    22272    560365   88ced serv2
kasidit@vm:~/Research/CS435-2566/socket$ ldd serv
linux-vdso.so.1 (0x0000fffff9945c000)
libc.so.6 => /lib/aarch64-linux-gnu/libc.so.6 (0x0000fffff99250000)
/lib/ld-linux-aarch64.so.1 (0x0000fffff99423000)
kasidit@vm:~/Research/CS435-2566/socket$ ldd serv2
not a dynamic executable
```

- 
- ขนาดของ statically link executable file จะใหญ่กว่าของ dynamically linked file
  - คำสั่ง ldd แสดงรายการ dynamically linked libraries  
→ ชื่อ .so ไฟล์และ version ของ library
  - ldd จะไม่มีอะไรแสดงสำหรับ statically link executable

# ตัวอย่าง static vs dynamic linking

## 1. ใช้ /proc ดูข้อมูลของ dynamically linked process

```
kasidit@vm:~/Research/CS435-2566/socket$ ./serv &
[1] 17586
[kasidit@vm:~/Research/CS435-2566/socket$ cat /proc/17586/maps
aaaae38c0000-aaaae38c1000 r-xp 00000000 fd:00 705419
aaaae38d1000-aaaae38d2000 r--p 00001000 fd:00 705419
aaaae38d2000-aaaae38d3000 rw-p 00002000 fd:00 705419
fffff898c0000-fffff89a48000 r-xp 00000000 fd:00 681451
fffff89a48000-fffff89a57000 ---p 00188000 fd:00 681451
fffff89a57000-fffff89a5b000 r--p 00187000 fd:00 681451
fffff89a5b000-fffff89a5d000 rw-p 0018b000 fd:00 681451
fffff89a5d000-fffff89a69000 rw-p 00000000 00:00 0
fffff89a70000-fffff89a9b000 r-xp 00000000 fd:00 672568
fffff89aa5000-fffff89aa7000 rw-p 00000000 00:00 0
fffff89aa7000-fffff89aa9000 r--p 00000000 00:00 0
fffff89aa9000-fffff89aaa000 r-xp 00000000 00:00 0
fffff89aaa000-fffff89aac000 r--p 0002a000 fd:00 672568
fffff89aac000-fffff89aae000 rw-p 0002c000 fd:00 672568
fffffe4e34000-fffffe4e55000 rw-p 00000000 00:00 0
[kasidit@vm:~/Research/CS435-2566/socket$ kill -9 17586
/home/kasidit/Research/CS435-2566/socket/serv
/home/kasidit/Research/CS435-2566/socket/serv
/home/kasidit/Research/CS435-2566/socket/serv
/usr/lib/aarch64-linux-gnu/libc.so.6
/usr/lib/aarch64-linux-gnu/libc.so.6
/usr/lib/aarch64-linux-gnu/libc.so.6
/usr/lib/aarch64-linux-gnu/libc.so.6
/usr/lib/aarch64-linux-gnu/ld-linux-aarch64.so.1
[vvar]
[vdso]
/usr/lib/aarch64-linux-gnu/ld-linux-aarch64.so.1
/usr/lib/aarch64-linux-gnu/ld-linux-aarch64.so.1
[stack]
```

## 2. ใช้ /proc ดูข้อมูลของ statically linked process

```
kasidit@vm:~/Research/CS435-2566/socket$ ./serv2 &
[2] 17592
[1] Killed ./.serv
[kasidit@vm:~/Research/CS435-2566/socket$ cat /proc/17592/maps
00400000-0047e000 r-xp 00000000 fd:00 705420
0048e000-00492000 r--p 0007e000 fd:00 705420
00492000-00495000 rw-p 00082000 fd:00 705420
00495000-0049a000 rw-p 00000000 00:00 0
020c3000-020e5000 rw-p 00000000 00:00 0
fffffa6391000-fffffa6393000 r--p 00000000 00:00 0
fffffa6393000-fffffa6394000 r-xp 00000000 00:00 0
fffffd7d78000-fffffd7d99000 rw-p 00000000 00:00 0
[kasidit@vm:~/Research/CS435-2566/socket$ kill -9 17592
/home/kasidit/Research/CS435-2566/socket/serv2
/home/kasidit/Research/CS435-2566/socket/serv2
/home/kasidit/Research/CS435-2566/socket/serv2
[heap]
[vvar]
[vdso]
[stack]
```

# การจัดการเนื้อหาโปรแกรมใน Memory

- **Contiguous Allocation**
- **Paging**

# Contiguous Allocation

- Main memory must support both OS and user processes
- Limited resource, must allocate efficiently
- Contiguous allocation is one early method
- Main memory usually into two **partitions**:
  - Resident operating system, usually held in low memory with interrupt vector
    - ▶ ແຕກຕ່າງຈາກຕ້ວອຍ່າງທຶນລ່າວຄືນກ່ອນໜ້າ
  - User processes then held in high memory
  - Each process contained in single contiguous section of memory



# Contiguous Allocation (Cont.)

- Relocation registers used to protect user processes from each other, and from changing operating-system code and data
  - Base register contains value of smallest physical address
  - Limit register contains range of logical addresses – each logical address must be less than the limit register
  - MMU maps logical address *dynamically*
  - Can then allow actions such as kernel code being transient and kernel changing size
    - ▶ เปลี่ยนตำแหน่งของ user processes เพื่อย้ายขนาด kernel

# Hardware Support for Relocation and Limit Registers



ตย. Relocation = 100040 และ limit = 74600

Logical Address = 100 ผลคือ

Logical Address = 0 ผลคือ

Logical Address = 100040 ผลคือ

Logical Address = 74599 ผลคือ

Logical Address = 100039 ผลคือ

# Hardware Support for Relocation and Limit Registers



ตย. Relocation = 100040 และ limit = 74600

Logical Address Space ของ Process คือ: \_\_\_\_\_ ถึง \_\_\_\_\_

Physical Address Space ของ Process คือ: \_\_\_\_\_ ถึง \_\_\_\_\_

# Variable Partition

- Multiple-partition allocation
  - Degree of multiprogramming limited by number of partitions
  - **Variable-partition** sizes for efficiency (sized to a given process' needs)
  - **Hole** – block of available memory; holes of various size are scattered throughout memory
  - When a process arrives, it is allocated memory from a hole large enough to accommodate it
  - Process exiting frees its partition, adjacent free partitions combined
  - Operating system maintains information about:
    - a) allocated partitions
    - b) free partitions (hole)



# Dynamic Storage-Allocation Problem

How to satisfy a request of size  $n$  from a list of free holes?

- **First-fit**: Allocate the *first* hole that is big enough
- **Best-fit**: Allocate the *smallest* hole that is big enough; must search entire list, unless ordered by size
  - Produces the smallest leftover hole
- **Worst-fit**: Allocate the *largest* hole; must also search entire list
  - Produces the largest leftover hole

First-fit and best-fit better than worst-fit in terms of speed and storage utilization

Top



First-Fit

Program F  
(100 MB)

Worst-Fit

Program F  
(100 MB)

Best-Fit

Program F  
(100 MB)

# Fragmentation

- **External Fragmentation** – total memory space exists to satisfy a request, but it is not contiguous
- **Internal Fragmentation** – allocated memory may be slightly larger than requested memory; this size difference is memory internal to a partition, but not being used
- First fit analysis reveals that given  $N$  blocks allocated,  $0.5 N$  blocks lost to fragmentation
  - $1/3$  may be unusable -> **50-percent rule**
  - ตย. ถ้าใช้หน่วยความจำไป **150 blocks** (สมมุติว่า **1 block = 1 KB**) จะเสียพื้นที่ให้กับ **fragmentation 50 blocks**



# Fragmentation (Cont.)

- Reduce external fragmentation by **compaction**
  - Shuffle memory contents to place all free memory together in one large block
  - Compaction is possible only if relocation is dynamic, and is done at execution time
  - I/O problem
    - ▶ Latch job in memory while it is involved in I/O
    - ▶ Do I/O only into OS buffers
- Now consider that backing store (storage) has same fragmentation problems



# ทบทวนการทำงานของ CPU และ Memory

- เริ่มต้นจาก von Neumann Architecture
  - ที่กล่าวถึง คอมพิวเตอร์ที่เก็บโปรแกรมใน memory
- CPU ต้องการซุดคำสั่งหรือข้อมูลก็จะส่งคำขอไปให้ Memory
- Memory รับคำขอและส่งข้อมูลกลับ



# การทำงานของ CPU และ Memory



# การทำงานของ CPU และ Memory



# Paging

- Physical address space of a process can be noncontiguous; process is allocated physical memory whenever the latter is available
  - Avoids external fragmentation
  - Avoids problem of varying sized memory chunks
- Divide physical memory into fixed-sized blocks called **frames**
  - Size is power of 2, between 512 bytes and 16 Mbytes
- Divide logical memory into blocks of same size called **pages**
- Keep track of all free frames
- To run a program of size  $N$  pages, need to find  $N$  free frames and load program
- Set up a **page table** to translate logical to physical addresses
- Backing store likewise split into pages
- Still have Internal fragmentation

# Address Translation Scheme

- Address generated by CPU is divided into:
  - **Page number ( $p$ )** – used as an index into a **page table** which contains base address of each page in physical memory
  - **Page offset ( $d$ )** – combined with base address to define the physical memory address that is sent to the memory unit



- For given logical address space  $2^m$  and page size  $2^n$
- Memory จะเป็นแบบ Byte Addressable หมายความว่า Address 1 ค่า เป็น Address สำหรับ 1 byte ในหน่วยความจำ

# Paging Hardware



# Paging Hardware

1. the logical address generated by the CPU is sent to the MMU where it is divided into a page number (p) and an offset (d)
  - the number of bits in each part depends on the page size



# Paging Hardware

2. the page number is used as an index into the page table
  - the entry in the page table at that index is the number of the frame of physical memory containing the page
  - that frame number is the first part of the physical memory address



# Paging Hardware

- the offset (d) within the page is the same as the offset within the frame, so it is retained, together with the frame number forming the physical address



# Paging Hardware

- the physical address translated from the logical address can now be used to access physical memory, frame (f), offset (d)



# Paging Model of Logical and Physical Memory



# Paging Example

- Logical address:  $n = 2$  and  $m = 4$ . Using a page size of 4 bytes and a physical memory of 32 bytes (8 pages)

|    |   |
|----|---|
| 0  | a |
| 1  | b |
| 2  | c |
| 3  | d |
| 4  | e |
| 5  | f |
| 6  | g |
| 7  | h |
| 8  | i |
| 9  | j |
| 10 | k |
| 11 | l |
| 12 | m |
| 13 | n |
| 14 | o |
| 15 | p |

logical memory

|   |   |
|---|---|
| 0 | 5 |
| 1 | 6 |
| 2 | 1 |
| 3 | 2 |

page table

|    |   |
|----|---|
| 0  |   |
| 4  |   |
| 8  |   |
| 12 |   |
| 16 |   |
| 20 | a |
| 24 | e |
| 28 |   |

physical memory

ในตัวอย่างนี้ ขนาดของ

logical address space ( $2^4 = 16$ )

น้อยกว่าขนาดของ

physical memory ( $2^5=32$ )

- Logical address:  $n = 2$  and  $m = 5$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 32 bytes (8 pages)

| 000 |    | a |
|-----|----|---|
| 000 |    | b |
| 000 |    | c |
| 000 |    | d |
| 001 | 00 | e |
| 001 | 01 | f |
| 001 | 10 | g |
| 001 | 11 | h |
| 010 | 00 | i |
| 010 | 01 | j |
| 010 | 10 | k |
| 010 | 11 | l |
| 011 | 00 | m |
| 011 | 01 | n |
| 011 | 10 | o |
| 011 | 11 | p |

Logical memory

Page Table

| p   | f   |
|-----|-----|
| 000 | 101 |
| 001 | 110 |
| 010 | 001 |
| 011 | 010 |

ในตัวอย่างนี้ ขนาดของ

logical address space ( $2^5 = 32$ )

เท่ากับขนาดของ

physical memory ( $2^5=32$ )

|     |    |   |  |
|-----|----|---|--|
| 000 | 00 |   |  |
| 000 | 01 |   |  |
| 000 | 10 |   |  |
| 000 | 11 |   |  |
| 001 | 00 | i |  |
| 001 | 01 | j |  |
| 001 | 10 | k |  |
| 001 | 11 | l |  |
| 010 | 00 | m |  |
| 010 | 01 | n |  |
| 010 | 10 | o |  |
| 010 | 11 | p |  |
| 011 | 00 |   |  |
| 011 | 01 |   |  |
| 011 | 10 |   |  |
| 011 | 11 |   |  |
| 100 | 00 |   |  |
| 100 | 01 |   |  |
| 100 | 10 |   |  |
| 100 | 11 |   |  |
| 101 | 00 | a |  |
| 101 | 01 | b |  |
| 101 | 10 | c |  |
| 101 | 11 | d |  |
| 110 | 00 | e |  |
| 110 | 01 | f |  |
| 110 | 10 | g |  |
| 110 | 11 | h |  |
| 111 | 00 |   |  |
| 111 | 01 |   |  |
| 111 | 10 |   |  |
| 111 | 11 |   |  |

physical memory

|     |    |   |
|-----|----|---|
|     |    | a |
|     |    | b |
|     |    | c |
|     |    | d |
| 000 | 00 |   |
| 000 | 01 |   |
| 000 | 10 |   |
| 000 | 11 |   |
| 001 | 00 | e |
| 001 | 01 | f |
| 001 | 10 | g |
| 001 | 11 | h |
| 010 | 00 | i |
| 010 | 01 | j |
| 010 | 10 | k |
| 010 | 11 | l |
| 011 | 00 | m |
| 011 | 01 | n |
| 011 | 10 | o |
| 011 | 11 | p |

Logical memory



Page Table

|     |     |
|-----|-----|
| p   | f   |
| 000 | 101 |
| 001 | 110 |
| 010 | 001 |
| 011 | 010 |

|     |    |   |
|-----|----|---|
| 000 | 00 | i |
| 000 | 01 | j |
| 000 | 10 | k |
| 000 | 11 | l |
| 001 | 00 | m |
| 001 | 01 | n |
| 001 | 10 | o |
| 001 | 11 | p |

|     |    |   |
|-----|----|---|
| 100 | 00 | a |
| 100 | 01 | b |
| 100 | 10 | c |
| 100 | 11 | d |
| 101 | 00 | e |
| 101 | 01 | f |
| 101 | 10 | g |
| 101 | 11 | h |

physical memory

- Logical address:  $n = 3$  and  $m = 5$ . Using a page size of  $2^3 = 8$  bytes and a physical memory of 32 bytes (4 pages)

|    |     |   |   |  |  |  |  |
|----|-----|---|---|--|--|--|--|
|    |     |   |   |  |  |  |  |
| 00 | 000 | a |   |  |  |  |  |
| 00 | 001 | b |   |  |  |  |  |
| 00 | 010 | c |   |  |  |  |  |
| 00 | 011 | d |   |  |  |  |  |
| 00 | 100 | e |   |  |  |  |  |
| 00 | 101 | f |   |  |  |  |  |
| 00 | 110 | g |   |  |  |  |  |
| 00 | 111 | h |   |  |  |  |  |
| 01 | 000 |   | i |  |  |  |  |
| 01 | 001 |   | j |  |  |  |  |
| 01 | 010 |   | k |  |  |  |  |
| 01 | 011 |   | l |  |  |  |  |
| 01 | 100 |   | m |  |  |  |  |
| 01 | 101 |   | n |  |  |  |  |
| 01 | 110 |   | o |  |  |  |  |
| 01 | 111 |   | p |  |  |  |  |
|    |     |   |   |  |  |  |  |

Logical memory

Page Table

|    |    |
|----|----|
| p  | f  |
| 00 | 11 |
| 01 | 10 |

|         |   |
|---------|---|
| 00. 000 |   |
| 00. 001 |   |
| 00. 010 |   |
| 00. 011 |   |
| 00. 100 |   |
| 00. 101 |   |
| 00. 110 |   |
| 00. 111 |   |
| 01. 000 |   |
| 01. 001 |   |
| 01. 010 |   |
| 01. 011 |   |
| 01. 100 |   |
| 01. 101 |   |
| 01. 110 |   |
| 01. 111 |   |
| 10. 000 | i |
| 10. 001 | j |
| 10. 010 | k |
| 10. 011 | l |
| 10. 100 | m |
| 10. 101 | n |
| 10. 110 | o |
| 10. 111 | p |
| 11. 000 | a |
| 11. 001 | b |
| 11. 010 | c |
| 11. 011 | d |
| 11. 100 | e |
| 11. 101 | f |
| 11. 110 | g |
| 11. 111 | h |

physical memory



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 64 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



frame id Page table contents

| frame id | Page table contents |
|----------|---------------------|
| 0x0      | 0x11                |
| 0x1      | 0x3C                |
| 0x2      | 0x06                |
| 0x3      | ----                |
| 0x4      | ----                |
| 0x5      | 0x10                |
| 0x6      | ----                |
| 0x7      | 0x2E                |
| 0x8      | 0x0F                |
| 0x9      | ----                |
| 0xA      | 0x1B                |
| 0xB      | 0x34                |
| 0xC      | ----                |
| 0xD      | 0x2A                |
| 0xE      | 0x14                |
| 0xF      | ----                |

Frame id (f) : offset (d)

4 bits : 2 bits



- จอย ให้ ตัวอย่างเนื้อหาใน Physical Mem  
แล้วให้ นศ สร้าง page table

- Logical address:  $n = 12$  and  $m = 32$ . Using a page size of  $2^{12} = 4\text{KB}$  bytes and a physical memory of  $2^{32} = 4\text{GB}$  ( $4 * 1024^3 / 4 * 1024^1 = 1024^2 = 1048576$  pages)



- ให้ ตัวอย่างของการแปลง **logical addr** ไปเป็น **physical addr** แล้วให้ นศ สร้าง **page table**

- Logical address:  $n = 12$  and  $m = 32$ . Using a page size of  $2^{12} = 4\text{KB}$  bytes and a physical memory of  $2^{32} = 4\text{GB}$  ( $4 * 1024^3 / 4 * 1024^1 = 1024^2 = 1048576$  pages)



- โจทย์ให้ ตัวอย่างของการแปลง logical addr ไปเป็น physical addr และให้ นศ สร้าง page table

# Paging -- Calculating internal fragmentation

- Page size = 2,048 bytes
- Process size = 72,766 bytes
- 35 pages + 1,086 bytes
- Internal fragmentation of  $2,048 - 1,086 = 962$  bytes
- Worst case fragmentation = 1 frame – 1 byte
- On average fragmentation = 1 / 2 frame size
- So small frame sizes desirable?
- But each page table entry takes memory to track
- Page sizes growing over time
  - Solaris supports two page sizes – 8 KB and 4 MB
  - Windows 10 supports two page sizes – 4 KB and 2MB
  - Linux usual page size is 4KB
    - ▶ Linux support huge page – 2 MB to 256 MB

# Free Frames

free-frame list

14  
13  
18  
20  
15



(a)

Before allocation

free-frame list

15



|   |    |
|---|----|
| 0 | 14 |
| 1 | 13 |
| 2 | 18 |
| 3 | 20 |

new-process page table



(b)

After allocation

# Implementation of Page Table

- Page table is kept in main memory
  - **Page-table base register (PTBR)** points to the page table
    - ▶ In x86\_64 it's CR3 register
  - **Page-table length register (PTLR)** indicates size of the page table
- In this scheme every data/instruction access requires **two memory accesses**
  - One for the page table and one for the data / instruction
- The two-memory access problem can be solved by the use of a special fast-lookup hardware cache called **translation look-aside buffers (TLBs)** (also called **associative memory**).

# Page Table อյุ๊ที่ไหน



- Physical Memory Space ถูกแบ่งเป็น Frames
- Logical Memory Space ถูกแบ่งเป็น Pages
- ขนาดของ Page กับ Frame เท่ากัน

0x0000

0xFFFF  
physical  
Address



physical memory

- Physical Memory Space ถูกแบ่งเป็น Frames
- Logical Memory Space ถูกแบ่งเป็น Pages
- ขนาดของ Page กับ Frame เท่ากัน
- Frames จำนวนหนึ่งจะถูกจดจำไว้ใช้ตลอดเวลาโดย OS
- ส่วนที่เหลือใช้สำหรับเก็บข้อมูลของ Process

0x0000

0xFFFF  
physical  
Address

os

.....



physical memory

- Physical Memory Space ถูกแบ่งเป็น Frames
- Logical Memory Space ถูกแบ่งเป็น Pages
- ขนาดของ Page กับ Frame เท่ากัน
- Frames จำนวนหนึ่งจะถูกจดจำไว้ใช้ตลอดเวลาโดย OS
- ส่วนที่เหลือใช้สำหรับเก็บข้อมูลของ Process
- Page Table ของแต่ละ Process จะอยู่ใน memory  
ของ OS
- เวลาที่แต่ละ Process ประมวลผล OS จะกำหนดค่า  
Page-table base register (PTBR) และ  
Page-table length register (PTLR)

0x0000

os

0xFFFF  
physical  
Address



physical memory

- เวลาที่แต่ละ Process P0 ประมวลผล OS จะกำหนดค่า Page-table base register (PTBR) และ Page-table length register (PTLR)



- เรามี Page-table length register (PTLR)  
 เพราะ Process ไม่ได้ใช้ Logical Address Space  
 ทั้งหมด และเพื่อป้องกันไม่ให้เสียพื้นที่ page table โดยเปล่าประโยชน์



# Translation Look-Aside Buffer

- ปัญหาของ Page Table คือ มันทำให้การเข้าถึง Memory ครั้งหนึ่ง ต้องเข้าถึง memory ถึง 2 ครั้ง
- **Translation Look-Aside Buffer** คือ หน่วยความจำความเร็วสูง ที่ MMU ใช้เก็บข้อมูลการ mapping ของ page table ที่ใช้บ่อย (เหมือน Data หรือ Instruction cache)
- Some TLBs store **address-space identifiers (ASIDs)** in each TLB entry – uniquely identifies each process to provide address-space protection for that process
  - Otherwise need to flush at every context switch
- TLBs typically small (64 to 1,024 entries)
- On a TLB miss, value is loaded into the TLB for faster access next time
  - Replacement policies must be considered
  - Some entries can be **wired down** for permanent fast access บาง address entry สามารถเก็บไว้ใน TLB เช่น สำหรับ kernel code

# TLB อญຸທີ່ໃຫນ



# Hardware

- Associative memory – parallel search

| Page # | Frame # |
|--------|---------|
|        |         |
|        |         |
|        |         |
|        |         |

- Address translation (p, d)
  - If p is in associative register, get frame # out
  - Otherwise get frame # from page table in memory

# Paging Hardware With TLB



|     |    |   |
|-----|----|---|
|     |    | a |
|     |    | b |
|     |    | c |
|     |    | d |
| 000 | 00 |   |
| 000 | 01 |   |
| 000 | 10 |   |
| 000 | 11 |   |
| 001 | 00 | e |
| 001 | 01 | f |
| 001 | 10 | g |
| 001 | 11 | h |
| 010 | 00 | i |
| 010 | 01 | j |
| 010 | 10 | k |
| 010 | 11 | l |
| 011 | 00 | m |
| 011 | 01 | n |
| 011 | 10 | o |
| 011 | 11 | p |

Logical memory



|     |    |   |
|-----|----|---|
| 000 | 00 |   |
| 000 | 01 |   |
| 000 | 10 |   |
| 000 | 11 |   |
| 001 | 00 | i |
| 001 | 01 | j |
| 001 | 10 | k |
| 001 | 11 | l |
| 010 | 00 | m |
| 010 | 01 | n |
| 010 | 10 | o |
| 010 | 11 | p |
| 011 | 00 |   |
| 011 | 01 |   |
| 011 | 10 |   |
| 011 | 11 |   |
| 100 | 00 |   |
| 100 | 01 |   |
| 100 | 10 |   |
| 100 | 11 |   |
| 101 | 00 | a |
| 101 | 01 | b |
| 101 | 10 | c |
| 101 | 11 | d |
| 110 | 00 | e |
| 110 | 01 | f |
| 110 | 10 | g |
| 110 | 11 | h |
| 111 | 00 |   |
| 111 | 01 |   |
| 111 | 10 |   |
| 111 | 11 |   |

physical memory

|  |  |   |
|--|--|---|
|  |  | a |
|  |  | b |
|  |  | c |
|  |  | d |
|  |  | e |
|  |  | f |
|  |  | g |
|  |  | h |
|  |  | i |
|  |  | j |
|  |  | k |
|  |  | l |
|  |  | m |
|  |  | n |
|  |  | o |
|  |  | p |

Logical memory



physical memory

# Effective Access Time

- Hit ratio – percentage of times that a page number is found in the TLB
- An 80% hit ratio means that we find the desired page number in the TLB 80% of the time.
- Suppose that 10 nanoseconds to access memory.
  - If we find the desired page in TLB then a mapped-memory access take 10 ns
  - Otherwise we need two memory access so it is 20 ns
- **Effective Access Time (EAT)**

$$EAT = 0.80 \times 10 + 0.20 \times 20 = 12 \text{ nanoseconds}$$

implying 20% slowdown in access time

- Consider amore realistic hit ratio of 99%,

$$EAT = 0.99 \times 10 + 0.01 \times 20 = 10.1\text{ns}$$

implying only 1% slowdown in access time.

- Intel Core i7 มี 128 entries L1 Instruction TLB และ 64 entries L1 data TLB และมี 512 entries L2 TLB

# TLB: ASID

- Address Space Identifier (ASID) เป็นตัวเลขที่ OS กำหนดให้แต่ละ Process
- ทำให้สามารถใช้ TLB เก็บ mapping page# → frame # ของหลาย Process ได้
- Associative memory – parallel search

| Page # | ASID # | Frame # |
|--------|--------|---------|
|        |        |         |
|        |        |         |
|        |        |         |

- Address translation (p, a, d)
  - If p is in associative register and a เป็น id ของ Process ที่ใช้งาน CPU อุปกรณ์,  
get frame # out
  - Otherwise get frame # from page table in memory
- ASID ช่วยให้ OS ไม่ต้อง Flush TLB ทุกครั้งที่มีการ context switching process ใหม่ เข้ามาใช้งาน CPU



การเข้าถึงข้อมูลที่ virtual addr = va1

สมมุติว่า va1 คือ physical addr = pa1

ซึ่งเก็บข้อมูลคือ x



(1) กำหนดให้ CR3 ชี้ไปที่ physical memory

address ของ Page Table ของ P0



(2) cpu รันคำสั่งอ่านค่าจาก va1 มาอยู่ register R1

MMU อ้างอิง PT (ชี้โดน CR3) เพื่อแปลง va1 เป็น pa1





(2.5) MMU นำค่า va1 และ pa1 ไปเก็บใน TLB (เรียกอีกอย่างว่า CACHE ของ Memory Address Translation

(3) MMU ส่งคำขอที่ memory เพื่อ ขอให้ส่งค่าที่เก็บใน pa1

มายัง CPU หรือ R1 = Memory [ pa1 ]



(4) Memory ส่งค่า x มาให้กับ CPU ผ่านระบบ CACHE ซึ่งเก็บค่า คู่ (tag และ data) คือ (pa1 และ x) ไว้ใน CACHE



(5) MMU ส่งคำขอที่ memory เพื่อ ขอให้ส่งค่าที่เก็บใน pa1  
มายัง CPU





(7) MMU จะส่ง physical address pa1 ไปให้ระบบ CACHE

เช็คก่อนว่า เก็บข้อมูลไว้หรือเปล่า ถ้ามีก็เอาข้อมูลส่งให้ CPU ถ้า

ไม่มีถึงจะส่ง pa1 ไปให้ Memory



# Memory Protection

- Memory protection implemented by associating protection bit with each frame to indicate if read-only or read-write access is allowed
  - Can also add more bits to indicate page execute-only, and so on
- **Valid-invalid** bit attached to each entry in the page table:
  - “valid” indicates that the associated page is in the process’ logical address space, and is thus a legal page
  - “invalid” indicates that the page is not in the process’ logical address space
  - Or use **page-table length register (PTLR)**
- Any violations result in a trap to the kernel

# Valid (v) or Invalid (i) Bit In A Page Table

|        |        |
|--------|--------|
| 00000  | page 0 |
|        | page 1 |
|        | page 2 |
|        | page 3 |
|        | page 4 |
| 10,468 | page 5 |
| 12,287 |        |

frame number      valid-invalid bit

|   |   |   |
|---|---|---|
| 0 | 2 | v |
| 1 | 3 | v |
| 2 | 4 | v |
| 3 | 7 | v |
| 4 | 8 | v |
| 5 | 9 | v |
| 6 | 0 | i |
| 7 | 0 | i |

page table



# Shared Pages

## ■ Shared code

- One copy of read-only (**reentrant**) code shared among processes (i.e., text editors, compilers, window systems)
- *Reentrant code is non-self-modifying code: it never changes during execution.*
- Similar to multiple threads sharing the same process space
- Also useful for interprocess communication if sharing of read-write pages is allowed

## ■ Private code and data

- Each process keeps a separate copy of the code and data
- The pages for the private code and data can appear anywhere in the logical address space

If a system has 40 user processes, and the libc library is 2 MB, this would require 80 MB of memory.

# Shared Pages Example



# Structure of the Page Table

- Memory structures for paging can get huge using straight-forward methods
  - Consider a 32-bit logical address space as on modern computers
  - Page size of 4 KB ( $2^{12}$ )
  - Page table would have 1 million entries ( $2^{32} / 2^{12}$ )
  - If each entry is 4 bytes → each process 4 MB of physical address space for the page table alone
    - ▶ Don't want to allocate that contiguously in main memory
  - One simple solution is to divide the page table into smaller units
    - ▶ Hierarchical Paging
    - ▶ Hashed Page Tables
    - ▶ Inverted Page Tables

# Hierarchical Page Tables

- Break up the logical address space into multiple page tables
- A simple technique is a two-level page table
- We then page the page table



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 64 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



Page id (p)



Frame id (f) : offset (d)

4 bits : 2 bits



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 64 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



Frame id (f) : offset (d)

4 bits : 2 bits



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 64 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



Page id (p)

0x0

00 00

00

01

10

11

0xD

11 01

0xE

11 10

0xF

11 11

Frame id (f) : offset (d)

4 bits : 2 bits



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 64 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



Page id (p)

0x0  
0x1  
0x2  
0x3  
0x4  
0x5  
0x6  
0x7  
0x8  
0x9  
0xA  
0xB  
0xC  
0xD  
0xE  
0xF

Frame id (f) : offset (d)

4 bits : 2 bits



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 64 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



Page id (p)

0x0

00 00

00  
01  
10  
11



Frame id (f) : offset (d)

4 bits : 2 bits



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 64 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



Page id (p)

0x0  
01 00



Frame id (f) : offset (d)

4 bits : 2 bits



# Two-Level Paging Example

- A logical address (on 32-bit machine with 4K page size) is divided into:
  - a page number consisting of 20 bits
  - a page offset consisting of 12 bits
- Since the page table is paged, the page number is further divided into:
  - a 10-bit page number
  - a 10-bit page offset
- Thus, a logical address is as follows:



- where  $p_1$  is an index into the outer page table, and  $p_2$  is the displacement within the page of the inner page table
- Known as **forward-mapped page table**

# Address-Translation Scheme





← 16 bits →

w



← 16 bits →

x



← 16 bits →

y



← 16 bits →

z



Level-1  
Page Table

Level-2  
Page Table

Level-3  
Page Table

# Address-Translation Scheme



PTBR



# 64-bit Logical Address Space

| UNIT       | ABBREVIATION | STORAGE                     |
|------------|--------------|-----------------------------|
| Bit        | B            | Binary Digit, Single 1 or 0 |
| Nibble     | -            | 4 bits                      |
| Byte/Octet | B            | 8 bits                      |
| Kilobyte   | KB           | 1024 bytes                  |
| Megabyte   | MB           | 1024 KB                     |
| Gigabyte   | GB           | 1024 MB                     |
| Terabyte   | TB           | 1024 GB                     |
| Petabyte   | PB           | 1024 TB                     |
| Exabyte    | EB           | 1024 PB                     |
| Zettabyte  | ZB           | 1024 EB                     |
| Yottabyte  | YB           | 1024 ZB                     |

Storage units ([www.byte-notes.com](http://www.byte-notes.com))

<https://lecture481.rssing.com/>  
chan-14834568/all\_p1.html

- Even two-level paging scheme not sufficient

- If page size is 4 KB ( $2^{12}$ )

- Then page table has  $2^{52}$  entries.

$$(4,503,599,627,370,496) = 4K \text{ T หรือ } 4P \text{ entries}$$

- If two level scheme, inner page tables could be  $2^{10}$  4-byte entries

- Address would look like



- Outer page table has  $2^{42}$  entries or  $2^{44}$  bytes = 17,592,186,044,416 bytes
- One solution is to add a 2<sup>nd</sup> outer page table
- But in the following example the 2<sup>nd</sup> outer page table is still  $2^{34}$  bytes in size
  - And possibly 4 memory access to get to one physical memory location

# Three-level Paging Scheme



**Figure 9.25** x86-64 linear address.



เมื่อ OS รัน Process P0 มันจะโหลด P0 เข้า  
Memory และสร้าง page table ใน kernel  
memory และเก็บค่า Physical Memory  
ของ P0 ใน Page Table Directory

Physical  
Memory  
For User  
Processes



เมื่อ OS รัน Process P1 มันจะโหลด P1 เข้า Memory และสร้าง page table ใน kernel memory และเก็บค่า Physical Memory ของ P1 ใน Page Table Directory

Physical  
Memory  
For User  
Processes



เมื่อ OS รัน Process P2 มันจะโหลด P2 เข้า  
Memory และสร้าง page table ใน kernel  
memory และเก็บค่า Physical Memory  
ของ P2 ใน Page Table Directory

Physical  
Memory  
For User  
Processes



เมื่อ OS รัน Process P0 มันจะโหลด P0 เข้า Memory และสร้าง page table ใน kernel memory และเก็บค่า Physical Memory ของ P0 ใน Page Table Directory

Physical  
Memory  
For User  
Processes



เมื่อ Process P2 จบ OS จะลบ page table  
ของ P0 ใน kernel memory และลบค่า  
Physical Memory ของ P0 จาก Page  
Table Directory

# Hierarchical Page table



# Hierarchical Page table



# Hierarchical Page table



# Hierarchical Page table



# Hierarchical Page table



# Hierarchical Page table



$$VA = 0x10 = 0b\ 0001\ 0000$$

$000_8$        $000_8$        $000_8$        $000_8$        $0020_8$

Linear/Virtual Address



$$CR3 = Pa$$

$$VA = 0x10 = 0b\ 0001\ 0000$$

$000_8$        $000_8$        $000_8$        $000_8$        $0020_8$

Linear/Virtual Address



$CR3 = Pa$

$$VA = 0x10 = 0b\ 0001\ 0000 = 0o\ 20$$

$000_8$        $000_8$        $000_8$        $000_8$        $0020_8$

Linear/Virtual Address



$$VA = 0x10 = 0b\ 0001\ 0000 = 0o\ 20$$

$000_8$        $000_8$        $000_8$        $000_8$        $0020_8$

Linear/Virtual Address



$CR3 = Pa$

$$VA = 0x10 = 0b\ 0001\ 0000 = 0o\ 20$$

$000_8$        $000_8$        $000_8$        $000_8$        $0020_8$

Linear/Virtual Address



CR3 = Pa

อ้างอิง AMD, AMD-V Nested Paging, 2008

Kernel Memory

$$VA = 0x\ 3000 = 0b\ 0011\ 0000\ 0000\ 0000 = 0o\ 30000$$



New VA

$000_8$

$001_8$

$000_8$

$000_8$

$0000_8$



8 Bytes

511

4KB

Pb



8 Bytes

511

Pe



8 Bytes

511

Pc



8 Bytes

511

Pd



1 Bytes

4095

4KB

4KB

0

4095

4KB

0

Py

4KB

User Process Memory

Memory

$CR3 = Pa$

อ้างอิง AMD, AMD-V Nested Paging, 2008

Kernel Memory











Virtual memory  
space of P0





# ปัญหาและวิธีแก้ปัญหาของ Heirarchical Page Table

- MMU ต้องเข้าถึง Memory 4 ครั้งเพื่อหาค่า Physical Mem Address (PA) ของ Virtual Mem Address (VA)
- ต้องใช้ TLB ช่วยเก็บค่า VA to PA mapping ทำให้ Access Time น้อยลง
- TLB มีหลายชั้น เมื่อน Cache มี L1 L2 L3 L4
- ในระหว่างที่ Walk Page Table ข้อมูลของ Page Table ระดับ 1 ถึง 4 ที่ถูกใช้บ่อย จะถูกเก็บไว้ใน Cache level ต่างๆของ CPU ทำให้เมื่อเกิด TLB Miss การ Walk Page Table จะทำได้เร็วขึ้น เพราะข้อมูลของ Page Table บางส่วนอยู่ใน Cache แล้ว

# Hierarchical Page table



# Hierarchical Page table



# Hierarchical Page table



# Hierarchical Page table



# Hierarchical Page table



P0

VA= 111 222 333 444 1765<sub>8</sub>

47

39

38 30

29 21

20 12 11

0

111<sub>8</sub>

222<sub>8</sub>

333<sub>8</sub>

444<sub>8</sub>

1765<sub>8</sub>

P0

VA= 111 222 333 444 1765<sub>8</sub>

47 39

111<sub>8</sub>

38 30

222<sub>8</sub>

29 21

333<sub>8</sub>

20 12 11

444<sub>8</sub>

0

1765<sub>8</sub>F(777<sub>8</sub>) 64 bitsF(111<sub>8</sub>)  
F(000<sub>8</sub>)140000<sub>8</sub>

CR3

$$F(x) = \text{index} * 8 + \text{Base}$$

$$\begin{aligned}
 F(111_8) &= 111_8 * 8 + \text{Base} \\
 &= 111_8 * 2^3 + \text{Base} \\
 &= (111_8 \ll 3) + \text{Base} \\
 &= 1110_8 + \text{Base} \\
 &= 1110_8 + 140000_8 \\
 &= \underline{14111}_8 0
 \end{aligned}$$

P0

VA= 111 222 333 444 1765<sub>8</sub>

47 39

111<sub>8</sub>

38 30

222<sub>8</sub>

29 21

333<sub>8</sub>

20 12 11

444<sub>8</sub>

0

147770<sub>8</sub>

64 bits

$$F(x) = \text{index} * 8 + \text{Base}$$

$$\begin{aligned}
 F(111_8) &= 111_8 * 8 + \text{Base} \\
 &= 111_8 * 2^3 + \text{Base} \\
 &= (111_8 \ll 3) + \text{Base} \\
 &= 1110_8 + \text{Base} \\
 &= 1110_8 + 140000_8 \\
 &= 14\underline{111}0_8
 \end{aligned}$$

**141110<sub>8</sub>**

140000<sub>8</sub>

140000<sub>8</sub>

CR3

P0

VA= 111 222 333 444 1765<sub>8</sub>

47 39

111<sub>8</sub>

38 30

222<sub>8</sub>

29 21

333<sub>8</sub>

20 12 11

444<sub>8</sub>

0

64 bits

147770<sub>8</sub>157770<sub>8</sub>141110<sub>8</sub>152220<sub>8</sub>140000<sub>8</sub>150000<sub>8</sub>

0

140000<sub>8</sub>

CR3

$$\begin{aligned}
 F(222_8) &= 222_8 * 8 + \text{Base} \\
 &= 222_8 * 2^3 + \text{Base} \\
 &= (222_8 \ll 3) + \text{Base} \\
 &= 2220_8 + \text{Base} \\
 &= 2220_8 + 150000_8 \\
 &= 152220_8
 \end{aligned}$$

P0

VA= 111 222 333 444 1765<sub>8</sub>

47 39

111<sub>8</sub>

38 30

222<sub>8</sub>

29 21

333<sub>8</sub>

20 12 11

444<sub>8</sub>

0

64 bits

147770<sub>8</sub>157770<sub>8</sub>152220<sub>8</sub>150000<sub>8</sub>167770<sub>8</sub>163330<sub>8</sub>160000<sub>8</sub>170000<sub>8</sub>140000<sub>8</sub>

CR3

$$\begin{aligned}
 F(333_8) &= 333_8 * 8 + \text{Base} \\
 &= 333_8 * 2^3 + \text{Base} \\
 &= (333_8 \ll 3) + \text{Base} \\
 &= 3330_8 + \text{Base} \\
 &= 3330_8 + 160000_8 \\
 &= 163330_8
 \end{aligned}$$

P0

VA= 111 222 333 444 1765<sub>8</sub>

47 39

38 30

29 21

20 12 11

0

111<sub>8</sub>222<sub>8</sub>333<sub>8</sub>444<sub>8</sub>1765<sub>8</sub>

64 bits

147770<sub>8</sub>140000<sub>8</sub>157770<sub>8</sub>152220<sub>8</sub>150000<sub>8</sub>167770<sub>8</sub>163330<sub>8</sub>160000<sub>8</sub>177770<sub>8</sub>174440<sub>8</sub>170000<sub>8</sub>140000<sub>8</sub>

CR3

$$\begin{aligned}
 F(444_8) &= 444_8 * 8 + \text{Base} \\
 &= 444_8 * 2^3 + \text{Base} \\
 &= (444_8 \ll 3) + \text{Base} \\
 &= 4440_8 + \text{Base} \\
 &= 4440_8 + 170000_8 \\
 &= 174440_8
 \end{aligned}$$

P0

VA= 111 222 333 444 1765<sub>8</sub>

47 39

38 30

29 21

20 12 11

0

111<sub>8</sub>222<sub>8</sub>333<sub>8</sub>444<sub>8</sub>1765<sub>8</sub>**Offset**

64 bits

147770<sub>8</sub>157770<sub>8</sub>152220<sub>8</sub>150000<sub>8</sub>167770<sub>8</sub>163330<sub>8</sub>160000<sub>8</sub>177770<sub>8</sub>174440<sub>8</sub>170000<sub>8</sub>701765<sub>8</sub>22<sub>8</sub>140000<sub>8</sub>

CR3

Page's Virtual Address: 111 222 333 444 0000<sub>8</sub>**MMU Walk Page Table** และได้ค่าPage's Physical Address: 000 000 000 070 0000<sub>8</sub>**Offset**ดังนั้น Virtual Address: 111 222 333 444 1765<sub>8</sub>จะได้ Physical Address: 000 000 000 070 0000<sub>8</sub> + 1765<sub>8</sub> = **70 1765<sub>8</sub>**

P0

VA= 111 222 333 444 1765<sub>8</sub>

47 39

38 30

29 21

20 12 11

0

111<sub>8</sub>222<sub>8</sub>333<sub>8</sub>444<sub>8</sub>1765<sub>8</sub>

64 bits

147770<sub>8</sub>157770<sub>8</sub>152220<sub>8</sub>150000<sub>8</sub>167770<sub>8</sub>163330<sub>8</sub>160000<sub>8</sub>177770<sub>8</sub>174440<sub>8</sub>170000<sub>8</sub>701765<sub>8</sub>140000<sub>8</sub>

CR3

22<sub>8</sub>00 010 010<sub>8</sub>

P0

VA = aaa bbb ccc ddd eeee<sub>8</sub>

47 39

aaa<sub>8</sub>

38 30

bbb<sub>8</sub>

29 21

ccc<sub>8</sub>

20 12 11

ddd<sub>8</sub>eeee<sub>8</sub>

0

64 bits

147770<sub>8</sub>157770<sub>8</sub>154220<sub>8</sub>150000<sub>8</sub>167770<sub>8</sub>163730<sub>8</sub>160000<sub>8</sub>177770<sub>8</sub>174540<sub>8</sub>170000<sub>8</sub>701755<sub>8</sub>700000<sub>8</sub>140000<sub>8</sub>

CR3

$$F(x) = x * 8 + B$$

22<sub>8</sub>00 010 010<sub>8</sub>

Sub QUIZ 1 จงตอบว่า VA คืออะไร

# Intel x86-64

- Current generation Intel x86 architecture
- 64 bits is ginormous ( $> 16$  exabytes)
- In practice only implement 48 bit addressing
  - Page sizes of 4 KB, 2 MB, 1 GB
  - Four levels of paging hierarchy
- Can also use PAE so virtual addresses are 48 bits and physical addresses are 52 bits (เราไม่พิจารณาเรื่อง PAE ในวิชานี้)



### Linear/Virtual Address



# Example: ARM Architecture

- Dominant mobile platform chip (Apple iOS and Google Android devices for example)
- Modern, energy efficient, 32-bit CPU
- 4 KB and 16 KB pages
- 1 MB and 16 MB pages (termed **sections**)
- One-level paging for sections, two-level for smaller pages
- Two levels of TLBs
  - Outer level has two micro TLBs (one data, one instruction)
  - Inner is single main TLB
  - First inner is checked, on miss outers are checked, and on miss page table walk performed by CPU





**Figure 9.26** ARM 4-KB translation granule.



**Figure 9.27** ARM four-level hierarchical paging.

# Revisit: x86\_64 Architecture

Linear/Virtual Address



# So, where Linux store those Valid (v) or Invalid (i) Bit In A Page Table?



# ម៉នុយ្យីន Page Table Entry (PTE)

Linear/Virtual Address



# Page table Entry



- PTE มีขนาดรวม 4KB
- เป็น Array ของ Element 512 Element
- แต่ละ Element มีขนาด 64 bits (หรือ 8 bytes)
- แต่ละ Element ใช้เพียงแค่ bit ที่ 12 ถึง 51 เพื่อกีบ physical memory address ที่ซึ่งไปยัง target physical mem frame
- Bit ที่เหลือเอาไว้เก็บค่า status



# x86\_64 Page table Entry Format

| Bit Position(s) | Contents                                                                                                                                                                           |
|-----------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 0 (P)           | Present; must be 1 to map a 4-KByte page                                                                                                                                           |
| 1 (R/W)         | Read/write; if 0, writes may not be allowed to the 4-KByte page referenced by this entry (see Section 4.6)                                                                         |
| 2 (U/S)         | User/supervisor; if 0, user-mode accesses are not allowed to the 4-KByte page referenced by this entry (see Section 4.6)                                                           |
| 3 (PWT)         | Page-level write-through; indirectly determines the memory type used to access the 4-KByte page referenced by this entry (see Section 4.9.2)                                       |
| 4 (PCD)         | Page-level cache disable; indirectly determines the memory type used to access the 4-KByte page referenced by this entry (see Section 4.9.2)                                       |
| 5 (A)           | Accessed; indicates whether software has accessed the 4-KByte page referenced by this entry (see Section 4.8)                                                                      |
| 6 (D)           | Dirty; indicates whether software has written to the 4-KByte page referenced by this entry (see Section 4.8)                                                                       |
| 7 (PAT)         | Indirectly determines the memory type used to access the 4-KByte page referenced by this entry (see Section 4.9.2)                                                                 |
| 8 (G)           | Global; if CR4.PGE = 1, determines whether the translation is global (see Section 4.10); ignored otherwise                                                                         |
| 11:9            | Ignored                                                                                                                                                                            |
| (M-1):12        | Physical address of the 4-KByte page referenced by this entry                                                                                                                      |
| 51:M            | Reserved (must be 0)                                                                                                                                                               |
| 58:52           | Ignored                                                                                                                                                                            |
| 62:59           | Protection key; if CR4.PKE = 1, determines the protection key of the page (see Section 4.6.2); ignored otherwise                                                                   |
| 63 (XD)         | If IA32_EFER.NXE = 1, execute-disable (if 1, instruction fetches are not allowed from the 4-KByte page controlled by this entry; see Section 4.6); otherwise, reserved (must be 0) |

# x86\_64 Page table Entry Format (อ้างอิง Perplexity AI)

| Bits  | Field/Usage                   |                                                                                                                                                   |
|-------|-------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------|
| 0     | Present (P)                   |  <b>Valid Bit (bit 0)</b>                                      |
| 1     | Read/Write (R/W)              |                                                                                                                                                   |
| 2     | User/Supervisor (U/S)         |                                                                                                                                                   |
| 3     | Page-level Write-Through      |                                                                                                                                                   |
| 4     | Page-level Cache Disable      |                                                                                                                                                   |
| 5     | Accessed (Reference)          |  <b>Reference Bit (bit 5)</b>                                  |
| 6     | Dirty                         |  <b>Dirty Bit (bit 6)</b>                                      |
| 7     | Page Size (for higher levels) |                                                                                                                                                   |
| 8     | Global                        |                                                                                                                                                   |
| 9-11  | Available to OS               |                                                                                                                                                   |
| 12-51 | Physical page frame address   |  <b>Physical Address</b>                                     |
| 52-62 | Available to OS               |                                                                                                                                                   |
| 63    | No-execute (NX)               | <br>เอา bit ที่ 12 ถึง 51 มาใช้ และเติมค่า 0 ใน bit 0 ถึง 11 |

# Hashed Page Tables

- hash function คือ function ที่ map ค่าข้อมูล ให้เป็นค่าที่มีขนาดจำกัด
  - ยกตัวอย่าง เช่น  $f(x) = x \bmod 10$
  - ถ้าได้ค่า  $f(x)$  เดียวกัน จากค่า  $x$  ต่างกัน เรียกว่าเกิด collision
  - <https://opendsa-server.cs.vt.edu/ODSA/Books/CS3/html/HashFuncExamp.html>
  - [https://en.wikipedia.org/wiki/Hash\\_function](https://en.wikipedia.org/wiki/Hash_function)
- Common in address spaces > 32 bits
- The virtual page number is hashed into a page table
  - This page table contains a chain of elements hashing to the same location
- Each element contains (1) the virtual page number (2) the value of the mapped page frame (3) a pointer to the next element
- Virtual page numbers are compared in this chain searching for a match
  - If a match is found, the corresponding physical frame is extracted



# Hashed Page Table



ในตัวอย่างนี้  $\text{hash}(p) = \text{hash}(q) = x$

จะต้องมี list ของ page table entries สำหรับแก้ปัญหา collision

Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 64 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



Page id (p)



Frame id (f) : offset (d)

4 bits : 2 bits



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 64 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



$$\begin{aligned} X &= \text{hash}(p) = p \% 2^3 \\ &= p \% 8 \\ &= p \% 0b1000 \end{aligned}$$

$0x0 = 0\ 000$   
 $0x1 = 0\ 001$   
 $0x2 = 0\ 010$   
 $0x3 = 0\ 011$   
 $0x4 = 0\ 100$   
 $0x5 = 0\ 101$   
 $0x6 = 0\ 110$   
 $0x7 = 0\ 111$   
 $0x8 = 1\ 000$   
 $0x9 = 1\ 001$   
 $0xA = 1\ 010$   
 $0xB = 1\ 011$   
 $0xC = 1\ 100$   
 $0xD = 1\ 101$   
 $0xE = 1\ 110$   
 $0xF = 1\ 111$



Frame id (f) : offset (d)

4 bits : 2 bits



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 32 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



$$\begin{aligned} X &= \text{hash}(p) = p \% 2^3 \\ &= p \% 8 \\ &= p \% 0b1000 \end{aligned}$$

|          |     |
|----------|-----|
| 0x0 = 0  | 000 |
| 0x1 = 0  | 001 |
| 0x2. = 0 | 010 |
| 0x3 = 0  | 011 |
| 0x4 = 0  | 100 |
| 0x5 = 0  | 101 |
| 0x6 = 0  | 110 |
| 0x7 = 0  | 111 |
| 0x8 = 1  | 000 |
| 0x9 = 1  | 001 |
| 0xA = 1  | 010 |
| 0xB = 1  | 011 |
| 0xC = 1  | 100 |
| 0xD = 1  | 101 |
| 0xE = 1  | 110 |
| 0xF = 1  | 111 |

$p = E$ ,  $\text{hash}(E) = 6$   
 $P = A$ ,  $\text{hash}(A) = 2$   
 $P = 2$ ,  $\text{hash}(2) = 2$  (**collision**)

Frame id (f) : offset (d)

4 bits : 2 bits



# Inverted Page Table

- Rather than each process having a page table and keeping track of all possible logical pages, track all physical pages
- One entry for each real page of memory
- Entry consists of the virtual address of the page stored in that real memory location, *with information about the process that owns that page*
- Decreases memory needed to store each page table, but increases time needed to search the table when a page reference occurs
- Use hash table to limit the search to one — or at most a few — page-table entries
  - TLB can accelerate access
- But how to implement shared memory?
  - One mapping of a virtual address to the shared physical address
  - ในช่อง frame หนึ่งช่อง เก็บค่า page id ได้ค่าเดียว

# Inverted Page Table Architecture



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 32 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



Inverted Page table

| Frame id | PID  | Page id |
|----------|------|---------|
| 0x0      | P1   | 0x11    |
| 0x1      | P2   | 0x3C    |
| 0x2      | P2   | 0x06    |
| 0x3      | ---- | ----    |
| 0x4      | ---- | ----    |
| 0x5      | P1   | 0x10    |
| 0x6      | ---- | ----    |
| 0x7      | P2   | 0x2E    |
| 0x8      | P1   | 0x0F    |
| 0x9      | ---- | ----    |
| 0xA      | P1   | 0x1B    |
| 0xB      | P2   | 0x34    |
| 0xC      | ---- | ----    |
| 0xD      | P1   | 0x2A    |
| 0xE      | P1   | 0x14    |
| 0xF      | ---- | ----    |

Frame id (f) : offset (d)

4 bits : 2 bits



Logical address:  $n = 2$  and  $m = 6$ . Using a page size of  $2^2 = 4$  bytes and a physical memory of 32 bytes (16 pages)

Page id (p) : offset (d)

4 bits : 2 bits



Inverted Page Table  
(IVT)

Frame id : Page id

|     |     |    |
|-----|-----|----|
| 0x0 | 0xA | p0 |
| 0x1 | 0xE | p0 |
| 0x2 |     |    |
| 0x3 | 0xA | p1 |
| 0x4 |     |    |
| 0x5 |     |    |
| 0x6 |     |    |
| 0x7 |     |    |
| 0x8 |     |    |
| 0x9 | 0x0 | p1 |
| 0xA |     |    |
| 0xB |     |    |
| 0xC |     |    |
| 0xD |     |    |
| 0xE | 0x2 | p0 |
| 0xF |     |    |

Frame id (f) : offset (d)

4 bits : 2 bits



When p0 runs:

Pg = 0xE, Search entire IVT for ("0xE", p0) = 0x1

Pg = 0xA, Search entire IVT for ("0xA", p0) = 0x0

Pg = 0x2, Search entire IVT for ("0x2", p0) = 0xE

# Swapping

- Standard Swapping
- A process can be **swapped** temporarily out of memory to a backing store, and then brought **back** into memory for continued execution
  - Total physical memory space of processes can exceed physical memory
- **Backing store** – fast disk large enough to accommodate copies of all memory images for all users; must provide direct access to these memory images
- **Roll out, roll in** – swapping variant used for priority-based scheduling algorithms; lower-priority process is swapped out so higher-priority process can be loaded and executed
- Major part of swap time is transfer time; total transfer time is directly proportional to the amount of memory swapped
- System maintains a **ready queue** of ready-to-run processes which have memory images on disk

# Schematic View of Swapping



# Swapping with Paging



# Swapping on Mobile Systems

- Not typically supported
  - Flash memory based
    - ▶ Small amount of space
    - ▶ Limited number of write cycles
    - ▶ Poor throughput between flash memory and CPU on mobile platform
- Instead use other methods to free memory if low
  - iOS **asks** apps to voluntarily relinquish allocated memory
    - ▶ Read-only data thrown out and reloaded from flash if needed
    - ▶ Failure to free can result in termination
  - Android terminates apps if low free memory, but first writes **application state** to flash for fast restart
  - Both OSes support paging as discussed below

# สรุป

- Memory Management
- Page Table
- TLB
- Page Table Implementations