



# IA-32 インテル® アーキテクチャ ソフトウェア・デベロッパーズ・ マニュアル

---

中巻 B：  
命令セット・リファレンス N-Z

## 注記：

『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル』は、次の 4 巻から構成されています。

上巻：基本アーキテクチャ (資料番号 253665-013J)

中巻 A：命令セット・リファレンス A-M (資料番号 253666-013J)

中巻 B：命令セット・リファレンス N-Z (資料番号 253667-013J)

下巻：システム・プログラミング・ガイド (資料番号 253668-013J)

設計する際は、これら 4 巻すべてを参照してください。

2004 年

### 【輸出規制に関する告知と注意事項】

本資料に掲載されている製品のうち、外国為替および外国為替管理法に定める戦略物資等または役務に該当するものについては、輸出または再輸出する場合、同法に基づく日本政府の輸出許可が必要です。また、米国産品である当社製品は日本からの輸出または再輸出に際し、原則として米国政府の事前許可が必要です。

### 【資料内容に関する注意事項】

- ・ 本ドキュメントの内容を予告なしに変更することがあります。
- ・ インテルでは、この資料に掲載された内容について、市販製品に使用した場合の保証あるいは特別な目的に合うことの保証等は、いかなる場合についてもいたしかねます。また、このドキュメント内の誤りについても責任を負いかねる場合があります。
- ・ インテルでは、インテル製品の内部回路以外の使用にて責任を負いません。また、外部回路の特許についても関知いたしません。
- ・ 本書の情報はインテル製品を使用できるようにする目的でのみ記載されています。

インテルは、製品について「取引条件」で提示されている場合を除き、インテル製品の販売や使用に関して、いかなる特許または著作権の侵害をも含み、あらゆる責任を負わないものとします。

- ・ いかなる形および方法によっても、インテルの文書による許可なく、この資料の一部またはすべてを複写することは禁じられています。

IA-32 アーキテクチャ・プロセッサ（インテル® Pentium® 4 プロセッサ、インテル® Pentium® III プロセッサなど）、エラッタと呼ばれる設計上の不具合が含まれている可能性があり、公表されている仕様とは異なる動作をする場合があります。現在確認済みのエラッタについては、インテルまでお問い合わせください。

ハイパー・スレッディング・テクノロジを利用するには、ハイパー・スレッディング・テクノロジに対応したインテル Pentium 4 プロセッサを搭載したコンピュータ・システム、および同技術に対応したチップセットと BIOS、OS が必要です。性能は、使用するハードウェアやソフトウェアによって異なります。HT テクノロジに対応したプロセッサの情報等、詳細については

<http://www.intel.co.jp/jp/info/hyperthreading/> を参照してください。

インテル、Intel ロゴ、Intel386、Intel486、Intel NetBurst、Celeron、MMX、Pentium、Xeon は、アメリカ合衆国およびその他の国における Intel Corporation またはその子会社の商標、登録商標です。

\* その他の社名、製品名などは、一般に各社の商標または登録商標です。

© 1997-2004, Intel Corporation.

# 4

---

命令セット・  
リファレンス N-Z



# 第4章 命令セット・リファレンス N-Z

4

第4章では、第3章に続き、IA-32 命令 (N-Z) についてアルファベット順に説明する。IA-32 命令の前半部分 (A-M) については『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、中巻 A』を参照のこと。

## NEG—Two's Complement Negation

| オペコード | 命令        | 説明                    |
|-------|-----------|-----------------------|
| F6 /3 | NEG r/m8  | 2 の補数が r/m8 をネガートする。  |
| F7 /3 | NEG r/m16 | 2 の補数が r/m16 をネガートする。 |
| F7 /3 | NEG r/m32 | 2 の補数が r/m32 をネガートする。 |

### 説明

オペランド (デスティネーション・オペランド) の値をその 2 の補数で置き換える。(この操作は、オペランドの 0 からの減算と同等である。) デスティネーション・オペランドは、汎用レジスタまたはメモリ・ロケーションである。

この命令を LOCK プリフィックスと共に使用すると、アトミックに命令を実行させることができる。

### 操作

```
IF DEST = 0
    THEN CF ← 0
    ELSE CF ← 1;
FI;
DEST ← -(DEST)
```

### 影響を受けるフラグ

ソース・オペランドが 0 である場合は、CF フラグが 0 にセットされる。そうでない場合は、CF フラグが 1 にセットされる。OF、SF、ZF、AF、PF フラグが結果にしたがってセットされる。

## NEG—Two's Complement Negation（続き）

### 保護モード例外

|              |                                                                  |
|--------------|------------------------------------------------------------------|
| #GP(0)       | デステイネーションが書き込み不可能なセグメントにある場合。                                    |
|              | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。               |
|              | DS、ES、FS、または GS レジスタの内容がマル・セグメント・セレクタの場合。                        |
| #SS(0)       | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                               |
| #PF（フォルトコード） | ページフォルトが発生した場合。                                                  |
| #AC(0)       | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

### 仮想 8086 モード例外

|              |                                                    |
|--------------|----------------------------------------------------|
| #GP(0)       | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)       | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF（フォルトコード） | ページフォルトが発生した場合。                                    |
| #AC(0)       | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## NOP—No Operation

| オペコード | 命令  | 説明   |
|-------|-----|------|
| 90    | NOP | 操作なし |

### 説明

何の操作も実行されない。この命令は、命令ストリーム内で空間を占めるが、EIP レジスタを除いて、マシン・コンテキストに影響を与えない1バイト命令である。

NOP 命令は、XCHG (E)AX、(E)AX 命令の別名ニーモニックである。

### 影響を受けるフラグ

なし。

### 例外（すべての操作モード）

なし。

## NOT—One's Complement Negation

| オペコード | 命令        | 説明                |
|-------|-----------|-------------------|
| F6 /2 | NOT r/m8  | r/m8 の各ビットを反転する。  |
| F7 /2 | NOT r/m16 | r/m16 の各ビットを反転する。 |
| F7 /2 | NOT r/m32 | r/m32 の各ビットを反転する。 |

### 説明

デスティネーション・オペランドにビット単位の NOT（否定）演算（各 1 が 0 にセットされ、各 0 が 1 にセットされる）を実行し、結果をデスティネーション・オペランド・ロケーションにストアする。デスティネーション・オペランドには、レジスタまたはメモリ・ロケーションを使用できる。

この命令を LOCK プリフィックスと共に使用すると、アトミックに命令を実行させることができる。

### 操作

DEST ← NOT DEST;

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                                                    |
|---------------|----------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | デスティネーション・オペランドが書き込み不可能なセグメントを指定している場合。<br><br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br><br>DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                                    |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                                   |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

## NOT—One's Complement Negation (続き)

### 仮想 8086 モード例外

- #GP(0) メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

## OR—Logical Inclusive OR

| オペコード           | 命令                     | 説明                                           |
|-----------------|------------------------|----------------------------------------------|
| 0C <i>ib</i>    | OR AL, <i>imm8</i>     | AL と <i>imm8</i> との OR をとる。                  |
| 0D <i>iw</i>    | OR AX, <i>imm16</i>    | AX と <i>imm16</i> との OR をとる。                 |
| 0D <i>id</i>    | OR EAX, <i>imm32</i>   | EAX と <i>imm32</i> との OR をとる。                |
| 80 /1 <i>ib</i> | OR <i>r/m8, imm8</i>   | <i>r/m8</i> と <i>imm8</i> との OR をとる。         |
| 81 /1 <i>iw</i> | OR <i>r/m16, imm16</i> | <i>r/m16</i> と <i>imm16</i> との OR をとる。       |
| 81 /1 <i>id</i> | OR <i>r/m32, imm32</i> | <i>r/m32</i> と <i>imm32</i> との OR をとる。       |
| 83 /1 <i>ib</i> | OR <i>r/m16, imm8</i>  | <i>r/m16</i> と <i>imm8</i> (符号拡張) との OR をとる。 |
| 83 /1 <i>id</i> | OR <i>r/m32, imm8</i>  | <i>r/m32</i> と <i>imm8</i> (符号拡張) との OR をとる。 |
| 08 /r           | OR <i>r/m8, r8</i>     | <i>r/m8</i> と <i>r8</i> との OR をとる。           |
| 09 /r           | OR <i>r/m16, r16</i>   | <i>r/m16</i> と <i>r16</i> との OR をとる。         |
| 09 /r           | OR <i>r/m32, r32</i>   | <i>r/m32</i> と <i>r32</i> との OR をとる。         |
| 0A /r           | OR <i>r8, r/m8</i>     | <i>r8</i> と <i>r/m8</i> との OR をとる。           |
| 0B /r           | OR <i>r16, r/m16</i>   | <i>r16</i> と <i>r/m16</i> との OR をとる。         |
| 0B /r           | OR <i>r32, r/m32</i>   | <i>r32</i> と <i>r/m32</i> との OR をとる。         |

### 説明

デステイネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）との間のビット単位の OR（論理和）演算を実行し、結果をデステイネーション・オペランド・ロケーションにストアする。ソース・オペランドには、即値、レジスタ、またはメモリ・ロケーションを使用できる。デステイネーション・オペランドには、レジスタまたはメモリ・ロケーションを使用できる。（ただし、1つの命令に2つのメモリ・オペランドを使用することはできない。）OR命令の各ビットの結果は、第1オペランドと第2オペランドの対応するビットが両方とも0である場合は0にセットされ、そうでない場合は1にセットされる。

この命令をLOCKプリフィックスと共に使用すると、アトミックに命令を実行させることができる。

### 操作

DEST ← DEST OR SRC;

### 影響を受けるフラグ

OF および CF フラグがクリアされ、SF、ZF、PF フラグが結果にしたがってセットされる。AF フラグの状態は未定義。

## OR—Logical Inclusive OR（続き）

### 保護モード例外

|               |                                                                                                                                           |
|---------------|-------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | デステイネーション・オペランドが書き込み不可能なセグメントを指している場合。<br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                        |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                           |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                          |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

### 仮想 8086 モード例外

|               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## ORPD—Bitwise Logical OR of Packed Double-Precision Floating-Point Values

| オペコード       | 命令                          | 説明                                                       |
|-------------|-----------------------------|----------------------------------------------------------|
| 66 0F 56 /r | ORPD <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のビット単位の OR (論理和) 演算を実行する。 |

### 説明

ソース・オペランド (第2オペランド) の2つのパックド倍精度浮動小数点値とデスティネーション・オペランド (第1オペランド) の2つのパックド倍精度浮動小数点値の間でビット単位のOR (論理和) 演算を実行し、結果をデスティネーション・オペランドに格納する。ソース・オペランドは、XMMレジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドはXMMレジスタである。

### 操作

DEST[127-0] ← DEST[127-0] BitwiseOR SRC[127-0];

### 同等のインテル® C/C++ コンパイラ組み込み関数

ORPD            \_\_m128d \_mm\_or\_pd(\_\_m128d a, \_\_m128d b)

### SIMD 浮動小数点例外

なし。

### 保護モード例外

|               |                                                                                                |
|---------------|------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、またはGSセグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが16バイトに合っていない場合。 |
| #SS(0)        | SSセグメント内のアドレスが無効の場合。                                                                           |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                |
| #NM           | CR0のTSがセットされた場合。                                                                               |
| #UD           | CR0のEMがセットされた場合。<br>CR4のOSFXSRが0の場合。<br>CPUID機能フラグSSE2が0の場合。                                   |

## ORPD—Bitwise Logical OR of Packed Double-Precision Floating-Point Values（続き）

### 実アドレスモード例外

|        |                                               |
|--------|-----------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
|        | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。           |
| #NM    | CR0 の TS がセットされた場合。                           |
| #UD    | CR0 の EM がセットされた場合。                           |
|        | CR4 の OSFXSR が 0 の場合。                         |
|        | CPUID 機能フラグ SSE2 が 0 の場合。                     |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## ORPS—Bitwise Logical OR of Packed Single-Precision Floating-Point Values

| オペコード    | 命令                          | 説明                                                       |
|----------|-----------------------------|----------------------------------------------------------|
| 0F 56 /r | ORPS <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のビット単位の OR (論理和) 演算を実行する。 |

### 説明

ソース・オペランド（第2オペランド）の4つのパックド単精度浮動小数点値とデスティネーション・オペランド（第1オペランド）の4つのパックド単精度浮動小数点値の間でビット単位のOR（論理和）演算を実行し、結果をデスティネーション・オペランドに格納する。ソース・オペランドは、XMMレジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドはXMMレジスタである。

### 操作

DEST[127-0] ← DEST[127-0] BitwiseOR SRC[127-0];

### 同等のインテル® C/C++ コンパイラ組み込み関数

ORPS            \_\_m128 \_mm\_or\_ps(\_\_m128 a, \_\_m128 b)

### SIMD 浮動小数点例外

なし。

### 保護モード例外

- |               |                                                                                                |
|---------------|------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、またはGSセグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが16バイトに合っていない場合。 |
| #SS(0)        | SSセグメント内のアドレスが無効の場合。                                                                           |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                |
| #NM           | CR0のTSがセットされた場合。                                                                               |
| #UD           | CR0のEMがセットされた場合。<br>CR4のOSFXSRが0の場合。<br>CPUID機能フラグSSEが0の場合。                                    |

## ORPS—Bitwise Logical OR of Packed Single-Precision Floating-Point Values（続き）

### 実アドレスモード例外

|        |                                               |
|--------|-----------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
|        | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。           |
| #NM    | CR0 の TS がセットされた場合。                           |
| #UD    | CR0 の EM がセットされた場合。                           |
|        | CR4 の OSFXSR が 0 の場合。                         |
|        | CPUID 機能フラグ SSE が 0 の場合。                      |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## OUT—Output to Port

| オペコード        | 命令                    | 説明                                            |
|--------------|-----------------------|-----------------------------------------------|
| E6 <i>ib</i> | OUT <i>imm8</i> , AL  | AL にあるバイトを I/O ポートアドレス <i>imm8</i> に出力する。     |
| E7 <i>ib</i> | OUT <i>imm8</i> , AX  | AX にあるワードを I/O ポートアドレス <i>imm8</i> に出力する。     |
| E7 <i>ib</i> | OUT <i>imm8</i> , EAX | EAX にあるダブルワードを I/O ポートアドレス <i>imm8</i> に出力する。 |
| EE           | OUT DX, AL            | AL にあるバイトを DX にある I/O ポートアドレスに出力する。           |
| EF           | OUT DX, AX            | AX にあるワードを DX にある I/O ポートアドレスに出力する。           |
| EF           | OUT DX, EAX           | EAX にあるダブルワードを DX にある I/O ポートアドレスに出力する。       |

### 説明

値を第2オペランド(ソース・オペランド)からデスティネーション・オペランド(第1オペランド)で指定されたI/Oポートにコピーする。ソース・オペランドには、アクセスされるポートのサイズ(8、16、または32ビット)に応じてそれぞれAL、AX、またはEAXレジスタを使用できる。デスティネーション・オペランドには、バイト即値またはDXレジスタを使用できる。バイト即値を使用すると、I/Oポートアドレス0～255をアクセスすることができる。ソース・オペランドとしてDXレジスタを使用すると、I/Oポート0～65,535をアクセスすることができる。

アクセスされるI/Oポートのサイズは、8ビットのI/Oポートではオペコードによって決まり、16ビットまたは32ビットのI/Oポートでは命令のオペランド・サイズ属性によって決まる。

マシン・コード・レベルでは、I/O命令は、8ビットのI/Oポートをアクセスするときは短くなる。この場合は、ポートアドレスの上位8ビットは0になる。

この命令は、プロセッサのI/Oアドレス空間にあるI/Oポートのアクセスだけに有用である。I/Oアドレス空間にあるI/Oポートのアクセスに関する詳細については、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の第13章「入出力」を参照のこと。

### IA-32 アーキテクチャにおける互換性

OUT命令を実行した後、インテル® Pentium® プロセッサは、次の命令の実行を開始する前に、EWBE#ピンがアクティブにサンプリングされていることを保証する。(EWBE#がアクティブでない場合でも命令をプリフェッチすることはできるが、EWBE#ピンがアクティブにサンプリングされるまで命令は実行されないことに注意すること。) インテル Pentium プロセッサ・ファミリだけにEWBE#ピンがあり、他のIA-32プロセッサにはない。

## OUT—Output to Port (続き)

### 操作

```

IF ((PE = 1) AND ((CPL > IOPL) OR (VM = 1)))
    THEN (* Protected mode with CPL > IOPL or virtual-8086 mode *)
        IF (Any I/O Permission Bit for I/O port being accessed = 1)
            THEN (* I/O operation is not allowed *)
                #GP(0);
            ELSE (* I/O operation is allowed *)
                DEST ← SRC; (* Writes to selected I/O port *)
        FI;
    ELSE (Real Mode or Protected Mode with CPL ≤ IOPL *)
        DEST ← SRC; (* Writes to selected I/O port *)
    FI;

```

### 影響を受けるフラグ

なし。

### 保護モード例外

#GP(0)           CPL が I/O 特権レベル (IOPL) より大きく (低い特権をもつ)、アクセスされる I/O ポートの TSS にある対応する I/O パーミッション・ビットのいずれかが 1 である場合。

### 実アドレスモード例外

なし。

### 仮想 8086 モード例外

#GP(0)           アクセスされる I/O ポートの TSS にある対応する I/O パーミッション・ビットのいずれかが 1 である場合。

## OUTS/OUTSB/OUTSW/OUTSD—Output String to Port

| オペコード | 命令           | 説明                                                          |
|-------|--------------|-------------------------------------------------------------|
| 6E    | OUTS DX, m8  | バイトを DS:(E)SI に指定されたメモリ・ロケーションから DX に指定された I/O ポートに出力する。    |
| 6F    | OUTS DX, m16 | ワードを DS:(E)SI に指定されたメモリ・ロケーションから DX に指定された I/O ポートに出力する。    |
| 6F    | OUTS DX, m32 | ダブルワードを DS:(E)SI に指定されたメモリ・ロケーションから DX に指定された I/O ポートに出力する。 |
| 6E    | OUTSB        | バイトを DS:(E)SI に指定されたメモリ・ロケーションから DX に指定された I/O ポートに出力する。    |
| 6F    | OUTSW        | ワードを DS:(E)SI に指定されたメモリ・ロケーションから DX に指定された I/O ポートに出力する。    |
| 6F    | OUTSD        | ダブルワードを DS:(E)SI に指定されたメモリ・ロケーションから DX に指定された I/O ポートに出力する。 |

### 説明

データをソース・オペランド（第2オペランド）からデスティネーション・オペランド（第1オペランド）で指定されたI/Oポートにコピーする。ソース・オペランドはメモリ・ロケーションであり、そのアドレスは、（命令のアドレスサイズ属性、32または16に応じて）それぞれDS:EDIレジスタまたはDS:DIレジスタから読み取られる。DSセグメントをセグメント・オーバライド・プリフィックスでオーバライドすることができます。デスティネーション・オペランドは、DXレジスタから読み取られるI/Oポートアドレス（0～65,535）である。アクセスされるI/Oポートのサイズ（すなわち、ソース・オペランドとデスティネーション・オペランドのサイズ）は、8ビットのI/Oポートではオペコードによって決まり、16ビットまたは32ビットのI/Oポートでは命令のオペランド・サイズ属性によって決まる。

アセンブリ・コード・レベルでは、この命令の「明示オペランド」形式と「オペランドなし」形式という2つの形式が使用できる。（OUTSニーモニックで指定される）明示オペランド形式では、ソース・オペランドとデスティネーション・オペランドを明示的に指定できる。この場合、ソース・オペランドは、I/Oポートのサイズとソースアドレスを示す記号でなければならない。デスティネーション・オペランドは、DXでなければならない。この明示オペランド形式は、ドキュメンテーションを可能にするために設けられたものであるが、この形式によって提供されるドキュメンテーションは誤解を招く場合があるので注意する。すなわち、ソース・オペランドの記号は、オペランドの正しいタイプ（サイズ：バイト、ワード、またはダブルワード）を指定しなければならないが、正しいロケーションを指定する必要はない。ロケーションは、常にDS:(E)SIレジスタによって指定されるので、OUTS命令を実行する前に、このレジスタに正しくロードされていなければならない。

## OUTS/OUTSB/OUTSW/OUTSD—Output String to Port (続き)

オペランドなし形式は、OUTS 命令のバイト、ワード、ダブルワード各バージョンの「ショート形式」を提供する。この場合も、DS:(E)SI がソース・オペランドであると想定され、DX がデスティネーション・オペランドであると想定される。I/O ポートのサイズは、OUTSB (バイト)、OUTSW (ワード)、または OUTSD (ダブルワード) の各ニーモニックの選択で指定される。

バイト、ワード、またはダブルワードがメモリ・ロケーションから I/O ポートに転送された後、(E)SI レジスタは EFLAGS レジスタ内の DF フラグの設定にしたがって自動的にインクリメントまたはデクリメントされる (DF フラグが 0 である場合は、(E)SI レジスタはインクリメントされる。DF フラグが 1 である場合は、(E)SI レジスタはデクリメントされる)。(E)SI レジスタは、バイト操作の場合は 1、ワード操作の場合は 2、ダブルワード操作の場合は 4、それぞれインクリメントまたはデクリメントされる。

OUTS、OUTSB、OUTSW、OUTSD 命令は、前に REP プリフィックスを付けることにより、ECX バイト、ワード、またはダブルワードのブロック入力を行うことができる。REP プリフィックスの説明については、本章の「REP/REPE/REPZ/REPNE/REPNZ—Repeat String Operation Prefix」を参照のこと。

この命令は、プロセッサの I/O アドレス空間にある I/O ポートのアクセスだけに有用である。I/O アドレス空間にある I/O ポートへのアクセスに関する詳細については、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の第 13 章「入出力」を参照のこと。

### IA-32 アーキテクチャにおける互換性

OUTS、OUTSB、OUTSW、または OUTSD 命令を実行した後、インテル® Pentium® プロセッサは、次の命令の実行を開始する前に、EWBE# ピンがアクティブにサンプリングされていることを保証する。(EWBE# がアクティブでない場合でも命令をプリフェッチすることはできるが、EWBE# ピンがアクティブにサンプリングされるまで命令は実行されないことに注意すること。) インテル Pentium プロセッサ・ファミリだけに EWBE# ピンがあり、他の IA-32 プロセッサにはない。インテル® Pentium® 4 プロセッサ、インテル® Xeon™ プロセッサ、および P6 ファミリのプロセッサは、OUTS、OUTSB、OUTSW、または OUTSD 命令の実行時に、そのトランザクションのデータフェーズが完了してから次の命令を実行する。

## OUTS/OUTSB/OUTSW/OUTSD—Output String to Port (続き)

### 操作

```

IF ((PE = 1) AND ((CPL > IOPL) OR (VM = 1)))
    THEN (* Protected mode with CPL > IOPL or virtual-8086 mode *)
        IF (Any I/O Permission Bit for I/O port being accessed = 1)
            THEN (* I/O operation is not allowed *)
                #GP(0);
            ELSE (* I/O operation is allowed *)
                DEST ← SRC; (* Writes to I/O port *)
        FI;
    ELSE (Real Mode or Protected Mode with CPL ≤ IOPL *)
        DEST ← SRC; (* Writes to I/O port *)
    FI;
IF (byte transfer)
    THEN IF DF = 0
        THEN (E)SI ← (E)SI + 1;
    ELSE (E)SI ← (E)SI - 1;
FI;
ELSE IF (word transfer)
    THEN IF DF = 0
        THEN (E)SI ← (E)SI + 2;
    ELSE (E)SI ← (E)SI - 2;
FI;
ELSE (* doubleword transfer *)
    THEN IF DF = 0
        THEN (E)SI ← (E)SI + 4;
    ELSE (E)SI ← (E)SI - 4;
FI;
FI;
FI;

```

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                                                                                             |
|---------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | CPL が I/O 特権レベル (IOPL) より大きく (低い特権をもつ)、アクセスされる I/O ポートの TSS にある対応する I/O パーミッション・ビットのいずれかが 1 である場合。<br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>セグメント・レジスタの内容がヌル・セグメント・セレクタの場合。 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                                                                             |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                                                                            |

## OUTS/OUTSB/OUTSW/OUTSD—Output String to Port (続き)

### 実アドレスモード例外

- #GP メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

### 仮想 8086 モード例外

- #GP(0) アクセスされる I/O ポートの TSS にある対応する I/O パーミッション・ビットのいずれかが 1 である場合。
- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

## PACKSSWB/PACKSSDW—Pack with Signed Saturation

| オペコード       | 命令                                         | 説明                                                                                                           |
|-------------|--------------------------------------------|--------------------------------------------------------------------------------------------------------------|
| 0F 63 /r    | PACKSSWB <i>mm1</i> ,<br><i>mm2/m64</i>    | 符号付き飽和処理を使用して、 <i>mm1</i> と <i>mm2/m64</i> の 4 個のパックド符号付きワード整数を、 <i>mm1</i> の 8 個のパックド符号付きバイト整数に変換する。        |
| 66 0F 63 /r | PACKSSWB <i>xmm1</i> ,<br><i>xmm2/m128</i> | 符号付き飽和処理を使用して、 <i>xmm1</i> と <i>xmm2/m128</i> の 8 個のパックド符号付きワード整数を、 <i>xmm1</i> の 16 個のパックド符号付きバイト整数に変換する。   |
| 0F 6B /r    | PACKSSDW <i>mm1</i> ,<br><i>mm2/m64</i>    | 符号付き飽和処理を使用して、 <i>mm1</i> と <i>mm2/m64</i> の 2 個のパックド符号付きダブルワード整数を、 <i>mm1</i> の 4 個のパックド符号付きワード整数に変換する。     |
| 66 0F 6B /r | PACKSSDW <i>xmm1</i> ,<br><i>xmm2/m128</i> | 符号付き飽和処理を使用して、 <i>xmm1</i> と <i>xmm2/m128</i> の 4 個のパックド符号付きダブルワード整数を、 <i>xmm1</i> の 8 個のパックド符号付きワード整数に変換する。 |

### 説明

オーバーフロー条件を処理する飽和処理を使用して、パックド符号付きワード整数をパックド符号付きバイト整数に変換する (PACKSSWB の場合) か、あるいはパックド符号付きダブルワード整数をパックド符号付きワード整数に変換する (PACKSSDW の場合)。パック操作の例については、図 4-1. を参照のこと。



図 4-1. 64 ビット・オペランドを使用しての PACKSSDW 命令の操作

PACKSSWB 命令は、デスティネーション・オペランド（第 1 オペランド）の 4 個または 8 個の符号付きワード整数とソース・オペランド（第 2 オペランド）の 4 個または 8 個の符号付きワード整数を、8 個または 16 個の符号付きバイト整数に変換し、デスティネーション・オペランドにその結果をストアする。符号付きワード整数値が符号付きバイト整数の範囲を超える場合（すなわち、正の整数では 7FH より大きく、負の整数では 80H より大きい場合）は、飽和された符号付きバイト整数値である 7FH または 80H がデスティネーションにストアされる。

## PACKSSWB/PACKSSDW—Pack with Signed Saturation（続き）

PACKSSDW 命令は、デスティネーション・オペランド（第1オペランド）の2個または4個の符号付きダブルワードとソース・オペランド（第2オペランド）の2個または4個の符号付きダブルワードを、デスティネーション・オペランドの4個または8個の符号付きワードにパックする（図4-1.を参照）。符号付きダブルワード整数値が符号付きワードの範囲を超える場合（すなわち、正の整数では7FFFHより大きく、負の整数では8000Hより大きい場合）は、飽和された符号付きワード整数値である7FFFHまたは8000Hがデスティネーションにストアされる。

PACKSSWB 命令および PACKSSDW 命令は、64ビット・オペランドまたは128ビット・オペランドのいずれかを操作する。64ビット・オペランドを操作する場合、デスティネーション・オペランドには MMX® テクノロジ・レジスタを使用しなければならないが、ソース・オペランドには MMX テクノロジ・レジスタまたは64ビット・メモリ・ロケーションのどちらを使用しても構わない。128ビット・オペランドを操作する場合は、デスティネーション・オペランドには XMM レジスタを使用しなければならないが、ソース・オペランドには XMM レジスタまたは128ビット・メモリ・ロケーションのどちらを使用しても構わない。

### 操作

PACKSSWB instruction with 64-bit operands

```
DEST[7..0] ← SaturateSignedWordToSignedByte DEST[15..0];
DEST[15..8] ← SaturateSignedWordToSignedByte DEST[31..16];
DEST[23..16] ← SaturateSignedWordToSignedByte DEST[47..32];
DEST[31..24] ← SaturateSignedWordToSignedByte DEST[63..48];
DEST[39..32] ← SaturateSignedWordToSignedByte SRC[15..0];
DEST[47..40] ← SaturateSignedWordToSignedByte SRC[31..16];
DEST[55..48] ← SaturateSignedWordToSignedByte SRC[47..32];
DEST[63..56] ← SaturateSignedWordToSignedByte SRC[63..48];
```

PACKSSDW instruction with 64-bit operands

```
DEST[15..0] ← SaturateSignedDoublewordToSignedWord DEST[31..0];
DEST[31..16] ← SaturateSignedDoublewordToSignedWord DEST[63..32];
DEST[47..32] ← SaturateSignedDoublewordToSignedWord SRC[31..0];
DEST[63..48] ← SaturateSignedDoublewordToSignedWord SRC[63..32];
```

PACKSSWB instruction with 128-bit operands

```
DEST[7-0] ← SaturateSignedWordToSignedByte (DEST[15-0]);
DEST[15-8] ← SaturateSignedWordToSignedByte (DEST[31-16]);
DEST[23-16] ← SaturateSignedWordToSignedByte (DEST[47-32]);
DEST[31-24] ← SaturateSignedWordToSignedByte (DEST[63-48]);
DEST[39-32] ← SaturateSignedWordToSignedByte (DEST[79-64]);
DEST[47-40] ← SaturateSignedWordToSignedByte (DEST[95-80]);
DEST[55-48] ← SaturateSignedWordToSignedByte (DEST[111-96]);
DEST[63-56] ← SaturateSignedWordToSignedByte (DEST[127-112]);
DEST[71-64] ← SaturateSignedWordToSignedByte (SRC[15-0]);
DEST[79-72] ← SaturateSignedWordToSignedByte (SRC[31-16]);
```

## PACKSSWB/PACKSSDW—Pack with Signed Saturation（続き）

```
DEST[87-80] ← SaturateSignedWordToSignedByte (SRC[47-32]);
DEST[95-88] ← SaturateSignedWordToSignedByte (SRC[63-48]);
DEST[103-96] ← SaturateSignedWordToSignedByte (SRC[79-64]);
DEST[111-104] ← SaturateSignedWordToSignedByte (SRC[95-80]);
DEST[119-112] ← SaturateSignedWordToSignedByte (SRC[111-96]);
DEST[127-120] ← SaturateSignedWordToSignedByte (SRC[127-112]);
```

PACKSSDW instruction with 128-bit operands

```
DEST[15-0] ← SaturateSignedDwordToSignedWord (DEST[31-0]);
DEST[31-16] ← SaturateSignedDwordToSignedWord (DEST[63-32]);
DEST[47-32] ← SaturateSignedDwordToSignedWord (DEST[95-64]);
DEST[63-48] ← SaturateSignedDwordToSignedWord (DEST[127-96]);
DEST[79-64] ← SaturateSignedDwordToSignedWord (SRC[31-0]);
DEST[95-80] ← SaturateSignedDwordToSignedWord (SRC[63-32]);
DEST[111-96] ← SaturateSignedDwordToSignedWord (SRC[95-64]);
DEST[127-112] ← SaturateSignedDwordToSignedWord (SRC[127-96]);
```

**同等のインテル® C/C++ コンパイラ組み込み関数**

```
_m64 _mm_packs_pi16(_m64 m1, _m64 m2)
_m64 _mm_packs_pi32 (_m64 m1, _m64 m2)
```

**影響を受けるフラグ**

なし。

**保護モード例外**

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。                                                        |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

## PACKSSWB/PACKSSDW—Pack with Signed Saturation（続き）

### 実アドレスモード例外

|        |                                                             |
|--------|-------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
|        | オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。                   |
| #UD    | CR0 の EM がセットされた場合。                                         |
|        | (128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。                         |
| #NM    | CR0 の TS がセットされた場合。                                         |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                          |

### 仮想 8086 モード例外

実アドレスモード例外と同じ。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PACKUSWB—Pack with Unsigned Saturation

| オペコード       | 命令                                         | 説明                                                                                                                |
|-------------|--------------------------------------------|-------------------------------------------------------------------------------------------------------------------|
| 0F 67 /r    | PACKUSWB <i>mm</i> ,<br><i>mm/m64</i>      | 符号なし飽和処理を使用して、 <i>mm</i> の 4 個の符号付きワード整数と <i>mm/m64</i> の 4 個の符号付きワード整数を、 <i>mm</i> の 8 個の符号なしバイト整数に変換する。         |
| 66 0F 67 /r | PACKUSWB <i>xmm1</i> ,<br><i>xmm2/m128</i> | 符号なし飽和処理を使用して、 <i>xmm1</i> の 8 個の符号付きワード整数と <i>xmm2/m128</i> の 8 個の符号付きワード整数を、 <i>xmm1</i> の 16 個の符号なしバイト整数に変換する。 |

### 説明

デスティネーション・オペランド（第1オペランド）の4個または8個の符号付きワード整数とソース・オペランド（第2オペランド）の4個または8個の符号付きワード整数を、8個または16個の符号なしバイト整数に変換し、デスティネーション・オペランドにその結果をストアする（パック操作の例については、図4-1.を参照のこと）。符号付きワード整数値が符号なしバイト整数の範囲を超える場合（すなわち、FFHより大きいか、00Hより小さい場合）は、飽和された符号なしバイト整数値であるFFHまたは00Hがデスティネーションにストアされる。

PACKUSWB 命令は、64 ビット・オペランドまたは 128 ビット・オペランドのいずれかを操作する。64 ビット・オペランドを操作する場合、デスティネーション・オペランドには MMX® テクノロジ・レジスタを使用しなければならないが、ソース・オペランドには MMX テクノロジ・レジスタまたは 64 ビット・メモリ・ロケーションのどちらを使用しても構わない。128 ビット・オペランドを操作する場合は、デスティネーション・オペランドには XMM レジスタを使用しなければならないが、ソース・オペランドには XMM レジスタまたは 128 ビット・メモリ・ロケーションのどちらを使用しても構わない。

### 操作

PACKUSWB instruction with 64-bit operands:

```

DEST[7..0] ← SaturateSignedWordToUnsignedByte DEST[15..0];
DEST[15..8] ← SaturateSignedWordToUnsignedByte DEST[31..16];
DEST[23..16] ← SaturateSignedWordToUnsignedByte DEST[47..32];
DEST[31..24] ← SaturateSignedWordToUnsignedByte DEST[63..48];
DEST[39..32] ← SaturateSignedWordToUnsignedByte SRC[15..0];
DEST[47..40] ← SaturateSignedWordToUnsignedByte SRC[31..16];
DEST[55..48] ← SaturateSignedWordToUnsignedByte SRC[47..32];
DEST[63..56] ← SaturateSignedWordToUnsignedByte SRC[63..48];

```

PACKUSWB instruction with 128-bit operands:

```

DEST[7..0] ← SaturateSignedWordToUnsignedByte (DEST[15..0]);
DEST[15..8] ← SaturateSignedWordToUnsignedByte (DEST[31..16]);
DEST[23..16] ← SaturateSignedWordToUnsignedByte (DEST[47..32]);
DEST[31..24] ← SaturateSignedWordToUnsignedByte (DEST[63..48]);
DEST[39..32] ← SaturateSignedWordToUnsignedByte (DEST[79..64]);

```

## PACKUSWB—Pack with Unsigned Saturation（続き）

```

DEST[47-40] ← SaturateSignedWordToUnsignedByte (DEST[95-80]);
DEST[55-48] ← SaturateSignedWordToUnsignedByte (DEST[111-96]);
DEST[63-56] ← SaturateSignedWordToUnsignedByte (DEST[127-112]);
DEST[71-64] ← SaturateSignedWordToUnsignedByte (SRC[15-0]);
DEST[79-72] ← SaturateSignedWordToUnsignedByte (SRC[31-16]);
DEST[87-80] ← SaturateSignedWordToUnsignedByte (SRC[47-32]);
DEST[95-88] ← SaturateSignedWordToUnsignedByte (SRC[63-48]);
DEST[103-96] ← SaturateSignedWordToUnsignedByte (SRC[79-64]);
DEST[111-104] ← SaturateSignedWordToUnsignedByte (SRC[95-80]);
DEST[119-112] ← SaturateSignedWordToUnsignedByte (SRC[111-96]);
DEST[127-120] ← SaturateSignedWordToUnsignedByte (SRC[127-112]);

```

### 同等のインテル® C/C++ コンパイラ組み込み関数

`__m64 _mm_packs_pu16(__m64 m1, __m64 m2)`

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                                                                |
|---------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                              |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                             |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM           | CR0 の TS がセットされた場合。                                                                                                                                            |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                                                |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                                  |

## PACKUSWB—Pack with Unsigned Saturation（続き）

### 実アドレスモード例外

|        |                                                                                                                                       |
|--------|---------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                                                           |
|        | オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合                                                                                              |
| #UD    | CR0 の EM がセットされた場合。                                                                                                                   |
|        | CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ（MMX テクノロジ対応プロセッサ）上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PADDB/PADDW/PADDD—Add Packed Integers

| オペコード       | 命令                           | 説明                                                  |
|-------------|------------------------------|-----------------------------------------------------|
| 0F FC /r    | PADDB <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のパックドバイト整数を加算する。          |
| 66 0F FC /r | PADDB <i>xmm1, mm2/m128</i>  | <i>xmm2/m128</i> と <i>xmm1</i> のパックドバイト整数を加算する。     |
| 0F FD /r    | PADDW <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のパックドワード整数を加算する。          |
| 66 0F FD /r | PADDW <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックドワード整数を加算する。     |
| 0F FE /r    | PADDD <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のパックド・ダブルワード整数を加算する。      |
| 66 0F FE /r | PADDD <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックド・ダブルワード整数を加算する。 |

### 説明

ソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）のパックド整数の SIMD 加算を実行し、結果のパックド整数をデスティネーション・オペランドに格納する。SIMD 演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 9-4. を参照のこと。以降の段落で説明するように、オーバーフローはラップアラウンドを使用して処理される。

上記の命令は、64ビット・オペランドまたは128ビット・オペランドのいずれかを操作する。64ビット・オペランドを操作する場合、デスティネーション・オペランドには MMX® テクノロジ・レジスタを使用しなければならないが、ソース・オペランドには MMX テクノロジ・レジスタまたは 64ビット・メモリ・ロケーションのどちらを使用しても構わない。128ビット・オペランドを操作する場合は、デスティネーション・オペランドには XMM レジスタを使用しなければならないが、ソース・オペランドには XMM レジスタまたは 128ビット・メモリ・ロケーションのどちらを使用しても構わない。

PADDB 命令は、パックドバイト整数に加算する。個別の結果が 8ビットで表現するには大きすぎるとき（オーバーフロー）、結果はラップアラウンドされ、下位 8ビットがデスティネーション・オペランドに書き込まれる。

PADDW 命令は、パックドワード整数に加算する。個別の結果が 16ビットで表現するには大きすぎるとき（オーバーフロー）、結果はラップアラウンドされ、下位 16ビットがデスティネーション・オペランドに書き込まれる。

PADDD 命令は、パックド・ダブルワード整数を加算する。個別の結果が 32ビットで表現するには大きすぎるとき（オーバーフロー）、結果はラップアラウンドされ、下位 32ビットがデスティネーション・オペランドに書き込まれる。

## PADDB/PADDW/PADD—Add Packed Integers（続き）

PADDB、PADDW、PADDD 命令は、符号なしありまたは符号付き（2の補数表記）のパックド整数を操作できることに注意すること。ただし、これらの命令は、オーバーフロー やキャリーを示す EFLAGS レジスタ内のビットをセットしない。このため、検出されないオーバーフロー状態が発生しないように、操作される値の範囲をソフトウェアによって制御しなければならない。

### 操作

PADDB instruction with 64-bit operands:

```
DEST[7..0] ← DEST[7..0] + SRC[7..0];
* repeat add operation for 2nd through 7th byte *;
DEST[63..56] ← DEST[63..56] + SRC[63..56];
```

PADDB instruction with 128-bit operands:

```
DEST[7-0] ← DEST[7-0] + SRC[7-0];
* repeat add operation for 2nd through 14th byte *;
DEST[127-120] ← DEST[111-120] + SRC[127-120];
```

PADDW instruction with 64-bit operands:

```
DEST[15..0] ← DEST[15..0] + SRC[15..0];
* repeat add operation for 2nd and 3th word *;
DEST[63..48] ← DEST[63..48] + SRC[63..48];
```

PADDW instruction with 128-bit operands:

```
DEST[15-0] ← DEST[15-0] + SRC[15-0];
* repeat add operation for 2nd through 7th word *;
DEST[127-112] ← DEST[127-112] + SRC[127-112];
```

PADDD instruction with 64-bit operands:

```
DEST[31..0] ← DEST[31..0] + SRC[31..0];
DEST[63..32] ← DEST[63..32] + SRC[63..32];
```

PADDD instruction with 128-bit operands:

```
DEST[31-0] ← DEST[31-0] + SRC[31-0];
* repeat add operation for 2nd and 3th doubleword *;
DEST[127-96] ← DEST[127-96] + SRC[127-96];
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|       |                                                             |
|-------|-------------------------------------------------------------|
| PADDB | <code>__m64 __mm_add_pi8(__m64 m1, __m64 m2)</code>         |
| PADDB | <code>__m128i __mm_add_epi8 (__m128ia,__m128ib )</code>     |
| PADDW | <code>__m64 __mm_addw_pi16(__m64 m1, __m64 m2)</code>       |
| PADDW | <code>__m128i __mm_add_epi16 ( __m128i a, __m128i b)</code> |
| PADDD | <code>__m64 __mm_add_pi32(__m64 m1, __m64 m2)</code>        |
| PADDD | <code>__m128i __mm_add_epi32 ( __m128i a, __m128i b)</code> |

### 影響を受けるフラグ

なし。

## PADDB/PADDW/PADDD—Add Packed Integers（続き）

### 保護モード例外

|               |                                                                                                                                                                 |
|---------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                               |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                              |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX® テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM           | CR0 の TS がセットされた場合。                                                                                                                                             |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                                                 |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                                   |

### 実アドレスモード例外

|     |                                                                                                                                                                |
|-----|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。                                                       |
| #UD | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM | CR0 の TS がセットされた場合。                                                                                                                                            |
| #MF | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                             |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PADDQ—Add Packed Quadword Integers

| オペコード       | 命令                           | 説明                                                                        |
|-------------|------------------------------|---------------------------------------------------------------------------|
| 0F D4 /r    | PADDQ <i>mm1, mm2/m64</i>    | <i>mm2/m64</i> と <i>mm1</i> のクワッドワード整数を加算し、結果を <i>mm1</i> に格納する。          |
| 66 0F D4 /r | PADDQ <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックド・クワッドワード整数を加算し、結果を <i>xmm1</i> に格納する。 |

### 説明

第1オペランド（デスティネーション・オペランド）と第2オペランド（ソース・オペランド）を加算して、結果をデスティネーション・オペランドに格納する。ソース・オペランドは、MMX® テクノロジ・レジスタまたは64ビットのメモリ・ロケーションに格納される1つのクワッドワード整数か、XMM レジスタまたは128ビットのメモリ・ロケーションに格納される2つのパックド・クワッドワード整数である。デスティネーション・オペランドは、MMX テクノロジ・レジスタに格納される1つのクワッドワード整数か、XMM レジスタに格納される2つのパックド・クワッドワード整数である。パックド・クワッドワードのオペランドを使用する場合は、SIMD 加算が実行される。結果のクワッドワードが大きすぎて64ビットで表現できない場合は（オーバーフロー）、結果はラップアラウンドされ、下位64ビットがデスティネーション要素に書き込まれる（すなわち、キャリーは無視される）。

PADDQ 命令は、符号なし整数と符号付き整数（2の補数記法）のどちらを操作することもできる。ただし、この命令は、オーバーフローやキャリーを示すEFLAGS レジスター内のビットをセットしない。このため、検出されないオーバーフロー状態が発生しないように、操作される値の範囲をソフトウェアによって制御しなければならない。

### 操作

PADDQ instruction with 64-Bit operands:

DEST[63-0] " DEST[63-0] + SRC[63-0];

PADDQ instruction with 128-Bit operands:

DEST[63-0] " DEST[63-0] + SRC[63-0];

DEST[127-64] " DEST[127-64] + SRC[127-64];

### 同等のインテル® C/C++ コンパイラ組み込み関数

PADDQ        \_\_m64 \_mm\_add\_si64 ( \_\_m64 a, \_\_m64 b)

PADDQ        \_\_m128i \_mm\_add\_epi64 ( \_\_m128i a, \_\_m128i b)

### 影響を受けるフラグ

なし。

## PADDQ—Add Packed Quadword Integers (続き)

### 保護モード例外

|               |                                                                                                                 |
|---------------|-----------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが、CS、DS、ES、FS、またはGSセグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                              |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。           |
| #NM           | CR0 の TS がセットされた場合。                                                                                             |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                 |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックが有効になっており、現行特権レベルが 3 のときにアライメントの合っていないメモリ参照を行った場合。                                      |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                             |
|---------------|-------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                             |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックが有効になっており、アライメントの合っていないメモリ参照を行った場合。 |

### 数値例外

なし。

## PADDSSB/PADDSSW—Add Packed Signed Integers with Signed Saturation

| オペコード       | 命令                             | 説明                                                           |
|-------------|--------------------------------|--------------------------------------------------------------|
| 0F EC /r    | PADDSSB <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のパックド符号付きバイト整数を加算し、結果を飽和処理する。      |
| 66 0F EC /r | PADDSSB <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックド符号付きバイト整数を加算し、結果を飽和処理する。 |
| 0F ED /r    | PADDSSW <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のパックド符号付きワード整数を加算し、結果を飽和処理する。      |
| 66 0F ED /r | PADDSSW <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックド符号付きワード整数を加算し、結果を飽和処理する。 |

### 説明

ソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）のパックド符号付き整数の SIMD 加算を実行し、結果のパックド整数をデスティネーション・オペランドに格納する。SIMD演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図9-4.を参照のこと。以降の段落で説明するように、オーバーフローは符号付き飽和処理を使用して処理される。

上記の命令は、64ビット・オペランドまたは128ビット・オペランドのいずれかを操作する。64ビット・オペランドを操作する場合、デスティネーション・オペランドにはMMX®テクノロジ・レジスタを使用しなければならないが、ソース・オペランドにはMMXテクノロジ・レジスタまたは64ビット・メモリ・ロケーションのどちらを使用しても構わない。128ビット・オペランドを操作する場合は、デスティネーション・オペランドにはXMM レジスタを使用しなければならないが、ソース・オペランドにはXMM レジスタまたは128ビット・メモリ・ロケーションのどちらを使用しても構わない。

PADDSSB命令は、パックド符号付きバイト整数を加算する。個別のバイトの結果が符号付きバイト整数の範囲を超える場合（すなわち、7FHより大きいかまたは80Hより小さい場合）は、それぞれ7FHまたは80Hの飽和された値がデスティネーション・オペランドに書き込まれる。

PADDSSW命令は、パックド符号付きワード整数を加算する。個別のワードの結果が符号付きワード整数の範囲を超える場合（すなわち、7FFFHより大きいかまたは8000Hより小さい場合）は、それぞれ7FFFHまたは8000Hの飽和された値がデスティネーション・オペランドに書き込まれる。

## PADDSS/PADDSW—Add Packed Signed Integers with Signed Saturation (続き)

### 操作

PADDSS instruction with 64-bit operands:

```
DEST[7..0] ← SaturateToSignedByte(DEST[7..0] + SRC[7..0]) ;
* repeat add operation for 2nd through 7th bytes *;
DEST[63..56] ← SaturateToSignedByte(DEST[63..56] + SRC[63..56]);
```

PADDSSB instruction with 128-bit operands:

```
DEST[7-0] ← SaturateToSignedByte (DEST[7-0] + SRC[7-0]);
* repeat add operation for 2nd through 14th bytes *;
DEST[127-120] ← SaturateToSignedByte (DEST[111-120] + SRC[127-120]);
```

PADDSW instruction with 64-bit operands

```
DEST[15..0] ← SaturateToSignedWord(DEST[15..0] + SRC[15..0]);
* repeat add operation for 2nd and 7th words *;
DEST[63..48] ← SaturateToSignedWord(DEST[63..48] + SRC[63..48]);
```

PADDSW instruction with 128-bit operands

```
DEST[15-0] ← SaturateToSignedWord (DEST[15-0] + SRC[15-0]);
* repeat add operation for 2nd through 7th words *;
DEST[127-112] ← SaturateToSignedWord (DEST[127-112] + SRC[127-112]);
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|         |                                                         |
|---------|---------------------------------------------------------|
| PADDSS  | <code>_m64 _mm_adds_pi8(_m64 m1, _m64 m2)</code>        |
| PADDSSB | <code>_m128i _mm_adds_epi8 (_m128i a, _m128i b)</code>  |
| PADDSW  | <code>_m64 _mm_adds_pi16(_m64 m1, _m64 m2)</code>       |
| PADDSW  | <code>_m128i _mm_adds_epi16 (_m128i a, _m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|        |                                                                                                                                                                 |
|--------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                               |
| #SS(0) | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                              |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX® テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                                             |

## PADDSD/PADDSW—Add Packed Signed Integers with Signed Saturation (続き)

|               |                                                                               |
|---------------|-------------------------------------------------------------------------------|
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                            |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                               |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|        |                                                                                                                                                                 |
|--------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。                                                        |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX® テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                                             |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                              |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PADDUSB/PADDUSW—Add Packed Unsigned Integers with Unsigned Saturation

| オペコード       | 命令                             | 説明                                                           |
|-------------|--------------------------------|--------------------------------------------------------------|
| 0F DC /r    | PADDUSB <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のパックド符号なしバイト整数を加算し、結果を飽和処理する。      |
| 66 0F DC /r | PADDUSB <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックド符号なしバイト整数を加算し、結果を飽和処理する。 |
| 0F DD /r    | PADDUSW <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のパックド符号なしワード整数を加算し、結果を飽和処理する。      |
| 66 0F DD /r | PADDUSW <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックド符号なしワード整数を加算し、結果を飽和処理する。 |

### 説明

ソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）のパックド符号なし整数の SIMD 加算を実行し、結果のパックド整数をデスティネーション・オペランドに格納する。SIMD演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図9-4. を参照のこと。以降の段落で説明するように、オーバーフローは符号なし飽和処理を使用して処理される。

上記の命令は、64ビット・オペランドまたは128ビット・オペランドのいずれかを操作する。64ビット・オペランドを操作する場合、デスティネーション・オペランドにはMMX®テクノロジ・レジスタを使用しなければならないが、ソース・オペランドにはMMXテクノロジ・レジスタまたは64ビット・メモリ・ロケーションのどちらを使用しても構わない。128ビット・オペランドを操作する場合は、デスティネーション・オペランドにはXMM レジスタを使用しなければならないが、ソース・オペランドにはXMM レジスタまたは128ビット・メモリ・ロケーションのどちらを使用しても構わない。

PADDUSB 命令は、パックド符号なしバイト整数を加算する。個別のバイトの結果が符号なしバイト整数の範囲を超える場合（すなわち、FFHより大きい場合）は、FFHの飽和された符号なし値がデスティネーション・オペランドに書き込まれる。

PADDUSW 命令は、パックド符号なしワード整数を加算する。個別のワードの結果が符号なしワード整数の範囲を超える場合（すなわち、FFFFHより大きい場合）は、FFFFHの飽和された符号なし値がデスティネーション・オペランドに書き込まれる。

## PADDUSB/PADDUSW—Add Packed Unsigned Integers with Unsigned Saturation（続き）

### 操作

PADDUSB instruction with 64-bit operands:

```
DEST[7..0] ← SaturateToUnsignedByte(DEST[7..0] + SRC [7..0] );
* repeat add operation for 2nd through 7th bytes *:
DEST[63..56] ← SaturateToUnsignedByte(DEST[63..56] + SRC[63..56])
```

PADDUSB instruction with 128-bit operands:

```
DEST[7-0] ← SaturateToUnsignedByte (DEST[7-0] + SRC[7-0]);
* repeat add operation for 2nd through 14th bytes *:
DEST[127-120] ← SaturateToUnSignedByte (DEST[127-120] + SRC[127-120]);
```

PADDUSW instruction with 64-bit operands:

```
DEST[15..0] ← SaturateToUnsignedWord(DEST[15..0] + SRC[15..0] );
* repeat add operation for 2nd and 3rd words *:
DEST[63..48] ← SaturateToUnsignedWord(DEST[63..48] + SRC[63..48] );
```

PADDUSW instruction with 128-bit operands:

```
DEST[15-0] ← SaturateToUnsignedWord (DEST[15-0] + SRC[15-0]);
* repeat add operation for 2nd through 7th words *:
DEST[127-112] ← SaturateToUnSignedWord (DEST[127-112] + SRC[127-112]);
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|         |                                                              |
|---------|--------------------------------------------------------------|
| PADDUSB | <code>__m64 __mm_adds_pu8(__m64 m1, __m64 m2)</code>         |
| PADDUSW | <code>__m64 __mm_adds_pu16(__m64 m1, __m64 m2)</code>        |
| PADDUSB | <code>__m128i __mm_adds_epu8 ( __m128i a, __m128i b)</code>  |
| PADDUSW | <code>__m128i __mm_adds_epu16 ( __m128i a, __m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|        |                                                                                                                                                                |
|--------|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                              |
| #SS(0) | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                             |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                                            |

## PADDUSB/PADDUSW—Add Packed Unsigned Integers with Unsigned Saturation (続き)

|               |                                                                               |
|---------------|-------------------------------------------------------------------------------|
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                            |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                               |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|        |                                                                                                                                                                  |
|--------|------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                                                                                      |
|        | オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。                                                                                                                        |
| #UD    | CR0 の EM がセットされた場合。<br>(CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。 SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                                              |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                               |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PAND—Logical AND

| オペコード       | 命令                          | 説明                                                        |
|-------------|-----------------------------|-----------------------------------------------------------|
| 0F DB /r    | PAND <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のビット単位の AND (論理積) 演算を実行する。      |
| 66 0F DB /r | PAND <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のビット単位の AND (論理積) 演算を実行する。 |

### 説明

ソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）との間のビット単位の AND (論理積) 演算を実行し、結果をデスティネーション・オペランドにストアする。ソース・オペランドには、MMX®テクノロジ・レジスタか64ビット・メモリ・ロケーションを使用でき、またはXMM レジスタか128ビット・メモリ・ロケーションを使用できる。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたはXMM レジスタでなければならない。各ビットの結果は、第1と第2オペランドの対応するビットが両方とも1である場合は1にセットされ、そうでない場合はゼロにセットされる。

### 操作

DEST ← DEST AND SRC;

### 同等のインテル® C/C++ コンパイラ組み込み関数

|      |                                                           |
|------|-----------------------------------------------------------|
| PAND | <code>_m64 _mm_and_si64 ( __m64 m1, __m64 m2)</code>      |
| PAND | <code>_m128i _mm_and_si128 ( __m128i a, __m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|        |                                                                                                                                                                |
|--------|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                              |
| #SS(0) | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                             |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                                            |

## PAND—Logical AND (続き)

|               |                                                                               |
|---------------|-------------------------------------------------------------------------------|
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                            |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                               |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|        |                                                                                                                                         |
|--------|-----------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                                                             |
|        | オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。                                                                                               |
| #UD    | CR0 の EM がセットされた場合。                                                                                                                     |
|        | CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                     |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                      |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PANDN—Logical AND NOT

| オペコード       | 命令                           | 説明                                                              |
|-------------|------------------------------|-----------------------------------------------------------------|
| 0F DF /r    | PANDN <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のビット単位の AND NOT (否定論理積) 演算を実行する。      |
| 66 0F DF /r | PANDN <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のビット単位の AND NOT (否定論理積) 演算を実行する。 |

### 説明

デスティネーション・オペランド（第1オペランド）のビット単位の NOT（否定）演算を実行した後、反転されたデスティネーション・オペランドとソース・オペランド（第2オペランド）の間でビット単位の AND（論理積）演算を実行する。結果はデスティネーション・オペランドに格納される。ソース・オペランドは、MMX®テクノロジ・レジスタまたは64ビットのメモリ・ロケーションか、XMM レジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたはXMM レジスタである。結果の各ビットは、第1オペランド内の対応するビットが0で第2オペランド内の対応するビットが1の場合は1に設定され、それ以外の場合は0に設定される。

### 操作

DEST ← (NOT DEST) AND SRC;

### 同等のインテル® C/C++ コンパイラ組み込み関数

|       |                                                               |
|-------|---------------------------------------------------------------|
| PANDN | <code>__m64 __mm_andnot_si64 (__m64 m1, __m64 m2)</code>      |
| PANDN | <code>__m128i __mm_andnot_si128 (__m128i a, __m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|        |                                                                                                                                                  |
|--------|--------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが16バイトに合っていない場合。                                   |
| #SS(0) | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                               |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が0の場合にのみ、128ビット操作によって#UDが発生する。SSE2に対応していないプロセッサ(MMXテクノロジ対応プロセッサ)上で128ビット命令を実行した場合、その命令はmmレジスタを操作し、#UDは発生しない。 |

## PANDN—Logical AND NOT（続き）

|               |                                                                               |
|---------------|-------------------------------------------------------------------------------|
| #NM           | CR0 の TS がセットされた場合。                                                           |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                            |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                               |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|     |                                                                                                                                                                |
|-----|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。                                                       |
| #UD | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM | CR0 の TS がセットされた場合。                                                                                                                                            |
| #MF | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                             |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PAUSE—Spin Loop Hint

| オペコード | 命令    | 説明                                            |
|-------|-------|-----------------------------------------------|
| F3 90 | PAUSE | spin-wait ループのパフォーマンスを向上させるためのヒントをプロセッサに提供する。 |

### 説明

spin-wait ループのパフォーマンスを向上させる。「spin-wait ループ」を実行すると、インテル® Pentium® 4 プロセッサまたはインテル® Xeon™ プロセッサは起こり得るメモリ順序違反を検出したとき、パフォーマンスの面で厳しい制限を受ける。PAUSE 命令は、コード・シーケンスが spin-wait ループになっているプロセッサにヒントを提供する。プロセッサはこのヒントを使用して、大抵の状況におけるメモリ順序違反を回避する。これにより、プロセッサのパフォーマンスは大幅に向上升す。こうした理由により、PAUSE 命令をすべての spin-wait ループに配置することが推奨される。

PAUSE 命令は、spin ループの実行時にインテル Pentium 4 プロセッサの消費電力を低減させる追加機能を備えている。インテル Pentium 4 プロセッサは spin-wait ループを極めて高速に実行できるため、リソースの待機中に電力を大量に消費する。spin-wait ループに PAUSE 命令を挿入することで、プロセッサの消費電力が大幅に低減される。

この命令はインテル Pentium 4 プロセッサで導入されたが、すべての IA-32 プロセッサに対して互換性がある。初期の IA-32 プロセッサにおいては、PAUSE 命令は NOP 命令と同じような動作をする。インテル Pentium 4 プロセッサとインテル Xeon プロセッサは、事前定義された待ち時間として PAUSE 命令を実装している。この待ち時間は有限であり、プロセッサによってはゼロである場合もある。この命令は、プロセッサのアーキテクチャ上の状態を変更することはない（つまり、この命令は、基本的には、ノー・オペレーションを実行することで次の命令の実行を遅らせる）。

### 操作

Execute\_Next\_Instruction(DELAY);

### 保護モード例外

なし。

### 実アドレスモード例外

なし。

### 仮想 8086 モード例外

なし。

## PAUSE—Spin Loop Hint（続き）

### 数値例外

なし。

## PAVGB/PAVGW—Average Packed Integers

| オペコード        | 命令                           | 説明                                                             |
|--------------|------------------------------|----------------------------------------------------------------|
| 0F E0 /r     | PAVGB <i>mm1, mm2/m64</i>    | 丸めを使用して、 <i>mm2/m64</i> と <i>mm1</i> のパックド符号なしバイト整数の平均を求める。    |
| 66 0F E0, /r | PAVGB <i>xmm1, xmm2/m128</i> | 丸めを使用して、 <i>xmm2/m128</i> と <i>xmm1</i> のパックド符号なしバイト整数の平均を求める。 |
| 0F E3 /r     | PAVGW <i>mm1, mm2/m64</i>    | 丸めを使用して、 <i>mm2/m64</i> と <i>mm1</i> のパックド符号なしワード整数の平均を求める。    |
| 66 0F E3 /r  | PAVGW <i>xmm1, xmm2/m128</i> | 丸めを使用して、 <i>xmm2/m128</i> と <i>xmm1</i> のパックド符号なしワード整数の平均を求める。 |

### 説明

ソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）のパックド符号なし整数の SIMD 平均値計算を実行し、結果をデスティネーション・オペランドに格納する。第1オペランドと第2オペランドの対応するデータ要素の各ペアについて、データ要素同士を加算して、その和に1を加算し、結果を1ビット右にシフトする。ソース・オペランドは、MMX® テクノロジ・レジスタまたは64ビットのメモリ・ロケーションか、XMM レジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたはXMM レジスタである。

PAVGB 命令は、符号なしパックドバイトを処理する。PAVGW 命令は、符号なしパックドワードを処理する。

### 操作

PAVGB instruction with 64-bit operands:

```
SRC[7-0] ← (SRC[7-0] + DEST[7-0] + 1) >> 1; * temp sum before shifting is 9 bits *
* repeat operation performed for bytes 2 through 6;
SRC[63-56] ← (SRC[63-56] + DEST[63-56] + 1) >> 1;
```

PAVGW instruction with 64-bit operands:

```
SRC[15-0] ← (SRC[15-0] + DEST[15-0] + 1) >> 1; * temp sum before shifting is 17 bits *
* repeat operation performed for words 2 and 3;
SRC[63-48] ← (SRC[63-48] + DEST[63-48] + 1) >> 1;
```

PAVGB instruction with 128-bit operands:

```
SRC[7-0] ← (SRC[7-0] + DEST[7-0] + 1) >> 1; * temp sum before shifting is 9 bits *
* repeat operation performed for bytes 2 through 14;
SRC[63-56] ← (SRC[63-56] + DEST[63-56] + 1) >> 1;
```

PAVGW instruction with 128-bit operands:

```
SRC[15-0] ← (SRC[15-0] + DEST[15-0] + 1) >> 1; * temp sum before shifting is 17 bits *
* repeat operation performed for words 2 through 6;
SRC[127-112] ← (SRC[127-112] + DEST[127-112] + 1) >> 1;
```

## PAVGB/PAVGW—Average Packed Integers（続き）

### 同等のインテル® C/C++ コンパイラ組み込み関数

|       |                                                          |
|-------|----------------------------------------------------------|
| PAVGB | <code>_m64_mm_avg_pu8 ( __m64 a, __m64 b)</code>         |
| PAVGW | <code>_m64_mm_avg_pu16 ( __m64 a, __m64 b)</code>        |
| PAVGB | <code>_m128i_mm_avg_epu8 ( __m128i a, __m128i b)</code>  |
| PAVGW | <code>_m128i_mm_avg_epu16 ( __m128i a, __m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

## PAVGB/PAVGW—Average Packed Integers（続き）

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフェルトが発生した場合。

#AC(0) (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

## PCMPEQB/PCMPEQW/PCMPEQD—Compare Packed Data for Equal

| オペコード       | 命令                             | 説明                                                    |
|-------------|--------------------------------|-------------------------------------------------------|
| 0F 74 /r    | PCMPEQB <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のパックドバイトを等しいか比較する。          |
| 66 0F 74 /r | PCMPEQB <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックドバイトを等しいか比較する。     |
| 0F 75 /r    | PCMPEQW <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のパックドワードを等しいか比較する。          |
| 66 0F 75 /r | PCMPEQW <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックドワードを等しいか比較する。     |
| 0F 76 /r    | PCMPEQD <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のパックド・ダブルワードを等しいか比較する。      |
| 66 0F 76 /r | PCMPEQD <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックド・ダブルワードを等しいか比較する。 |

### 説明

デスティネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）のパックドバイト/ワード/ダブルワードが等しいかどうかの SIMD 比較を実行する。データ要素のペアが等しい場合は、デスティネーション・オペランドの対応するデータ要素はすべて 1 に設定される。そうでない場合は、すべてゼロに設定される。ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーション、XMM レジスタまたは 128 ビットのメモリ・ロケーションを使用できる。デスティネーション・オペランドには、MMX テクノロジ・レジスタまたは XMM レジスタを使用できる。

PCMPEQB 命令は、デスティネーション・オペランドおよびソース・オペランドの対応するバイトを比較する。PCMPEQW 命令は、デスティネーション・オペランドおよびソース・オペランドの対応するワードを比較する。PCMPEQD 命令は、デスティネーション・オペランドおよびソース・オペランドの対応するダブルワードを比較する。

### 操作

PCMPEQB instruction with 64-bit operands:

```

IF DEST[7..0] = SRC[7..0]
  THEN DEST[7..0] ← FFH;
  ELSE DEST[7..0] ← 0;
* Continue comparison of 2nd through 7th bytes in DEST and SRC *
IF DEST[63..56] = SRC[63..56]
  THEN DEST[63..56] ← FFH;
  ELSE DEST[63..56] ← 0;

```

PCMPEQB instruction with 128-bit operands:

```

IF DEST[7..0] = SRC[7..0]
  THEN DEST[7..0] ← FFH;
  ELSE DEST[7..0] ← 0;

```

## PCMPEQB/PCMPEQW/PCMPEQD—Compare Packed Data for Equal (続き)

\* Continue comparison of 2nd through 15th bytes in DEST and SRC \*

```
IF DEST[63..56] = SRC[63..56]
    THEN DEST[63..56] ← FFH;
    ELSE DEST[63..56] ← 0;
```

PCMPEQW instruction with 64-bit operands:

```
IF DEST[15..0] = SRC[15..0]
    THEN DEST[15..0] ← FFFFH;
    ELSE DEST[15..0] ← 0;
```

\* Continue comparison of 2nd and 3rd words in DEST and SRC \*

```
IF DEST[63..48] = SRC[63..48]
    THEN DEST[63..48] ← FFFFH;
    ELSE DEST[63..48] ← 0;
```

PCMPEQW instruction with 128-bit operands:

```
IF DEST[15..0] = SRC[15..0]
    THEN DEST[15..0] ← FFFFH;
    ELSE DEST[15..0] ← 0;
```

\* Continue comparison of 2nd through 7th words in DEST and SRC \*

```
IF DEST[63..48] = SRC[63..48]
    THEN DEST[63..48] ← FFFFH;
    ELSE DEST[63..48] ← 0;
```

PCMPEQD instruction with 64-bit operands:

```
IF DEST[31..0] = SRC[31..0]
    THEN DEST[31..0] ← FFFFFFFFH;
    ELSE DEST[31..0] ← 0;
IF DEST[63..32] = SRC[63..32]
    THEN DEST[63..32] ← FFFFFFFFH;
    ELSE DEST[63..32] ← 0;
```

PCMPEQD instruction with 128-bit operands:

```
IF DEST[31..0] = SRC[31..0]
    THEN DEST[31..0] ← FFFFFFFFH;
    ELSE DEST[31..0] ← 0;
```

\* Continue comparison of 2nd and 3rd doublewords in DEST and SRC \*

```
IF DEST[63..32] = SRC[63..32]
    THEN DEST[63..32] ← FFFFFFFFH;
    ELSE DEST[63..32] ← 0;
```

## PCMPEQB/PCMPEQW/PCMPEQD—Compare Packed Data for Equal (続き)

### 同等のインテル® C/C++ コンパイラ組み込み関数

|         |                                                              |
|---------|--------------------------------------------------------------|
| PCMPEQB | <code>__m64 _mm_cmpeq_pi8 ( __m64 m1, __m64 m2)</code>       |
| PCMPEQW | <code>__m64 _mm_cmpeq_pi16 ( __m64 m1, __m64 m2)</code>      |
| PCMPEQD | <code>__m64 _mm_cmpeq_pi32 ( __m64 m1, __m64 m2)</code>      |
| PCMPEQB | <code>__m128i _mm_cmpeq_epi8 ( __m128i a, __m128i b)</code>  |
| PCMPEQW | <code>__m128i _mm_cmpeq_epi16 ( __m128i a, __m128i b)</code> |
| PCMPEQD | <code>__m128i _mm_cmpeq_epi32 ( __m128i a, __m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                                                                |
|---------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                              |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                             |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM           | CR0 の TS がセットされた場合。                                                                                                                                            |
| #MF           | (64 ビット操作のみ) 未処理の X87 FPU 例外がある場合。                                                                                                                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                                                |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                                  |

## PCMPEQB/PCMPEQW/PCMPEQD—Compare Packed Data for Equal (続き)

### 実アドレスモード例外

|        |                                                                                                                                         |
|--------|-----------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                                                             |
|        | オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。                                                                                               |
| #UD    | CR0 の EM がセットされた場合。                                                                                                                     |
|        | CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                     |
| #MF    | (64 ビット操作のみ) 未処理の X87 FPU 例外がある場合。                                                                                                      |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフェルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PCMPGTB/PCMPGTW/PCMPGTD—Compare Packed Signed Integers for Greater Than

| オペコード       | 命令                             | 説明                                                                 |
|-------------|--------------------------------|--------------------------------------------------------------------|
| 0F 64 /r    | PCMPGTB <i>mm, mm/m64</i>      | <i>mm</i> と <i>mm/m64</i> のパックド符号付きバイト整数を、「より大きい」の条件で比較する。         |
| 66 0F 64 /r | PCMPGTB <i>xmm1, xmm2/m128</i> | <i>xmm1</i> と <i>xmm2/m128</i> のパックド符号付きバイト整数を、「より大きい」の条件で比較する。    |
| 0F 65 /r    | PCMPGTW <i>mm, mm/m64</i>      | <i>mm</i> と <i>mm/m64</i> のパックド符号付きワード整数を、「より大きい」の条件で比較する。         |
| 66 0F 65 /r | PCMPGTW <i>xmm1, xmm2/m128</i> | <i>xmm1</i> と <i>xmm2/m128</i> のパックド符号付きワード整数を、「より大きい」の条件で比較する。    |
| 0F 66 /r    | PCMPGTD <i>mm, mm/m64</i>      | <i>mm</i> と <i>mm/m64</i> のパックド符号付きダブルワード整数を、「より大きい」の条件で比較する。      |
| 66 0F 66 /r | PCMPGTD <i>xmm1, xmm2/m128</i> | <i>xmm1</i> と <i>xmm2/m128</i> のパックド符号付きダブルワード整数を、「より大きい」の条件で比較する。 |

### 説明

デスティネーション・オペランド（第1オペランド）のパックドバイト整数/ワード整数/ダブルワード整数の値が、ソース・オペランド（第2オペランド）のパックドバイト整数/ワード整数/ダブルワード整数の値より大きいかどうかの SIMD 符号付き比較を実行する。デスティネーション・オペランドのデータ要素がソース・オペランドの対応するデータ要素より大きい場合は、デスティネーション・オペランドの対応するデータ要素はすべて 1 に設定される。そうでない場合は、すべて 0 に設定される。ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーション、XMM レジスタまたは 128 ビットのメモリ・ロケーションを使用できる。デスティネーション・オペランドには、MMX テクノロジ・レジスタまたは XMM レジスタを使用できる。

PCMPGTB 命令は、デスティネーション・オペランドおよびソース・オペランドの対応する符号付きバイト整数を比較する。PCMPGTW 命令は、デスティネーション・オペランドおよびソース・オペランドの対応する符号付きワード整数を比較する。PCMPGTD 命令は、デスティネーション・オペランドおよびソース・オペランドの対応する符号付きダブルワード整数を比較する。

### 操作

PCMPGTB instruction with 64-bit operands:

```

IF DEST[7..0] > SRC[7..0]
  THEN DEST[7..0] ← FFH;
  ELSE DEST[7..0] ← 0;
* Continue comparison of 2nd through 7th bytes in DEST and SRC *
IF DEST[63..56] > SRC[63..56]
  THEN DEST[63..56] ← FFH;
  ELSE DEST[63..56] ← 0;
```

## PCMPGTB/PCMPGTW/PCMPGTD—Compare Packed Signed Integers for Greater Than (続き)

PCMPGTB instruction with 128-bit operands:

```

IF DEST[7..0] > SRC[7..0]
  THEN DEST[7..0] ← FFH;
ELSE DEST[7..0] ← 0;
* Continue comparison of 2nd through 15th bytes in DEST and SRC *
IF DEST[63..56] > SRC[63..56]
  THEN DEST[63..56] ← FFH;
ELSE DEST[63..56] ← 0;
```

PCMPGTW instruction with 64-bit operands:

```

IF DEST[15..0] > SRC[15..0]
  THEN DEST[15..0] ← FFFFH;
ELSE DEST[15..0] ← 0;
* Continue comparison of 2nd and 3rd words in DEST and SRC *
IF DEST[63..48] > SRC[63..48]
  THEN DEST[63..48] ← FFFFH;
ELSE DEST[63..48] ← 0;
```

PCMPGTW instruction with 128-bit operands:

```

IF DEST[15..0] > SRC[15..0]
  THEN DEST[15..0] ← FFFFH;
ELSE DEST[15..0] ← 0;
* Continue comparison of 2nd through 7th words in DEST and SRC *
IF DEST[63..48] > SRC[63..48]
  THEN DEST[63..48] ← FFFFH;
ELSE DEST[63..48] ← 0;
```

PCMPGTD instruction with 64-bit operands:

```

IF DEST[31..0] > SRC[31..0]
  THEN DEST[31..0] ← FFFFFFFFH;
ELSE DEST[31..0] ← 0;
IF DEST[63..32] > SRC[63..32]
  THEN DEST[63..32] ← FFFFFFFFH;
ELSE DEST[63..32] ← 0;
```

PCMPGTD instruction with 128-bit operands:

```

IF DEST[31..0] > SRC[31..0]
  THEN DEST[31..0] ← FFFFFFFFH;
ELSE DEST[31..0] ← 0;
* Continue comparison of 2nd and 3rd doublewords in DEST and SRC *
IF DEST[63..32] > SRC[63..32]
  THEN DEST[63..32] ← FFFFFFFFH;
ELSE DEST[63..32] ← 0;
```

## PCMPGTB/PCMPGTW/PCMPGTD—Compare Packed Signed Integers for Greater Than（続き）

### 同等のインテル® C/C++ コンパイラ組み込み関数

|         |                                                          |
|---------|----------------------------------------------------------|
| PCMPGTB | <code>__m64 _mm_cmplt_pi8 (__m64 m1, __m64 m2)</code>    |
| PCMPGTW | <code>__m64 _mm_pcmpgt_pi16 (__m64 m1, __m64 m2)</code>  |
| DCMPGTD | <code>__m64 _mm_pcmpgt_pi32 (__m64 m1, __m64 m2)</code>  |
| PCMPGTB | <code>_m128i _mm_cmplt_epi8 (_m128i a, _m128i b)</code>  |
| PCMPGTW | <code>_m128i _mm_cmplt_epi16 (_m128i a, _m128i b)</code> |
| DCMPGTD | <code>_m128i _mm_cmplt_epi32 (_m128i a, _m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                                                                |
|---------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                               |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                             |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM           | CR0 の TS がセットされた場合。                                                                                                                                            |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                                                |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                                  |

## PCMPGTB/PCMPGTW/PCMPGTD—Compare Packed Signed Integers for Greater Than（続き）

### 実アドレスモード例外

|        |                                                                                                                                       |
|--------|---------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                                                           |
|        | オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。                                                                                             |
| #UD    | CR0 の EM がセットされた場合。                                                                                                                   |
|        | CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ（MMX テクノロジ対応プロセッサ）上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフェルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PEXTRW—Extract Word

| オペコード          | 命令                           | 説明                                                            |
|----------------|------------------------------|---------------------------------------------------------------|
| 0F C5 /r ib    | PEXTRW <i>r32, mm, imm8</i>  | <i>imm8</i> によって指定されたワードを <i>mm</i> から抽出し、 <i>r32</i> に移動する。  |
| 66 0F C5 /r ib | PEXTRW <i>r32, xmm, imm8</i> | <i>imm8</i> によって指定されたワードを <i>xmm</i> から抽出し、 <i>r32</i> に移動する。 |

### 説明

カウント・オペランド（第3オペランド）で指定されたソース・オペランド（第2オペランド）内のワードを、デスティネーション・オペランド（第1オペランド）にコピーする。ソース・オペランドは、MMX®テクノロジ・レジスタまたはXMMレジスタである。デスティネーション・オペランドは汎用レジスタの下位ワードである。カウント・オペランドは8ビットの即値である。MMXテクノロジ・レジスタにワード・ロケーションを指定する場合、カウント・オペランドの下位2ビットによってそのロケーションを指定する。XMMレジスタの場合は、下位3ビットによってそのロケーションを指定する。デスティネーション・オペランドの上位ワードはクリアされる（すべて0に設定される）。

### 操作

PEXTRW instruction with 64-bit source operand:

```
SEL ← COUNT AND 3H;
TEMP ← (SRC >> (SEL * 16)) AND FFFFH;
r32[15-0] ← TEMP[15-0];
r32[31-16] ← 0000H;
```

PEXTRW instruction with 128-bit source operand:

```
SEL ← COUNT AND 7H;
TEMP ← (SRC >> (SEL * 16)) AND FFFFH;
r32[15-0] ← TEMP[15-0];
r32[31-16] ← 0000H;
```

### 同等のインテル®C/C++コンパイラ組み込み関数

|        |                                           |
|--------|-------------------------------------------|
| PEXTRW | int_mm_extract_pi16 (_m64 a, int n)       |
| PEXTRW | int _mm_extract_epi16 (_m128i a, int imm) |

### 影響を受けるフラグ

なし。

## PEXTRW—Extract Word (続き)

### 保護モード例外

|               |                                                                                                       |
|---------------|-------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。                                                    |
| (#SS(0))      | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                    |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM           | CR0 の TS がセットされた場合。                                                                                   |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                       |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                         |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                                                                   |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PINSRW—Insert Word

| オペコード          | 命令                               | 説明                                                                             |
|----------------|----------------------------------|--------------------------------------------------------------------------------|
| 0F C4 /r ib    | PINSRW <i>mm, r32/m16, imm8</i>  | <i>r32</i> または <i>m16</i> の下位ワードを、 <i>imm8</i> で指定された <i>mm</i> 内のワード位置に挿入する。  |
| 66 0F C4 /r ib | PINSRW <i>xmm, r32/m16, imm8</i> | <i>r32</i> または <i>m16</i> の下位ワードを、 <i>imm8</i> で指定された <i>xmm</i> 内のワード位置に移動する。 |

### 説明

ソース・オペランド（第2オペランド）から1ワードをコピーして、カウント・オペランド（第3オペランド）で指定されたデスティネーション・オペランド（第1オペランド）内の位置に挿入する（デスティネーション・レジスタの他のワードは変更されない）。ソース・オペランドは、汎用レジスタまたは16ビットのメモリ・ロケーションである（ソース・オペランドが汎用レジスタの場合は、レジスタの下位ワードがコピーされる）。デスティネーション・オペランドは、MMX®テクノロジ・レジスタまたはXMMレジスタである。カウント・オペランドは8ビットの即値である。MMXテクノロジ・レジスタにワード・ロケーションを指定する場合、カウント・オペランドの下位2ビットによってそのロケーションを指定する。XMMレジスタの場合は、下位3ビットによってそのロケーションを指定する。

### 操作

PINSRW instruction with 64-bit source operand:

```

SEL ← COUNT AND 3H;
CASE (determine word position) OF
  SEL ← 0: MASK ← 0000000000000000FFFFH;
  SEL ← 1: MASK ← 00000000FFFF0000H;
  SEL ← 2: MASK ← 0000FFFF00000000H;
  SEL ← 3: MASK ← FFFF000000000000H;
DEST ← (DEST AND NOT MASK) OR (((SRC << (SEL * 16)) AND MASK);

```

PINSRW instruction with 128-bit source operand:

```

SEL ← COUNT AND 7H;
CASE (determine word position) OF
  SEL ← 0: MASK ← 00000000000000000000000000000000FFFFH;
  SEL ← 1: MASK ← 00000000000000000000000000000000FFFF0000H;
  SEL ← 2: MASK ← 00000000000000000000000000000000FFFF00000000H;
  SEL ← 3: MASK ← 00000000000000000000000000000000FFFF0000000000H;
  SEL ← 4: MASK ← 00000000000000000000000000000000FFFF000000000000H;
  SEL ← 5: MASK ← 000000000FFF0000000000000000000000000000H;
  SEL ← 6: MASK ← 0000FFFF00000000000000000000000000000000H;
  SEL ← 7: MASK ← FFFF000000000000000000000000000000000000H;
DEST ← (DEST AND NOT MASK) OR (((SRC << (SEL * 16)) AND MASK);

```

## PINSRW—Insert Word (続き)

### 同等のインテル® C/C++ コンパイラ組み込み関数

|        |                                                                    |
|--------|--------------------------------------------------------------------|
| PINSRW | <code>__m64 _mm_insert_pi16 ( __m64 a, int d, int n)</code>        |
| PINSRW | <code>__m128i _mm_insert_epi16 ( __m128i a, int b, int imm)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                       |
|---------------|-------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。                                                    |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                    |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM           | CR0 の TS がセットされた場合。                                                                                   |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                       |
| #AC           | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                         |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                                                                   |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PINSRW—Insert Word (続き)

### 数値例外

なし。

## PMADDWD—Multiply and Add Packed Integers

| オペコード       | 命令                             | 説明                                                                                              |
|-------------|--------------------------------|-------------------------------------------------------------------------------------------------|
| 0F F5 /r    | PMADDWD <i>mm, mm/m64</i>      | <i>mm</i> のパックドワードに <i>mm/m64</i> のパックドワードを掛ける。結果の隣接するダブルワードを加算して <i>mm</i> にストアする。             |
| 66 0F F5 /r | PMADDWD <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のパックドワード整数に <i>xmm2/m128</i> のパックドワード整数を掛けて、得られた隣接するダブルワードを加算して <i>xmm1</i> にストアする。 |

### 説明

デスティネーション・オペランド（第1オペランド）の個別のパックド符号付きワードにソース・オペランド（第2オペランド）の対応する符号付きワードを掛け、仮の符号付きダブルワードの結果を生成する。次に、得られた隣接するダブルワードを合計して、デスティネーション・オペランドに格納する。例えば、ソース・オペランドとデスティネーション・オペランド内の対応する下位ワード（15～0）および（31～16）同士がそれぞれ乗算されて、得られたダブルワードが加算され、デスティネーション・レジスタの下位ダブルワード（31～0）に格納される。その他の隣接するワードについても、同じ操作が実行される（図4-2は、64ビット・オペランドを使用する場合の操作を示している）。ソース・オペランドは、MMX® テクノロジ・レジスタまたは64ビットのメモリ・ロケーションか、XMM レジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたはXMM レジスタである。

PMADD命令は、1つのグループ内の操作される2対のワードがすべて8000Hである場合にのみ、ラップアラウンドを使用する。この場合、結果は80000000Hにラップアラウンドされる。



図 4-2. 64 ビット・オペランドを使用した PMADDWD 実行モデル

## PMADDWD—Multiply and Add Packed Integers（続き）

### 操作

PMADDWD instruction with 64-bit operands:

```
DEST[31..0] ← (DEST[15..0] * SRC[15..0]) + (DEST[31..16] * SRC[31..16]);
DEST[63..32] ← (DEST[47..32] * SRC[47..32]) + (DEST[63..48] * SRC[63..48]);
```

PMADDWD instruction with 128-bit operands:

```
DEST[31..0] ← (DEST[15..0] * SRC[15..0]) + (DEST[31..16] * SRC[31..16]);
DEST[63..32] ← (DEST[47..32] * SRC[47..32]) + (DEST[63..48] * SRC[63..48]);
DEST[95..64) ← (DEST[79..64) * SRC[79..64)) + (DEST[95..80) * SRC[95..80));
DEST[127..96) ← (DEST[111..96) * SRC[111..96)) + (DEST[127..112) *
SRC[127..112));
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|         |                                                             |
|---------|-------------------------------------------------------------|
| PMADDWD | <code>__m64 _mm_madd_pi16(__m64 m1, __m64 m2)</code>        |
| PMADDWD | <code>__m128i _mm_madd_epi16 ( __m128i a, __m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                                                                |
|---------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                              |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                             |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM           | CR0 の TS がセットされた場合。                                                                                                                                            |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                                                |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                                  |

## PMADDWD—Multiply and Add Packed Integers（続き）

### 実アドレスモード例外

|        |                                                                                                                                       |
|--------|---------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                                                           |
|        | オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。                                                                                             |
| #UD    | CR0 の EM がセットされた場合。                                                                                                                   |
|        | CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ（MMX テクノロジ対応プロセッサ）上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PMAXSW—Maximum of Packed Signed Word Integers

| オペコード       | 命令                            | 説明                                                    |
|-------------|-------------------------------|-------------------------------------------------------|
| 0F EE /r    | PMAXSW <i>mm1, mm2/m64</i>    | <i>mm2/m64</i> と <i>mm1</i> の符号付きワード整数を比較して最大値を返す。    |
| 66 0F EE /r | PMAXSW <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> の符号付きワード整数を比較して最大値を返す。 |

### 説明

デスティネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）のパックド符号付きワード整数の SIMD 比較を実行し、それぞれのワード整数のペアの最大値をデスティネーション・オペランドに返す。ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーションか、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたは XMM レジスタである。

### 操作

PMAXSW instruction for 64-bit operands:

```

IF DEST[15-0] > SRC[15-0] THEN
    (DEST[15-0] ← DEST[15-0];
ELSE
    (DEST[15-0] ← SRC[15-0];
FI
* repeat operation for 2nd and 3rd words in source and destination operands *
IF DEST[63-48] > SRC[63-48] THEN
    (DEST[63-48] ← DEST[63-48];
ELSE
    (DEST[63-48] ← SRC[63-48];
FI

```

PMAXSW instruction for 128-bit operands:

```

IF DEST[15-0] > SRC[15-0] THEN
    (DEST[15-0] ← DEST[15-0];
ELSE
    (DEST[15-0] ← SRC[15-0];
FI
* repeat operation for 2nd through 7th words in source and destination operands *
IF DEST[127-112] > SRC[127-112] THEN
    (DEST[127-112] ← DEST[127-112];
ELSE
    (DEST[127-112] ← SRC[127-112];
FI

```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|        |                                                           |
|--------|-----------------------------------------------------------|
| PMAXSW | <code>_m64 _mm_max_pi16(_m64 a, _m64 b)</code>            |
| PMAXSW | <code>_m128i _mm_max_epi16 ( __m128i a, __m128i b)</code> |

## PMAXSW—Maximum of Packed Signed Word Integers（続き）

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PMAXSW—Maximum of Packed Signed Word Integers（続き）

### 数値例外

なし。

## PMAXUB—Maximum of Packed Unsigned Byte Integers

| オペコード       | 命令                            | 説明                                                    |
|-------------|-------------------------------|-------------------------------------------------------|
| 0F DE /r    | PMAXUB <i>mm1, mm2/m64</i>    | <i>mm2/m64</i> と <i>mm1</i> の符号なしバイト整数を比較して最大値を返す。    |
| 66 0F DE /r | PMAXUB <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> の符号なしバイト整数を比較して最大値を返す。 |

### 説明

デスティネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）のパックド符号なしバイト整数の SIMD 比較を実行し、それぞれのバイト整数のペアの最大値をデスティネーション・オペランドに返す。ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーションか、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたは XMM レジスタである。

### 操作

PMAXUB instruction for 64-bit operands:

```

IF DEST[7-0] > SRC[17-0] THEN
    (DEST[7-0] ← DEST[7-0];
ELSE
    (DEST[7-0] ← SRC[7-0];
FI
* repeat operation for 2nd through 7th bytes in source and destination operands *
IF DEST[63-56] > SRC[63-56] THEN
    (DEST[63-56] ← DEST[63-56];
ELSE
    (DEST[63-56] ← SRC[63-56];
FI

```

PMAXUB instruction for 128-bit operands:

```

IF DEST[7-0] > SRC[17-0] THEN
    (DEST[7-0] ← DEST[7-0];
ELSE
    (DEST[7-0] ← SRC[7-0];
FI
* repeat operation for 2nd through 15th bytes in source and destination operands *
IF DEST[127-120] > SRC[127-120] THEN
    (DEST[127-120] ← DEST[127-120];
ELSE
    (DEST[127-120] ← SRC[127-120];
FI

```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|        |                                                        |
|--------|--------------------------------------------------------|
| PMAXUB | <code>_m64 _mm_max_pu8(_m64 a, _m64 b)</code>          |
| PMAXUB | <code>_m128i _mm_max_epu8 ( _m128i a, _m128i b)</code> |

## PMAXUB—Maximum of Packed Unsigned Byte Integers (続き)

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PMAXUB—Maximum of Packed Unsigned Byte Integers（続き）

### 数値例外

なし。

## PMINSW—Minimum of Packed Signed Word Integers

| オペコード       | 命令                            | 説明                                                    |
|-------------|-------------------------------|-------------------------------------------------------|
| 0F EA /r    | PMINSW <i>mm1, mm2/m64</i>    | <i>mm2/m64</i> と <i>mm1</i> の符号付きワード整数を比較して最小値を返す。    |
| 66 0F EA /r | PMINSW <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> の符号付きワード整数を比較して最小値を返す。 |

### 説明

デスティネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）のパックド符号付きワード整数の SIMD 比較を実行し、それぞれのワード整数のペアの最小値をデスティネーション・オペランドに返す。ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーションか、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたは XMM レジスタである。

### 操作

PMINSW instruction for 64-bit operands:

```

IF DEST[15-0] < SRC[15-0] THEN
    (DEST[15-0] ← DEST[15-0];
ELSE
    (DEST[15-0] ← SRC[15-0];
FI
* repeat operation for 2nd and 3rd words in source and destination operands *
IF DEST[63-48] < SRC[63-48] THEN
    (DEST[63-48] ← DEST[63-48];
ELSE
    (DEST[63-48] ← SRC[63-48];
FI

```

MINSW instruction for 128-bit operands:

```

IF DEST[15-0] < SRC[15-0] THEN
    (DEST[15-0] ← DEST[15-0];
ELSE
    (DEST[15-0] ← SRC[15-0];
FI
* repeat operation for 2nd through 7th words in source and destination operands *
IF DEST[127-112] < SRC/m64[127-112] THEN
    (DEST[127-112] ← DEST[127-112];
ELSE
    (DEST[127-112] ← SRC[127-112];
FI

```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|        |                                                        |
|--------|--------------------------------------------------------|
| PMINSW | <code>_m64 _mm_min_pi16 (_m64 a, _m64 b)</code>        |
| PMINSW | <code>_m128i _mm_min_epi16 (_m128i a, _m128i b)</code> |

## PMINSW—Minimum of Packed Signed Word Integers（続き）

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC           | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PMINSW—Minimum of Packed Signed Word Integers（続き）

### 数値例外

なし。

## PMINUB—Minimum of Packed Unsigned Byte Integers

| オペコード       | 命令                            | 説明                                                    |
|-------------|-------------------------------|-------------------------------------------------------|
| 0F DA /r    | PMINUB <i>mm1, mm2/m64</i>    | <i>mm2/m64</i> と <i>mm1</i> の符号なしバイト整数を比較して最小値を返す。    |
| 66 0F DA /r | PMINUB <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> の符号なしバイト整数を比較して最小値を返す。 |

### 説明

デスティネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）のパックド符号なしバイト整数の SIMD 比較を実行し、それぞれのバイト整数のペアの最小値をデスティネーション・オペランドに返す。ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーションか、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたは XMM レジスタである。

### 操作

PMINUB instruction for 64-bit operands:

```

IF DEST[7-0] < SRC[17-0] THEN
    (DEST[7-0] ← DEST[7-0];
ELSE
    (DEST[7-0] ← SRC[7-0];
FI
* repeat operation for 2nd through 7th bytes in source and destination operands *
IF DEST[63-56] < SRC[63-56] THEN
    (DEST[63-56] ← DEST[63-56];
ELSE
    (DEST[63-56] ← SRC[63-56];
FI

```

PMINUB instruction for 128-bit operands:

```

IF DEST[7-0] < SRC[17-0] THEN
    (DEST[7-0] ← DEST[7-0];
ELSE
    (DEST[7-0] ← SRC[7-0];
FI
* repeat operation for 2nd through 15th bytes in source and destination operands *
IF DEST[127-120] < SRC[127-120] THEN
    (DEST[127-120] ← DEST[127-120];
ELSE
    (DEST[127-120] ← SRC[127-120];
FI

```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|        |                                                           |
|--------|-----------------------------------------------------------|
| PMINUB | <code>__m64 _m_min_pu8 (__m64 a, __m64 b)</code>          |
| PMINUB | <code>__m128i _mm_min_epu8 ( __m128i a, __m128i b)</code> |

## PMINUB—Minimum of Packed Unsigned Byte Integers（続き）

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PMINUB—Minimum of Packed Unsigned Byte Integers（続き）

### 数値例外

なし。

## PMOVMSKB—Move Byte Mask

| オペコード       | 命令                       | 説明                                    |
|-------------|--------------------------|---------------------------------------|
| 0F D7 /r    | PMOVMSKB <i>r32, mm</i>  | <i>mm</i> のバイトマスクを <i>r32</i> に移動する。  |
| 66 0F D7 /r | PMOVMSKB <i>r32, xmm</i> | <i>xmm</i> のバイトマスクを <i>r32</i> に移動する。 |

### 説明

ソース・オペランド（第2オペランド）の各バイトの最上位ビットからマスクを作成し、結果をデスティネーション・オペランド（第1オペランド）の最下位バイトまたは下位ワードに格納する。ソース・オペランドは、MMX®テクノロジ・レジスタまたはXMM レジスタである。デスティネーション・オペランドは汎用レジスタである。64 ビットのオペランドを操作する場合、バイトマスクは 8 ビットである。128 ビットのオペランドを操作する場合、バイトマスクは 16 ビットである。

### 操作

PMOVMSKB instruction with 64-bit source operand:

```
r32[0] ← SRC[7];
r32[1] ← SRC[15];
* repeat operation for bytes 2 through 6;
r32[7] ← SRC[63];
r32[31-8] ← 000000H;
```

PMOVMSKB instruction with 128-bit source operand:

```
r32[0] ← SRC[7];
r32[1] ← SRC[15];
* repeat operation for bytes 2 through 14;
r32[15] ← SRC[127];
r32[31-16] ← 0000H;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|          |                                    |
|----------|------------------------------------|
| PMOVMSKB | int_mm_movemask_pi8(__m64 a)       |
| PMOVMSKB | int _mm_movemask_epi8 ( __m128i a) |

### 影響を受けるフラグ

なし。

### 保護モード例外

|     |                                                                                                       |
|-----|-------------------------------------------------------------------------------------------------------|
| #UD | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM | CR0 の TS がセットされた場合。                                                                                   |
| #MF | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

## **PMOVMSKB—Move Byte Mask（続き）**

### **実アドレスモード例外**

保護モードと同じ例外。

### **仮想 8086 モード例外**

保護モードと同じ例外。

### **数値例外**

なし。

## PMULHUW—Multiply Packed Unsigned Integers and Store High Result

| オペコード       | 命令                             | 説明                                                                                 |
|-------------|--------------------------------|------------------------------------------------------------------------------------|
| 0F E4 /r    | PMULHUW <i>mm1, mm2/m64</i>    | <i>mm1</i> レジスタと <i>mm2/m64</i> のパックド符号なしワード整数を乗算し、結果の上位 16 ビットを <i>mm1</i> に格納する。 |
| 66 0F E4 /r | PMULHUW <i>xmm1, xmm2/m128</i> | <i>xmm1</i> と <i>xmm2/m128</i> のパックド符号なしワード整数を乗算し、結果の上位 16 ビットを <i>xmm1</i> に格納する。 |

### 説明

デスティネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）のパックド符号なしワード整数の SIMD 符号なし乗算を実行し、それぞれの 32 ビットの中間結果の上位 16 ビットをデスティネーション・オペランドに格納する（図 4-3. は、64 ビット・オペランドを使用する場合の操作を示している）。ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーションか、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたは XMM レジスタである。



図 4-3. 64 ビット・オペランドを使用した PMULHUW 命令および PMULHW 命令の動作

### 操作

PMULHUW instruction with 64-bit operands:

```

TEMP0[31-0] ← DEST[15-0] * SRC[15-0]; * Unsigned multiplication *
TEMP1[31-0] ← DEST[31-16] * SRC[31-16];
TEMP2[31-0] ← DEST[47-32] * SRC[47-32];
TEMP3[31-0] ← DEST[63-48] * SRC[63-48];
DEST[15-0] ← TEMP0[31-16];
DEST[31-16] ← TEMP1[31-16];
DEST[47-32] ← TEMP2[31-16];
DEST[63-48] ← TEMP3[31-16];

```

## PMULHUW—Multiply Packed Unsigned Integers and Store High Result (続き)

PMULHUW instruction with 128-bit operands:

```

TEMP0[31-0] ← DEST[15-0] * SRC[15-0]; * Unsigned multiplication *
TEMP1[31-0] ← DEST[31-16] * SRC[31-16];
TEMP2[31-0] ← DEST[47-32] * SRC[47-32];
TEMP3[31-0] ← DEST[63-48] * SRC[63-48];
TEMP4[31-0] ← DEST[79-64] * SRC[79-64];
TEMP5[31-0] ← DEST[95-80] * SRC[95-80];
TEMP6[31-0] ← DEST[111-96] * SRC[111-96];
TEMP7[31-0] ← DEST[127-112] * SRC[127-112];
DEST[15-0] ← TEMP0[31-16];
DEST[31-16] ← TEMP1[31-16];
DEST[47-32] ← TEMP2[31-16];
DEST[63-48] ← TEMP3[31-16];
DEST[79-64] ← TEMP4[31-16];
DEST[95-80] ← TEMP5[31-16];
DEST[111-96] ← TEMP6[31-16];
DEST[127-112] ← TEMP7[31-16];

```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|         |                                                           |
|---------|-----------------------------------------------------------|
| PMULHUW | <code>_m64 _mm_mulhi_pu16(_m64 a, _m64 b)</code>          |
| PMULHUW | <code>_m128i _mm_mulhi_epu16 ( _m128i a, _m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

## PMULHUW—Multiply Packed Unsigned Integers and Store High Result (続き)

### 実アドレスモード例外

|        |                                                             |
|--------|-------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
|        | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                         |
| #UD    | CR0 の EM がセットされた場合。                                         |
|        | (128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。                         |
|        | (128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。                     |
| #NM    | CR0 の TS がセットされた場合。                                         |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                          |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PMULHW—Multiply Packed Signed Integers and Store High Result

| オペコード       | 命令                            | 説明                                                                                 |
|-------------|-------------------------------|------------------------------------------------------------------------------------|
| 0F E5 /r    | PMULHW <i>mm, mm/m64</i>      | <i>mm1</i> レジスタと <i>mm2/m64</i> のパックド符号付きワード整数を乗算し、結果の上位 16 ビットを <i>mm1</i> に格納する。 |
| 66 0F E5 /r | PMULHW <i>xmm1, xmm2/m128</i> | <i>xmm1</i> と <i>xmm2/m128</i> のパックド符号付きワード整数を乗算し、結果の上位 16 ビットを <i>xmm1</i> に格納する。 |

### 説明

デスティネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）のパックド符号付きワード整数の SIMD 符号付き乗算を実行し、それぞれの 32 ビットの中間結果の上位 16 ビットをデスティネーション・オペランドに格納する（図 4-3. は、64 ビット・オペランドを使用する場合の操作を示している）。ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーションか、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたは XMM レジスタである。

### 操作

PMULHW instruction with 64-bit operands:

```

TEMP0[31-0] ← DEST[15-0] * SRC[15-0]; * Signed multiplication *
TEMP1[31-0] ← DEST[31-16] * SRC[31-16];
TEMP2[31-0] ← DEST[47-32] * SRC[47-32];
TEMP3[31-0] ← DEST[63-48] * SRC[63-48];
DEST[15-0] ← TEMP0[31-16];
DEST[31-16] ← TEMP1[31-16];
DEST[47-32] ← TEMP2[31-16];
DEST[63-48] ← TEMP3[31-16];

```

PMULHW instruction with 128-bit operands:

```

TEMP0[31-0] ← DEST[15-0] * SRC[15-0]; * Signed multiplication *
TEMP1[31-0] ← DEST[31-16] * SRC[31-16];
TEMP2[31-0] ← DEST[47-32] * SRC[47-32];
TEMP3[31-0] ← DEST[63-48] * SRC[63-48];
TEMP4[31-0] ← DEST[79-64] * SRC[79-64];
TEMP5[31-0] ← DEST[95-80] * SRC[95-80];
TEMP6[31-0] ← DEST[111-96] * SRC[111-96];
TEMP7[31-0] ← DEST[127-112] * SRC[127-112];
DEST[15-0] ← TEMP0[31-16];
DEST[31-16] ← TEMP1[31-16];
DEST[47-32] ← TEMP2[31-16];
DEST[63-48] ← TEMP3[31-16];
DEST[79-64] ← TEMP4[31-16];
DEST[95-80] ← TEMP5[31-16];
DEST[111-96] ← TEMP6[31-16];
DEST[127-112] ← TEMP7[31-16];

```

## PMULHW—Multiply Packed Signed Integers and Store High Result (続き)

### 同等のインテル® C/C++ コンパイラ組み込み関数

PMULHW      `_m64 _mm_mulhi_pi16 ( __m64 m1, __m64 m2)`  
 PMULHW      `_m128i _mm_mulhi_epi16 ( __m128i a, __m128i b)`

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                                                                |
|---------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                              |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                             |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM           | CR0 の TS がセットされた場合。                                                                                                                                            |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                                                |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                                  |

### 実アドレスモード例外

|        |                                                                                                                                                                |
|--------|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。                                                       |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                                            |

## PMULHW—Multiply Packed Signed Integers and Store High Result (続き)

#MF (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフェルトが発生した場合。

#AC(0) (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

## PMULLW—Multiply Packed Signed Integers and Store Low Result

| オペコード       | 命令                            | 説明                                                                                 |
|-------------|-------------------------------|------------------------------------------------------------------------------------|
| 0F D5 /r    | PMULLW <i>mm, mm/m64</i>      | <i>mm1</i> レジスタと <i>mm2/m64</i> のパックド符号付きワード整数を乗算し、結果の下位 16 ビットを <i>mm1</i> に格納する。 |
| 66 0F D5 /r | PMULLW <i>xmm1, xmm2/m128</i> | <i>xmm1</i> と <i>xmm2/m128</i> のパックド符号付きワード整数を乗算し、結果の下位 16 ビットを <i>xmm1</i> に格納する。 |

### 説明

デスティネーション・オペランド（第 1 オペランド）とソース・オペランド（第 2 オペランド）のパックド符号付きワード整数の SIMD 符号付き乗算を実行し、それぞれの 32 ビットの中間結果の下位 16 ビットをデスティネーション・オペランドに格納する（図 4-4. は、64 ビット・オペランドを使用する場合の操作を示している）。ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーションか、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたは XMM レジスタである。



図 4-4. 64 ビット・オペランドを使用した PMULLW 命令の動作

### 操作

PMULLW instruction with 64-bit operands:

```

TEMP0[31-0] ← DEST[15-0] * SRC[15-0]; * Signed multiplication *
TEMP1[31-0] ← DEST[31-16] * SRC[31-16];
TEMP2[31-0] ← DEST[47-32] * SRC[47-32];
TEMP3[31-0] ← DEST[63-48] * SRC[63-48];
DEST[15-0] ← TEMP0[15-0];
DEST[31-16] ← TEMP1[15-0];
DEST[47-32] ← TEMP2[15-0];
DEST[63-48] ← TEMP3[15-0];

```

## PMULLW—Multiply Packed Signed Integers and Store Low Result (続き)

PMULLW instruction with 64-bit operands:

```

TEMP0[31-0] ← DEST[15-0] * SRC[15-0]; * Signed multiplication *
TEMP1[31-0] ← DEST[31-16] * SRC[31-16];
TEMP2[31-0] ← DEST[47-32] * SRC[47-32];
TEMP3[31-0] ← DEST[63-48] * SRC[63-48];
TEMP4[31-0] ← DEST[79-64] * SRC[79-64];
TEMP5[31-0] ← DEST[95-80] * SRC[95-80];
TEMP6[31-0] ← DEST[111-96] * SRC[111-96];
TEMP7[31-0] ← DEST[127-112] * SRC[127-112];
DEST[15-0] ← TEMP0[15-0];
DEST[31-16] ← TEMP1[15-0];
DEST[47-32] ← TEMP2[15-0];
DEST[63-48] ← TEMP3[15-0];
DEST[79-64] ← TEMP4[15-0];
DEST[95-80] ← TEMP5[15-0];
DEST[111-96] ← TEMP6[15-0];
DEST[127-112] ← TEMP7[15-0];

```

同等のインテル® C/C++ コンパイラ組み込み関数

|        |                                                              |
|--------|--------------------------------------------------------------|
| PMULLW | <code>__m64 _mm_mullo_pi16(__m64 m1, __m64 m2)</code>        |
| PMULLW | <code>__m128i _mm_mullo_epi16 ( __m128i a, __m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                                                                |
|---------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                              |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                             |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM           | CR0 の TS がセットされた場合。                                                                                                                                            |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                                                |

## PMULLW—Multiply Packed Signed Integers and Store Low Result (続き)

#AC(0) (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

#GP(0) (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。

オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。

#UD CR0 の EM がセットされた場合。

CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。

#NM CR0 の TS がセットされた場合。

#MF (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

## PMULUDQ—Multiply Packed Unsigned Doubleword Integers

| オペコード       | 命令                             | 説明                                                                                                   |
|-------------|--------------------------------|------------------------------------------------------------------------------------------------------|
| 0F F4 /r    | PMULUDQ <i>mm1, mm2/m64</i>    | <i>mm1</i> の符号なしダブルワード整数に <i>mm2/m64</i> の符号なしダブルワード整数を掛けて、結果のクワッドワードを <i>mm1</i> に格納する。             |
| 66 OF F4 /r | PMULUDQ <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のパックド符号なしダブルワード整数に <i>xmm2/m128</i> のパックド符号なしダブルワード整数を掛けて、結果のクワッドワードを <i>xmm1</i> に格納する。 |

### 説明

第1オペランド（デスティネーション・オペランド）に第2オペランド（ソース・オペランド）を掛け、結果をデスティネーション・オペランドに格納する。ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーションの下位ダブルワードに格納される 1 つの符号なしダブルワード整数か、XMM レジスタまたは 128 ビットのメモリ・ロケーションの第1（最下位）ダブルワードと第3ダブルワードに格納される 2 つのパックド符号なしダブルワード整数である。デスティネーション・オペランドは、MMX テクノロジ・レジスタの下位ダブルワードに格納される 1 つの符号なしダブルワード整数か、XMM レジスタの第1ダブルワードと第3ダブルワードに格納される 2 つのパックド・ダブルワード整数である。得られる結果は、デスティネーションである MMX テクノロジ・レジスタにストアされた符号なしクワッドワード整数か、XMM レジスタにストアされた 2 つのパックド符号なしクワッドワード整数である。結果のクワッドワードが大きすぎて 64 ビットで表現できない場合は（オーバーフロー）、結果はラップアラウンドされ、下位 64 ビットがデスティネーション要素に書き込まれる（すなわち、キャリーは無視される）。

64 ビット・メモリ・オペランドの場合は 64 ビットがメモリからフェッチされるが、下位のダブルワードしか計算に使用されない。128 ビット・メモリ・オペランドの場合は 128 ビットがメモリからフェッチされるが、第1および第3のダブルワードしか計算に使用されない。

### 操作

PMULUDQ instruction with 64-Bit operands:  
 $DEST[63-0] \leftarrow DEST[31-0] * SRC[31-0];$

PMULUDQ instruction with 128-Bit operands:  
 $DEST[63-0] \leftarrow DEST[31-0] * SRC[31-0];$   
 $DEST[127-64] \leftarrow DEST[95-64] * SRC[95-64];$

### 同等のインテル® C/C++ コンパイラ組み込み関数

|         |                                                            |
|---------|------------------------------------------------------------|
| PMULUDQ | <code>__m64 _mm_mul_su32 ( __m64 a, __m64 b)</code>        |
| PMULUDQ | <code>__m128i _mm_mul_epu32 ( __m128i a, __m128i b)</code> |

## PMULUDQ—Multiply Packed Unsigned Doubleword Integers（続き）

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                 |
|---------------|-----------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが、CS、DS、ES、FS、またはGSセグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                              |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。           |
| #NM           | CR0 の TS がセットされた場合。                                                                                             |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                 |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックが有効になっており、現行特権レベルが 3 のときにアライメントの合っていないメモリ参照を行った場合。                                      |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                             |
|---------------|-------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                             |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックが有効になっており、アライメントの合っていないメモリ参照を行った場合。 |

## POP—Pop a Value from the Stack

| オペコード         | 命令             | 説明                                             |
|---------------|----------------|------------------------------------------------|
| 8F /0         | POP <i>m16</i> | スタックのトップを <i>m16</i> にポップし、スタックポインタをインクリメントする。 |
| 8F /0         | POP <i>m32</i> | スタックのトップを <i>m32</i> にポップし、スタックポインタをインクリメントする。 |
| 58+ <i>rw</i> | POP <i>r16</i> | スタックのトップを <i>r16</i> にポップし、スタックポインタをインクリメントする。 |
| 58+ <i>rd</i> | POP <i>r32</i> | スタックのトップを <i>r32</i> にポップし、スタックポインタをインクリメントする。 |
| 1F            | POP DS         | スタックのトップを DS にポップし、スタックポインタをインクリメントする。         |
| 07            | POP ES         | スタックのトップを ES にポップし、スタックポインタをインクリメントする。         |
| 17            | POP SS         | スタックのトップを SS にポップし、スタックポインタをインクリメントする。         |
| 0F A1         | POP FS         | スタックのトップを FS にポップし、スタックポインタをインクリメントする。         |
| 0F A9         | POP GS         | スタックのトップを GS にポップし、スタックポインタをインクリメントする。         |

### 説明

値をスタックのトップからデスティネーション・オペランドで指定されたロケーションにロードし、スタックポインタをインクリメントする。デスティネーション・オペランドには、汎用レジスタ、メモリ・ロケーション、またはセグメント・レジスタを使用できる。

スタック・セグメントのアドレス・サイズ属性によって、スタックポインタのサイズ（16 ビットまたは 32 ビット—ソース・アドレスのサイズ）が決まり、現在のコード・セグメントのオペランド・サイズ属性によって、スタックポインタをインクリメントする量（2 バイトまたは 4 バイト）が決まる。例えば、これらのアドレス・サイズ属性およびオペランド・サイズ属性が 32 である場合は、32 ビットの ESP レジスタ（スタックポインタ）が 4 インクリメントされ、それらの属性が 16 である場合は、16 ビットの SP レジスタが 2 インクリメントされる。（スタック・セグメントのセグメント・ディスクリプタの B フラグによって、スタックのアドレスサイズ属性が決まり、現在のコード・セグメントのセグメント・ディスクリプタの D フラグ（プリフィックスとともに）によって、オペランド・サイズ属性およびデスティネーション・オペランドのアドレスサイズ属性が決まる。）

## POP—Pop a Value from the Stack (続き)

デスティネーション・オペランドがセグメント・レジスタ DS、ES、FS、GS、または SS の 1 つである場合は、レジスタにロードされる値は、有効なセグメント・セレクタでなければならない。保護モードでは、セグメント・セレクタをセグメント・レジスタにポップすると、そのセグメント・セレクタに関連するディスクリプタ情報がセグメント・レジスタの隠蔽（シャドー）部分に自動的にロードされ、セレクタおよびディスクリプタの情報が有効にされる（下記の「操作」の項を参照）。

一般保護フォルトを発生させずにヌル値（0000～0003）を DS、ES、FS、または GS レジスタにポップすることができる。ただし、対応するセグメント・レジスタにヌル値がロードされているセグメントをその後で参照しようとするとき、一般保護例外 (#GP) が発生する。この状況では、メモリ参照は行われず、セグメント・レジスタのセーブされた値はヌルである。

POP 命令では、値を CS レジスタにポップすることはできない。スタックから CS レジスタにロードするには、RET 命令を使用する。

メモリ内のデスティネーション・オペランドのアドレスを指定するベースレジスタとして ESP レジスタを使用すると、POP 命令は、ESP レジスタをインクリメントした後にオペランドの実効アドレスを計算する。16 ビット・スタックで POP 命令を実行した結果、ESP レジスタが 0h にラップされた場合は、結果のメモリ書き込みの位置はプロセッサのファミリによって異なる。

POP ESP 命令は、スタックの古いトップにあるデータをデスティネーションに書き込む前に、スタックポインタ（ESP）をインクリメントする。

POP SS 命令は、次の命令の実行後まで、NMI 割り込みを含めたすべての割り込みを禁止する。この処置によって、POP SS 命令および MOV ESP,EBP 命令を逐次に実行しても、割り込みによってスタックが無効になる危険はない<sup>2</sup>。ただし、SS レジスタおよび ESP レジスタをロードする方法としては、LSS 命令の使用が望ましい。

---

2. 以降の命令を過ぎて割り込みを個別にディレイさせる命令シーケンスでは、シーケンスの最初の命令は、割り込みをディレイさせることが保証されるが、後続の割り込みディレイ命令は、割り込みをディレイさせない場合があることに注意する。そのため、次の命令シーケンス

```
STI  
POP SS  
POP ESP
```

では、STI も 1 命令の間割り込みをディレイさせており、POP ESP が実行される前に、割り込みが認識されることがある。

## POP—Pop a Value from the Stack (続き)

### 操作

```

IF StackAddrSize = 32
    THEN
        IF OperandSize = 32
            THEN
                DEST ← SS:ESP; (* copy a doubleword *)
                ESP ← ESP + 4;
            ELSE (* OperandSize = 16*)
                DEST ← SS:ESP; (* copy a word *)
                ESP ← ESP + 2;
            FI;
        ELSE (* StackAddrSize = 16* )
            IF OperandSize = 16
                THEN
                    DEST ← SS:SP; (* copy a word *)
                    SP ← SP + 2;
                ELSE (* OperandSize = 32 *)
                    DEST ← SS:SP; (* copy a doubleword *)
                    SP ← SP + 4;
                FI;
            FI;

```

保護モードの間にセグメント・レジスタをロードすると、以下のリストで説明しているように特殊な処置が行われる。これらのチェックは、セグメント・セレクタとそれが指しているセグメント・ディスクリプタに対して行われる。

```

IF SS is loaded;
    THEN
        IF segment selector is null
            THEN #GP(0);
        FI;
        IF segment selector index is outside descriptor table limits
            OR segment selector's RPL ≠ CPL
            OR segment is not a writable data segment
            OR DPL ≠ CPL
                THEN #GP(selector);
        FI;
        IF segment not marked present
            THEN #SS(selector);
    ELSE
        SS ← segment selector;
        SS ← segment descriptor;
    FI;
FI;
IF DS, ES, FS, or GS is loaded with non-null selector;
THEN
    IF segment selector index is outside descriptor table limits
        OR segment is not a data or readable code segment

```

## POP—Pop a Value from the Stack (続き)

```

OR ((segment is a data or nonconforming code segment)
    AND (both RPL and CPL > DPL))
        THEN #GP(selector);
IF segment not marked present
    THEN #NP(selector);
ELSE
    SegmentRegister ← segment selector;
    SegmentRegister ← segment descriptor;
FI;
FI;
IF DS, ES, FS, or GS is loaded with a null selector;
THEN
    SegmentRegister ← segment selector;
    SegmentRegister ← segment descriptor;
FI;

```

### 影響を受けるフラグ

なし。

### 保護モード例外

|            |                                                                                                                                                                                                                                                                                                                                                        |
|------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)     | ヌル・セグメント・セレクタで SS レジスタをロードしようとした場合。<br>デスティネーション・オペランドが書き込み不可能なセグメントにある場合。<br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>DS、ES、FS、または GS レジスタを使用してメモリがアクセスされ、レジスタの内容がヌル・セグメント・セレクタであった場合。                                                                                                                                                   |
| #GP (セレクタ) | セグメント・セレクタ・インデックスがディスクリプタ・テーブルの範囲外の場合。<br>SS レジスタがロードされ、セグメント・セレクタの RPL およびセグメント・ディスクリプタの DPL が CPL に等しくない場合。<br>SS レジスタがロードされ、指示先のセグメントが書き込み不可能なデータ・セグメントである場合。<br>DS、ES、FS、または GS レジスタがロードされ、指示先のセグメントがデータ・セグメントまたは読み取り可能なコード・セグメントでない場合。<br>DS、ES、FS、または GS レジスタがロードされ、指示先のセグメントがデータ・セグメントまたは非コンフォーミング・コード・セグメントであるが、RPL および CPL の両方とも DPL より大きい場合。 |

## POP—Pop a Value from the Stack (続き)

|               |                                                                     |
|---------------|---------------------------------------------------------------------|
| #SS(0)        | スタックの現在のトップがスタック・セグメント内にない場合。<br>メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。 |
| #SS (セレクタ)    | SS レジスタがロードされ、指示先のセグメントが存在しないとマークされている場合。                           |
| #NP           | DS、ES、FS、または GS レジスタがロードされ、指示先のセグメントが存在しないとマークされている場合。              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                     |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。    |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
|-----|----------------------------------------------------|

### 仮想 8086 モード例外

|               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## POPA/POPAD—Pop All General-Purpose Registers

| オペコード | 命令    | 説明                                  |
|-------|-------|-------------------------------------|
| 61    | POPA  | DI、SI、BP、BX、DX、CX、AX をポップする。        |
| 61    | POPAD | EDI、ESI、EBP、EBX、EDX、ECX、EAX をポップする。 |

### 説明

ダブルワード (POPAD) またはワード (POPA) をスタックから汎用レジスタにポップする。レジスタがロードされる順番は、(オペランド・サイズ属性が 32 である場合は) EDI、ESI、EBP、EBX、EDX、ECX、EAX であり、(オペランド・サイズ属性が 16 である場合は) DI、SI、BP、BX、DX、CX、AX である。これらの命令は、PUSHA/PUSHAD 命令の逆の操作を実行する。ESP レジスタまたは SP レジスタのスタック上の値は無視される。その代わりに、ESP レジスタまたは SP レジスタは、各レジスタがロードされた後にインクリメントされる。

POPA (すべてをポップ) ニーモニックおよび POPAD (すべてのダブルをポップ) ニーモニックは、同じオペコードを参照する。POPA 命令は、オペランド・サイズ属性が 16 であるときに使用するためのものであり、POPAD 命令は、オペランド・サイズ属性が 32 であるときに使用するためのものである。一部のアセンブラーは、(必要な場合にはオペランド・サイズ・オーバライド・プリフィックス [66H] を使用して) POPA が使用されるときはオペランド・サイズを 16 に、POPAD が使用されるときは 32 に強制する。他のアセンブラーは、これらのニーモニックをシノニム (POPA/POPAD) として取り扱い、オペランド・サイズ属性の現在の設定を使用して、使用されているニーモニックに関係なく、スタックからポップする値のサイズを決定することができる。(現在のコード・セグメントのセグメント・ディスクリプタの D フラグによって、オペランド・サイズ属性が決まる。)

### 操作

```

IF OperandSize = 32 (* instruction = POPAD *)
THEN
    EDI ← Pop();
    ESI ← Pop();
    EBP ← Pop();
    increment ESP by 4 (* skip next 4 bytes of stack *)
    EBX ← Pop();
    EDX ← Pop();
    ECX ← Pop();
    EAX ← Pop();

```

## POPA/POPAD—Pop All General-Purpose Registers（続き）

```

ELSE (* OperandSize = 16, instruction = POPA *)
    DI ← Pop();
    SI ← Pop();
    BP ← Pop();
    increment ESP by 2 (* skip next 2 bytes of stack *)
    BX ← Pop();
    DX ← Pop();
    CX ← Pop();
    AX ← Pop();
FI;

```

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                  |
|---------------|------------------------------------------------------------------|
| #SS(0)        | 開始スタックアドレスまたは終了スタックアドレスがスタック・セグメント内にない場合                         |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|     |                                           |
|-----|-------------------------------------------|
| #SS | 開始スタックアドレスまたは終了スタックアドレスがスタック・セグメント内にない場合。 |
|-----|-------------------------------------------|

### 仮想 8086 モード例外

|               |                                                  |
|---------------|--------------------------------------------------|
| #SS(0)        | 開始スタックアドレスまたは終了スタックアドレスがスタック・セグメント内にない場合。        |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                  |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## POPF/POPFD—Pop Stack into EFLAGS Register

| オペコード | 命令    | 説明                             |
|-------|-------|--------------------------------|
| 9D    | POPF  | スタックのトップをEFLAGSの下位16ビットにポップする。 |
| 9D    | POPFD | スタックのトップをEFLAGSにポップする。         |

### 説明

(現在のオペランド・サイズ属性が 32 である場合は) ダブルワード (POPFD) をスタックのトップからポップして、値を EFLAGS レジスタにストアする。(オペランド・サイズ属性が 16 である場合は) ワードをスタックのトップからポップして、値を EFLAGS レジスタの下位 16 ビット (すなわち、FLAGS レジスタ) にストアする。これらの命令は、PUSHF/PUSHFD 命令の逆の操作を実行する。

POPF (フラグをポップ) ニーモニックおよび POPFD (フラグダブルをポップ) ニーモニックは、同じオペコードを参照する。POPF 命令は、オペランド・サイズ属性が 16 であるときに使用するためのものであり、POPFD 命令は、オペランド・サイズ属性が 32 であるときに使用するためのものである。一部のアセンブラーは、POPF が使用されるときはオペランド・サイズを 16 に、POPFD が使用されるときは 32 に強制する。他のアセンブラーは、これらのニーモニックをシノニム (POPF/POPFD) として取り扱い、オペランド・サイズ属性の現在の設定を使用して、使用されているニーモニックに関係なく、スタックからポップする値のサイズを決定することができる。

EFLAGS レジスタへの POPF/POPFD 命令の影響は、プロセッサの動作モードに応じて少し変わる。プロセッサが特権レベル 0 の保護モード (または特権レベル 0 に同等である実アドレスモード) で動作しているときは、VIP、VIF、VM フラグを除く EFLAGS レジスタのすべての非予約フラグは修正される可能性がある。VIP および VIF フラグはクリアされ、VM フラグは影響を受けない。

特権レベルが 0 より大きいけれども IOPL 以下である保護モードで動作しているときは、IOPL フィールドと VIP、VIF、VM フラグを除くすべてのフラグは修正される可能性がある。この場合も、IOPL のフラグは影響を受けず、VIP および VIF フラグはクリアされ、VM フラグは影響を受けない。割り込みフラグ (IF) は、IOPL と少なくとも同じ特権レベルで動作しているときだけに変更される。POPF/POPFD 命令が不十分な特権で実行されていても、例外は発生しないが、特権ビットは変わらない。

仮想 8086 モードで動作しているときは、I/O 特権レベル (IOPL) は、POPF/POPFD 命令を使用するには 3 に等しくなければならず、VM、RF、IOPL、VIP、VIF フラグは影響を受けない。IOPL が 3 より小さい場合、POPF/POPFD 命令は一般保護例外 (#GP) を発生させる。

EFLAGS レジスタの詳細については、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の第 3 章の「EFLAGS レジスタ」を参照のこと。

## POPF/POPFD—Pop Stack into EFLAGS Register (続き)

### 操作

```

IF VM=0 (* Not in Virtual-8086 Mode *)
    THEN IF CPL=0
        THEN
            IF OperandSize = 32;
                THEN
                    EFLAGS ← Pop();
                    (* All non-reserved flags except VIP, VIF, and VM can be modified; *)
                    (* VIP and VIF are cleared; VM is unaffected*)
                ELSE (* OperandSize = 16 *)
                    EFLAGS[15:0] ← Pop(); (* All non-reserved flags can be modified; *)
                FI;
            ELSE (* CPL > 0 *)
                IF OperandSize = 32;
                    THEN
                        EFLAGS ← Pop()
                        (* All non-reserved bits except IOPL, VIP, and VIF can be modified; *)
                        (* IOPL is unaffected; VIP and VIF are cleared; VM is unaffected *)
                    ELSE (* OperandSize = 16 *)
                        EFLAGS[15:0] ← Pop();
                        (* All non-reserved bits except IOPL can be modified *)
                        (* IOPL is unaffected *)
                    FI;
                FI;
            ELSE (* In Virtual-8086 Mode *)
                IF IOPL=3
                    THEN IF OperandSize=32
                        THEN
                            EFLAGS ← Pop()
                            (* All non-reserved bits except VM, RF, IOPL, VIP, and VIF *)
                            (* can be modified; VM, RF, IOPL, VIP, and VIF are unaffected *)
                        ELSE
                            EFLAGS[15:0] ← Pop()
                            (* All non-reserved bits except IOPL can be modified *)
                            (* IOPL is unaffected *)
                        FI;
                    ELSE (* IOPL < 3 *)
                        #GP(0); (* trap to virtual-8086 monitor *)
                    FI;
                FI;
            FI;
        FI;
    FI;

```

## POPF/POPFD—Pop Stack into EFLAGS Register (続き)

### 影響を受けるフラグ

予約ビットと VM ビットを除くすべてのフラグ。

### 保護モード例外

- #SS(0) スタックのトップがスタック・セグメント内にない場合。
- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

- #SS スタックのトップがスタック・セグメント内にない場合。

### 仮想 8086 モード例外

- #GP(0) I/O 特権レベルが 3 より小さい場合。  
オペランド・サイズ・オーバライド・プリフィックスの付いた POPF/POPFD 命令を実行しようとした場合。
- #SS(0) スタックのトップがスタック・セグメント内にない場合。
- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

## POR—Bitwise Logical OR

| オペコード       | 命令                         | 説明                                                     |
|-------------|----------------------------|--------------------------------------------------------|
| 0F EB /r    | POR <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のビット単位の OR（論理和）演算を実行する。      |
| 66 0F EB /r | POR <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のビット単位の OR（論理和）演算を実行する。 |

### 説明

クワッドワードのソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）との間のビット単位のOR（論理和）演算を実行し、結果をデスティネーション・オペランドにストアする。ソース・オペランドには、MMX® テクノロジ・レジスタまたは64ビットのメモリ・ロケーション、XMM レジスタまたは128ビットのメモリ・ロケーションを使用できる。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたはXMM レジスタでなければならない。結果の各ビットは、第1オペランドと第2オペランドの対応するビットのうちいずれか一方または両方が1の場合は1に設定され、それ以外の場合は0に設定される。

### 操作

DEST ← DEST OR SRC;

### 同等のインテル® C/C++ コンパイラ組み込み関数

|     |                                                           |
|-----|-----------------------------------------------------------|
| POR | <code>__m64 _mm_or_si64(__m64 m1, __m64 m2)</code>        |
| POR | <code>__m128i _mm_or_si128(__m128i m1, __m128i m2)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|        |                                                                                                                                                              |
|--------|--------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                                             |
| #SS(0) | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                                           |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合にのみ、128ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                                                                          |
| #MF    | (64ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                                                            |

## POR—Bitwise Logical OR (続き)

- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

- #GP(0) (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。  
オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。
- #UD CR0 の EM がセットされた場合。  
CR4 の OSFXSR が 0 の場合にのみ、128 ビット操作によって #UD が発生する。SSE2 に対応していないプロセッサ (MMX テクノロジ対応プロセッサ) 上で 128 ビット命令を実行した場合、その命令は mm レジスタを操作し、#UD は発生しない。
- #NM CR0 の TS がセットされた場合。
- #MF (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

## PREFETCHh—Prefetch Data Into Caches

| オペコード    | 命令                    | 説明                                          |
|----------|-----------------------|---------------------------------------------|
| 0F 18 /1 | PREFETCHT0 <i>m8</i>  | T0 ヒントを使用して、 <i>m8</i> のデータをプロセッサの近くに移動する。  |
| 0F 18 /2 | PREFETCHT1 <i>m8</i>  | T1 ヒントを使用して、 <i>m8</i> のデータをプロセッサの近くに移動する。  |
| 0F 18 /3 | PREFETCHT2 <i>m8</i>  | T2 ヒントを使用して、 <i>m8</i> のデータをプロセッサの近くに移動する。  |
| 0F 18 /0 | PREFETCHNTA <i>m8</i> | NTA ヒントを使用して、 <i>m8</i> のデータをプロセッサの近くに移動する。 |

### 説明

ソース・オペランドで指定されたバイトを含むメモリから、ローカリティのヒントで指定されたキャッシュ階層内の位置にデータのラインをフェッチする。

- T0 テンポラル・データ – キャッシュ階層のすべてのレベルにデータをプリフェッチする。
  - インテル® Pentium® III プロセッサー – 第 1 レベル・キャッシュまたは第 2 レベル・キャッシュ
  - インテル® Pentium® 4 プロセッサおよびインテル® Xeon™ プロセッサー – 第 2 レベル・キャッシュ
- T1 第 1 キャッシュ・レベル以上についてテンポラル・データ – L2 キャッシュ以上にデータをプリフェッチする。
  - インテル Pentium III プロセッサー – 第 2 レベル・キャッシュ
  - インテル Pentium 4 プロセッサおよびインテル Xeon プロセッサー – 第 2 レベル・キャッシュ
- T2 第 2 キャッシュ・レベル以上についてテンポラル・データ – L2 キャッシュ以上にデータをプリフェッチする。
  - インテル Pentium III プロセッサー – 第 2 レベル・キャッシュ
  - インテル Pentium 4 プロセッサおよびインテル Xeon プロセッサー – 第 2 レベル・キャッシュ
- NTA すべてのキャッシュ・レベルについて非テンポラル・データ – キャッシュの汚染を最小限に抑えて、非テンポラルなキャッシュ構造とプロセッサへのロケーション・クローズにデータをプリフェッチする。
  - インテル Pentium III プロセッサー – 第 1 レベル・キャッシュ
  - インテル Pentium 4 プロセッサおよびインテル Xeon プロセッサー – 第 2 レベル・キャッシュ

## PREFETCHh—Prefetch Data Into Caches (続き)

ソース・オペランドは、1バイトのメモリ・ロケーションである（ローカリティのヒントは、ModR/M バイトのビット 3～5 を使用して、マシンレベルの命令にエンコーディングされる。上記の値以外の ModR/M 値を指定すると、予測不可能な動作が発生する）。

選択されたラインが、指定されたレベルよりプロセッサに近いキャッシュ階層レベルにすでに存在する場合は、データの転送は行われない。キャッシュ不可メモリまたは WC メモリに対するプリフェッチ命令は無視される。

PREFETCHh 命令は単なるヒントであり、プログラムの動作には影響を与えない。この命令は、実行された場合、これから使用されることが予想されるデータを、プロセッサの近くに移動する。

プリフェッチのローカリティ・ヒントの影響はプロセッサによって異なり、オーバーロードされたり、無視されたりする可能性がある。プリフェッチされるデータのサイズもプロセッサによって異なるが、最小でも 32 バイトのデータがプリフェッチされる。

プロセッサは、見込み的な読み込みが許されるメモリタイプ（すなわち、WB、WC、および WT メモリタイプ）が割り当てられたシステムメモリ領域から、いつでもデータを見込み的にフェッチしてキャッシュに入れることができる。PREFETCHh 命令は、この見込み的な動作に対するヒントと見なされる。この見込み的なフェッチ動作は、命令の実行には拘束されず、任意の時点で発生する。したがって、PREFETCHh 命令は、フェンス命令 (MFENCE、SFENCE、LFENCE) やロックされたメモリ参照に対して順序付けされない。また、PREFETCHh 命令は、CLFLUSH 命令、他の PREFETCHh 命令、あるいは他の汎用命令に対しても順序付けされない。ただし、PREFETCHh 命令は、CPUID、WRMSR、OUT、MOV CR などのシリアル化命令に対しては順序付けされる。

### 操作

FETCH (m8);

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
void _mm_prefetch(char *p, int i)
```

引き数 "\*p" は、プリフェッチされるバイト（および対応するキャッシュ・ライン）のアドレスを示す。値 "i" は、実行されるプリフェッチ操作のタイプを指定する定数 (\_MM\_HINT\_T0、\_MM\_HINT\_T1、\_MM\_HINT\_T2、または \_MM\_HINT\_NTA) を示す。

## PREFETCHh—Prefetch Data Into Caches（続き）

### 数値例外

なし。

### 保護モード例外

なし。

### 実アドレスモード例外

なし。

### 仮想 8086 モード例外

なし。

## PSADBW—Compute Sum of Absolute Differences

| オペコード       | 命令                            | 説明                                                                                                   |
|-------------|-------------------------------|------------------------------------------------------------------------------------------------------|
| 0F F6 /r    | PSADBW <i>mm1, mm2/m64</i>    | <i>mm2/m64</i> と <i>mm1</i> の符号なしパックドバイト整数の差の絶対値を計算し、得られた差を合計して 1 符号なしワードの結果を返す。                     |
| 66 0F F6 /r | PSADBW <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のパックド符号なしバイト整数の差の絶対値を計算し、下位の 8 つの差と上位の 8 つの差を別々に合計して 2 つのワード整数の結果を返す。 |

### 説明

ソース・オペランド（第1オペランド）の8つの符号なしバイト整数とデスティネーション・オペランド（第2オペランド）の8つの符号なしバイト整数の差の絶対値を計算する。次に、得られた8つの差を合計して1つの符号なしワード整数を求め、結果をデスティネーション・オペランドに格納する。ソース・オペランドは、MMX®テクノロジ・レジスタまたは64ビットのメモリ・ロケーションか、XMM レジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたはXMM レジスタである。図4-5.は、64ビット・オペランドを使用する場合のPSADBW命令の操作を示している。

64ビット・オペランドを操作する場合は、結果のワード整数はデスティネーション・オペランドの下位ワードに格納され、デスティネーション・オペランドのその他のバイトはすべて0にクリアされる。

128ビット・オペランドを操作する場合は、2つの結果が計算され、パックされる。この場合は、ソース・オペランドとデスティネーション・オペランドの下位の8バイトを操作して1ワードの結果を求め、デスティネーション・オペランドの最下位ワードに格納する。また、上位の8バイトを操作して1ワードの結果を求め、デスティネーション・オペランドのビット64～79に格納する。デスティネーション・オペランドのその他のバイトはすべてクリアされる。

## PSADBW—Compute Sum of Absolute Differences (続き)

|      |            |            |            |            |            |            |                    |            |
|------|------------|------------|------------|------------|------------|------------|--------------------|------------|
| SRC  | X7         | X6         | X5         | X4         | X3         | X2         | X1                 | X0         |
| DEST | Y7         | Y6         | Y5         | Y4         | Y3         | Y2         | Y1                 | Y0         |
| TEMP | ABS(X7-Y7) | ABS(X6-Y6) | ABS(X5-Y5) | ABS(X4-Y4) | ABS(X3-Y3) | ABS(X2-Y2) | ABS(X1-Y1)         | ABS(X0-Y0) |
| DEST | 00H        | 00H        | 00H        | 00H        | 00H        | 00H        | SUM(TEMP7...TEMP0) |            |

図 4-5. 64 ビット・オペランドを使用した PSADBW 命令の操作

### 操作

PSADBW instructions when using 64-bit operands:

```

TEMP0 ← ABS(DEST[7-0] – SRC[7-0]);
* repeat operation for bytes 2 through 6 *;
TEMP7 ← ABS(DEST[63-56] – SRC[63-56]);
DEST[15:0] ← SUM(TEMP0...TEMP7);
DEST[63:16] ← 000000000000H;

```

PSADBW instructions when using 128-bit operands:

```

TEMP0 ← ABS(DEST[7-0] – SRC[7-0]);
* repeat operation for bytes 2 through 14 *;
TEMP15 ← ABS(DEST[127-120] – SRC[127-120]);
DEST[15:0] ← SUM(TEMP0...TEMP7);
DEST[63:6] ← 000000000000H;
DEST[79-64] ← SUM(TEMP8...TEMP15);
DEST[127-80] ← 000000000000H;

```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|        |                                                        |
|--------|--------------------------------------------------------|
| PSADBW | <code>__m64_mm_sad_pu8(__m64 a,__m64 b)</code>         |
| PSADBW | <code>__m128i_mm_sad_epu8(__m128i a, __m128i b)</code> |

### 影響を受けるフラグ

なし。

## PSADBW—Compute Sum of Absolute Differences (続き)

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PSHUFD—Shuffle Packed Doublewords

| オペコード          | 命令                                             | 説明                                                                                 |
|----------------|------------------------------------------------|------------------------------------------------------------------------------------|
| 66 0F 70 /r ib | PSHUFD <i>xmm1</i> ,<br><i>xmm2/m128, imm8</i> | <i>imm8</i> のエンコーディングに基づいて、 <i>xmm2/m128</i> のダブルワードをシャッフルし、結果を <i>xmm1</i> に格納する。 |

### 説明

ソース・オペランド（第2オペランド）からダブルワードをコピーして、オーダー・オペランド（第3オペランド）で選択されたデスティネーション・オペランド（第1オペランド）内の位置に挿入する。図4-6.は、PSHUFD命令の操作と、オーダー・オペランドのエンコーディングを示している。オーダー・オペランドのそれぞれの2ビット・フィールドは、デスティネーション・オペランドの1つのダブルワード位置の内容を指定する。例えば、オーダー・オペランドのビット0とビット1は、デスティネーション・オペランドのダブルワード0の内容を選択する。オーダー・オペランドのビット0とビット1のエンコーディング（図4-6.の各フィールドのエンコーディングを参照）によって、ソース・オペランドのどのダブルワードがデスティネーション・オペランドのダブルワード0にコピーされるかが決まる。



図 4-6. PSHUFD 命令の操作

ソース・オペランドは、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスタである。オーダー・オペランドは 8 ビットの即値である。

この命令は、ソース・オペランドのダブルワードを、デスティネーション・オペランドの2つ以上のダブルワード位置にコピーすることができる。

## PSHUFD—Shuffle Packed Doublewords (続き)

### 操作

```
DEST[31-0] ← (SRC >> (ORDER[1-0] * 32))[31-0]
DEST[63-32] ← (SRC >> (ORDER[3-2] * 32))[31-0]
DEST[95-64] ← (SRC >> (ORDER[5-4] * 32))[31-0]
DEST[127-96] ← (SRC >> (ORDER[7-6] * 32))[31-0]
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

`PSHUFD __m128i _mm_shuffle_epi32(__m128i a, int n)`

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                 |
|---------------|-------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが、CS、DS、ES、FS、またはGSセグメントの範囲外の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが16バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスがSSセグメントの範囲外の場合。                                                                |
| #UD           | CR0のEMがセットされた場合。<br>CR4のOSFXSRが0の場合。                                                            |
|               | CPUID機能フラグSSE2が0の場合。                                                                            |
| #NM           | CR0のTSがセットされた場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                 |

### 実アドレスモード例外

|        |                                                                                  |
|--------|----------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが16バイトに合っていない場合。<br>オペランドの一部が0～FFFFHの実効アドレス空間の範囲外の場合。 |
| #UD    | CR0のEMがセットされた場合。<br>CR4のOSFXSRが0の場合。                                             |
|        | CPUID機能フラグSSE2が0の場合。                                                             |
| #NM    | CR0のTSがセットされた場合。                                                                 |

### 仮想8086モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## PSHUFD—Shuffle Packed Doublewords (続き)

### 数値例外

なし。

## PSHUFHW—Shuffle Packed High Words

| オペコード          | 命令                                              | 説明                                                                                |
|----------------|-------------------------------------------------|-----------------------------------------------------------------------------------|
| F3 0F 70 /r ib | PSHUFHW <i>xmm1</i> ,<br><i>xmm2/m128, imm8</i> | <i>imm8</i> のエンコーディングに基づいて、 <i>xmm2/m128</i> の上位ワードをシャッフルし、結果を <i>xmm1</i> に格納する。 |

### 説明

ソース・オペランド（第2オペランド）の上位クワッドワードからワードをコピーして、オーダー・オペランド（第3オペランド）で選択された、デスティネーション・オペランド（第1オペランド）の上位クワッドワード内のワード位置に挿入する。この操作は、図4-6.に示したPSHUFD命令の操作とよく似ている。PSHUFHW命令では、オーダー・オペランドのそれぞれの2ビット・フィールドは、デスティネーション・オペランドの上位クワッドワード内の1つのワード位置の内容を指定する。オーダー・オペランドの各フィールドの2進エンコーディングによって、ソース・オペランドの上位クワッドワードからデスティネーション・オペランドにコピーされるワード（0、1、2、または3、4）が選択される。ソース・オペランドの下位のクワッドワードがデスティネーション・オペランドの下位のクワッドワードにコピーされる。

ソース・オペランドは、XMMレジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドはXMMレジスタである。オーダー・オペランドは8ビットの即値である。

この命令は、ソース・オペランドの上位のクワッドワードのワードを、デスティネーション・オペランドの上位のクワッドワード内の2つ以上のワード位置にコピーすることができる。

### 操作

```

DEST[63-0] ← (SRC[63-0]
DEST[79-64] ← (SRC >> (ORDER[1-0] * 16 ))[79-64]
DEST[95-80] ← (SRC >> (ORDER[3-2] * 16 ))[79-64]
DEST[111-96] ← (SRC >> (ORDER[5-4] * 16 ))[79-64]
DEST[127-112] ← (SRC >> (ORDER[7-6] * 16 ))[79-64]
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

PSHUFHW      \_\_m128i \_mm\_shufflehi\_epi16(\_\_m128i a, int n)

### 影響を受けるフラグ

なし。

## PSHUFHW—Shuffle Packed High Words（続き）

### 保護モード例外

|               |                                                                                                     |
|---------------|-----------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが、CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                  |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。                           |
| #NM           | CR0 の TS がセットされた場合。                                                                                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                     |

### 実アドレスモード例外

|        |                                                                                      |
|--------|--------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。 |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。            |
| #NM    | CR0 の TS がセットされた場合。                                                                  |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

### 数値例外

なし。

## PSHUFLW—Shuffle Packed Low Words

| オペコード          | 命令                                              | 説明                                                                                |
|----------------|-------------------------------------------------|-----------------------------------------------------------------------------------|
| F2 0F 70 /r ib | PSHUFLW <i>xmm1</i> ,<br><i>xmm2/m128, imm8</i> | <i>imm8</i> のエンコーディングに基づいて、 <i>xmm2/m128</i> の下位ワードをシャッフルし、結果を <i>xmm1</i> に格納する。 |

### 説明

ソース・オペランド（第2オペランド）の下位クワッドワードからワードをコピーして、オーダー・オペランド（第3オペランド）で選択された、デスティネーション・オペランド（第1オペランド）の下位クワッドワード内のワード位置に挿入する。この操作は、図4-6.に示したPSHUFD命令の操作とよく似ている。PSHUFLW命令では、オーダー・オペランドのそれぞれの2ビット・フィールドは、デスティネーション・オペランドの下位クワッドワード内の1つのワード位置の内容を指定する。オーダー・オペランドの各フィールドの2進エンコーディングによって、ソース・オペランドの下位クワッドワードからデスティネーション・オペランドにコピーされるワード（0、1、2、または3）が選択される。ソース・オペランドの上位のクワッドワードがデスティネーション・オペランドの上位のクワッドワードにコピーされる。

ソース・オペランドは、XMMレジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドはXMMレジスタである。オーダー・オペランドは8ビットの即値である。

この命令は、ソース・オペランドの下位のクワッドワードのワードを、デスティネーション・オペランドの下位のクワッドワード内の2つ以上のワード位置にコピーすることができる。

### 操作

```

DEST[15-0] ← (SRC >> (ORDER[1-0] * 16 ))[15-0]
DEST[31-16] ← (SRC >> (ORDER[3-2] * 16 ))[15-0]
DEST[47-32] ← (SRC >> (ORDER[5-4] * 16 ))[15-0]
DEST[63-48] ← (SRC >> (ORDER[7-6] * 16 ))[15-0]
DEST[127-64] ← (SRC[127-64])

```

### 同等のインテル® C/C++ コンパイラ組み込み関数

PSHUFLW      `__m128i _mm_shufflelo_epi16(__m128i a, int n)`

### 影響を受けるフラグ

なし。

## PSHUFLW—Shuffle Packed Low Words（続き）

### 保護モード例外

|               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが、CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
|               | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。      |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #UD           | CR0 の EM がセットされた場合。                                |
|               | CR4 の OSFXSR が 0 の場合。                              |
|               | CPUID 機能フラグ SSE2 が 0 の場合。                          |
| #NM           | CR0 の TS がセットされた場合。                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |

### 実アドレスモード例外

|        |                                               |
|--------|-----------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
|        | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。           |
| #UD    | CR0 の EM がセットされた場合。                           |
|        | CR4 の OSFXSR が 0 の場合。                         |
|        | CPUID 機能フラグ SSE2 が 0 の場合。                     |
| #NM    | CR0 の TS がセットされた場合。                           |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

### 数値例外

なし。

## PSHUFW—Shuffle Packed Words

| オペコード       | 命令                                          | 説明                                                                           |
|-------------|---------------------------------------------|------------------------------------------------------------------------------|
| 0F 70 /r ib | PSHUFW <i>mm1</i> ,<br><i>mm2/m64, imm8</i> | <i>imm8</i> のエンコーディングに基づいて <i>mm2/m64</i> のワードをシャッフルし、 <i>mm1</i> の結果にストアする。 |

### 説明

ソース・オペランド（第2オペランド）からワードをコピーして、オーダー・オペランド（第3オペランド）で選択されたデスティネーション・オペランド（第1オペランド）内のワード位置に挿入する。この操作は、図4-6に示したPSHUFD命令の操作とよく似ている。PSHUFW命令では、オーダー・オペランドのそれぞれの2ビット・フィールドは、デスティネーション・オペランドの1つのワード位置の内容を指定する。オーダー・オペランドの各フィールドのエンコーディングによって、ソース・オペランドからデスティネーション・オペランドにコピーされるワードが選択される。

ソース・オペランドは、MMX®テクノロジ・レジスタまたは64ビットのメモリ・ロケーションである。デスティネーション・オペランドはMMXテクノロジ・レジスタである。オーダー・オペランドは8ビットの即値である。

この命令は、ソース・オペランドのワードを、デスティネーション・オペランドの2つ以上のワード位置にコピーすることができる。

### 操作

```
DEST[15-0] ← (SRC >> (ORDER[1-0] * 16 ))[15-0]
DEST[31-16] ← (SRC >> (ORDER[3-2] * 16 ))[15-0]
DEST[47-32] ← (SRC >> (ORDER[5-4] * 16 ))[15-0]
DEST[63-48] ← (SRC >> (ORDER[7-6] * 16 ))[15-0]
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

PSHUFW        \_\_m64 \_mm\_shuffle\_pi16(\_\_m64 a, int n)

### 影響を受けるフラグ

なし。

### 保護モード例外

|        |                                                 |
|--------|-------------------------------------------------|
| #GP(0) | メモリ・オペランドの実効アドレスがCS、DS、ES、FS、またはGSセグメントの範囲外の場合。 |
| #SS(0) | メモリ・オペランドの実効アドレスがSSセグメントの範囲外の場合。                |
| #UD    | CR0のEMがセットされた場合。                                |
| #NM    | CR0のTSがセットされた場合。                                |
| #MF    | 未処理のx87 FPU例外がある場合。                             |

## PSHUFW—Shuffle Packed Words（続き）

#PF（フォルトコード） ページフォルトが発生した場合。

#AC 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

#GP(0) オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。

#UD CR0 の EM がセットされた場合。

#NM CR0 の TS がセットされた場合。

#MF 未処理の x87 FPU 例外がある場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF（フォルトコード） ページフォルトが発生した場合。

#AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

## PSLLDQ—Shift Double Quadword Left Logical

| オペコード          | 命令                       | 説明                                                      |
|----------------|--------------------------|---------------------------------------------------------|
| 66 0F 73 /7 ib | PSLLDQ <i>xmm1, imm8</i> | <i>imm8</i> で指定されたバイト数だけ <i>xmm1</i> を左にシフトし、下位はゼロで埋める。 |

### 説明

カウント・オペランド（第2オペランド）で指定されたバイト数だけ、デスティネーション・オペランド（第1オペランド）を左にシフトする。空いた下位バイトはクリアされる（すべて0にセットされる）。カウント・オペランドで指定された値が15より大きい場合は、デスティネーション・オペランドはすべて0に設定される。デスティネーション・オペランドはXMMレジスタである。カウント・オペランドは8ビットの即値である。

### 操作

```
TEMP ← COUNT;
if (TEMP > 15) TEMP ← 16;
DEST ← DEST << (TEMP * 8);
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

PSLLDQ        \_\_m128i \_mm\_slli\_si128 ( \_\_m128i a, int imm)

### 影響を受けるフラグ

なし。

### 保護モード例外

|     |                                                                           |
|-----|---------------------------------------------------------------------------|
| #UD | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM | CR0 の TS がセットされた場合。                                                       |

### 実アドレスモード例外

保護モードと同じ例外。

### 仮想 8086 モード例外

保護モードと同じ例外。

### 数値例外

なし。

## PSLLW/PSLLD/PSLLQ—Shift Packed Data Left Logical

| オペコード          | 命令                           | 説明                                                         |
|----------------|------------------------------|------------------------------------------------------------|
| 0F F1 /r       | PSLLW <i>mm, mm/m64</i>      | <i>mm</i> のワードを <i>mm/m64</i> だけ左にシフトし、下位はゼロで埋める。          |
| 66 0F F1 /r    | PSLLW <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のワードを <i>xmm2/m128</i> だけ左にシフトし、下位はゼロで埋める。     |
| 0F 71 /6 ib    | PSLLW <i>mm, imm8</i>        | <i>mm</i> のワードを <i>imm8</i> だけ左にシフトし、下位はゼロで埋める。            |
| 66 0F 71 /6 ib | PSLLW <i>xmm1, imm8</i>      | <i>xmm1</i> のワードを <i>imm8</i> だけ左にシフトし、下位はゼロで埋める。          |
| 0F F2 /r       | PSLLD <i>mm, mm/m64</i>      | <i>mm</i> のダブルワードを <i>mm/m64</i> だけ左にシフトし、下位はゼロで埋める。       |
| 66 0F F2 /r    | PSLLD <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のダブルワードを <i>xmm2/m128</i> だけ左にシフトし、下位はゼロで埋める。  |
| 0F 72 /6 ib    | PSLLD <i>mm, imm8</i>        | <i>mm</i> のダブルワードを <i>imm8</i> だけ左にシフトし、下位はゼロで埋める。         |
| 66 0F 72 /6 ib | PSLLD <i>xmm1, imm8</i>      | <i>xmm1</i> のダブルワードを <i>imm8</i> だけ左にシフトし、下位はゼロで埋める。       |
| 0F F3 /r       | PSLLQ <i>mm, mm/m64</i>      | <i>mm</i> のクワッドワードを <i>mm/m64</i> だけ左にシフトし、下位はゼロで埋める。      |
| 66 0F F3 /r    | PSLLQ <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のクワッドワードを <i>xmm2/m128</i> だけ左にシフトし、下位はゼロで埋める。 |
| 0F 73 /6 ib    | PSLLQ <i>mm, imm8</i>        | <i>mm</i> のクワッドワードを <i>imm8</i> だけ左にシフトし、下位はゼロで埋める。        |
| 66 0F 73 /6 ib | PSLLQ <i>xmm1, imm8</i>      | <i>xmm1</i> のクワッドワードを <i>imm8</i> だけ左にシフトし、下位はゼロで埋める。      |

### 説明

デステイネーション・オペランド（第1オペランド）にある個別のデータ要素（ワード、ダブルワード、クワッドワード）のビットを、カウント・オペランド（第2オペランド）に指定されたビット数だけ左にシフトする。データ要素のビットが左にシフトされると、空の下位ビットはクリアされる（ゼロに設定される）。カウント・オペランドによって指定される値が（ワードでは）15、（ダブルワードでは）31、または（クワッドワードでは）63より大きいと、デステイネーション・オペランドはすべてゼロに設定される（図4-7.は、64ビット・オペランド内でワードをシフトする操作の例を示している）。デステイネーション・オペランドは、MMX®テクノロジ・レジスタまたはXMM レジスタでなければならない。カウント・オペランドには、MMX テクノロジ・レジスタまたは64ビットのメモリ・ロケーション、XMM レジスタまたは128ビットのメモリ・ロケーション、または8ビットの即値を使用できる。

## PSLLW/PSLLD/PSLLQ—Shift Packed Data Left Logical（続き）



図 4-7. 64 ビット・オペランドを使用した PSLLW 命令、PSLLD 命令、PSLLQ 命令の動作

PSLLW 命令は、デスティネーション・オペランドのワードのそれぞれを、カウント・オペランドに指定されたビット数だけ左にシフトする。PSLLD 命令は、デスティネーション・オペランドのダブルワードのそれぞれをシフトし、PSLLQ 命令は、デスティネーション・オペランドのクワッドワードをシフトする。個別データ要素が左にシフトされると、空の下位ビット位置はゼロで埋められる。

### 操作

PSLLW instruction with 64-bit operand:

```

IF (COUNT > 15)
THEN
    DEST[64..0] ← 0000000000000000H
ELSE
    DEST[15..0] ← ZeroExtend(DEST[15..0] << COUNT);
    * repeat shift operation for 2nd and 3rd words *;
    DEST[63..48] ← ZeroExtend(DEST[63..48] << COUNT);
FI;
```

PSLLD instruction with 64-bit operand:

```

IF (COUNT > 31)
THEN
    DEST[64..0] ← 0000000000000000H
ELSE
    DEST[31..0] ← ZeroExtend(DEST[31..0] << COUNT);
    DEST[63..32] ← ZeroExtend(DEST[63..32] << COUNT);
FI;
```

PSLLQ instruction with 64-bit operand:

```

IF (COUNT > 63)
THEN
    DEST[64..0] ← 0000000000000000H
ELSE
    DEST ← ZeroExtend(DEST << COUNT);
FI;
```

## PSLLW/PSLLD/PSLLQ—Shift Packed Data Left Logical（続き）

PSLLW instruction with 128-bit operand:

```

IF (COUNT > 15)
THEN
DEST[128..0] ← 00000000000000000000000000000000H
ELSE
    DEST[15-0] ← ZeroExtend(DEST[15-0] << COUNT);
    * repeat shift operation for 2nd through 7th words *;
    DEST[127-112] ← ZeroExtend(DEST[127-112] << COUNT);
FI;
```

PSLLD instruction with 128-bit operand:

```

IF (COUNT > 31)
THEN
    DEST[128..0] ← 00000000000000000000000000000000H
ELSE
    DEST[31-0] ← ZeroExtend(DEST[31-0] << COUNT);
    * repeat shift operation for 2nd and 3rd doublewords *;
    DEST[127-96] ← ZeroExtend(DEST[127-96] << COUNT);
FI;
```

PSLLQ instruction with 128-bit operand:

```

IF (COUNT > 15)
THEN
    DEST[128..0] ← 00000000000000000000000000000000H
ELSE
    DEST[63-0] ← ZeroExtend(DEST[63-0] << COUNT);
    DEST[127-64] ← ZeroExtend(DEST[127-64] << COUNT);
FI;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|       |                                                          |
|-------|----------------------------------------------------------|
| PSLLW | <code>_m64_mm_slli_pi16(_m64 m, int count)</code>        |
| PSLLW | <code>_m64_mm_sll_pi16(_m64 m, _m64 count)</code>        |
| PSLLW | <code>_m128i_mm_slli_pi16(_m64 m, int count)</code>      |
| PSLLW | <code>_m128i_mm_sll_pi16(_m128i m, _m128i count)</code>  |
| PSLLD | <code>_m64_mm_slli_pi32(_m64 m, int count)</code>        |
| PSLLD | <code>_m64_mm_sll_pi32(_m64 m, _m64 count)</code>        |
| PSLLD | <code>_m128i_mm_slli_epi32(_m128i m, int count)</code>   |
| PSLLD | <code>_m128i_mm_sll_epi32(_m128i m, _m128i count)</code> |
| PSLLQ | <code>_m64_mm_slli_si64(_m64 m, int count)</code>        |
| PSLLQ | <code>_m64_mm_sll_si64(_m64 m, _m64 count)</code>        |
| PSLLQ | <code>_m128i_mm_slli_si64(_m128i m, int count)</code>    |
| PSLLQ | <code>_m128i_mm_sll_si64(_m128i m, _m128i count)</code>  |

### 影響を受けるフラグ

なし。

## PSLLW/PSLLD/PSLLQ—Shift Packed Data Left Logical（続き）

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                          |
|--------|----------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。 |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。    |
| #NM    | CR0 の TS がセットされた場合。                                                                                      |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                       |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PSRAW/PSRAD—Shift Packed Data Right Arithmetic

| オペコード          | 命令                    | 説明                                             |
|----------------|-----------------------|------------------------------------------------|
| 0F E1 /r       | PSRAW mm, mm/m64      | mm のワードを mm/m64 だけ右にシフトし、上位は符号ビットで埋める。         |
| 66 0F E1 /r    | PSRAW xmm1, xmm2/m128 | xmm1 のワードを xmm2/m128 だけ右にシフトし、上位は符号ビットで埋める。    |
| 0F 71 /4 ib    | PSRAW mm, imm8        | mm のワードを imm8 だけ右にシフトし、上位は符号ビットで埋める。           |
| 66 0F 71 /4 ib | PSRAW xmm1, imm8      | xmm1 のワードを imm8 だけ右にシフトし、上位は符号ビットで埋める。         |
| 0F E2 /r       | PSRAD mm, mm/m64      | mm のダブルワードを mm/m64 だけ右にシフトし、上位は符号ビットで埋める。      |
| 66 0F E2 /r    | PSRAD xmm1, xmm2/m128 | xmm1 のダブルワードを xmm2/m128 だけ右にシフトし、上位は符号ビットで埋める。 |
| 0F 72 /4 ib    | PSRAD mm, imm8        | mm のダブルワードを imm8 だけ右にシフトし、上位は符号ビットで埋める。        |
| 66 0F 72 /4 ib | PSRAD xmm1, imm8      | xmm1 のダブルワードを imm8 だけ右にシフトし、上位は符号ビットで埋める。      |

### 説明

デスティネーション・オペランド（第1オペランド）にある個別のデータ要素（ワードまたはダブルワード）のビットを、カウント・オペランド（第2オペランド）に指定されたビット量だけ右にシフトする。データ要素のビットが右にシフトされると、各要素の空の上位ビットは、データ要素の符号ビットの初期値で埋められる。カウント・オペランドによって指定される値が、（ワードでは）15 または（ダブルワードでは）31 より大きいと、デスティネーションの各データ要素は、その要素の符号ビットの初期値で埋められる（図4-8.は、64ビット・オペランド内でワードをシフトする操作の例を示している）。



図 4-8. 64 ビット・オペランドを使用した PSRAW 命令と PSRAD 命令の動作

## PSRAW/PSRAD—Shift Packed Data Right Arithmetic（続き）

デスティネーション・オペランドは、MMX® テクノロジ・レジスタまたは XMM レジスタでなければならない。カウント・オペランドには、MMX テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーション、XMM レジスタまたは 128 ビットのメモリ・ロケーション、または 8 ビットの即値を使用できる。

PSRAW 命令は、デスティネーション・オペランドのワードのそれぞれを、カウント・オペランドに指定されたビット数だけ右にシフトする。PSRAD 命令は、デスティネーション・オペランドのダブルワードのそれぞれをシフトする。

### 操作

PSRAW instruction with 64-bit operand:

```
IF (COUNT > 15)
    THEN COUNT ← 16;
FI;
DEST[15..0] ← SignExtend(DEST[15..0] >> COUNT);
* repeat shift operation for 2nd and 3rd words *;
DEST[63..48] ← SignExtend(DEST[63..48] >> COUNT);
```

PSRAD instruction with 64-bit operand:

```
IF (COUNT > 31)
    THEN COUNT ← 32;
FI;
ELSE
    DEST[31..0] ← SignExtend(DEST[31..0] >> COUNT);
    DEST[63..32] ← SignExtend(DEST[63..32] >> COUNT);
```

PSRAW instruction with 128-bit operand:

```
IF (COUNT > 15)
    THEN COUNT ← 16;
FI;
ELSE
    DEST[15..0] ← SignExtend(DEST[15..0] >> COUNT);
    * repeat shift operation for 2nd through 7th words *;
    DEST[127..112] ← SignExtend(DEST[127..112] >> COUNT);
```

PSRAD instruction with 128-bit operand:

```
IF (COUNT > 31)
    THEN COUNT ← 32;
FI;
ELSE
    DEST[31..0] ← SignExtend(DEST[31..0] >> COUNT);
    * repeat shift operation for 2nd and 3rd doublewords *;
    DEST[127..96] ← SignExtend(DEST[127..96] >> COUNT);
```

## PSRAW/PSRAD—Shift Packed Data Right Arithmetic（続き）

### 同等のインテル® C/C++ コンパイラ組み込み関数

|       |                                                              |
|-------|--------------------------------------------------------------|
| PSRAW | <code>__m64_mm_srai_pi16 (__m64 m, int count)</code>         |
| PSRAW | <code>__m64_mm_sraw_pi16 (__m64 m, __m64 count)</code>       |
| PSRAD | <code>__m64_mm_srai_pi32 (__m64 m, int count)</code>         |
| PSRAD | <code>__m64_mm_sra_pi32 (__m64 m, __m64 count)</code>        |
| PSRAW | <code>__m128i_mm_srai_epi16 (__m128i m, int count)</code>    |
| PSRAW | <code>__m128i_mm_sra_epi16 (__m128i m, __m128i count)</code> |
| PSRAD | <code>__m128i_mm_srai_epi32 (__m128i m, int count)</code>    |
| PSRAD | <code>__m128i_mm_sra_epi32 (__m128i m, __m128i count)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。<br>(64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                  |
| #AC(0)        |                                                                                                                   |

### 実アドレスモード例外

|        |                                                                                                          |
|--------|----------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。 |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。    |

## PSRAW/PSRAD—Shift Packed Data Right Arithmetic（続き）

- |     |                                    |
|-----|------------------------------------|
| #NM | CR0 の TS がセットされた場合。                |
| #MF | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。 |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

- |               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフェルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 数値例外

なし。

## PSRLDQ—Shift Double Quadword Right Logical

| オペコード          | 命令                       | 説明                                            |
|----------------|--------------------------|-----------------------------------------------|
| 66 0F 73 /3 ib | PSRLDQ <i>xmm1, imm8</i> | <i>xmm1</i> を <i>imm8</i> だけ右にシフトし、上位はゼロで埋める。 |

### 説明

カウント・オペランド（第2オペランド）で指定されたバイト数だけ、デスティネーション・オペランド（第1オペランド）を右にシフトする。空いた上位バイトはクリアされる（すべて0にセットされる）。カウント・オペランドで指定された値が15より大きい場合は、デスティネーション・オペランドはすべて0に設定される。デスティネーション・オペランドはXMMレジスタである。カウント・オペランドは8ビットの即値である。

### 操作

```
TEMP ← COUNT;
if (TEMP > 15) TEMP ← 16;
DEST ← DEST >> (temp * 8);
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

PSRLDQ        \_\_m128i \_mm\_srls\_si128 ( \_\_m128i a, int imm)

### 影響を受けるフラグ

なし。

### 保護モード例外

|     |                                                                           |
|-----|---------------------------------------------------------------------------|
| #UD | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM | CR0 の TS がセットされた場合。                                                       |

### 実アドレスモード例外

保護モードと同じ例外。

### 仮想 8086 モード例外

保護モードと同じ例外。

### 数値例外

なし。

## PSRLW/PSRLD/PSRLQ—Shift Packed Data Right Logical

| オペコード          | 命令                           | 説明                                                                  |
|----------------|------------------------------|---------------------------------------------------------------------|
| 0F D1 /r       | PSRLW <i>mm, mm/m64</i>      | <i>mm</i> のワードを <i>mm/m64</i> に指定されたビットだけ右にシフトし、上位はゼロで埋める。          |
| 66 0F D1 /r    | PSRLW <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のワードを <i>xmm2/m128</i> に指定されたビットだけ右にシフトし、上位はゼロで埋める。     |
| 0F 71 /2 ib    | PSRLW <i>mm, imm8</i>        | <i>mm</i> のワードを <i>imm8</i> だけ右にシフトし、上位はゼロで埋める。                     |
| 66 0F 71 /2 ib | PSRLW <i>xmm1, imm8</i>      | <i>xmm1</i> のワードを <i>imm8</i> だけ右にシフトし、上位はゼロで埋める。                   |
| 0F D2 /r       | PSRLD <i>mm, mm/m64</i>      | <i>mm</i> のダブルワードを <i>mm/m64</i> に指定されたビットだけ右にシフトし、上位はゼロで埋める。       |
| 66 0F D2 /r    | PSRLD <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のダブルワードを <i>xmm2/m128</i> に指定されたビットだけ右にシフトし、上位はゼロで埋める。  |
| 0F 72 /2 ib    | PSRLD <i>mm, imm8</i>        | <i>mm</i> のダブルワードを <i>imm8</i> だけ右にシフトし、上位はゼロで埋める。                  |
| 66 0F 72 /2 ib | PSRLD <i>xmm1, imm8</i>      | <i>xmm1</i> のダブルワードを <i>imm8</i> だけ右にシフトし、上位はゼロで埋める。                |
| 0F D3 /r       | PSRLQ <i>mm, mm/m64</i>      | <i>mm</i> を <i>mm/m64</i> に指定されたビットだけ右にシフトし、上位はゼロで埋める。              |
| 66 0F D3 /r    | PSRLQ <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のクワッドワードを <i>xmm2/m128</i> に指定されたビットだけ右にシフトし、上位はゼロで埋める。 |
| 0F 73 /2 ib    | PSRLQ <i>mm, imm8</i>        | <i>mm</i> を <i>imm8</i> だけ右にシフトし、上位はゼロで埋める。                         |
| 66 0F 73 /2 ib | PSRLQ <i>xmm1, imm8</i>      | <i>xmm1</i> を <i>imm8</i> だけ右にシフトし、上位はゼロで埋める。                       |

### 説明

デステイネーション・オペランド（第1オペランド）にある個別のデータ要素（ワード、ダブルワード、またはクワッドワード）のビットを、カウント・オペランド（第2オペランド）に指定されたビット量だけ右にシフトする。データ要素のビットが右にシフトされると、空の上位ビットはクリアされる（ゼロに設定される）。カウント・オペランドによって指定された値が（ワードでは）15、（ダブルワードでは）31、または（クワッドワードでは）63より大きいと、デステイネーション・オペランドはすべてゼロに設定される（図4-9.は、64ビット・オペランド内でワードをシフトする操作の例を示している）。デステイネーション・オペランドは、MMX®テクノロジ・レジスタまたはXMMレジスタでなければならない。カウント・オペランドには、MMXテクノロジ・レジスタまたは64ビットのメモリ・ロケーション、XMMレジスタまたは128ビット・メモリ・ロケーション、または8ビットの即値を使用できる。

## PSRLW/PSRLD/PSRLQ—Shift Packed Data Right Logical（続き）



図 4-9. 64 ビット・オペランドを使用した PSRLW 命令、PSRLD 命令、PSRLQ 命令の動作

PSRLW 命令は、デスティネーション・オペランドのワードのそれぞれを、カウント・オペランドに指定されたビット数だけ右にシフトする。PSRLD 命令は、デスティネーション・オペランドのダブルワードのそれぞれをシフトし、PSRLQ 命令は、デスティネーション・オペランドの 64 ビットのクワッドワードをシフトする。

### 操作

PSRLW instruction with 64-bit operand:

```

IF (COUNT > 15)
THEN
    DEST[64..0] ← 0000000000000000H
ELSE
    DEST[15..0] ← ZeroExtend(DEST[15..0] >> COUNT);
    * repeat shift operation for 2nd and 3rd words *
    DEST[63..48] ← ZeroExtend(DEST[63..48] >> COUNT);
FI;
```

PSRLD instruction with 64-bit operand:

```

IF (COUNT > 31)
THEN
    DEST[64..0] ← 0000000000000000H
ELSE
    DEST[31..0] ← ZeroExtend(DEST[31..0] >> COUNT);
    DEST[63..32] ← ZeroExtend(DEST[63..32] >> COUNT);
FI;
```

PSRLQ instruction with 64-bit operand:

```

IF (COUNT > 63)
THEN
    DEST[64..0] ← 0000000000000000H
ELSE
    DEST ← ZeroExtend(DEST >> COUNT);
FI;
```

## PSRLW/PSRLD/PSRLQ—Shift Packed Data Right Logical（続き）

PSRLW instruction with 128-bit operand:

```

IF (COUNT > 15)
THEN
    DEST[128..0] ← 00000000000000000000000000000000H
ELSE
    DEST[15-0] ← ZeroExtend(DEST[15-0] >> COUNT);
    * repeat shift operation for 2nd through 7th words *;
    DEST[127-112] ← ZeroExtend(DEST[127-112] >> COUNT);
FI;
```

PSRLD instruction with 128-bit operand:

```

IF (COUNT > 31)
THEN
    DEST[128..0] ← 00000000000000000000000000000000H
ELSE
    DEST[31-0] ← ZeroExtend(DEST[31-0] >> COUNT);
    * repeat shift operation for 2nd and 3rd doublewords *;
    DEST[127-96] ← ZeroExtend(DEST[127-96] >> COUNT);
FI;
```

PSRLQ instruction with 128-bit operand:

```

IF (COUNT > 15)
THEN
    DEST[128..0] ← 00000000000000000000000000000000H
ELSE
    DEST[63-0] ← ZeroExtend(DEST[63-0] >> COUNT);
    DEST[127-64] ← ZeroExtend(DEST[127-64] >> COUNT);
FI;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|       |                                                            |
|-------|------------------------------------------------------------|
| PSRLW | <code>_m64_mm_srli_pi16(_m64 m, int count)</code>          |
| PSRLW | <code>_m64_mm_srl_pi16 (_m64 m, __m64 count)</code>        |
| PSRLW | <code>_m128i_mm_srli_epi16 (_m128i m, int count)</code>    |
| PSRLW | <code>_m128i_mm_srl_epi16 (_m128i m, __m128i count)</code> |
| PSRLD | <code>_m64_mm_srli_pi32 (_m64 m, int count)</code>         |
| PSRLD | <code>_m64_mm_srl_pi32 (_m64 m, __m64 count)</code>        |
| PSRLD | <code>_m128i_mm_srli_epi32 (_m128i m, int count)</code>    |
| PSRLD | <code>_m128i_mm_srl_epi32 (_m128i m, __m128i count)</code> |
| PSRLQ | <code>_m64_mm_srli_si64 (_m64 m, int count)</code>         |
| PSRLQ | <code>_m64_mm_srl_si64 (_m64 m, __m64 count)</code>        |
| PSRLQ | <code>_m128i_mm_srli_epi64 (_m128i m, int count)</code>    |
| PSRLQ | <code>_m128i_mm_srl_epi64 (_m128i m, __m128i count)</code> |

## PSRLW/PSRLD/PSRLQ—Shift Packed Data Right Logical（続き）

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                          |
|--------|----------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。 |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。    |
| #NM    | CR0 の TS がセットされた場合。                                                                                      |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                       |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                               |
|---------------|---------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                               |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PSRLW/PSRLD/PSRLQ—Shift Packed Data Right Logical（続き）

### 数値例外

なし。

## PSUBB/PSUBW/PSUBD—Subtract Packed Integers

| オペコード       | 命令                           | 説明                                                               |
|-------------|------------------------------|------------------------------------------------------------------|
| 0F F8 /r    | PSUBB <i>mm, mm/m64</i>      | <i>mm</i> のパックドバイト整数から <i>mm/m64</i> のパックドバイト整数を引く。              |
| 66 0F F8 /r | PSUBB <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のパックドバイト整数から <i>xmm2/m128</i> のパックドバイト整数を引く。         |
| 0F F9 /r    | PSUBW <i>mm, mm/m64</i>      | <i>mm</i> のパックドワード整数から <i>mm/m64</i> のパックドワード整数を引く。              |
| 66 0F F9 /r | PSUBW <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のパックドワード整数から <i>xmm2/m128</i> のパックドワード整数を引く。         |
| 0F FA /r    | PSUBD <i>mm, mm/m64</i>      | <i>mm</i> のパックド・ダブルワード整数から <i>mm/m64</i> のパックド・ダブルワード整数を引く。      |
| 66 0F FA /r | PSUBD <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のパックド・ダブルワード整数から <i>xmm2/m128</i> のパックド・ダブルワード整数を引く。 |

### 説明

デスティネーション・オペランド（第1オペランド）のパックド整数からソース・オペランド（第2オペランド）のパックド整数を SIMD 減算し、結果のパックド整数をデスティネーション・オペランドに格納する。SIMD 演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図9-4. を参照のこと。以降の段落で説明するように、オーバーフローはラップアラウンドを使用して処理される。

上記の命令は、64ビット・オペランドまたは128ビット・オペランドのいずれかを操作する。64ビット・オペランドを操作する場合、デスティネーション・オペランドには MMX® テクノロジ・レジスタを使用しなければならないが、ソース・オペランドには MMX テクノロジ・レジスタまたは64ビット・メモリ・ロケーションのどちらを使用しても構わない。128ビット・オペランドを操作する場合は、デスティネーション・オペランドには XMM レジスタを使用しなければならないが、ソース・オペランドには XMM レジスタまたは128ビット・メモリ・ロケーションのどちらを使用しても構わない。

PSUBB 命令は、パックドバイト整数を引く。個別の結果がバイトで表現するには大きすぎるまたは小さすぎるときは、結果はラップアラウンドされ、下位8ビットがデスティネーション要素に書き込まれる。

PSUBW 命令は、パックドワード整数を引く。個別の結果がワードで表現するには大きすぎるまたは小さすぎるときは、結果はラップアラウンドされ、下位16ビットがデスティネーション要素に書き込まれる。

## PSUBB/PSUBW/PSUBD—Subtract Packed Integers（続き）

PSUBD 命令は、パックド・ダブルワード整数を引く。個別の結果がダブルワードで表現するには大きすぎるまたは小さすぎるときは、結果はラップアラウンドされ、下位 32 ビットがデスティネーション要素に書き込まれる。

PSUBB、PSUBW、PSUBD 命令は、符号なしまたは符号付き（2 の補数表記）のパックド整数を操作できることに注意すること。ただし、これらの命令は、オーバーフロー やキャリーを示す EFLAGS レジスタ内のビットをセットしない。このため、検出されないオーバーフロー状態が発生しないように、操作される値の範囲をソフトウェアによって制御しなければならない。

### 操作

PSUBB instruction with 64-bit operands:

```
DEST[7..0] ← DEST[7..0] – SRC[7..0];
* repeat subtract operation for 2nd through 7th byte *;
DEST[63..56] ← DEST[63..56] – SRC[63..56];
```

PSUBB instruction with 128-bit operands:

```
DEST[7-0] ← DEST[7-0] – SRC[7-0];
* repeat subtract operation for 2nd through 14th byte *;
DEST[127-120] ← DEST[111-120] – SRC[127-120];
```

PSUBW instruction with 64-bit operands:

```
DEST[15..0] ← DEST[15..0] – SRC[15..0];
* repeat subtract operation for 2nd and 3rd word *;
DEST[63..48] ← DEST[63..48] – SRC[63..48];
```

PSUBW instruction with 128-bit operands:

```
DEST[15-0] ← DEST[15-0] – SRC[15-0];
* repeat subtract operation for 2nd through 7th word *;
DEST[127-112] ← DEST[127-112] – SRC[127-112];
```

PSUBD instruction with 64-bit operands:

```
DEST[31..0] ← DEST[31..0] – SRC[31..0];
DEST[63..32] ← DEST[63..32] – SRC[63..32];
```

PSUBD instruction with 128-bit operands:

```
DEST[31-0] ← DEST[31-0] – SRC[31-0];
* repeat subtract operation for 2nd and 3rd doubleword *;
DEST[127-96] ← DEST[127-96] – SRC[127-96];
```

## PSUBB/PSUBW/PSUBD—Subtract Packed Integers（続き）

### 同等のインテル® C/C++ コンパイラ組み込み関数

|       |                                                        |
|-------|--------------------------------------------------------|
| PSUBB | <code>_m64_mm_sub_pi8(_m64 m1, _m64 m2)</code>         |
| PSUBW | <code>_m64_mm_sub_pi16(_m64 m1, _m64 m2)</code>        |
| PSUBD | <code>_m64_mm_sub_pi32(_m64 m1, _m64 m2)</code>        |
| PSUBB | <code>_m128i_mm_sub_epi8 ( _m128i a, _m128i b)</code>  |
| PSUBW | <code>_m128i_mm_sub_epi16 ( _m128i a, _m128i b)</code> |
| PSUBD | <code>_m128i_mm_sub_epi32 ( _m128i a, _m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                          |
|--------|----------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。 |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。    |
| #NM    | CR0 の TS がセットされた場合。                                                                                      |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                       |

## PSUBB/PSUBW/PSUBD—Subtract Packed Integers（続き）

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフェルトが発生した場合。

#AC(0) (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

## PSUBQ—Subtract Packed Quadword Integers

| オペコード       | 命令                    | 説明                                    |
|-------------|-----------------------|---------------------------------------|
| 0F FB /r    | PSUBQ mm1, mm2/m64    | mm2/m64 から mm1 のクワッドワード整数を引く。         |
| 66 0F FB /r | PSUBQ xmm1, xmm2/m128 | xmm2/m128 から xmm1 のパックド・クワッドワード整数を引く。 |

### 説明

第1オペランド（デスティネーション・オペランド）から第2オペランド（ソース・オペランド）を引き、結果をデスティネーション・オペランドに格納する。ソース・オペランドは、MMX® テクノロジ・レジスタまたは64ビットのメモリ・ロケーションに格納される1つのクワッドワード整数か、XMM レジスタまたは128ビットのメモリ・ロケーションに格納される2つのパックド・クワッドワード整数である。デスティネーション・オペランドは、MMX テクノロジ・レジスタに格納される1つのクワッドワード整数か、XMM レジスタに格納される2つのパックド・クワッドワード整数である。パックド・クワッドワードのオペランドを使用する場合は、SIMD 減算が実行される。結果のクワッドワードが大きすぎて64ビットで表現できない場合は（オーバーフロー）、結果はラップアラウンドされ、下位64ビットがデスティネーション要素に書き込まれる（すなわち、キャリーは無視される）。

PSUBQ 命令は、符号なし整数と符号付き整数（2の補数記法）のどちらを操作することもできる。ただし、この命令は、オーバーフロー やキャリーを示す EFLAGS レジスタ内のビットをセットしない。このため、検出されないオーバーフロー状態が発生しないように、操作される値の範囲をソフトウェアによって制御しなければならない。

### 操作

PSUBQ instruction with 64-Bit operands:

```
DEST[63-0] ← DEST[63-0] – SRC[63-0];
```

PSUBQ instruction with 128-Bit operands:

```
DEST[63-0] ← DEST[63-0] – SRC[63-0];
DEST[127-64] ← DEST[127-64] – SRC[127-64];
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|       |                                                         |
|-------|---------------------------------------------------------|
| PSUBQ | <code>_m64 _mm_sub_si64(_m64 m1, _m64 m2)</code>        |
| PSUBQ | <code>_m128i _mm_sub_epi64(_m128i m1, _m128i m2)</code> |

### 影響を受けるフラグ

なし。

## PSUBQ—Subtract Packed Quadword Integers（続き）

### 保護モード例外

|               |                                                                                                                 |
|---------------|-----------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが、CS、DS、ES、FS、またはGSセグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                              |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。           |
| #NM           | CR0 の TS がセットされた場合。                                                                                             |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                 |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックが有効になっており、現行特権レベルが 3 のときにアライメントの合っていないメモリ参照を行った場合。                                      |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                    |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                                                             |
|---------------|-------------------------------------------------------------|
| #PF (フォルトコード) | ページフォルトが発生した場合。                                             |
| #AC(0)        | (64 ビット操作のみ) アライメント・チェックが有効になっており、アライメントの合っていないメモリ参照を行った場合。 |

### 数値例外

なし。

## PSUBSB/PSUBSW—Subtract Packed Signed Integers with Signed Saturation

| オペコード       | 命令                            | 説明                                                                    |
|-------------|-------------------------------|-----------------------------------------------------------------------|
| 0F E8 /r    | PSUBSB <i>mm, mm/m64</i>      | <i>mm</i> の符号付きパックドバイトから <i>mm/m64</i> の符号付きパックドバイトを引き、結果を飽和させる。      |
| 66 0F E8 /r | PSUBSB <i>xmm1, xmm2/m128</i> | <i>xmm1</i> の符号つきパックドバイトから <i>xmm2/m128</i> の符号付きパックドバイトを引き、結果を飽和させる。 |
| 0F E9 /r    | PSUBSW <i>mm, mm/m64</i>      | <i>mm</i> の符号付きパックドワードから <i>mm/m64</i> の符号付きパックドワードを引き、結果を飽和させる。      |
| 66 0F E9 /r | PSUBSW <i>xmm1, xmm2/m128</i> | <i>xmm1</i> の符号つきパックドワードから <i>xmm2/m128</i> の符号付きパックドワードを引き、結果を飽和させる。 |

### 説明

デスティネーション・オペランド（第1オペランド）のパックド符号付き整数からソース・オペランド（第2オペランド）のパックド符号付き整数を SIMD 減算し、結果のパックド整数をデスティネーション・オペランドに格納する。オーバーフローは、以下に説明する方法で飽和処理される。SIMD 演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 9-4. を参照のこと。以降の段落で説明するように、オーバーフローは符号付き飽和処理を使用して処理される。

上記の命令は、64ビット・オペランドまたは128ビット・オペランドのいずれかを操作する。64ビット・オペランドを操作する場合、デスティネーション・オペランドには MMX® テクノロジ・レジスタを使用しなければならないが、ソース・オペランドには MMX テクノロジ・レジスタまたは 64ビット・メモリ・ロケーションのどちらを使用しても構わない。128ビット・オペランドを操作する場合は、デスティネーション・オペランドには XMM レジスタを使用しなければならないが、ソース・オペランドには XMM レジスタまたは 128ビット・メモリ・ロケーションのどちらを使用しても構わない。

PSUBSB 命令は、符号付きパックドバイト整数を引く。個別のバイト結果が符号付きバイト整数の範囲を超える場合（すなわち、7FHより大きいかまたは80Hより小さい場合）は、それぞれ 7FH または 80H の飽和された値がデスティネーション・オペランドに書き込まれる。

PSUBSW 命令は、符号付きパックドワード整数を引く。個別のワード結果が符号付きワード整数の範囲を超える場合（すなわち、7FFFHより大きいかまたは8000Hより小さい場合）は、それぞれ 7FFFH または 8000H の飽和された値がデスティネーション・オペランドに書き込まれる。

## PSUBSB/PSUBSW—Subtract Packed Integers with Signed Saturation (続き)

### 操作

PSUBSB instruction with 64-bit operands:

```
DEST[7..0] ← SaturateToSignedByte(DEST[7..0] – SRC[7..0]) ;
* repeat subtract operation for 2nd through 7th bytes *;
DEST[63..56] ← SaturateToSignedByte(DEST[63..56] – SRC[63..56]);
```

PSUBSB instruction with 128-bit operands:

```
DEST[7-0] ← SaturateToSignedByte (DEST[7-0] – SRC[7-0]);
* repeat subtract operation for 2nd through 14th bytes *;
DEST[127-120] ← SaturateToSignedByte (DEST[111-120] – SRC[127-120]);
```

PSUBSW instruction with 64-bit operands

```
DEST[15..0] ← SaturateToSignedWord(DEST[15..0] – SRC[15..0] );
* repeat subtract operation for 2nd and 7th words *;
DEST[63..48] ← SaturateToSignedWord(DEST[63..48] – SRC[63..48] );
```

PSUBSW instruction with 128-bit operands

```
DEST[15-0] ← SaturateToSignedWord (DEST[15-0] – SRC[15-0]);
* repeat subtract operation for 2nd through 7th words *;
DEST[127-112] ← SaturateToSignedWord (DEST[127-112] – SRC[127-112]);
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|        |                                                          |
|--------|----------------------------------------------------------|
| PSUBSB | <code>_m64 _mm_subs_pi8(_m64 m1, _m64 m2)</code>         |
| PSUBSB | <code>_m128i _mm_subs_epi8(_m128i m1, _m128i m2)</code>  |
| PSUBSW | <code>_m64 _mm_subs_pi16(_m64 m1, _m64 m2)</code>        |
| PSUBSW | <code>_m128i _mm_subs_epi16(_m128i m1, _m128i m2)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|        |                                                                                                                   |
|--------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0) | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0) | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM    | CR0 の TS がセットされた場合。                                                                                               |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |

## PSUBSB/PSUBSW—Subtract Packed Signed Integers with Signed Saturation（続き）

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

#GP(0) (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。

オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。

#UD CR0 の EM がセットされた場合。

(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。

(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。

#NM CR0 の TS がセットされた場合。

#MF (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

## PSUBUSB/PSUBUSW—Subtract Packed Unsigned Integers with Unsigned Saturation

| オペコード       | 命令                             | 説明                                                                    |
|-------------|--------------------------------|-----------------------------------------------------------------------|
| 0F D8 /r    | PSUBUSB <i>mm, mm/m64</i>      | <i>mm</i> の符号なしパックドバイトから <i>mm/m64</i> の符号なしパックドバイトを引き、結果を飽和させる。      |
| 66 0F D8 /r | PSUBUSB <i>xmm1, xmm2/m128</i> | <i>xmm1</i> の符号なしパックドバイトから <i>xmm2/m128</i> の符号なしパックドバイトを引き、結果を飽和させる。 |
| 0F D9 /r    | PSUBUSW <i>mm, mm/m64</i>      | <i>mm</i> の符号なしパックドワードから <i>mm/m64</i> の符号なしパックドワードを引き、結果を飽和させる。      |
| 66 0F D9 /r | PSUBUSW <i>xmm1, xmm2/m128</i> | <i>xmm1</i> の符号なしパックドワードから <i>xmm2/m128</i> の符号なしパックドワードを引き、結果を飽和させる。 |

### 説明

デスティネーション・オペランド（第1オペランド）のパックド符号なし整数からソース・オペランド（第2オペランド）のパックド符号なし整数を SIMD 減算し、結果のパックド整数をデスティネーション・オペランドに格納する。SIMD 演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 9-4. を参照のこと。以降の段落で説明するように、オーバーフローは符号なし飽和処理を使用して処理される。

上記の命令は、64ビット・オペランドまたは128ビット・オペランドのいずれかを操作する。64ビット・オペランドを操作する場合、デスティネーション・オペランドには MMX® テクノロジ・レジスタを使用しなければならないが、ソース・オペランドには MMX テクノロジ・レジスタまたは64ビット・メモリ・ロケーションのどちらを使用しても構わない。128ビット・オペランドを操作する場合は、デスティネーション・オペランドには XMM レジスタを使用しなければならないが、ソース・オペランドには XMM レジスタまたは128ビット・メモリ・ロケーションのどちらを使用しても構わない。

PSUBUSB 命令は、符号なしパックドバイト整数を引く。個別のバイト結果がゼロより小さい場合は、00H の飽和された符号なし値がデスティネーション・オペランドに書き込まれる。

PSUBUSW 命令は、符号なしパックドワード整数を引く。個別のワード結果がゼロより小さい場合は、0000H の飽和された符号なし値がデスティネーション・オペランドに書き込まれる。

## PSUBUSB/PSUBUSW—Subtract Packed Unsigned Integers with Unsigned Saturation（続き）

### 操作

PSUBUSB instruction with 64-bit operands:

```
DEST[7..0] ← SaturateToUnsignedByte(DEST[7..0] – SRC [7..0] );
* repeat add operation for 2nd through 7th bytes *:
DEST[63..56] ← SaturateToUnsignedByte(DEST[63..56] – SRC[63..56])
```

PSUBUSB instruction with 128-bit operands:

```
DEST[7-0] ← SaturateToUnsignedByte (DEST[7-0] – SRC[7-0]);
* repeat add operation for 2nd through 14th bytes *:
DEST[127-120] ← SaturateToUnSignedByte (DEST[127-120] – SRC[127-120]);
```

PSUBUSW instruction with 64-bit operands:

```
DEST[15..0] ← SaturateToUnsignedWord(DEST[15..0] – SRC[15..0] );
* repeat add operation for 2nd and 3rd words *:
DEST[63..48] ← SaturateToUnsignedWord(DEST[63..48] – SRC[63..48] );
```

PSUBUSW instruction with 128-bit operands:

```
DEST[15-0] ← SaturateToUnsignedWord (DEST[15-0] – SRC[15-0]);
* repeat add operation for 2nd through 7th words *:
DEST[127-112] ← SaturateToUnSignedWord (DEST[127-112] – SRC[127-112]);
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|         |                                                         |
|---------|---------------------------------------------------------|
| PSUBUSB | <code>_m64 _mm_sub_pu8(_m64 m1, _m64 m2)</code>         |
| PSUBUSB | <code>_m128i _mm_sub_epu8(_m128i m1, _m128i m2)</code>  |
| PSUBUSW | <code>_m64 _mm_sub_pu16(_m64 m1, _m64 m2)</code>        |
| PSUBUSW | <code>_m128i _mm_sub_epu16(_m128i m1, _m128i m2)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|        |                                                                                                                   |
|--------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0) | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0) | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM    | CR0 の TS がセットされた場合。                                                                                               |
| #MF    | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |

## PSUBUSB/PSUBUSW—Subtract Packed Unsigned Integers with Unsigned Saturation（続き）

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

#GP(0) (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。

オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。

#UD CR0 の EM がセットされた場合。

(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。

(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。

#NM CR0 の TS がセットされた場合。

#MF (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

## PUNPCKHBW/PUNPCKHWD/PUNPCKHDQ/PUNPCKHQDQ— Unpack High Data

| オペコード       | 命令                                           | 説明                                                                          |
|-------------|----------------------------------------------|-----------------------------------------------------------------------------|
| 0F 68 /r    | PUNPCKHBW <i>mm</i> ,<br><i>mm/m64</i>       | <i>mm</i> および <i>mm/m64</i> から <i>mm</i> に上位バイトをアンパックしてインタリーブする。            |
| 66 0F 68 /r | PUNPCKHBW <i>xmm1</i> ,<br><i>xmm2/m128</i>  | <i>xmm1</i> および <i>xmm2/m128</i> から <i>xmm1</i> に上位バイトをアンパックしてインタリーブする。     |
| 0F 69 /r    | PUNPCKHWD <i>mm</i> ,<br><i>mm/m64</i>       | <i>mm</i> および <i>mm/m64</i> から <i>mm</i> に上位ワードをアンパックしてインタリーブする。            |
| 66 0F 69 /r | PUNPCKHWD <i>xmm1</i> ,<br><i>xmm2/m128</i>  | <i>xmm1</i> および <i>xmm2/m128</i> から <i>xmm1</i> に上位ワードをアンパックしてインタリーブする。     |
| 0F 6A /r    | PUNPCKHDQ <i>mm</i> ,<br><i>mm/m64</i>       | <i>mm</i> および <i>mm/m64</i> から <i>mm</i> に上位ダブルワードをアンパックしてインタリーブする。         |
| 66 0F 6A /r | PUNPCKHDQ <i>xmm1</i> ,<br><i>xmm2/m128</i>  | <i>xmm1</i> および <i>xmm2/m128</i> から <i>xmm1</i> に上位ダブルワードをアンパックしてインタリーブする。  |
| 66 0F 6D /r | PUNPCKHQDQ <i>xmm1</i> ,<br><i>xmm2/m128</i> | <i>xmm1</i> および <i>xmm2/m128</i> から <i>xmm1</i> に上位クワッドワードをアンパックしてインタリーブする。 |

### 説明

デスティネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）の上位データ要素（バイト、ワード、ダブルワードまたはクワッドワード）をデスティネーション・オペランドにアンパックしてインタリーブする（図4-10.はビット・オペランドのバイトでアンパックされた動作を示す）。下位データ要素は無視される。



図 4-10. 64 ビット・オペランドを使用した PUNPCKHBW 命令の動作

## PUNPCKHBW/PUNPCKHWD/PUNPCKHDQ/PUNPCKHQDQ— Unpack High Data（続き）

ソース・オペランドは、MMX® テクノロジ・レジスタまたは 64 ビットのメモリ・ロケーション、XMM レジスタまたは 128 ビットのメモリ・ロケーションが使用できる。デスティネーション・オペランドには、MMX テクノロジ・レジスタまたは XMM レジスタを使用できる。ソースデータが 64 ビットのメモリ・オペランドからであるときは、64 ビット・オペランドすべてがメモリからアクセスされるが、命令は上位 32 ビットだけを使用する。ソースデータが 128 ビット・メモリ・オペランドからのものである場合、プロセッサによっては、適切な 64 ビットだけがフェッチされる。ただし、この場合も、16 バイト境界へのアライメントと通常のセグメント・チェックが適用される。

PUNPCKHBW 命令は、ソース・オペランドとデスティネーション・オペランドの上位バイトをインタリーブする。PUNPCKHWD 命令は、ソース・オペランドとデスティネーション・オペランドの上位ワードをインタリーブする。PUNPCKHDQ 命令は、ソース・オペランドとデスティネーション・オペランドの上位ダブルワードをインタリーブし、PUNPCKHQDQ 命令は、ソース・オペランドとデスティネーション・オペランドの上位クワッドワードをインタリーブする。

上記の命令では、ソース・オペランドにすべてゼロを入れることにより、バイトからワード、ワードからダブルワード、ダブルワードからクワッドワード、クワッドワードからダブル・クワッドワードへと、それぞれ変換することができる。ソース・オペランドがすべてゼロである場合、（デスティネーション・オペランドにストアされる）結果は、デスティネーション・オペランドの元の値の上位データ要素がゼロ拡張されたものになる。例えば、PUNPCKHBW 命令では、上位バイトがゼロ拡張され（すなわち、符号なしワード整数にアンパックされる）、PUNPCKHWD 命令では、上位ワードがゼロ拡張される（符号なしダブルワード整数にアンパックされる）。

### 操作

PUNPCKHBW instruction with 64-bit operands:

```
DEST[7..0] ← DEST[39..32];
DEST[15..8] ← SRC[39..32];
DEST[23..16] ← DEST[47..40];
DEST[31..24] ← SRC[47..40];
DEST[39..32] ← DEST[55..48];
DEST[47..40] ← SRC[55..48];
DEST[55..48] ← DEST[63..56];
DEST[63..56] ← SRC[63..56];
```

## PUNPCKHBW/PUNPCKHWD/PUNPCKHDQ/PUNPCKHQDQ— Unpack High Data（続き）

PUNPCKHW instruction with 64-bit operands:

```
DEST[15..0] ← DEST[47..32];
DEST[31..16] ← SRC[47..32];
DEST[47..32] ← DEST[63..48];
DEST[63..48] ← SRC[63..48];
```

PUNPCKHDQ instruction with 64-bit operands:

```
DEST[31..0] ← DEST[63..32]
DEST[63..32] ← SRC[63..32];
```

PUNPCKHBW instruction with 128-bit operands:

```
DEST[7..0] ← DEST[71-64];
DEST[15..8] ← SRC[71-64];
DEST[23..16] ← DEST[79-72];
DEST[31..24] ← SRC[79-72];
DEST[39..32] ← DEST[87-80];
DEST[47..40] ← SRC[87-80];
DEST[55..48] ← DEST[95-88];
DEST[63..56] ← SRC[95-88];
DEST[71..64] ← DEST[103-96];
DEST[79..72] ← SRC[103-96];
DEST[87..80] ← DEST[111-104];
DEST[95..88] ← SRC[111-104];
DEST[103..96] ← DEST[119-112];
DEST[111..104] ← SRC[119-112];
DEST[119..112] ← DEST[127-120];
DEST[127..120] ← SRC[127-120];
```

PUNPCKHWD instruction with 128-bit operands:

```
DEST[15..0] ← DEST[79-64];
DEST[31..16] ← SRC[79-64];
DEST[47..32] ← DEST[95-80];
DEST[63..48] ← SRC[95-80];
DEST[79..64] ← DEST[111-96];
DEST[95..80] ← SRC[111-96];
DEST[111..96] ← DEST[127-112];
DEST[127..112] ← SRC[127-112];
```

PUNPCKHDQ instruction with 128-bit operands:

```
DEST[31..0] ← DEST[95-64];
DEST[63..32] ← SRC[95-64];
DEST[95..64] ← DEST[127-96];
DEST[127..96] ← SRC[127-96];
```

PUNPCKHQDQ instruction:

```
DEST[63..0] ← DEST[127-64];
DEST[127..64] ← SRC[127-64];
```

## PUNPCKHBW/PUNPCKHWD/PUNPCKHDQ/PUNPCKHQDQ— Unpack High Data（続き）

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
PUNPCKHBW  __m64 _mm_unpackhi_pi8(__m64 m1, __m64 m2)
PUNPCKHBW  __m128i _mm_unpackhi_epi8(__m128i m1, __m128i m2)
PUNPCKHWD  __m64 _mm_unpackhi_pi16(__m64 m1, __m64 m2)
PUNPCKHWD  __m128i _mm_unpackhi_epi16(__m128i m1, __m128i m2)
PUNPCKHDQ  __m64 _mm_unpackhi_pi32(__m64 m1, __m64 m2)
PUNPCKHDQ  __m128i _mm_unpackhi_epi32(__m128i m1, __m128i m2)
PUNPCKHQDQ __m128i _mm_unpackhi_epi64( __m128i a, __m128i b)
```

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |

## PUNPCKHBW/PUNPCKHWD/PUNPCKHDQ/PUNPCKHQDQ— Unpack High Data（続き）

#MF (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフェルトが発生した場合。

#AC(0) (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

## PUNPCKLBW/PUNPCKLWD/PUNPCKLDQ/PUNPCKLQDQ— Unpack Low Data

| オペコード       | 命令                                           | 説明                                                                              |
|-------------|----------------------------------------------|---------------------------------------------------------------------------------|
| 0F 60 /r    | PUNPCKLBW <i>mm</i> ,<br><i>mm/m32</i>       | <i>mm</i> および <i>mm/m64</i> から <i>mm</i> に下位バイトをアンパックしてインタリーブする。                |
| 66 0F 60 /r | PUNPCKLBW <i>xmm1</i> ,<br><i>xmm2/m128</i>  | <i>xmm1</i> および <i>xmm2/m128</i> から <i>xmm1</i> に下位バイトをアンパックしてインタリーブする。         |
| 0F 61 /r    | PUNPCKLWD <i>mm</i> ,<br><i>mm/m32</i>       | <i>mm</i> および <i>mm/m64</i> から <i>mm</i> に下位ワードをアンパックしてインタリーブする。                |
| 66 0F 61 /r | PUNPCKLWD <i>xmm1</i> ,<br><i>xmm2/m128</i>  | <i>xmm1</i> および <i>xmm2/m128</i> から <i>xmm1</i> に下位ワードをアンパックしてインタリーブする。         |
| 0F 62 /r    | PUNPCKLDQ <i>mm</i> ,<br><i>mm/m32</i>       | <i>mm</i> および <i>mm/m64</i> から <i>mm</i> に下位ダブルワードをアンパックしてインタリーブする。             |
| 66 0F 62 /r | PUNPCKLDQ <i>xmm1</i> ,<br><i>xmm2/m128</i>  | <i>xmm1</i> および <i>xmm2/m128</i> から <i>xmm1</i> に下位ダブルワードをアンパックしてインタリーブする。      |
| 66 0F 6C /r | PUNPCKLQDQ <i>xmm1</i> ,<br><i>xmm2/m128</i> | <i>xmm1</i> および <i>xmm2/m128</i> から <i>xmm1</i> レジスタに下位クワッドワードをアンパックしてインタリーブする。 |

### 説明

デスティネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）の下位データ要素（バイト、ワード、ダブルワード、およびクワッドワード）をデスティネーション・オペランドにアンパックしてインタリーブする（図4-11.は64ビット・オペランドのバイトでアンパックされた動作を示す）。上位データ要素は無視される。



図 4-11. 64 ビット・オペランドを使用した PUNPCKLBW 命令の動作

## PUNPCKLBW/PUNPCKLWD/PUNPCKLDQ/PUNPCKLQDQ— Unpack Low Data（続き）

ソース・オペランドには、MMX® テクノロジ・レジスタまたは32ビットのメモリ・ロケーション、XMM レジスタまたは128ビットのメモリ・ロケーションを使用できる。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたは XMM レジスタを使用できる。ソースデータが 128 ビット・メモリ・オペランドからのものである場合、プロセッサによっては、適切な 64 ビットだけがフェッチされる。ただし、この場合も、16 バイト境界へのアライメントと通常のセグメント・チェックが適用される。

PUNPCKLBW 命令は、ソース・オペランドとデスティネーション・オペランドの下位バイトをインタリーブする。PUNPCKLWD 命令は、ソース・オペランドとデスティネーション・オペランドの下位ワードをインタリーブする。PUNPCKLDQ 命令は、ソース・オペランドとデスティネーション・オペランドの下位ダブルワードをインタリーブする。

上記の命令では、ソース・オペランドにすべてゼロを入れることにより、バイトからワード、ワードからダブルワード、ダブルワードからクワッドワード、クワッドワードからダブル・クワッドワードへと、それぞれ変換することができる。ソース・オペランドがすべてゼロである場合、(デスティネーション・オペランドにストアされる) 結果は、デスティネーション・オペランドの元の値の上位データ要素がゼロ拡張されたものになる。例えば、PUNPCKLBW 命令では、上位バイトがゼロ拡張され（すなわち、符号なしワード整数にアンパックされる）、PUNPCKLWD 命令では、上位ワードがゼロ拡張される（符号なしダブルワード整数にアンパックされる）。

### 操作

PUNPCKLBW instruction with 64-bit operands:

```
DEST[63..56] ← SRC[31..24];
DEST[55..48] ← DEST[31..24];
DEST[47..40] ← SRC[23..16];
DEST[39..32] ← DEST[23..16];
DEST[31..24] ← SRC[15..8];
DEST[23..16] ← DEST[15..8];
DEST[15..8] ← SRC[7..0];
DEST[7..0] ← DEST[7..0];
```

PUNPCKLWD instruction with 64-bit operands:

```
DEST[63..48] ← SRC[31..16];
DEST[47..32] ← DEST[31..16];
DEST[31..16] ← SRC[15..0];
DEST[15..0] ← DEST[15..0];
```

## PUNPCKLBW/PUNPCKLWD/PUNPCKLDQ/PUNPCKLQDQ— Unpack Low Data（続き）

PUNPCKLDQ instruction with 64-bit operands:

```
DEST[63..32] ← SRC[31..0];
DEST[31..0] ← DEST[31..0];
```

PUNPCKLBW instruction with 128-bit operands:

```
DEST[7-0] ← DEST[7-0];
DEST[15-8] ← SRC[7-0];
DEST[23-16] ← DEST[15-8];
DEST[31-24] ← SRC[15-8];
DEST[39-32] ← DEST[23-16];
DEST[47-40] ← SRC[23-16];
DEST[55-48] ← DEST[31-24];
DEST[63-56] ← SRC[31-24];
DEST[71-64] ← DEST[39-32];
DEST[79-72] ← SRC[39-32];
DEST[87-80] ← DEST[47-40];
DEST[95-88] ← SRC[47-40];
DEST[103-96] ← DEST[55-48];
DEST[111-104] ← SRC[55-48];
DEST[119-112] ← DEST[63-56];
DEST[127-120] ← SRC[63-56];
```

PUNPCKLWD instruction with 128-bit operands:

```
DEST[15-0] ← DEST[15-0];
DEST[31-16] ← SRC[15-0];
DEST[47-32] ← DEST[31-16];
DEST[63-48] ← SRC[31-16];
DEST[79-64] ← DEST[47-32];
DEST[95-80] ← SRC[47-32];
DEST[111-96] ← DEST[63-48];
DEST[127-112] ← SRC[63-48];
```

PUNPCKLDQ instruction with 128-bit operands:

```
DEST[31-0] ← DEST[31-0];
DEST[63-32] ← SRC[31-0];
DEST[95-64] ← DEST[63-32];
DEST[127-96] ← SRC[63-32];
```

PUNPCKLQDQ

```
DEST[63-0] ← DEST[63-0];
DEST[127-64] ← SRC[63-0];
```

## PUNPCKLBW/PUNPCKLWD/PUNPCKLDQ/PUNPCKLQDQ— Unpack Low Data（続き）

### 同等のインテル® C/C++ コンパイラ組み込み関数

|            |                                                              |
|------------|--------------------------------------------------------------|
| PUNPCKLBW  | <code>_m64_mm_unpacklo_pi8 (_m64 m1, _m64 m2)</code>         |
| PUNPCKLBW  | <code>_m128i_mm_unpacklo_epi8 (_m128i m1, _m128i m2)</code>  |
| PUNPCKLWD  | <code>_m64_mm_unpacklo_pi16 (_m64 m1, _m64 m2)</code>        |
| PUNPCKLWD  | <code>_m128i_mm_unpacklo_epi16 (_m128i m1, _m128i m2)</code> |
| PUNPCKLDQ  | <code>_m64_mm_unpacklo_pi32 (_m64 m1, _m64 m2)</code>        |
| PUNPCKLDQ  | <code>_m128i_mm_unpacklo_epi32 (_m128i m1, _m128i m2)</code> |
| PUNPCKLQDQ | <code>_m128i_mm_unpacklo_epi64 (_m128i m1, _m128i m2)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                   |
|---------------|-------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。             |
| #NM           | CR0 の TS がセットされた場合。                                                                                               |
| #MF           | (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                   |
| #AC(0)        | (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                     |

### 実アドレスモード例外

|        |                                                                                                       |
|--------|-------------------------------------------------------------------------------------------------------|
| #GP(0) | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。<br>(128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。    |
| #UD    | CR0 の EM がセットされた場合。<br>(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                                   |

## PUNPCKLBW/PUNPCKLWD/PUNPCKLDQ/PUNPCKLQDQ— Unpack Low Data (続き)

#MF (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフェルトが発生した場合。

#AC(0) (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

## PUSH—Push Word or Doubleword onto the Stack

| オペコード         | 命令                | 説明                    |
|---------------|-------------------|-----------------------|
| FF /6         | PUSH <i>r/m16</i> | <i>r/m16</i> をプッシュする。 |
| FF /6         | PUSH <i>r/m32</i> | <i>r/m32</i> をプッシュする。 |
| 50+ <i>rw</i> | PUSH <i>r16</i>   | <i>r16</i> をプッシュする。   |
| 50+ <i>rd</i> | PUSH <i>r32</i>   | <i>r32</i> をプッシュする。   |
| 6A            | PUSH <i>imm8</i>  | <i>imm8</i> をプッシュする。  |
| 68            | PUSH <i>imm16</i> | <i>imm16</i> をプッシュする。 |
| 68            | PUSH <i>imm32</i> | <i>imm32</i> をプッシュする。 |
| 0E            | PUSH CS           | CS をプッシュする。           |
| 16            | PUSH SS           | SS をプッシュする。           |
| 1E            | PUSH DS           | DS をプッシュする。           |
| 06            | PUSH ES           | ES をプッシュする。           |
| 0F A0         | PUSH FS           | FS をプッシュする。           |
| 0F A8         | PUSH GS           | GS をプッシュする。           |

### 説明

スタックポインタをデクリメントし、次にソース・オペランドをスタックのトップにストアする。スタック・セグメントのアドレスサイズ属性によって、スタックポインタのサイズ（16ビットまたは32ビット）が決まり、現在のコード・セグメントのオペランド・サイズ属性によって、スタックポインタをデクリメントする量（2バイトまたは4バイト）が決まる。例えば、これらのアドレスサイズ属性およびオペランド・サイズ属性が32である場合は、32ビットのESPレジスタ（スタックポインタ）が4デクリメントされ、それらの属性が16である場合は、16ビットのSPレジスタが2デクリメントされる。（スタック・セグメントのセグメント・ディスクリプタのBフラグによって、スタックのアドレスサイズ属性が決まり、現在のコード・セグメントのセグメント・ディスクリプタのDフラグ（プリフィックスを伴う）によって、オペランド・サイズ属性およびソース・オペランドのアドレスサイズ属性が決まる。）スタックのアドレスサイズ属性が32であるときに16ビット・オペランドをプッシュすると、スタックポインタでアライメント不正が発生することがある（すなわち、スタックポインタはダブルワード境界にアライメントが合っていない）。

PUSH ESP命令は、命令が実行される前にESPレジスタの値が存在していたようにその値をプッシュする。そのため、ESPレジスタがオペランド・アドレスの計算にベースレジスタとして使用されるメモリ・オペランドを、PUSH命令が使用すると、ESPレジスタがデクリメントされる前に、オペランドの実効アドレスが計算される。

## PUSH—Push Word or Doubleword onto the Stack (続き)

実アドレスモードでは、PUSH 命令が実行されるときに、ESP レジスタまたは SP レジスタが 1 である場合、プロセッサはスタックスペースの不足によってシャットダウンする。この状態を示す例外は生成されない。

### IA-32 アーキテクチャにおける互換性

インテル® 286 プロセッサ以降の IA-32 プロセッサでは、PUSH ESP 命令は、命令が実行される前に ESP レジスタの値が存在していたようにその値をプッシュする。(このことは、実アドレスモードまたは仮想 8086 モードでも同じである。) インテル® 8086 プロセッサでは、PUSH SP 命令は、(2 デクリメントされた後の値である) SP レジスタの新しい値をプッシュする。

### 操作

```

IF StackAddrSize = 32
THEN
  IF OperandSize = 32
    THEN
      ESP ← ESP - 4;
      SS:ESP ← SRC; (* push doubleword *)
    ELSE (* OperandSize = 16*)
      ESP ← ESP - 2;
      SS:ESP ← SRC; (* push word *)
    FI;
  ELSE (* StackAddrSize = 16*)
    IF OperandSize = 16
      THEN
        SP ← SP - 2;
        SS:SP ← SRC; (* push word *)
    ELSE (* OperandSize = 32*)
      SP ← SP - 4;
      SS:SP ← SRC; (* push doubleword *)
    FI;
  FI;

```

### 影響を受けるフラグ

なし。

### 保護モード例外

- |        |                                                                  |
|--------|------------------------------------------------------------------|
| #GP(0) | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。               |
|        | DS、ES、FS、または GS レジスタを使用してメモリがアクセスされ、レジスタの内容がヌル・セグメント・セレクタであった場合。 |
| #SS(0) | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                               |

## PUSH—Push Word or Doubleword onto the Stack（続き）

#PF（フォルトコード） ページフォルトが発生した場合。

#AC(0) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

#GP メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。

#SS メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。  
SP レジスタまたは ESP レジスタの新しい値がスタック・セグメントの範囲外の場合。

### 仮想 8086 モード例外

#GP(0) メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。

#SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

#PF（フォルトコード） ページフォルトが発生した場合。

#AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

## PUSHA/PUSHAD—Push All General-Purpose Registers

| オペコード | 命令     | 説明                                              |
|-------|--------|-------------------------------------------------|
| 60    | PUSHA  | AX、CX、DX、BX、元の SP、BP、SI、および DI をプッシュする。         |
| 60    | PUSHAD | EAX、ECX、EDX、EBX、元の ESP、EBP、ESI、および EDI をプッシュする。 |

### 説明

汎用レジスタの内容をスタックにプッシュする。レジスタがスタックにストアされる順番は、(現在のオペランド・サイズ属性が 32 である場合は) EAX、ECX、EDX、EBX、ESP (元の値)、EBP、ESI、EDI であり、(オペランド・サイズ属性が 16 である場合は) AX、CX、DX、BX、SP (元の値)、BP、SI、DI である。これらの命令は、POPA/POPAD 命令の逆の操作を実行する。ESP レジスタまたは SP レジスタとしてプッシュされる値は、最初のレジスタをプッシュする前のその値である (下記の「操作」の項を参照)。

PUSHA (すべてをプッシュ) ニーモニックおよび PUSHAD (すべてのダブルをプッシュ) ニーモニックは、同じオペコードを参照する。PUSHA 命令は、オペランド・サイズ属性が 16 であるときに使用するためのものであり、PUSHAD 命令は、オペランド・サイズ属性が 32 であるときに使用するためのものである。一部のアセンブラーは、PUSHA が使用されるときはオペランド・サイズを 16 に、PUSHAD が使用されるときは 32 に強制する。他のアセンブラーは、これらのニーモニックをシノニム (PUSHA/PUSHAD) として取り扱い、オペランド・サイズ属性の現在の設定を使用して、使用されるニーモニックに関係なく、スタックにプッシュする値のサイズを決定することができる。

実アドレスモードでは、PUSHA/PUSHAD 命令が実行されるときに、ESP レジスタまたは SP レジスタが 1、3、または 5 である場合、プロセッサはスタックスペースの不足によってシャットダウンする。この状態を示す例外は生成されない。

### 操作

```
IF OperandSize = 32 (* PUSHAD instruction *)
  THEN
    Temp ← (ESP);
    Push(EAX);
    Push(ECX);
    Push(EDX);
    Push(EBX);
    Push(Temp);
    Push(EBP);
    Push(ESI);
    Push(EDI);
```

## PUSHA/PUSHAD—Push All General-Purpose Register（続き）

```

ELSE (* OperandSize = 16, PUSHA instruction *)
    Temp ← (SP);
    Push(AX);
    Push(CX);
    Push(DX);
    Push(BX);
    Push(Temp);
    Push(BP);
    Push(SI);
    Push(DI);
FI;

```

### 影響を受けるフラグ

なし。

### 保護モード例外

- |               |                                                                  |
|---------------|------------------------------------------------------------------|
| #SS(0)        | 開始スタックアドレスまたは終了スタックアドレスがスタック・セグメント内にない場合。                        |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

- |     |                                                 |
|-----|-------------------------------------------------|
| #GP | ESP レジスタまたは SP レジスタの内容が 7、9、11、13、または 15 である場合。 |
|-----|-------------------------------------------------|

### 仮想 8086 モード例外

- |               |                                                  |
|---------------|--------------------------------------------------|
| #GP(0)        | ESP レジスタまたは SP レジスタの内容が 7、9、11、13、または 15 である場合。  |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                  |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PUSHF/PUSHFD—Push EFLAGS Register onto the Stack

| オペコード | 命令     | 説明                        |
|-------|--------|---------------------------|
| 9C    | PUSHF  | EFLAGS の下位 16 ビットをプッシュする。 |
| 9C    | PUSHFD | EFLAGS をプッシュする。           |

### 説明

(現在のオペランド・サイズ属性が 32 である場合は) スタックポインタを 4 デクリメントし、EFLAGS レジスタの内容全体をスタックにプッシュする。(オペランド・サイズ属性が 16 である場合は) スタックポインタを 2 デクリメントし、EFLAGS レジスタの下位 16 ビット (すなわち、FLAGS レジスタ) をスタックにプッシュする。(これらの命令は、POPF/POPFD 命令の逆の操作を実行する。) EFLAGS レジスタ全体をスタックにコピーするときは、VM および RF フラグ (ビット 16 および 17) はコピーされない。その代わりに、これらのフラグの値は、スタックにストアされる EFLAGS イメージでクリアされる。EFLAGS レジスタの詳細については、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の第 3 章の「EFLAGS レジスタ」の項を参照のこと。

PUSHF (フラグをプッシュ) ニーモニックおよび PUSHFD (ダブルのフラグをプッシュ) ニーモニックは、同じオペコードを参照する。PUSHF 命令は、オペランド・サイズ属性が 16 であるときに使用するためのものであり、PUSHFD 命令は、オペランド・サイズ属性が 32 であるときに使用するためのものである。一部のアセンブラーは、PUSHF が使用されるときはオペランド・サイズを 16 に、PUSHFD が使用されるときは 32 に強制する。他のアセンブラーは、これらのニーモニックをシノニム (PUSHF/PUSHFD) として取り扱い、オペランド・サイズ属性の現在の設定を使用して、使用されているニーモニックに関係なく、スタックにプッシュする値のサイズを決定することができる。

仮想 8086 モードで I/O 特権レベル (IOPL) が 3 より小さい場合、PUSHF/PUSHFD 命令は一般保護例外 (#GP) を発生させる。

実アドレスモードでは、PUSHF/PUSHFD 命令が実行されるときに、ESP レジスタまたは SP レジスタが 1、3、または 5 である場合、プロセッサはスタックスペースの不足によってシャットダウンする。この状態を示す例外は生成されない。

## PUSHF/PUSHFD—Push EFLAGS Register onto the Stack (続き)

### 操作

```

IF (PE=0) OR (PE=1 AND ((VM=0) OR (VM=1 AND IOPL=3)))
(* Real-Address Mode, Protected mode, or Virtual-8086 mode with IOPL equal to 3 *)
    THEN
        IF OperandSize = 32
            THEN
                push(EFLAGS AND 00FCFFFFH);
                (* VM and RF EFLAG bits are cleared in image stored on the stack*)
            ELSE
                push(EFLAGS); (* Lower 16 bits only *)
            FI;
        ELSE (* In Virtual-8086 Mode with IOPL less than 3 *)
            #GP(0); (* Trap to virtual-8086 monitor *)
        FI;
    
```

### 影響を受けるフラグ

なし。

### 保護モード例外

- |               |                                                                  |
|---------------|------------------------------------------------------------------|
| #SS(0)        | ESP レジスタの新しい値がスタック・セグメントの境界外にある場合。                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

なし。

### 仮想 8086 モード例外

- |               |                                                  |
|---------------|--------------------------------------------------|
| #GP(0)        | I/O 特権レベルが 3 より小さい場合。                            |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                  |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## PXOR—Logical Exclusive OR

| オペコード       | 命令                          | 説明                                                         |
|-------------|-----------------------------|------------------------------------------------------------|
| 0F EF /r    | PXOR <i>mm, mm/m64</i>      | <i>mm/m64</i> と <i>mm</i> のビット単位の XOR（排他的論理和）演算を実行する。      |
| 66 0F EF /r | PXOR <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のビット単位の XOR（排他的論理和）演算を実行する。 |

### 説明

ソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）との間のビット単位の XOR（排他的論理和）演算を実行し、結果をデスティネーション・オペランドにストアする。ソース・オペランドには、MMX®テクノロジ・レジスタまたは64ビットのメモリ・ロケーション、XMM レジスタまたは128ビットのメモリ・ロケーションを使用できる。デスティネーション・オペランドは、MMX テクノロジ・レジスタまたはXMM レジスタを使用できる。各ビットの結果は、2つのオペランドの対応するビットが異なる場合は1になり、同じ場合は0になる。

### 操作

DEST ← DEST XOR SRC;

### 同等のインテル® C/C++ コンパイラ組み込み関数

|      |                                                             |
|------|-------------------------------------------------------------|
| PXOR | <code>__m64 __mm_xor_si64 ( __m64 m1, __m64 m2)</code>      |
| PXOR | <code>__m128i __mm_xor_si128 ( __m128i a, __m128i b)</code> |

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                                                                  |
|---------------|------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>(128ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                               |
| #UD           | CR0 の EM がセットされた場合。<br>(128ビット操作のみ) CR4 の OSFXSR が 0 の場合。<br>(128ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。              |
| #NM           | CR0 の TS がセットされた場合。                                                                                              |
| #MF           | (64ビット操作のみ) 未処理の x87 FPU 例外がある場合。                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                  |

## PXOR—Logical Exclusive OR（続き）

#AC(0) (64 ビット操作のみ) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

#GP(0) (128 ビット操作のみ) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。

オペランドのいずれかの部分が実効アドレス空間 0 ~ FFFFH の外にある場合。

#UD CR0 の EM がセットされた場合。

(128 ビット操作のみ) CR4 の OSFXSR が 0 の場合。

(128 ビット操作のみ) CPUID 機能フラグ SSE2 が 0 の場合。

#NM CR0 の TS がセットされた場合。

#MF (64 ビット操作のみ) 未処理の x87 FPU 例外がある場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフェルトが発生した場合。

#AC(0) (64 ビット操作のみ) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 数値例外

なし。

**RCL/RCR/ROL/ROR—Rotate**

| オペコード           | 命令                     | 説明                                                 |
|-----------------|------------------------|----------------------------------------------------|
| D0 /2           | RCL <i>r/m8, 1</i>     | 9 ビット (CF、 <i>r/m8</i> ) を左に 1 回回転させる。             |
| D2 /2           | RCL <i>r/m8, CL</i>    | 9 ビット (CF、 <i>r/m8</i> ) を左に CL 回回転させる。            |
| C0 /2 <i>ib</i> | RCL <i>r/m8, imm8</i>  | 9 ビット (CF、 <i>r/m8</i> ) を左に <i>imm8</i> 回回転させる。   |
| D1 /2           | RCL <i>r/m16, 1</i>    | 17 ビット (CF、 <i>r/m16</i> ) を左に 1 回回転させる。           |
| D3 /2           | RCL <i>r/m16, CL</i>   | 17 ビット (CF、 <i>r/m16</i> ) を左に CL 回回転させる。          |
| C1 /2 <i>ib</i> | RCL <i>r/m16, imm8</i> | 17 ビット (CF、 <i>r/m16</i> ) を左に <i>imm8</i> 回回転させる。 |
| D1 /2           | RCL <i>r/m32, 1</i>    | 33 ビット (CF、 <i>r/m32</i> ) を左に 1 回回転させる。           |
| D3 /2           | RCL <i>r/m32, CL</i>   | 33 ビット (CF、 <i>r/m32</i> ) を左に CL 回回転させる。          |
| C1 /2 <i>ib</i> | RCL <i>r/m32, imm8</i> | 33 ビット (CF、 <i>r/m32</i> ) を左に <i>imm8</i> 回回転させる。 |
| D0 /3           | RCR <i>r/m8, 1</i>     | 9 ビット (CF、 <i>r/m8</i> ) を右に 1 回回転させる。             |
| D2 /3           | RCR <i>r/m8, CL</i>    | 9 ビット (CF、 <i>r/m8</i> ) を右に CL 回回転させる。            |
| C0 /3 <i>ib</i> | RCR <i>r/m8, imm8</i>  | 9 ビット (CF、 <i>r/m8</i> ) を右に <i>imm8</i> 回回転させる。   |
| D1 /3           | RCR <i>r/m16, 1</i>    | 17 ビット (CF、 <i>r/m16</i> ) を右に 1 回回転させる。           |
| D3 /3           | RCR <i>r/m16, CL</i>   | 17 ビット (CF、 <i>r/m16</i> ) を右に CL 回回転させる。          |
| C1 /3 <i>ib</i> | RCR <i>r/m16, imm8</i> | 17 ビット (CF、 <i>r/m16</i> ) を右に <i>imm8</i> 回回転させる。 |
| D1 /3           | RCR <i>r/m32, 1</i>    | 33 ビット (CF、 <i>r/m32</i> ) を右に 1 回回転させる。           |
| D3 /3           | RCR <i>r/m32, CL</i>   | 33 ビット (CF、 <i>r/m32</i> ) を右に CL 回回転させる。          |
| C1 /3 <i>ib</i> | RCR <i>r/m32, imm8</i> | 33 ビット (CF、 <i>r/m32</i> ) を右に <i>imm8</i> 回回転させる。 |
| D0 /0           | ROL <i>r/m8, 1</i>     | 8 ビット <i>r/m8</i> を左に 1 回回転させる。                    |
| D2 /0           | ROL <i>r/m8, CL</i>    | 8 ビット <i>r/m8</i> を左に CL 回回転させる。                   |
| C0 /0 <i>ib</i> | ROL <i>r/m8, imm8</i>  | 8 ビット <i>r/m8</i> を左に <i>imm8</i> 回回転させる。          |
| D1 /0           | ROL <i>r/m16, 1</i>    | 16 ビット <i>r/m16</i> を左に 1 回回転させる。                  |
| D3 /0           | ROL <i>r/m16, CL</i>   | 16 ビット <i>r/m16</i> を左に CL 回回転させる。                 |
| C1 /0 <i>ib</i> | ROL <i>r/m16, imm8</i> | 16 ビット <i>r/m16</i> を左に <i>imm8</i> 回回転させる。        |
| D1 /0           | ROL <i>r/m32, 1</i>    | 32 ビット <i>r/m32</i> を左に 1 回回転させる。                  |
| D3 /0           | ROL <i>r/m32, CL</i>   | 32 ビット <i>r/m32</i> を左に CL 回回転させる。                 |
| C1 /0 <i>ib</i> | ROL <i>r/m32, imm8</i> | 32 ビット <i>r/m32</i> を左に <i>imm8</i> 回回転させる。        |
| D0 /1           | ROR <i>r/m8, 1</i>     | 8 ビット <i>r/m8</i> を右に 1 回回転させる。                    |
| D2 /1           | ROR <i>r/m8, CL</i>    | 8 ビット <i>r/m8</i> を右に CL 回回転させる。                   |
| C0 /1 <i>ib</i> | ROR <i>r/m8, imm8</i>  | 8 ビット <i>r/m8</i> を右に <i>imm8</i> 回回転させる。          |
| D1 /1           | ROR <i>r/m16, 1</i>    | 16 ビット <i>r/m16</i> を右に 1 回回転させる。                  |
| D3 /1           | ROR <i>r/m16, CL</i>   | 16 ビット <i>r/m16</i> を右に CL 回回転させる。                 |
| C1 /1 <i>ib</i> | ROR <i>r/m16, imm8</i> | 16 ビット <i>r/m16</i> を右に <i>imm8</i> 回回転させる。        |
| D1 /1           | ROR <i>r/m32, 1</i>    | 32 ビット <i>r/m32</i> を右に 1 回回転させる。                  |
| D3 /1           | ROR <i>r/m32, CL</i>   | 32 ビット <i>r/m32</i> を右に CL 回回転させる。                 |
| C1 /1 <i>ib</i> | ROR <i>r/m32, imm8</i> | 32 ビット <i>r/m32</i> を右に <i>imm8</i> 回回転させる。        |

## RCL/RCR/ROL/ROR—Rotate（続き）

### 説明

第1オペランド（デスティネーション・オペランド）のビットを第2オペランド（カウント・オペランド）に指定されたビット位置の数だけシフトし（回転させ）、結果をデスティネーション・オペランドにストアする。デスティネーション・オペランドには、レジスタまたはメモリ・ロケーションを使用できる。カウント・オペランドは、即値またはCLレジスタの値が可能で、符号なし整数である。プロセッサは、最下位5ビットを除くカウント・オペランドのすべてのビットをマスクして、カウントを0から31までの数に制限する。

左に回転（ROL）命令およびキャリーを通じて左に回転（RCL）命令は、すべてのビットを最上位ビット位置の方向にシフトするが、最上位ビットだけは最下位ビット・ロケーションに回転される（『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図7-11.を参照）。右に回転（ROR）命令およびキャリーを通じて右に回転（RCR）命令は、すべてのビットを最下位ビット位置の方向にシフトするが、最下位ビットだけは最上位ビット・ロケーションに回転される（『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図7-11.を参照）。

RCL命令およびRCR命令は、回転の中にCFフラグを含める。RCL命令は、CFフラグを最下位ビットにシフトさせ、最上位ビットをCFフラグにシフトさせる（『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図7-11.を参照）。RCR命令は、CFフラグを最上位ビットにシフトさせ、最下位ビットをCFフラグにシフトさせる（『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図7-11.を参照）。ROL命令およびROR命令では、CFフラグの元の値は結果には含まれられないが、CFフラグには1端からもう1端にシフトされたビットのコピーが入る。

OFフラグは、1ビットの回転だけに定義され、（どのフラグにも影響を与えないゼロビットの回転が何も行わないことを除いて）その他のすべての場合は未定義である。左回転では、OFフラグは、（回転後の）CFビットと結果の最上位ビットとの排他的論理和に設定される。右回転では、OFフラグは、結果の最上位2ビットの排他的論理和に設定される。

### IA-32 アーキテクチャにおける互換性

8086は、回転カウントをマスクしない。ただし、（インテル® 286プロセッサから始まる）他のすべてのIA-32プロセッサは、回転カウントを5ビットにマスクするので、最大カウントは31になる。このマスク設定は（仮想8086モードを含めた）すべての動作モードで行われて、命令の最大実行時間を減少させる。

## RCL/RCR/ROL/ROR—Rotate (続き)

### 操作

```
(* RCL and RCR instructions *)
SIZE ← OperandSize
CASE (determine count) OF
  SIZE ← 8:  tempCOUNT ← (COUNT AND 1FH) MOD 9;
  SIZE ← 16: tempCOUNT ← (COUNT AND 1FH) MOD 17;
  SIZE ← 32: tempCOUNT ← COUNT AND 1FH;
ESAC;
(* RCL instruction operation *)
WHILE (tempCOUNT ≠ 0)
  DO
    tempCF ← MSB(DEST);
    DEST ← (DEST * 2) + CF;
    CF ← tempCF;
    tempCOUNT ← tempCOUNT - 1;
  OD;
  ELIHW;
  IF COUNT = 1
    THEN OF ← MSB(DEST) XOR CF;
    ELSE OF is undefined;
  FI;
(* RCR instruction operation *)
IF COUNT = 1
  THEN OF ← MSB(DEST) XOR CF;
  ELSE OF is undefined;
FI;
WHILE (tempCOUNT ≠ 0)
  DO
    tempCF ← LSB(SRC);
    DEST ← (DEST / 2) + (CF * 2SIZE);
    CF ← tempCF;
    tempCOUNT ← tempCOUNT - 1;
  OD;
(* ROL and ROR instructions *)
SIZE ← OperandSize
CASE (determine count) OF
  SIZE ← 8:  tempCOUNT ← COUNT MOD 8;
  SIZE ← 16: tempCOUNT ← COUNT MOD 16;
  SIZE ← 32: tempCOUNT ← COUNT MOD 32;
ESAC;
(* ROL instruction operation *)
WHILE (tempCOUNT ≠ 0)
  DO
    tempCF ← MSB(DEST);
    DEST ← (DEST * 2) + tempCF;
    tempCOUNT ← tempCOUNT - 1;
  OD;
  ELIHW;
  CF ← LSB(DEST);
```

## RCL/RCR/ROL/ROR—Rotate（続き）

```

IF COUNT = 1
    THEN OF ← MSB(DEST) XOR CF;
    ELSE OF is undefined;
FI;
(* ROR instruction operation *)
WHILE (tempCOUNT ≠ 0)
DO
    tempCF ← LSB(SRC);
    DEST ← (DEST / 2) + (tempCF * 2SIZE);
    tempCOUNT ← tempCOUNT – 1;
OD;
ELIHW;
CF ← MSB(DEST);
IF COUNT = 1
    THEN OF ← MSB(DEST) XOR MSB – 1(DEST);
    ELSE OF is undefined;
FI;

```

### 影響を受けるフラグ

CF フラグは、そこにシフトされたビットの値を持つ。OF フラグは、単一ビット回転（上記の「説明」の項を参照）の場合だけに影響を受け、複数ビット回転の場合には未定義である。SF、ZF、AF、PF フラグは影響を受けない。

### 保護モード例外

|               |                                                                                                                                  |
|---------------|----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | ソース・オペランドが書き込み不可能なセグメントにある場合。<br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                 |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

## RCL/RCR/ROL/ROR—Rotate（続き）

### 仮想 8086 モード例外

- |               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## RCPPS—Compute Reciprocals of Packed Single-Precision Floating-Point Values

| オペコード    | 命令                           | 説明                                                                   |
|----------|------------------------------|----------------------------------------------------------------------|
| 0F 53 /r | RCPPS <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> のパックド単精度浮動小数点値の逆数の近似値を計算し、その結果を <i>xmm1</i> にストアする。 |

### 説明

ソース・オペランド（第2オペランド）の4つのパックド単精度浮動小数点値の逆数の近似値を SIMD 計算し、結果のパックド単精度浮動小数点値をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスタである。単精度浮動小数点値の SIMD 演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 10-5. を参照のこと。

この近似値の相対誤差は以下のとおりである。

$$|\text{相対誤差}| \leq 1.5 * 2^{-12}$$

RCPSS 命令は、MXCSR レジスタの丸め制御ビットの影響を受けない。ソースの値が 0.0 の場合は、ソースの値と同じ符号の∞が返される。ソースの値がデノーマルの場合は、(同じ符号の) 0.0 として処理される。極小の結果は、オペランドと同じ符号の 0.0 に常にフラッシュされる（入力値が  $|1.111111111010000000000B*2^{125}|$  と等しいかまたはそれより大きい場合は、極小の結果は生成されないことが保証されている。入力値が  $|1.00000000000110000000001B*2^{126}|$  と等しいかまたはそれより小さい場合は、極小の結果が生成され、0.0 にフラッシュされることが保証されている。入力値がこの範囲の中間にある場合は、プロセッサのモデルによって、極小の結果が生成されることも生成されないこともある）。ソースの値が SNaN または QNaN の場合は、QNaN に変換された SNaN か、ソースの QNaN が返される。

### 操作

```
DEST[31-0] ← APPROXIMATE(1.0/(SRC[31-0]));
DEST[63-32] ← APPROXIMATE(1.0/(SRC[63-32]));
DEST[95-64] ← APPROXIMATE(1.0/(SRC[95-64]));
DEST[127-96] ← APPROXIMATE(1.0/(SRC[127-96]));
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

RCCPS        \_\_m128 \_mm\_rcp\_ps(\_\_m128 a)

### SIMD 浮動小数点例外

なし。

## RCPPS—Compute Reciprocals of Packed Single-Precision Floating-Point Values (続き)

### 保護モード例外

|               |                                                                          |
|---------------|--------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。                         |
|               | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                            |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                    |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                          |
| #NM           | CR0 の TS がセットされた場合。                                                      |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。 |

### 実アドレスモード例外

|        |                                                                                      |
|--------|--------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                  |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。             |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## RCPSS—Compute Reciprocal of Scalar Single-Precision Floating-Point Values

| オペコード       | 命令                          | 説明                                                                  |
|-------------|-----------------------------|---------------------------------------------------------------------|
| F3 0F 53 /r | RCPSS <i>xmm1, xmm2/m32</i> | <i>xmm2/m128</i> のスカラ単精度浮動小数点値の逆数の近似値を計算し、その結果を <i>xmm1</i> にストアする。 |

### 説明

ソース・オペランド（第2オペランド）の最下位の単精度浮動小数点値の逆数の近似値を計算し、結果の単精度浮動小数点値をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは32ビットのメモリ・ロケーションである。デスティネーション・オペランドはXMM レジスタである。デスティネーション・オペランドの上位3つのダブルワードは変更されない。単精度浮動小数点値のスカラ演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 10-6. を参照のこと。

この近似値の相対誤差は以下のとおりである。

$$|\text{相対誤差}| \leq 1.5 * 2^{-12}$$

RCPSS 命令は、MXCSR レジスタの丸め制御ビットの影響を受けない。ソースの値が 0.0 の場合は、ソースの値と同じ符号の∞が返される。ソースの値がデノーマルの場合は、(同じ符号の) 0.0 として処理される。極小の結果は、オペランドと同じ符号の 0.0 に常にフラッシュされる（入力値が  $|1.111111111010000000000B*2^{125}|$  と等しいかまたはそれより大きい場合は、極小の結果は生成されないことが保証されている。入力値が  $|1.000000000001100000000001B*2^{126}|$  と等しいかまたはそれより小さい場合は、極小の結果が生成され、0.0 にフラッシュされることが保証されている。入力値がこの範囲の中間にある場合は、プロセッサのモデルによって、極小の結果が生成されることも生成されないこともある）。ソースの値が SNaN または QNaN の場合は、QNaN に変換された SNaN か、ソースの QNaN が返される。

### 操作

```
DEST[31-0] ← APPROX (1.0/(SRC[31-0]));
* DEST[127-32] remains unchanged *;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

RCPSS        \_\_m128\_mm\_rcp\_ss(\_\_m128 a)

### SIMD 浮動小数点例外

なし。

## RCPSS—Compute Reciprocal of Scalar Single-Precision Floating-Point Values (続き)

### 保護モード例外

|               |                                                                          |
|---------------|--------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。                         |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                    |
| #PF (フォルトコード) | ページフェルトが発生した場合。                                                          |
| #NM           | CR0 の TS がセットされた場合。                                                      |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。 |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、現行特権レベルが 3 のときにアライメントが合わないメモリ参照を行った場合。           |

### 実アドレスモード例外

|       |                                                                          |
|-------|--------------------------------------------------------------------------|
| GP(0) | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                                      |
| #NM   | CR0 の TS がセットされた場合。                                                      |
| #UD   | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。 |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|               |                           |
|---------------|---------------------------|
| #PF (フォルトコード) | ページフェルトが発生した場合。           |
| #AC(0)        | アライメントの合っていないメモリ参照を行った場合。 |

## RDMSR—Read from Model Specific Register

| オペコード | 命令    | 説明                             |
|-------|-------|--------------------------------|
| OF 32 | RDMSR | ECXによって指定されるMSRをEDX:EAXにロードする。 |

### 説明

ECX レジスタに指定された 64 ビットのモデル固有レジスタ (MSR) の内容をレジスタ EDX:EAX にロードする。ECX レジスタにロードされる入力値は、読み取られる MSR のアドレスである。EDX レジスタには MSR の上位 32 ビットがロードされ、EAX レジスタには下位 32 ビットがロードされる。読み取られる MSR に 64 より少ないビットしかインプリメントされていない場合は、インプリメントされていないビット・ロケーションで EDX:EAX に返される値は未定義である。

この命令は、特権レベル 0 または実アドレスモードで実行しなければならない。そうしないと、一般保護例外 #GP(0) が生成される。予約されているかまたはインプリメントされていない MSR アドレスを ECX に指定しても、一般保護例外が生成される。

MSR は、テスト機能、実行トレース、性能モニタリング、マシン・チェック・エラーの機能を制御する。『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、下巻』の付録 B 「モデル固有レジスタ (MSR)」では、この命令で読み取ることができるすべての MSR とそれらのアドレスを一覧している。各プロセッサ・ファミリーは、独自に一連の MSR を持っていることに注意すること。

この命令を使用する前に、MSR がサポートされている (EDX[5]=1) かどうかを判断するため、CPUID 命令を使用する必要がある。

### IA-32 アーキテクチャにおける互換性

MSR および RDMSR 命令でそれらを読み取る機能は、インテル® Pentium® プロセッサで IA-32 アーキテクチャに導入された。インテル Pentium プロセッサより以前の IA-32 プロセッサでこの命令を実行すると、無効オペコード例外 #UD が生成される。

### 操作

EDX:EAX ← MSR[ECX];

### 影響を受けるフラグ

なし。

## RDMSR—Read from Model Specific Register（続き）

### 保護モード例外

- #GP(0) 現行特権レベルが 0 でない場合。  
ECX の値が予約されているかまたはインプリメントされていない MSR アドレスを指定している場合。

### 実アドレスモード例外

- #GP CX の値が予約されているまたはインプリメントされていない MSR アドレスを指定している場合。

### 仮想 8086 モード例外

- #GP(0) RDMSR 命令は仮想 8086 モードでは認識されない。

## RDPMC—Read Performance-Monitoring Counters

| オペコード | 命令    | 説明                                         |
|-------|-------|--------------------------------------------|
| OF 33 | RDPMC | ECX によって指定される性能モニタリング・カウンタを EDX:EAX に読み込む。 |

### 説明

この命令は、ECX レジスタに指定された 40 ビットの性能モニタリング・カウンタの内容をレジスタ EDX:EAX にロードする。EDX レジスタには、カウンタの上位 8 ビットがロードされ、EAX レジスタには、下位 32 ビットがロードされる。読み込まれるカウンタは、ECX レジスタに格納される符号なし整数で指定される。P6 ファミリ・プロセッサと MMX® テクノロジ Pentium® プロセッサには、2 個の性能モニタリング・カウンタ (0 および 1) があり、ECX レジスタにそれぞれ 0000H または 0001H を入れて指定する。インテル® Pentium® 4 プロセッサとインテル® Xeon™ プロセッサには 18 個のカウンタ (0 ~ 17) があり、それぞれ 0000H から 0011H で指定する。

インテル Pentium 4 プロセッサとインテル Xeon プロセッサではパフォーマンス・カウンタの「高速」(32 ビット) 読み込みと「低速」(40 ビット) 読み込みをサポートしているが、これは、ECX レジスタのビット 31 で選択される。ビット 31 がセットされている場合、RDPMC 命令は、選択されたパフォーマンス・カウンタの下位 32 ビットのみを読み込む。ビット 31 がクリアされている場合は、カウンタの 40 ビットがすべて読み込まれる。読み込まれた 32 ビット・カウンタは EAX レジスタに返され、EDX レジスタは 0 にセットされる。インテル Pentium 4 プロセッサまたはインテル Xeon プロセッサでは、全 40 ビットの読み込みよりも 32 ビットの読み込みの方が高速に実行される。

保護モードまたは仮想 8086 モードでは、レジスタ CR4 の性能モニタリング・カウンタ・イネーブル (PCE) フラグにより、RDPMC 命令の使用が次のように制限される。PCE フラグがセットされている場合、RDPMC 命令をすべての特権レベルで実行できる。フラグがクリアされている場合、この命令は特権レベル 0 でのみ実行できる（実アドレスモードでは、RDPMC 命令は常にイネーブルになる）。

特権レベル 0 で実行した場合、RDMSR 命令を使用して性能モニタリング・カウンタを読み取ることもできる。

性能モニタリング・カウンタは、デコードされた命令数、受け取った割り込み数、キヤッシュ・ロードの回数などのイベントをカウントするようにプログラムできるイベントカウンタである。『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、下巻』の付録 A 「性能モニタリング・イベント」では、インテル Pentium 4 プロセッサ、インテル Xeon プロセッサ、初期の IA-32 プロセッサでカウントできるイベントを一覧している。

## RDPMC—Read Performance-Monitoring Counters (続き)

RDPMC 命令は、命令をシリアル化しない。すなわち、先行する命令によって発生したすべてのイベントが完了していること、または後続の命令によって発生するイベントが開始していないことを保証していない。正確なイベントカウントが必要な場合は、ソフトウェアは、RDPMC 命令の前、後、またはその両方で (CPUID 命令などの) シリアル化命令を挿入しなければならない。

インテル Pentium 4 プロセッサおよびインテル Xeon プロセッサでは、バックツーバック高速読み込みの実行が単調になるという保証はない。バックツーバック読み込みの単調性を保証するためには、シリアル化命令を 2 つの RDPMC 命令間に配置する必要がある。

RDPMC 命令は、16 ビット・アドレス指定モードまたは仮想 8086 モードで実行することができるが、ECX レジスタの内容すべてを使用してカウンタを選択し、イベントカウントはすべての EAX レジスタおよび EDX レジスタにストアされる。

RDPMC 命令は、インテル® Pentium® Pro プロセッサおよび MMX® テクノロジを実装したインテル Pentium プロセッサで IA-32 アーキテクチャに導入された。初期のインテル Pentium プロセッサにも性能モニタリング・カウンタがあるが、RDMSR 命令で読み取らなければならない。

### 操作

```
(* P6 family processors and Pentium processor with MMX technology *)
IF (ECX=0 OR 1) AND ((CR4.PCE=1) OR (CPL=0) OR (CR0.PE=0))
    THEN
        EAX ← PMC(ECX)[31:0];
        EDX ← PMC(ECX)[39:32];
    ELSE (* ECX is not 0 or 1 or CR4.PCE is 0 and CPL is 1, 2, or 3 and CR0.PE is 1 *)
        #GP(0); FI;
(* Pentium 4 and Intel Xeon processor *)
IF (ECX[30:0]=0 ... 17) AND ((CR4.PCE=1) OR (CPL=0) OR (CR0.PE=0))
    THEN IF ECX[31] = 0
        THEN
            EAX ← PMC(ECX[30:0])[31:0]; (* 40-bit read *);
            EDX ← PMC(ECX[30:0])[39:32];
        ELSE IF ECX[31] = 1
            THEN
                EAX ← PMC(ECX[30:0])[31:0]; (* 32-bit read *);
                EDX ← 0;
            FI;
        FI;
    ELSE (* ECX[30:0] is not 0...17 or CR4.PCE is 0 and CPL is 1, 2, or 3 and CR0.PE is 1 *)
        #GP(0); FI;
```

## RDPMC—Read Performance-Monitoring Counters（続き）

### 影響を受けるフラグ

なし。

### 保護モード例外

#GP(0)

現行特権レベルが 0 でなく、CR4 レジスタの PCE フラグがクリアされている場合。

(P6 ファミリ・プロセッサおよび MMX テクノロジ Pentium プロセッサ) ECX レジスタの値が 0 または 1 でない場合。

(インテル Pentium 4 プロセッサおよびインテル Xeon プロセッサ) ECX[30:0] の値が 0 ~ 17 の範囲外の場合。ECX レジスタの値が 0 または 1 でない場合。

### 実アドレスモード例外

#GP

(P6 ファミリ・プロセッサおよび MMX テクノロジ Pentium プロセッサ)

ECX レジスタの値が 0 または 1 でない場合。

(インテル Pentium 4 プロセッサおよびインテル Xeon プロセッサ) ECX[30:0] の値が 0 ~ 17 の範囲外の場合。

### 仮想 8086 モード例外

#GP(0)

CR4 レジスタの PCE フラグがクリアされている場合。

(P6 ファミリ・プロセッサおよび MMX テクノロジ Pentium プロセッサ) ECX レジスタの値が 0 または 1 でない場合。

(インテル Pentium 4 プロセッサおよびインテル Xeon プロセッサ) ECX[30:0] の値が 0 ~ 17 の範囲外の場合。

## RDTSC—Read Time-Stamp Counter

| オペコード | 命令    | 説明                           |
|-------|-------|------------------------------|
| 0F 31 | RDTSC | タイムスタンプ・カウンタを EDX:EAX に読み込む。 |

### 説明

プロセッサのタイムスタンプ・カウンタの現在の値を EDX:EAX レジスタにロードする。タイムスタンプ・カウンタは、64 ビットの MSR に含まれている。MSR の上位 32 ビットが EDX レジスタにロードされ、下位 32 ビットが EAX レジスタにロードされる。プロセッサは、クロックサイクルごとにタイムスタンプ・カウンタ MSR を単調にインクリメントし、プロセッサがリセットされるとカウンタを 0 にリセットする。タイムスタンプ・カウンタの動作の詳細は、『IA-32 インテル®・アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、下巻』の第 15 章の「タイムスタンプ・カウンタ」を参照のこと。

保護モードまたは仮想 8086 モードでは、CR4 レジスタのタイムスタンプ・ディスクエーブル (TSD) フラグは、以下のように RDTSC 命令の使用を制限する。TSD フラグがクリアされていると、RDTSC 命令はどの特権レベルでも実行することができる。このフラグがセットされていると、命令は特権レベル 0 だけで実行することができる（実アドレスモードでは、RDTSC 命令は常にイネーブルである）。

特権レベル 0 で実行しているときは、RDMSR 命令を使用してタイムスタンプ・カウンタを読み取ることもできる。

RDTSC 命令は、シリアル化命令ではない。そのため、カウンタを読み取る前に、前のすべての命令が実行されるまで待つことをしない。同様に、読み取り操作が行われる前に、後続の命令が実行を開始している場合もある。

この命令は、インテル® Pentium® プロセッサで IA-32 アーキテクチャに導入された。

### 操作

```
IF (CR4.TSD=0) OR (CPL=0) OR (CR0.PE=0)
    THEN
        EDX:EAX ← TimeStampCounter;
    ELSE (* CR4.TSD is 1 and CPL is 1, 2, or 3 and CR0.PE is 1 *)
        #GP(0)
    FI;
```

### 影響を受けるフラグ

なし。

## RDTSC—Read Time-Stamp Counter（続き）

### 保護モード例外

#GP(0) CR4 レジスタの TSD フラグがセットされていて、CPL が 0 より大きい場合。

### 実アドレスモード例外

なし。

### 仮想 8086 モード例外

#GP(0) CR4 レジスタの TSD フラグがセットされた場合。

## REP/REPE/REPZ/REPNE/REPNZ—Repeat String Operation Prefix

| オペコード | 命令                         | 説明                                             |
|-------|----------------------------|------------------------------------------------|
| F3 6C | REP INS <i>m8, DX</i>      | (E)CX のバイトをポート DX から ES:[(E)DI] に入力する。         |
| F3 6D | REP INS <i>m16, DX</i>     | (E)CX のワードをポート DX から ES:[(E)DI] に入力する。         |
| F3 6D | REP INS <i>m32, DX</i>     | (E)CX のダブルワードをポート DX から ES:[(E)DI] に入力する。      |
| F3 A4 | REP MOVS <i>m8, m8</i>     | (E)CX のバイトを DS:[(E)SI] から ES:[(E)DI] に転送する。    |
| F3 A5 | REP MOVS <i>m16, m16</i>   | (E)CX のワードを DS:[(E)SI] から ES:[(E)DI] に転送する。    |
| F3 A5 | REP MOVS <i>m32, m32</i>   | (E)CX のダブルワードを DS:[(E)SI] から ES:[(E)DI] に転送する。 |
| F3 6E | REP OUTS DX, <i>r/m8</i>   | (E)CX のバイトを DS:[(E)SI] からポート DX に出力する。         |
| F3 6F | REP OUTS DX, <i>r/m16</i>  | (E)CX のワードを DS:[(E)SI] からポート DX に出力する。         |
| F3 6F | REP OUTS DX, <i>r/m32</i>  | (E)CX のダブルワードを DS:[(E)SI] からポート DX に出力する。      |
| F3 AC | REP LODS AL                | (E)CX のバイトを DS:[(E)SI] から AL にロードする。           |
| F3 AD | REP LODS AX                | (E)CX のワードを DS:[(E)SI] から AX にロードする。           |
| F3 AD | REP LODS EAX               | (E)CX のダブルワードを DS:[(E)SI] から EAX にロードする。       |
| F3 AA | REP STOS <i>m8</i>         | ES:[(E)DI] にある (E)CX のバイトを AL で埋める。            |
| F3 AB | REP STOS <i>m16</i>        | ES:[(E)DI] にある (E)CX のワードを AX で埋める。            |
| F3 AB | REP STOS <i>m32</i>        | ES:[(E)DI] にある (E)CX のダブルワードを EAX で埋める。        |
| F3 A6 | REPE CMPS <i>m8, m8</i>    | ES:[(E)DI] と DS:[(E)SI] にある一致していないバイトを探す。      |
| F3 A7 | REPE CMPS <i>m16, m16</i>  | ES:[(E)DI] と DS:[(E)SI] にある一致していないワードを探す。      |
| F3 A7 | REPE CMPS <i>m32, m32</i>  | ES:[(E)DI] と DS:[(E)SI] にある一致していないダブルワードを探す。   |
| F3 AE | REPE SCAS <i>m8</i>        | ES:[(E)DI] で始まる AL でないバイトを探す。                  |
| F3 AF | REPE SCAS <i>m16</i>       | ES:[(E)DI] で始まる AX でないワードを探す。                  |
| F3 AF | REPE SCAS <i>m32</i>       | ES:[(E)DI] で始まる EAX でないダブルワードを探す。              |
| F2 A6 | REPNE CMPS <i>m8, m8</i>   | ES:[(E)DI] と DS:[(E)SI] にある一致しているバイトを探す。       |
| F2 A7 | REPNE CMPS <i>m16, m16</i> | ES:[(E)DI] と DS:[(E)SI] にある一致しているワードを探す。       |
| F2 A7 | REPNE CMPS <i>m32, m32</i> | ES:[(E)DI] と DS:[(E)SI] にある一致しているダブルワードを探す。    |
| F2 AE | REPNE SCAS <i>m8</i>       | ES:[(E)DI] で始まる AL を探す。                        |
| F2 AF | REPNE SCAS <i>m16</i>      | ES:[(E)DI] で始まる AX を探す。                        |
| F2 AF | REPNE SCAS <i>m32</i>      | ES:[(E)DI] で始まる EAX を探す。                       |

## REP/REPE/REPZ/REPNE/REPNZ—Repeat String Operation Prefix (続き)

### 説明

カウンタレジスタ ((E)CX) に指定された回数か、またはZFフラグの指定された条件が満たされなくなるまで、ストリング命令を繰り返す。REP (リピート)、REPE (等しい間はリピート)、REPNE (等しくない間はリピート)、REPZ (ゼロの間はリピート)、REPNZ (ゼロでない間はリピート) の各ニーモニックは、ストリング命令の1つに付加できるプリフィックスである。REP プリフィックスは、INS、OUTS、MOVS、LODS、およびSTOS 命令に付加することができ、REPE、REPNE、REPZ、およびREPNZプリフィックスは、CMPS および SCAS 命令に付加することができる。(REPZ プリフィックスおよびREPNZプリフィックスは、それぞれ REPE プリフィックスおよびREPNE プリフィックスのシノニム形式である。) 非ストリング命令と共に使用すると、REP プリフィックスの行動は未定義である。

REP プリフィックスは、一度には1つのストリング命令だけに適用される。命令ブロックを繰り返すには、LOOP 命令またはその他のループ構造体を使用する。

これらすべてのリピート・プリフィックスは、(E)CX レジスタのカウントが 0 にデクリメントされるまで、関連する命令を繰り返させる (下記の表を参照) (現在のアドレスサイズ属性が 32 である場合)。ECX レジスタがカウンタとして使用され、アドレスサイズ属性が 16 である場合は、CX レジスタが使用される。REPE、REPNE、REPZ、REPNZ プリフィックスも、各リピート後に ZF フラグの状態をチェックし、ZF フラグが指定された状態になければリピートループを終了する。両方の終了条件がテストされるときは、リピート終了の原因是、JECXZ 命令での(E)CX レジスタのテスト、または JZ、JNZ、JNE 命令での ZF フラグのテストによって判断することができる。

| リピート・プリフィックス | 終了条件 1 | 終了条件 2 |
|--------------|--------|--------|
| REP          | ECX=0  | なし     |
| REPE/REPZ    | ECX=0  | ZF=0   |
| REPNE/REPNZ  | ECX=0  | ZF=1   |

REPE/REPZ および REPNE/REPNZ プリフィックスを使用すると、CMPS 命令および SCAS 命令の両方が、それらが行う比較の結果にしたがって ZF フラグに影響を与えるので、ZF フラグを初期化する必要はない。

## REP/REPE/REPZ/REPNE/REPNZ—Repeat String Operation Prefix (続き)

リピート・ストリング操作は、例外または割り込みによって中断されることがある。こうなっても、レジスタの状態は、例外ハンドラまたは割り込みハンドラからのリターン時にストリング操作を再開できるように保たれる。ソースレジスタおよびデスティネーション・レジスタは操作する次のストリング要素を指し、EIP レジスタはストリング命令を指し、ECX レジスタは命令の最後の正常なリピートの後に保持していた値をもつ。これによって、システムの割り込み応答時間に影響を与えずに、長いストリング操作を進めることができる。

PEPE または REPNE のプリフィックスの付いた CMPS 命令または SCAS 命令の実行中にフォルトが発生すると、EFLAGS の値は命令の実行前の状態にリストアされる。SCAS 命令および CMPS 命令は EFLAGS を入力として使用しないので、プロセッサはページフォルト・ハンドラの後に命令を再開することができる。

REP INS 命令および REP OUTS 命令は、注意して使用しなければならない。これらの命令が実行するレートを処理できない I/O ポートもある。

REP STOS 命令は、大きいメモリブロックを初期化する最も速い方法である。

### 操作

```

IF AddressSize = 16
    THEN
        use CX for CountReg;
    ELSE (* AddressSize = 32 *)
        use ECX for CountReg;
FI;
WHILE CountReg ≠ 0
    DO
        service pending interrupts (if any);
        execute associated string instruction;
        CountReg ← CountReg - 1;
        IF CountReg = 0
            THEN exit WHILE loop
        FI;
        IF (repeat prefix is REPZ or REPE) AND (ZF=0)
        OR (repeat prefix is REPNZ or REPNE) AND (ZF=1)
            THEN exit WHILE loop
        FI;
    OD;
```

### 影響を受けるフラグ

なし。ただし、CMPS 命令および SCAS 命令は、EFLAGS レジスタのステータス・フラグを設定する。

## REP/REPE/REPZ/REPNE/REPNZ—Repeat String Operation Prefix (続き)

### 例外（すべての操作モード）

なし。ただし、リピート・プリフィックスが関係している命令によって例外が生成されることがある。

## RET—Return from Procedure

| オペコード        | 命令               | 説明                                                    |
|--------------|------------------|-------------------------------------------------------|
| C3           | RET              | コール元プロシージャに near リターンする。                              |
| CB           | RET              | コール元プロシージャに far リターンする。                               |
| C2 <i>iw</i> | RET <i>imm16</i> | コール元プロシージャに near リターンし、 <i>imm16</i> バイトをスタックからポップする。 |
| CA <i>iw</i> | RET <i>imm16</i> | コール元プロシージャに far リターンし、 <i>imm16</i> バイトをスタックからポップする。  |

### 説明

プログラム制御をスタックのトップにあるリターンアドレスに移す。通常、アドレスは CALL 命令によってスタックに置かれ、リターンは CALL 命令の後に続く命令に対して行われる。

オプションのソース・オペランドは、リターンアドレスがポップされた後にリリースされるスタックバイト数を指定し、デフォルトではなしである。このオペランドは、コール先プロシージャに渡されてもう必要なパラメータをスタックからリリースするために使用することができる。これは、新しいプロシージャへの切り替えに使用される CALL 命令が新しいプロシージャのアクセスにゼロでないワードカウントのコールゲートを使用するときに使用しなければならない。ここで、RET 命令のソース・オペランドは、コールゲートのワード・カウント・フィールドに指定されているのと同じバイト数を指定しなければならない。

RET 命令を使用して、以下の異なる 3 つのタイプのリターンを実行することができる。

- near リターン – 現在のコード・セグメント（現在の CS レジスタの指示先のセグメント）内にあるコール元プロシージャへのリターン。セグメント内リターンともいう。
- far リターン – 現在のコード・セグメントとは異なるセグメント内にあるコール元プロシージャへのリターン。セグメント間リターンともいう。
- 特権レベル間 far リターン – 現在実行中のプログラムまたはプロシージャの特権レベルとは異なる特権レベルへの far リターン。

特権レベル間リターンタイプは、保護モードでしか実行することができない。near、far、および特権レベル間の各リターンの詳細については、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の第 6 章の「CALL と RET によるプロシージャのコール」の節を参照のこと。

## RET—Return from Procedure（続き）

near リターンを実行すると、プロセッサは、リターン命令ポインタ（オフセット）をスタックのトップから EIP レジスタにポップし、新しい命令ポインタでのプログラム実行を開始する。CS レジスタは変更されない。

far リターンを実行すると、プロセッサは、リターン命令ポインタをスタックのトップから EIP レジスタにポップし、次にセグメント・セレクタをスタックのトップから CS レジスタにポップする。プロセッサは、その後、新しい命令ポインタにある新しいコード・セグメントでのプログラム実行を開始する。

特権レベル間 far リターンのメカニズムは、セグメント間リターンと同様であるが、プロセッサが戻されるコード・セグメントとスタック・セグメントの特権レベルとアクセス権を調べて、制御の転送を行うことができるかどうかを判断する点が異なる。DS、ES、FS、GS セグメント・レジスタは、新しい特権レベルではアクセスすることができないセグメントをそれらが参照している場合は、特権レベル間リターン中に RET 命令によってクリアされる。特権レベル間リターンではスタックスイッチも行われるので、ESP レジスタおよび SS レジスタがスタックからロードされる。

特権レベル間コール中にパラメータがコール先プロシージャに渡される場合は、RET 命令でオプションのソース・オペランドを使用して、リターン時にパラメータをリリースしなければならない。この場合は、パラメータは、コール先プロシージャのスタックとコール元プロシージャのスタック（すなわち、戻されるスタック）から両方ともリリースされる。

### 操作

```
(* Near return *)
IF instruction = near return
    THEN;
        IF OperandSize = 32
            THEN
                IF top 12 bytes of stack not within stack limits THEN #SS(0); FI;
                EIP ← Pop();
            ELSE (* OperandSize = 16 *)
                IF top 6 bytes of stack not within stack limits
                    THEN #SS(0)
                FI;
                tempEIP ← Pop();
                tempEIP ← tempEIP AND 0000FFFFH;
                IF tempEIP not within code segment limits THEN #GP(0); FI;
                EIP ← tempEIP;
            FI;
```

## RET—Return from Procedure (続き)

```

IF instruction has immediate operand
THEN IF StackAddressSize=32
    THEN
        ESP ← ESP + SRC; (* release parameters from stack *)
    ELSE (* StackAddressSize=16 *)
        SP ← SP + SRC; (* release parameters from stack *)
    FI;
FI;

(* Real-address mode or virtual-8086 mode *)
IF ((PE = 0) OR (PE = 1 AND VM = 1)) AND instruction = far return
THEN;
    IF OperandSize = 32
        THEN
            IF top 12 bytes of stack not within stack limits THEN #SS(0); FI;
            EIP ← Pop();
            CS ← Pop(); (* 32-bit pop, high-order 16 bits discarded *)
        ELSE (* OperandSize = 16 *)
            IF top 6 bytes of stack not within stack limits THEN #SS(0); FI;
            tempEIP ← Pop();
            tempEIP ← tempEIP AND 0000FFFFH;
            IF tempEIP not within code segment limits THEN #GP(0); FI;
            EIP ← tempEIP;
            CS ← Pop(); (* 16-bit pop *)
        FI;
    IF instruction has immediate operand
        THEN
            SP ← SP + (SRC AND FFFFH); (* release parameters from stack *)
        FI;
    FI;
(* Protected mode, not virtual-8086 mode *)
IF (PE = 1 AND VM = 0) AND instruction = far RET
THEN
    IF OperandSize = 32
        THEN
            IF second doubleword on stack is not within stack limits THEN #SS(0); FI;
        ELSE (* OperandSize = 16 *)
            IF second word on stack is not within stack limits THEN #SS(0); FI;
        FI;
    IF return code segment selector is null THEN GP(0); FI;
    IF return code segment selector address is beyond descriptor table limit
        THEN GP(selector); FI;
    Obtain descriptor to which return code segment selector points from descriptor table
    IF return code segment descriptor is not a code segment THEN #GP(selector); FI;
    if return code segment selector RPL < CPL THEN #GP(selector); FI;
    IF return code segment descriptor is conforming
        AND return code segment DPL > return code segment selector RPL
        THEN #GP(selector); FI;
    IF return code segment descriptor is not present THEN #NP(selector); FI;

```

## RET—Return from Procedure (続き)

```

IF return code segment selector RPL > CPL
    THEN GOTO RETURN-OUTER-PRIVILEGE-LEVEL;
    ELSE GOTO RETURN-TO-SAME-PRIVILEGE-LEVEL
FI;
END;FI;

RETURN-SAME-PRIVILEGE-LEVEL:
IF the return instruction pointer is not within ther return code segment limit
    THEN #GP(0);
FI;
IF OperandSize=32
THEN
    EIP ← Pop();
    CS ← Pop(); (* 32-bit pop, high-order 16 bits discarded *)
    ESP ← ESP + SRC; (* release parameters from stack *)
ELSE (* OperandSize=16 *)
    EIP ← Pop();
    EIP ← EIP AND 0000FFFFH;
    CS ← Pop(); (* 16-bit pop *)
    ESP ← ESP + SRC; (* release parameters from stack *)
FI;

RETURN-OUTER-PRIVILEGE-LEVEL:
IF top (16 + SRC) bytes of stack are not within stack limits (OperandSize=32)
    OR top (8 + SRC) bytes of stack are not within stack limits (OperandSize=16)
    THEN #SS(0); FI;
FI;
Read return segment selector;
IF stack segment selector is null THEN #GP(0); FI;
IF return stack segment selector index is not within its descriptor table limits
    THEN #GP(selector); FI;
Read segment descriptor pointed to by return segment selector;
IF stack segment selector RPL ≠ RPL of the return code segment selector
    OR stack segment is not a writable data segment
    OR stack segment descriptor DPL ≠ RPL of the return code segment selector
        THEN #GP(selector); FI;
IF stack segment not present THEN #SS(StackSegmentSelector); FI;
IF the return instruction pointer is not within the return code segment limit
    THEN #GP(0); FI;
CPL ← ReturnCodeSegmentSelector(RPL);
IF OperandSize=32
THEN
    EIP ← Pop();
    CS ← Pop(); (* 32-bit pop, high-order 16 bits discarded *)
    (* segment descriptor information also loaded *)
    CS(RPL) ← CPL;
    ESP ← ESP + SRC; (* release parameters from called procedure's stack *)
    tempESP ← Pop();
    tempSS ← Pop(); (* 32-bit pop, high-order 16 bits discarded *)

```

## RET—Return from Procedure (続き)

```

(* segment descriptor information also loaded *)
ESP ← tempESP;
SS ← tempSS;
ELSE (* OperandSize=16 *)
    EIP ← Pop();
    EIP ← EIP AND 0000FFFFH;
    CS ← Pop(); (* 16-bit pop; segment descriptor information also loaded *)
    CS(RPL) ← CPL;
    ESP ← ESP + SRC; (* release parameters from called procedure's stack *)
    tempESP ← Pop();
    tempSS ← Pop(); (* 16-bit pop; segment descriptor information also loaded *)
    (* segment descriptor information also loaded *)
    ESP ← tempESP;
    SS ← tempSS;
FI;
FOR each of segment register (ES, FS, GS, and DS)
DO;
    IF segment register points to data or non-conforming code segment
    AND CPL > segment descriptor DPL; (* DPL in hidden part of segment register *)
        THEN (* segment register invalid *)
            SegmentSelector ← 0; (* null segment selector *)
    FI;
    OD;
For each of ES, FS, GS, and DS
DO
    IF segment selector index is not within descriptor table limits
    OR segment descriptor indicates the segment is not a data or
        readable code segment
    OR if the segment is a data or non-conforming code segment and the segment
        descriptor's DPL < CPL or RPL of code segment's segment selector
        THEN
            segment selector register ← null selector;
    OD;
    ESP ← ESP + SRC; (* release parameters from calling procedure's stack *)

```

### 影響を受けるフラグ

なし。

## RET—Return from Procedure (続き)

### 保護モード例外

|               |                                                                                                                                                     |
|---------------|-----------------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | リターンコードまたはスタック・セグメント・セレクタがヌルの場合。<br>リターン命令ポインタがリターン・コード・セグメントの範囲内にない場合。                                                                             |
| #GP (セレクタ)    | リターン・コード・セグメント・セレクタの RPL が CPL より小さい場合。<br>リターンコードまたはスタック・セグメント・セレクタ・インデックスがそのディスクリプタ・テーブルの範囲内にない場合。<br>リターン・コード・セグメント・ディスクリプタがコード・セグメントを指定していない場合。 |
|               | リターン・コード・セグメントが非コンフォーミングであり、セグメント・セレクタの DPL がコード・セグメントのセグメント・セレクタの RPL に等しくない場合。                                                                    |
|               | リターン・コード・セグメントがコンフォーミングであり、セグメント・セレクタの DPL がコード・セグメントのセグメント・セレクタの RPL より大きい場合。                                                                      |
|               | スタック・セグメントが書き込み可能なデータ・セグメントでない場合。                                                                                                                   |
|               | スタック・セグメント・セレクタ RPL がリターン・コード・セグメント・セレクタの RPL に等しくない場合。                                                                                             |
|               | スタック・セグメント・ディスクリプタ DPL がリターン・コード・セグメント・セレクタの RPL に等しくない場合。                                                                                          |
| #SS(0)        | スタックのトップバイトがスタックの範囲内にない場合。<br>リターン・スタック・セグメントが存在しない場合。                                                                                              |
| #NP (セレクタ)    | リターン・コード・セグメントが存在しない場合。                                                                                                                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                                     |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリアクセスが行われた場合。                                                                                  |

### 実アドレスモード例外

|     |                                     |
|-----|-------------------------------------|
| #GP | リターン命令ポインタがリターン・コード・セグメントの範囲内にない場合。 |
| #SS | スタックのトップバイトがスタックの範囲内にない場合。          |

## RET—Return from Procedure (続き)

### 仮想 8086 モード例外

- |               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | リターン命令ポインタがリターン・コード・セグメントの範囲内にない場合。                |
| #SS(0)        | スタックのトップバイトがスタックの範囲内にない場合。                         |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリアクセスが行われた場合。 |

## ROL/ROR—Rotate

「RCL/RCR/ROL/ROR—Rotate」を参照のこと。

## RSM—Resume from System Management Mode

| オペコード | 命令  | 説明                   |
|-------|-----|----------------------|
| OF AA | RSM | 割り込まれたプログラムの動作を再開する。 |

### 説明

プログラム制御をシステム管理モード（SMM）からプロセッサがSMM割り込みを受け取ったときに割り込まれたアプリケーション・プログラムまたはオペレーティング・システム・プロシージャに戻す。プロセッサの状態は、SMMに入ったときに作成されたダンプからリストアされる。プロセッサは、状態リストア中に無効な状態情報を検出すると、シャットダウン状態に入る。以下の無効な情報がシャットダウンを発生させる可能性がある。

- CR4の予約ビットのいずれかが1にセットされている。
- (PG=1とPE=0) や (NW=1とCD=0) などCR0のビットの不当な組み合わせ。
- (インテル® Pentium® プロセッサおよびIntel486™ プロセッサのみ) 状態ダンプ・ベース・フィールドにストアされている値が32Kバイト・アライメント・アドレスでない。

モデル固有レジスタの内容は、SMMからのリターンによって影響を受けない。

SMMおよびRSM命令の動作の詳細については、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、下巻』の第13章「システム管理」を参照のこと。

### 操作

```
ReturnFromSSM;  
ProcessorState ← Restore(SSMDump);
```

### 影響を受けるフラグ

すべて。

### 保護モード例外

#UD プロセッサがSMMにないときにこの命令を実行しようとした場合。

### 実アドレスモード例外

#UD プロセッサがSMMにないときにこの命令を実行しようとした場合。

### 仮想8086モード例外

#UD プロセッサがSMMにないときにこの命令を実行しようとした場合。

## RSQRTPS—Compute Reciprocals of Square Roots of Packed Single-Precision Floating-Point Values

| オペコード    | 命令                                        | 説明                                                                       |
|----------|-------------------------------------------|--------------------------------------------------------------------------|
| 0F 52 /r | RSQRTPS <i>xmm1</i> ,<br><i>xmm2/m128</i> | <i>xmm2/m128</i> のパックド単精度浮動小数点値の平方根の逆数の近似値を計算し、その結果を <i>xmm1</i> にストアする。 |

### 説明

ソース・オペランド（第2オペランド）の4つのパックド単精度浮動小数点値の平方根の逆数の近似値を SIMD 計算し、結果のパックド単精度浮動小数点値をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは 128ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスタである。単精度浮動小数点値の SIMD 演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 10-5. を参照のこと。

この近似値の相対誤差は以下のとおりである。

$$|\text{相対誤差}| \leq 1.5 * 2^{-12}$$

RSQRTPS 命令は、MXCSR レジスタの丸め制御ビットの影響を受けない。ソース値が 0.0 の場合、ソース値の符号の∞が返される。デノーマル・ソース値は、同じ符号の 0.0 として処理される。ソース値が -0.0 以外の負の値の場合、浮動小数点の未定義値が返される。ソース値が SNaN または QNaN の場合、QNaN またはソース QNaN に変換される SNaN が返される。

### 操作

```
DEST[31-0] ← APPROXIMATE(1.0/SQRT(SRC[31-0]));
DEST[63-32] ← APPROXIMATE(1.0/SQRT(SRC[63-32]));
DEST[95-64] ← APPROXIMATE(1.0/SQRT(SRC[95-64]));
DEST[127-96] ← APPROXIMATE(1.0/SQRT(SRC[127-96]));
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

RSQRTPS        \_\_m128 \_mm\_sqrt\_ps(\_\_m128 a)

### SIMD 浮動小数点例外

なし。

## RSQRTPS—Compute Reciprocals of Square Roots of Packed Single-Precision Floating-Point Values（続き）

### 保護モード例外

|              |                                                                          |
|--------------|--------------------------------------------------------------------------|
| #GP(0)       | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。                         |
|              | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                            |
| #SS(0)       | SS セグメント内のアドレスが無効の場合。                                                    |
| #PF（フォルトコード） | ページフォルトが発生した場合。                                                          |
| #NM          | CR0 の TS がセットされた場合。                                                      |
| #UD          | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。 |

### 実アドレスモード例外

|        |                                                                                      |
|--------|--------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                  |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。             |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF（フォルトコード） ページフォルトが発生した場合。

## RSQRTSS—Compute Reciprocal of Square Root of Scalar Single-Precision Floating-Point Value

| オペコード       | 命令                               | 説明                                                             |
|-------------|----------------------------------|----------------------------------------------------------------|
| F3 0F 52 /r | RSQRTSS $xmm_1$ ,<br>$xmm_2/m32$ | $xmm_2/m32$ の下位の単精度浮動小数点値の平方根の逆数の近似値を計算し、その結果を $xmm_1$ にストアする。 |

### 説明

ソース・オペランド（第2オペランド）の最下位の単精度浮動小数点値の平方根の逆数の近似値を計算し、結果の単精度浮動小数点値をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは32ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスタである。デスティネーション・オペランドの上位3つのダブルワードは変更されない。単精度浮動小数点値のスカラ演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 10-6. を参照のこと。

この近似値の相対誤差は以下のとおりである。

$$|\text{相対誤差}| \leq 1.5 * 2^{-12}$$

RSQRTSS 命令は、MXCSR レジスタの丸め制御ビットの影響を受けない。ソース値が 0.0 の場合、ソース値の符号の∞が返される。デノーマル・ソース値は、同じ符号の 0.0 として処理される。ソース値が -0.0 以外の負の値の場合、浮動小数点の未定義値が返される。ソース値が SNaN または QNaN の場合、QNaN またはソース QNaN に変換される SNaN が返される。

### 操作

```
DEST[31-0] ← APPROXIMATE(1.0/SQRT(SRC[31-0]));
* DEST[127-32] remains unchanged *;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

RSQRTSS      `_m128 _mm_sqrt_ss(_m128 a)`

### SIMD 浮動小数点例外

なし。

## RSQRTSS—Compute Reciprocal of Square Root of Scalar Single-Precision Floating-Point Value（続き）

### 保護モード例外

|              |                                                                          |
|--------------|--------------------------------------------------------------------------|
| #GP(0)       | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。                         |
| #SS(0)       | SS セグメント内のアドレスが無効の場合。                                                    |
| #PF（フォルトコード） | ページフォルトが発生した場合。                                                          |
| #NM          | CR0 の TS がセットされた場合。                                                      |
| #UD          | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。 |
| #AC(0)       | アライメント・チェックがイネーブルにされていて、現行特権レベルが 3 のときにアライメントが合わないメモリ参照を行った場合。           |

### 実アドレスモード例外

|       |                                                                          |
|-------|--------------------------------------------------------------------------|
| GP(0) | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                                      |
| #NM   | CR0 の TS がセットされた場合。                                                      |
| #UD   | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。 |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

|              |                                                 |
|--------------|-------------------------------------------------|
| #PF（フォルトコード） | ページフォルトが発生した場合。                                 |
| #AC(0)       | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照を行った場合。 |

## SAHF—Store AH into Flags

| オペコード | 命令   | 説明                                               |
|-------|------|--------------------------------------------------|
| 9E    | SAHF | 9E SF、ZF、AF、PF、および CF を AH から EFLAGS レジスタにロードする。 |

### 説明

EFLAGS レジスタの SF、ZF、AF、PF、CF フラグに AH レジスタの対応するビット（それぞれビット 7、6、4、2、0）からの値をロードする。レジスタ AH のビット 1、3、および 5 は無視される。EFLAGS レジスタの対応する予約ビット（1、3、5）は、以下の「操作」の項に示すように残る。

### 操作

`EFLAGS(SF:ZF:0:AF:0:PF:1:CF) ← AH;`

### 影響を受けるフラグ

SF、ZF、AF、PF、CF フラグに AH レジスタからの値がロードされる。EFLAGS レジスタのビット 1、3、5 は影響を受けず、それぞれ 1、0、0 の値が残る。

### 例外（すべての操作モード）

なし。

## SAL/SAR/SHL/SHR—Shift

| オペコード    | 命令              | 説明                           |
|----------|-----------------|------------------------------|
| D0 /4    | SAL r/m8        | r/m8 に 2 を 1 回掛ける。           |
| D2 /4    | SAL r/m8, CL    | r/m8 に 2 を CL 回掛ける。          |
| C0 /4 ib | SAL r/m8, imm8  | r/m8 に 2 を imm8 回掛ける。        |
| D1 /4    | SAL r/m16       | r/m16 に 2 を 1 回掛ける。          |
| D3 /4    | SAL r/m16, CL   | r/m16 に 2 を CL 回掛ける。         |
| C1 /4 ib | SAL r/m16, imm8 | r/m16 に 2 を imm8 回掛ける。       |
| D1 /4    | SAL r/m32       | r/m32 に 2 を 1 回掛ける。          |
| D3 /4    | SAL r/m32, CL   | r/m32 に 2 を CL 回掛ける。         |
| C1 /4 ib | SAL r/m32, imm8 | r/m32 に 2 を imm8 回掛ける。       |
| D0 /7    | SAR r/m8        | r/m8 を 2 で 1 回符号付き除算する。*     |
| D2 /7    | SAR r/m8, CL    | r/m8 を 2 で CL 回符号付き除算する。*    |
| C0 /7 ib | SAR r/m8, imm8  | r/m8 を 2 で imm8 回符号付き除算する。*  |
| D1 /7    | SAR r/m16       | r/m16 を 2 で 1 回符号付き除算する。*    |
| D3 /7    | SAR r/m16, CL   | r/m16 を 2 で CL 回符号付き除算する。*   |
| C1 /7 ib | SAR r/m16, imm8 | r/m16 を 2 で imm8 回符号付き除算する。* |
| D1 /7    | SAR r/m32       | r/m32 を 2 で 1 回符号付き除算する。*    |
| D3 /7    | SAR r/m32, CL   | r/m32 を 2 で CL 回符号付き除算する。*   |
| C1 /7 ib | SAR r/m32, imm8 | r/m32 を 2 で imm8 回符号付き除算する。* |
| D0 /4    | SHL r/m8        | r/m8 に 2 を 1 回掛ける。           |
| D2 /4    | SHL r/m8, CL    | r/m8 に 2 を CL 回掛ける。          |
| C0 /4 ib | SHL r/m8, imm8  | r/m8 に 2 を imm8 回掛ける。        |
| D1 /4    | SHL r/m16       | r/m16 に 2 を 1 回掛ける。          |
| D3 /4    | SHL r/m16, CL   | r/m16 に 2 を CL 回掛ける。         |
| C1 /4 ib | SHL r/m16, imm8 | r/m16 に 2 を imm8 回掛ける。       |
| D1 /4    | SHL r/m32       | r/m32 に 2 を 1 回掛ける。          |
| D3 /4    | SHL r/m32, CL   | r/m32 に 2 を CL 回掛ける。         |
| C1 /4 ib | SHL r/m32, imm8 | r/m32 に 2 を imm8 回掛ける。       |
| D0 /5    | SHR r/m8        | r/m8 を 2 で 1 回符号なし除算する。      |
| D2 /5    | SHR r/m8, CL    | r/m8 を 2 で CL 回符号なし除算する。     |
| C0 /5 ib | SHR r/m8, imm8  | r/m8 を 2 で imm8 回符号なし除算する。   |
| D1 /5    | SHR r/m16       | r/m16 を 2 で 1 回符号なし除算する。     |
| D3 /5    | SHR r/m16, CL   | r/m16 を 2 で CL 回符号なし除算する。    |
| C1 /5 ib | SHR r/m16, imm8 | r/m16 を 2 で imm8 回符号なし除算する。  |
| D1 /5    | SHR r/m32       | r/m32 を 2 で 1 回符号なし除算する。     |
| D3 /5    | SHR r/m32, CL   | r/m32 を 2 で CL 回符号なし除算する。    |
| C1 /5 ib | SHR r/m32, imm8 | r/m32 を 2 で imm8 回符号なし除算する。  |

注：

\* IDIV と同じ除算形式ではないことに注意する。負の無限大方向に丸められる。

## SAL/SAR/SHL/SHR—Shift（続き）

### 説明

第1オペランド（デスティネーション・オペランド）のビットを第2オペランド（カウント・オペランド）に指定されたビット数だけ左または右にシフトする。デスティネーション・オペランドの境界を超えてシフトされるビットは、まず CF フラグにシフトされ、次に捨てられる。シフト操作の最後では、CF フラグには、デスティネーション・オペランドから最後にシフトされたビットが含まれる。

デスティネーション・オペランドには、レジスタまたはメモリ・ロケーションを使用できる。カウント・オペランドには、即値またはレジスタ CL を使用できる。カウントは、5ビットにマスクされ、0から31までのカウント範囲に制限される。1のカウントに対しては、特別なオペコード・エンコーディングが備えられている。

左への算術シフト（SAL）命令および左への論理シフト（SHL）命令は、同じ操作を実行する。すなわち、デスティネーション・オペランドのビットを左（上位ビット・ロケーションの方向）にシフトする。シフトカウントごとに、デスティネーション・オペランドの最上位ビットが CF フラグにシフトされ、最下位ビットはクリアされる（『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 7-7. を参照）。

右への算術シフト（SAR）命令および右への論理シフト（SHR）命令は、デスティネーション・オペランドのビットを右（下位ビット・ロケーションの方向）にシフトする。シフトカウントごとに、デスティネーション・オペランドの最下位ビットが CF フラグにシフトされ、最上位ビットは、命令タイプに応じてセットまたはクリアされる。SHR 命令は、最上位ビットをクリアする（『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 7-8. を参照のこと）。SAR 命令は、デスティネーション・オペランドの元の値の符号（最上位ビット）に相当するように最上位ビットをセットまたはクリアする。实际上、SAR 命令は、空のビット位置のシフトされた値をシフトされていない値の符号で埋める（『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 7-9. を参照のこと）。

SAR 命令および SHR 命令を使用して、それぞれデスティネーション・オペランドに2の累乗による符号付きまたは符号なしの除算を行うことができる。例えば、SAR 命令を使用して符号付き整数を1ビット右にシフトすることは、値を2で割ることになる。

## SAL/SAR/SHL/SHR—Shift（続き）

SAR 命令を使用して除算演算を実行しても、IDIV 命令と同じ結果は生成されない。IDIV 命令の商はゼロ方向に丸められるのに対し、SAR 命令の「商」は負の無限大方向に丸められる。この違いは、負の数に対してだけ明白である。例えば、IDIV 命令を使用して -9 を 4 で除算すると、結果は -2 であり、剰余は -1 である。SAR 命令を使用して -9 を右に 2 ビットだけシフトすると、結果は -3 であり、「剰余」は +3 である。ただし、SAR 命令は、剰余の最上位ビットだけを (CF フラグに) ストアする。

OF フラグは、1 ビット・シフトの場合だけに影響を受ける。左シフトでは、結果の最上位ビットが CF フラグと同じである（すなわち、元のオペランドの最上位 2 ビットが同じである）場合は、OF フラグは 0 にセットされ、そうでない場合は 1 にセットされる。SAR 命令では、OF フラグはすべての 1 ビット・シフトでクリアされる。SHR 命令では、OF フラグは元のオペランドの最上位ビットに設定される。

### IA-32 アーキテクチャにおける互換性

8086 は、シフトカウントをマスクしない。しかし、（インテル® 286 プロセッサで始まる）その他のすべての IA-32 プロセッサは、シフトカウントを 5 ビットにマスクするので、最大カウントは 31 になる。このマスク設定は、（仮想 8086 モードを含めた）すべての動作モードで行われ、命令の最大実行時間を減少させる。

### 操作

```

tempCOUNT ← (COUNT AND 1FH);
tempDEST ← DEST;
WHILE (tempCOUNT ≠ 0)
DO
    IF instruction is SAL or SHL
        THEN
            CF ← MSB(DEST);
        ELSE (* instruction is SAR or SHR *)
            CF ← LSB(DEST);
    FI;
    IF instruction is SAL or SHL
        THEN
            DEST ← DEST * 2;
        ELSE
            IF instruction is SAR
                THEN
                    DEST ← DEST / 2 (*Signed divide, rounding toward negative infinity*);
                ELSE (* instruction is SHR *)
                    DEST ← DEST / 2 ; (* Unsigned divide *);
                FI;
            FI;
            tempCOUNT ← tempCOUNT – 1;
    OD;

```

## SAL/SAR/SHL/SHR—Shift（続き）

```
(* Determine overflow for the various instructions *)
IF (COUNT and 1FH) = 1
    THEN
        IF instruction is SAL or SHL
            THEN
                OF ← MSB(DEST) XOR CF;
            ELSE
                IF instruction is SAR
                    THEN
                        OF ← 0;
                    ELSE (* instruction is SHR *)
                        OF ← MSB(tempDEST);
                END;
            END;
        END;
    ELSE IF (COUNT AND 1FH) = 0
        THEN
            All flags remain unchanged;
        ELSE (* COUNT neither 1 or 0 *)
            OF ← undefined;
        END;
    END;

```

### 影響を受けるフラグ

CF フラグは、デスティネーション・オペランドから最後にシフトされたビットの値をもつ。このフラグは、カウントがデスティネーション・オペランドの（ビットでの）サイズ以上である SHL 命令と SHR 命令では未定義である。OF フラグは、1 ビット・シフトの場合だけに影響を受け（上記の「説明」の項を参照）、その他の場合は未定義である。SF、ZF、PF フラグは、結果にしたがって設定される。カウントが 0 である場合は、フラグは影響を受けない。カウントがゼロでない場合は、AF フラグは未定義である。

### 保護モード例外

|               |                                                                                                                                  |
|---------------|----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | デスティネーションが書き込み不可能なセグメントにある場合。<br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                 |

## SAL/SAR/SHL/SHR—Shift（続き）

### 実アドレスモード例外

- #GP メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

### 仮想 8086 モード例外

- #GP(0) メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

## SBB—Integer Subtraction with Borrow

| オペコード           | 命令                      | 説明                                             |
|-----------------|-------------------------|------------------------------------------------|
| 1C <i>ib</i>    | SBB AL, <i>imm8</i>     | AL から <i>imm8</i> をボローありで引く。                   |
| 1D <i>iw</i>    | SBB AX, <i>imm16</i>    | AX から <i>imm16</i> をボローありで引く。                  |
| 1D <i>id</i>    | SBB EAX, <i>imm32</i>   | EAX から <i>imm32</i> をボローありで引く。                 |
| 80 /3 <i>ib</i> | SBB <i>r/m8, imm8</i>   | <i>r/m8</i> から <i>imm8</i> をボローありで引く。          |
| 81 /3 <i>iw</i> | SBB <i>r/m16, imm16</i> | <i>r/m16</i> から <i>imm16</i> をボローありで引く。        |
| 81 /3 <i>id</i> | SBB <i>r/m32, imm32</i> | <i>r/m32</i> から <i>imm32</i> をボローありで引く。        |
| 83 /3 <i>ib</i> | SBB <i>r/m16, imm8</i>  | <i>r/m16</i> から 符号拡張された <i>imm8</i> をボローありで引く。 |
| 83 /3 <i>ib</i> | SBB <i>r/m32, imm8</i>  | <i>r/m32</i> から 符号拡張された <i>imm8</i> をボローありで引く。 |
| 18 /r           | SBB <i>r/m8, r8</i>     | <i>r/m8</i> から <i>r8</i> をボローありで引く。            |
| 19 /r           | SBB <i>r/m16, r16</i>   | <i>r/m16</i> から <i>r16</i> をボローありで引く。          |
| 19 /r           | SBB <i>r/m32, r32</i>   | <i>r/m32</i> から <i>r32</i> をボローありで引く。          |
| 1A /r           | SBB <i>r8, r/m8</i>     | <i>r8</i> から <i>r/m8</i> をボローありで引く。            |
| 1B /r           | SBB <i>r16, r/m16</i>   | <i>r16</i> から <i>r/m16</i> をボローありで引く。          |
| 1B /r           | SBB <i>r32, r/m32</i>   | <i>r32</i> から <i>r/m32</i> をボローありで引く。          |

### 説明

ソース・オペランド（第2オペランド）とキャリー（CF）フラグを加算し、結果をデスティネーション・オペランド（第1オペランド）から引く。減算の結果は、デスティネーション・オペランドにストアされる。デスティネーション・オペランドには、レジスタまたはメモリ・ロケーションを使用できる。ソース・オペランドには、即値、レジスタ、またはメモリ・ロケーションを使用できる。（ただし、1つの命令で2つのメモリ・オペランドを使用することはできない。）CFフラグの状態は、前の減算からのボローを表す。

即値をオペランドとして使用すると、デスティネーション・オペランドのフォーマットの長さまで符号拡張される。

SBB命令は、符号付きオペランドと符号なしオペランドとを区別しない。その代わりに、プロセッサは、両方のデータ型の結果を評価し、OFフラグとCFフラグを設定して、それぞれ符号付きの結果または符号なしの結果のボローを示す。SFフラグは、符号付き結果の符号を示す。

通常、SBB命令は、SUB命令の後にSBB命令が続く複数バイトまたは複数ワードの除算の一部として実行される。

この命令をLOCKプリフィックスと共に使用すると、アトミックに命令を実行させることができる。

## SBB—Integer Subtraction with Borrow (続き)

### 操作

$\text{DEST} \leftarrow \text{DEST} - (\text{SRC} + \text{CF});$

### 影響を受けるフラグ

OF、SF、ZF、AF、PF、CF フラグが結果にしたがって設定される。

### 保護モード例外

|               |                                                                                                                                  |
|---------------|----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | デステイネーションが書き込み不可能なセグメントにある場合。<br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                 |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

### 仮想 8086 モード例外

|               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## SCAS/SCASB/SCASW/SCASD—Scan String

| オペコード | 命令       | 説明                                         |
|-------|----------|--------------------------------------------|
| AE    | SCAS m8  | AL を ES:(E)DI のバイトと比較し、ステータス・フラグを設定する。     |
| AF    | SCAS m16 | AX を ES:(E)DI のワードと比較し、ステータス・フラグを設定する。     |
| AF    | SCAS m32 | EAX を ES:(E)DI のダブルワードと比較し、ステータス・フラグを設定する。 |
| AE    | SCASB    | AL を ES:(E)DI のバイトと比較し、ステータス・フラグを設定する。     |
| AF    | SCASW    | AX を ES:(E)DI のワードと比較し、ステータス・フラグを設定する。     |
| AF    | SCASD    | EAX を ES:(E)DI のダブルワードと比較し、ステータス・フラグを設定する。 |

### 説明

メモリ・オペランドで指定されたバイト、ワード、またはダブルワードを、AL、AX、またはEAX レジスタの値と比較し、結果にしたがってEFLAGS レジスタのステータス・フラグを設定する。メモリ・オペランド・アドレスは、(命令のアドレス・サイズ属性、32 または 16 に応じて) それぞれES:EDI レジスタまたはES:DI レジスタから読み取られる。) ESセグメントは、セグメント・オーバライド・プリフィックスでオーバライドすることはできない。

アセンブリ・コード・レベルでは、この命令の「明示オペランド」形式と「オペランドなし」形式という2つの形式が使用できる。(SCASニーモニックで指定される) 明示オペランド形式では、メモリ・オペランドを明示的に指定することができる。この場合、メモリ・オペランドは、オペランド値のサイズとロケーションを示す記号でなければならない。レジスタ・オペランドは、この場合にはメモリ・オペランドのサイズに一致するように自動的に選択される(バイト比較ではAL レジスタ、ワード比較ではAX レジスタ、ダブルワード比較ではEAX レジスタ)。この明示オペランド形式は、ドキュメンテーションを可能にするために設けられたものであるが、この形式によって提供されるドキュメンテーションは誤解を招く場合があるので注意する。すなわち、メモリ・オペランドの記号は、オペランドの正しいタイプ(サイズ:バイト、ワード、またはダブルワード)を指定しなければならないが、正しいロケーションを指定する必要はない。ロケーションは、常にES:(E)DI レジスタによって指定されるので、ストリング比較命令を実行する前に、これらのレジスタに正しくロードされなければならない。

オペランドなし形式は、SCAS 命令のバイト、ワード、ダブルワード各バージョンの「ショート形式」を提供する。この場合も、ES:(E)DI がメモリ・オペランドであると想定され、AL、AX、またはEAX レジスタがレジスタ・オペランドであると想定される。2つのオペランドのサイズは、SCASB(バイト比較)、SCASW(ワード比較)、またはSCASD(ダブルワード比較)の各ニーモニックで選択される。

## SCAS/SCASB/SCASW/SCASD—Scan String（続き）

比較後、(E)DI レジスタはEFLAGS レジスタ内の DF フラグの設定にしたがって自動的にインクリメントまたはデクリメントされる。(DF フラグが 0 である場合は、(E)DI レジスタはインクリメントされる。DF フラグが 1 である場合は、(E)DI レジスタはデクリメントされる。) (E)DI レジスタは、バイト操作の場合は 1、ワード操作の場合は 2、ダブルワード操作の場合は 4、それぞれインクリメントまたはデクリメントされる。

SCAS、SCASB、SCASW、SCASD 命令は、前に REP プリフィックスを付けることにより、ECX バイト、ワード、またはダブルワードのブロック比較を行うことができる。しかし通常は、これらの命令は、次の比較が行われる前にステータス・フラグの設定に基づいてある処置を行うループ構造体で使用されることの方が多い。REP リフィックスの説明については、本章の「REP/REPE/REPZ/REPNE /REPNZ—Repeat String Operation Prefix」を参照のこと。

### 操作

```

IF (byte comparison)
  THEN
    temp ← AL – SRC;
    SetStatusFlags(temp);
    THEN IF DF = 0
      THEN (E)DI ← (E)DI + 1;
      ELSE (E)DI ← (E)DI – 1;
    FI;
  ELSE IF (word comparison)
    THEN
      temp ← AX – SRC;
      SetStatusFlags(temp)
      THEN IF DF = 0
        THEN (E)DI ← (E)DI + 2;
        ELSE (E)DI ← (E)DI – 2;
      FI;
    ELSE (* doubleword comparison *)
      temp ← EAX – SRC;
      SetStatusFlags(temp)
      THEN IF DF = 0
        THEN (E)DI ← (E)DI + 4;
        ELSE (E)DI ← (E)DI – 4;
      FI;
    FI;
FI;
```

### 影響を受けるフラグ

OF、SF、ZF、AF、PF、CF フラグが比較の一時的な結果にしたがって設定される。

## SCAS/SCASB/SCASW/SCASD—Scan String（続き）

### 保護モード例外

- #GP(0) メモリ・オペランドの実効アドレスが ES セグメントの範囲外の場合。  
ES レジスタの内容がヌル・セグメント・セレクタの場合。  
ES レジスタに不当なメモリ・オペランド実効アドレスが与えられている場合。
- #PF (フォルトコード) ページフェaultが発生した場合。
- #AC(0) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

- #GP メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

### 仮想 8086 モード例外

- #GP(0) メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフェaultが発生した場合。
- #AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

## SETcc—Set Byte on Condition

| オペコード | 命令          | 説明                                        |
|-------|-------------|-------------------------------------------|
| 0F 97 | SETA r/m8   | より上 (CF=0 および ZF=0) の場合バイトを設定する。          |
| 0F 93 | SETAE r/m8  | より上か等しい (CF=0) 場合バイトを設定する。                |
| 0F 92 | SETB r/m8   | より下 (CF=1) の場合バイトを設定する。                   |
| 0F 96 | SETBE r/m8  | より下か等しい (CF=1 または ZF=1) 場合バイトを設定する。       |
| 0F 92 | SETC r/m8   | キャリーがある (CF=1) 場合設定する。                    |
| 0F 94 | SETE r/m8   | 等しい (ZF=1) 場合バイトを設定する。                    |
| 0F 9F | SETG r/m8   | より大きい (ZF=0 および SF=OF) 場合バイトを設定する。        |
| 0F 9D | SETGE r/m8  | より大きいか等しい (SF=OF) 場合バイトを設定する。             |
| 0F 9C | SETL r/m8   | より小さい (SF<>OF) 場合バイトを設定する。                |
| 0F 9E | SETLE r/m8  | より小さいか等しい (ZF=1 または SF<>OF) 場合バイトを設定する。   |
| 0F 96 | SETNA r/m8  | より上でない (CF=1 または ZF=1) 場合バイトを設定する。        |
| 0F 92 | SETNAE r/m8 | より上でなく等しくない (CF=1) 場合バイトを設定する。            |
| 0F 93 | SETNB r/m8  | より下でない (CF=0) 場合バイトを設定する。                 |
| 0F 97 | SETNBE r/m8 | より下でなく等しくない (CF=0 および ZF=0) 場合バイトを設定する。   |
| 0F 93 | SETNC r/m8  | キャリーがない (CF=0) 場合バイトを設定する。                |
| 0F 95 | SETNE r/m8  | 等しくない (ZF=0) 場合バイトを設定する。                  |
| 0F 9E | SETNG r/m8  | より大きくなく (ZF=1 または SF<>OF) 場合バイトを設定する。     |
| 0F 9C | SETNGE r/m8 | より大きくなく等しくない (SF<>OF) 場合設定する。             |
| 0F 9D | SETNL r/m8  | より小さくなく (SF=OF) 場合バイトを設定する。               |
| 0F 9F | SETNLE r/m8 | より小さくなく等しくない (ZF=0 および SF=OF) 場合バイトを設定する。 |
| 0F 91 | SETNO r/m8  | オーバーフローがない (OF=0) 場合バイトを設定する。             |
| 0F 9B | SETNP r/m8  | パリティがない (PF=0) 場合バイトを設定する。                |
| 0F 99 | SETNS r/m8  | 符号がない (SF=0) 場合バイトを設定する。                  |
| 0F 95 | SETNZ r/m8  | ゼロでない (ZF=0) 場合バイトを設定する。                  |
| 0F 90 | SETO r/m8   | オーバーフローがある (OF=1) 場合バイトを設定する。             |
| 0F 9A | SETP r/m8   | パリティがある (PF=1) 場合バイトを設定する。                |
| 0F 9A | SETPE r/m8  | パリティが偶数 (PF=1) の場合バイトを設定する。               |
| 0F 9B | SETPO r/m8  | パリティが奇数 (PF=0) の場合バイトを設定する。               |
| 0F 98 | SETS r/m8   | 符号がある (SF=1) 場合バイトを設定する。                  |
| 0F 94 | SETZ r/m8   | ゼロ (ZF=1) の場合バイトを設定する。                    |

## SETcc—Set Byte on Condition (続き)

### 説明

デステイネーション・オペランドをEFLAGSレジスタのステータス・フラグ(CF、SF、OF、ZF、PF)の設定にしたがって0または1に設定する。デステイネーション・オペランドは、バイトレジスタまたはメモリ内のバイトを指す。条件コード・サフィックス(cc)は、テストされる条件を示している。

「より上」および「より下」という表現は、CFフラグに関連付けられ、2つの符号なし整数値間の関係をいっている。「より大きい」および「より小さい」という表現は、SFおよびOFフラグに関連付けられ、2つの符号付き整数値間の関係をいっている。

SETcc命令のオペコードの多くには、代替ニーモニックがある。例えば、SETG(より大きい場合バイトを設定)とSETNLE(より小さくなく等しくない場合設定)は、同じオペコードをもち、同じ条件、すなわち、ZFが0に等しく、SFがOFに等しいことをテストする。これらの代替ニーモニックは、コードをよりわかりやすくするために提供されている。『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の付録B「EFLAGS条件コード」では、さまざまなテスト条件の代替ニーモニックを示している。

一部の言語では、すべてのビットをセットした整数として論理1を表す。この表現は、SETcc命令に論理的に反対の条件を選択し、結果をデクリメントすると得ることができる。例えば、オーバーフローがあるかテストするには、SETNO命令を使用し、次に結果をデクリメントする。

### 操作

```
IF condition
    THEN DEST ← 1
    ELSE DEST ← 0;
FI;
```

### 影響を受けるフラグ

なし。

## SETcc—Set Byte on Condition (続き)

### 保護モード例外

- #GP(0) デステイネーションが書き込み不可能なセグメントにある場合。
- メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- DS、ES、FS、または GS レジスタの内容がマル・セグメント・セレクタの場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフォルトが発生した場合。

### 実アドレスモード例外

- #GP メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

### 仮想 8086 モード例外

- #GP(0) メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフォルトが発生した場合。

## SFENCE—Store Fence

| オペコード    | 命令     | 説明             |
|----------|--------|----------------|
| OF AE /7 | SFENCE | ストア操作をシリアル化する。 |

### 説明

SFENCE 命令より前に発行されたすべてのストアメモリ命令に対して、シリアル化操作を実行する。このシリアル化操作は、プログラムの順序で SFENCE 命令に先行するすべてのストア命令が、SFENCE 命令に後続するストア命令より前にグローバルにアクセス可能になることを保証する。SFENCE 命令は、ストア命令、他の SFENCE 命令、MFENCE 命令、任意のシリアル化命令（CPUID 命令など）に対して順序付けされる。SFENCE 命令は、ロード命令や LFENCE 命令に対しては順序付けされない。

順序設定の緩いメモリタイプを使用して、アウト・オブ・オーダー発行、ライト・コンバイニング、ライト・コラピングなどの手法により、プロセッサ・パフォーマンスの向上を達成する。データを参照する側のルーチンが、順序設定の緩いデータであることをどの程度認識するかは、アプリケーションによって異なり、データを生成する側のルーチンにはわからない。SFENCE 命令は、順序設定の緩い結果を生成するルーチンとそのデータを参照するルーチンの間のストアの順序付けを保証するための効率的な方法である。

### 操作

```
Wait_On_Following_Stores_Until(preceding_stores_globally_visible);
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
void_mm_sfence(void)
```

### 保護モード例外

なし。

### 実アドレスモード例外

なし。

### 仮想 8086 モード例外

なし。

## SGDT—Store Global Descriptor Table Register

| オペコード    | 命令            | 説明                      |
|----------|---------------|-------------------------|
| 0F 01 /0 | SGDT <i>m</i> | GDTR を <i>m</i> にストアする。 |

### 説明

グローバル・ディスクリプタ・テーブル・レジスタ (GDTR) をデスティネーション・オペランドにストアする。デスティネーション・オペランドは、6 バイトのメモリ・ロケーションを指定する。オペランド・サイズ属性が 32 ビットである場合は、レジスタの 16 ビットのリミット・フィールドがメモリ・ロケーションの下位 2 バイトにストアされ、32 ビットのベースアドレスが上位 4 バイトにストアされる。オペランド・サイズ属性が 16 ビットである場合は、範囲が下位 2 バイトにストアされ、24 ビットのベースアドレスが 3～5 バイト目にストアされ、6 バイト目は 0 で埋められる。

SGDT 命令は、オペレーティング・システム・ソフトウェアだけに有用であるが、例外を生成せずにアプリケーション・プログラムで使用することができる。

GDTR および IDTR のローディングに関する詳細については、本章の「LGDT/LIDT—Load Global/Interrupt Descriptor Table Register」を参照のこと。

### IA-32 アーキテクチャにおける互換性

SGDT 命令の 16 ビット形式は、上位 8 ビットが参照されない場合に Intel 286 プロセッサと互換性がある。Intel 286 プロセッサはこれらのビットを 1 で埋め、インテル® Pentium® 4 プロセッサ、インテル® Xeon™ プロセッサ、P6 ファミリ・プロセッサ、インテル® Pentium® プロセッサ、Intel486™ プロセッサ、および Intel386™ プロセッサはこれらのビットを 0 で埋める。

### 操作

IF instruction is SGDT

```

    IF OperandSize = 16
        THEN
            DEST[0:15] ← GDTR(Limit);
            DEST[16:39] ← GDTR(Base); (* 24 bits of base address loaded; *)
            DEST[40:47] ← 0;
        ELSE (* 32-bit Operand Size *)
            DEST[0:15] ← GDTR(Limit);
            DEST[16:47] ← GDTR(Base); (* full 32-bit base address loaded *)
        FI;
    FI;
```

## SGDT/SIDT—Store Global/Interrupt Descriptor Table Register（続き）

### 影響を受けるフラグ

なし。

### 保護モード例外

|               |                                                                |
|---------------|----------------------------------------------------------------|
| #UD           | デスティネーション・オペランドがレジスタである場合。                                     |
| #GP(0)        | デスティネーションが書き込み不可能なセグメントにある場合。                                  |
|               | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。             |
|               | DS、ES、FS、GS レジスタを使用してメモリがアクセスされ、レジスタの内容がヌル・セグメント・セレクタであった場合。   |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、現行特権レベルが 3 のときにアライメントが合わないメモリ参照を行った場合。 |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #UD | デスティネーション・オペランドがレジスタである場合。                         |
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

### 仮想 8086 モード例外

|               |                                                    |
|---------------|----------------------------------------------------|
| #UD           | デスティネーション・オペランドがレジスタである場合。                         |
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照を行った場合。    |

## SHL/SHR—Shift Instructions

「SAL/SAR/SHL/SHR—Shift」を参照のこと。

## SHLD—Double Precision Shift Left

| オペコード | 命令                    | 説明                                           |
|-------|-----------------------|----------------------------------------------|
| 0F A4 | SHLD r/m16, r16, imm8 | r/m16 を左に imm8 位置シフトし、r16 からのビットを右からシフトインする。 |
| 0F A5 | SHLD r/m16, r16, CL   | r/m16 を左に CL 位置シフトし、r16 からのビットを右からシフトインする。   |
| 0F A4 | SHLD r/m32, r32, imm8 | r/m32 を左に imm8 位置シフトし、r32 からのビットを右からシフトインする。 |
| 0F A5 | SHLD r/m32, r32, CL   | r/m32 を左に CL 位置シフトし、r32 からのビットを右からシフトインする。   |

### 説明

第1オペランド（デスティネーション・オペランド）を第3オペランド（カウント・オペランド）で指定されたビット数だけ左にシフトする。第2オペランド（ソース・オペランド）は、（デスティネーション・オペランドのビット0で始まって）右からシフトインするビットを指定する。デスティネーション・オペランドには、レジスタまたはメモリ・ロケーションを使用できる。ソース・オペランドは、レジスタである。カウント・オペランドは符号なし整数で、即値バイトまたはCLレジスタの内容である。カウントのビット0～4だけが使用され、カウントが0～31の値にマスクされる。カウントがオペランド・サイズより大きい場合は、デスティネーション・オペランドの結果は未定義である。

カウントが1以上である場合は、CFフラグにはデスティネーション・オペランドから最後にシフトされたビットが入る。1ビット・シフトでは、OFフラグは、符号変更が発生するとセットされ、そうでなければクリアされる。カウント・オペランドが0である場合は、フラグは影響を受けない。

SHLD命令は、64ビット以上の多重精度シフトに有用である。

### 操作

```

COUNT ← COUNT MOD 32;
SIZE ← OperandSize
IF COUNT = 0
    THEN
        no operation
ELSE
    IF COUNT > SIZE
        THEN (* Bad parameters *)
            DEST is undefined;
            CF, OF, SF, ZF, AF, PF are undefined;
    ELSE (* Perform the shift *)
        CF ← BIT[DEST, SIZE – COUNT];
        (* Last bit shifted out on exit *)
        FOR i ← SIZE – 1 DOWNTO COUNT

```

## SHLD—Double Precision Shift Left（続き）

```

DO
    Bit(DEST, i) ← Bit(DEST, i - COUNT);
OD;
FOR i ← COUNT - 1 DOWNTO 0
DO
    BIT[DEST, i] ← BIT[SRC, i - COUNT + SIZE];
OD;
FI;
FI;

```

### 影響を受けるフラグ

カウントが1以上である場合は、CF フラグにはデスティネーション・オペランドから最後にシフトされたビットが入り、SF、ZF、PF フラグは結果の値にしたがって設定される。1ビット・シフトでは、OF フラグは、符号変更が発生するとセットされ、そうでなければクリアされる。1ビットより大きいシフトでは、OF フラグは未定義である。シフトが行われると、AF フラグは未定義である。カウント・オペランドが0である場合は、フラグは影響を受けない。カウントがオペランド・サイズより大きい場合は、フラグは未定義である。

### 保護モード例外

|               |                                                                                                                                  |
|---------------|----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | デスティネーションが書き込み不可能なセグメントにある場合。<br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                  |
| #AC(0)        | 現行特権レベルが3のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                   |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

## SHLD—Double Precision Shift Left（続き）

### 仮想 8086 モード例外

- |               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## SHRD—Double Precision Shift Right

| オペコード | 命令                    | 説明                                           |
|-------|-----------------------|----------------------------------------------|
| 0F AC | SHRD r/m16, r16, imm8 | r/m16 を右に imm8 位置シフトし、r16 からのビットを左からシフトインする。 |
| 0F AD | SHRD r/m16, r16, CL   | r/m16 を右に CL 位置シフトし、r16 からのビットを左からシフトインする。   |
| 0F AC | SHRD r/m32, r32, mm8  | r/m32 を右に imm8 位置シフトし、r32 からのビットを左からシフトインする。 |
| 0F AD | SHRD r/m32, r32, CL   | r/m32 を右に CL 位置シフトし、r32 からのビットを左からシフトインする。   |

### 説明

第1オペランド（デスティネーション・オペランド）を第3オペランド（カウント・オペランド）で指定されたビット数だけ右にシフトする。第2オペランド（ソース・オペランド）は、（デスティネーション・オペランドの最上位ビットで始まって）左からシフトインするビットを指定する。デスティネーション・オペランドには、レジスタまたはメモリ・ロケーションを使用できる。ソース・オペランドは、レジスタである。カウント・オペランドは符号なし整数で、即値バイトまたはCLレジスタの内容である。カウントのビット0～4だけが使用され、カウントが0～31の値にマスクされる。カウントがオペランド・サイズより大きい場合は、デスティネーション・オペランドの結果は未定義である。

カウントが1以上である場合は、CFフラグにはデスティネーション・オペランドから最後にシフトされたビットが入る。1ビット・シフトでは、OFフラグは、符号変更が発生するとセットされ、そうでなければクリアされる。カウント・オペランドが0である場合は、フラグは影響を受けない。

SHRD命令は、64ビット以上の多重精度シフトに有用である。

### 操作

```

COUNT ← COUNT MOD 32;
SIZE ← OperandSize
IF COUNT = 0
    THEN
        no operation
ELSE
    IF COUNT > SIZE
        THEN (* Bad parameters *)
            DEST is undefined;
            CF, OF, SF, ZF, AF, PF are undefined;
    ELSE (* Perform the shift *)
        CF ← BIT[DEST, COUNT - 1]; (* last bit shifted out on exit *)
        FOR i ← 0 TO SIZE - 1 - COUNT
            DO

```

## SHRD—Double Precision Shift Right（続き）

```

        BIT[DEST, i] ← BIT[DEST, i + COUNT];
OD;
FOR i ← SIZE - COUNT TO SIZE - 1
DO
    BIT[DEST,i] ← BIT[SRC, i + COUNT - SIZE];
OD;
FI;
FI;

```

### 影響を受けるフラグ

カウントが1以上である場合は、CF フラグにはデスティネーション・オペランドから最後にシフトされたビットが入り、SF、ZF、PF フラグは結果の値にしたがって設定される。1ビット・シフトでは、OF フラグは、符号変更が発生するとセットされ、そうでなければクリアされる。1ビットより大きいシフトでは、OF フラグは未定義である。シフトが行われると、AF フラグは未定義である。カウント・オペランドが0である場合は、フラグは影響を受けない。カウントがオペランド・サイズより大きい場合は、フラグは未定義である。

### 保護モード例外

|               |                                                                                                                                  |
|---------------|----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | デスティネーションが書き込み不可能なセグメントにある場合。<br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                 |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

## SHRD—Double Precision Shift Right（続き）

### 仮想 8086 モード例外

|               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## SHUFPD—Shuffle Packed Double-Precision Floating-Point Values

| オペコード          | 命令                                                     | 説明                                                                                                  |
|----------------|--------------------------------------------------------|-----------------------------------------------------------------------------------------------------|
| 66 0F C6 /r ib | SHUFPD <i>xmm1</i> ,<br><i>xmm2/m128</i> , <i>imm8</i> | <i>imm8</i> によって選択された、 <i>xmm1</i> および <i>xmm1/m128</i> 内のパックド倍精度浮動小数点値をシャッフルして、 <i>xmm1</i> に格納する。 |

### 説明

デスティネーション・オペランド（第1オペランド）内の2つのパックド倍精度浮動小数点値のうち1つを、デスティネーション・オペランドの下位クワッドワードに移動し、ソース・オペランド内の2つのパックド倍精度浮動小数点値のうち1つを、デスティネーション・オペランドの上位クワッドワードに移動する（図4-12. を参照）。セレクト・オペランド（第3オペランド）によって、どちらの値がデスティネーション・オペランドに転送されるかが決まる。



図 4-12. SHUFPD のシャッフル操作

ソース・オペランドは、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスタである。セレクト・オペランドは 8 ビットの即値である。セレクト・オペランドのビット 0 は、デスティネーション・オペランドから結果に転送される値を選択する（値が 0 の場合は下位クワッドワードが転送され、1 の場合は上位クワッドワードが転送される）。ビット 1 は、ソース・オペランドから結果に転送される値を選択する。選択オペランドのビット 2～7 は予約されていて、0 にセットしなければならない。

## SHUFPD—Shuffle Packed Double-Precision Floating-Point Values (続き)

### 操作

```

IF SELECT[0] = 0
    THEN DEST[63-0] ← DEST[63-0];
    ELSE DEST[63-0] ← DEST[127-64]; FI;
IF SELECT[1] = 0
    THEN DEST[127-64] ← SRC[63-0];
    ELSE DEST[127-64] ← SRC[127-64]; FI;

```

### 同等のインテル® C/C++ コンパイラ組み込み関数

SHUFPD        \_\_m128d \_mm\_shuffle\_pd(\_\_m128d a, \_\_m128d b, unsigned int imm8)

### SIMD 浮動小数点例外

なし。

### 保護モード例外

|               |                                                                                                   |
|---------------|---------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                   |
| #NM           | CR0 の TS がセットされた場合。                                                                               |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。                         |

### 実アドレスモード例外

|        |                                                                                      |
|--------|--------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                  |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。            |

## **SHUFPD—Shuffle Packed Double-Precision Floating-Point Values (続き)**

### **仮想 8086 モード例外**

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフェルトが発生した場合。

## SHUFPS—Shuffle Packed Single-Precision Floating-Point Values

| オペコード       | 命令                                                     | 説明                                                                                                  |
|-------------|--------------------------------------------------------|-----------------------------------------------------------------------------------------------------|
| 0F C6 /r ib | SHUFPS <i>xmm1</i> ,<br><i>xmm2/m128</i> , <i>imm8</i> | <i>imm8</i> によって選択された、 <i>xmm1</i> および <i>xmm1/m128</i> 内のパックド単精度浮動小数点値をシャッフルして、 <i>xmm1</i> に格納する。 |

### 説明

デスティネーション・オペランド（第1オペランド）の4つのパックド単精度浮動小数点値のうち2つを、デスティネーション・オペランドの下位クワッドワードに移動し、ソース・オペランド（第2オペランド）の4つの単精度浮動小数点値のうち2つを、デスティネーション・オペランドの上位クワッドワードに移動する（図4-13.を参照）。セレクト・オペランド（第3オペランド）によって、どの値がデスティネーション・オペランドに転送されるかが決まる。



図 4-13. SHUFPS 命令の動作

ソース・オペランドは、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスタである。セレクト・オペランドは 8 ビットの即値である。即値のビット 0 とビット 1 は、デスティネーション・オペランドから結果の最下位のダブルワードに転送される値を選択する。ビット 2 とビット 3 は、デスティネーション・オペランドから結果の第 2 ダブルワードに転送される値を選択する。ビット 4 とビット 5 は、ソース・オペランドから結果の第 3 ダブルワードに転送される値を選択する。ビット 6 とビット 7 は、ソース・オペランドから結果の最上位のダブルワードに転送される値を選択する。

## SHUFPS—Shuffle Packed Single-Precision Floating-Point Values (続き)

### 操作

```
CASE (SELECT[1-0]) OF
  0: DEST[31-0] ← DEST[31-0];
  1: DEST[31-0] ← DEST[63-32];
  2: DEST[31-0] ← DEST[95-64];
  3: DEST[31-0] ← DEST[127-96];
ESAC;
CASE (SELECT[3-2]) OF
  0: DEST[63-32] ← DEST[31-0];
  1: DEST[63-32] ← DEST[63-32];
  2: DEST[63-32] ← DEST[95-64];
  3: DEST[63-32] ← DEST[127-96];
ESAC;
CASE (SELECT[5-4]) OF
  0: DEST[95-64] ← SRC[31-0];
  1: DEST[95-64] ← SRC[63-32];
  2: DEST[95-64] ← SRC[95-64];
  3: DEST[95-64] ← SRC[127-96];
ESAC;
CASE (SELECT[7-6]) OF
  0: DEST[127-96] ← SRC[31-0];
  1: DEST[127-96] ← SRC[63-32];
  2: DEST[127-96] ← SRC[95-64];
  3: DEST[127-96] ← SRC[127-96];
ESAC;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

SHUFPS        `__m128 _mm_shuffle_ps(__m128 a, __m128 b, unsigned int imm8)`

### SIMD 浮動小数点例外

なし。

### 保護モード例外

|               |                                                                                                   |
|---------------|---------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                   |
| #NM           | CR0 の TS ビットがセットされた場合。                                                                            |

## SHUFPS—Shuffle Packed Single-Precision Floating-Point Values (続き)

- #UD CR0 の EM がセットされた場合。  
CR4 の OSFXSR が 0 の場合。  
CPUID 機能フラグ SSE が 0 の場合。

### 実アドレスモード例外

- #GP(0) セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。  
オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。
- #NM CR0 の TS がセットされた場合。
- #UD CR0 の EM がセットされた場合。  
CR4 の OSFXSR が 0 の場合。  
CPUID 機能フラグ SSE が 0 の場合。

### 仮想 8086 モード例外

- 実アドレスモードと同じ例外。
- #PF (フォルトコード) ページフォルトが発生した場合。

## SIDT—Store Interrupt Descriptor Table Register

| オペコード    | 命令            | 説明                      |
|----------|---------------|-------------------------|
| 0F 01 /1 | SIDT <i>m</i> | IDTR を <i>m</i> にストアする。 |

### 説明

割り込みディスクリプタ・テーブル・レジスタ (IDTR) の内容をデスティネーション・オペランドにストアする。デスティネーション・オペランドは、6 バイトのメモリ・ロケーションを指定する。オペランド・サイズ属性が 32 ビットである場合は、レジスタの 16 ビットのリミット・フィールドがメモリ・ロケーションの下位 2 バイトにストアされ、32 ビットのベースアドレスが上位 4 バイトにストアされる。オペランド・サイズ属性が 16 ビットである場合は、範囲が下位 2 バイトにストアされ、24 ビットのベースアドレスが 3～5 バイト目にストアされ、6 バイト目は 0 で埋められる。

SIDT は、オペレーティング・システム・ソフトウェアだけに有用であるが、例外を生成せずにアプリケーション・プログラムで使用することができる。

GDTR および IDTR のローディングに関する詳細については、本章の「LGDT/LIDT—Load Global/Interrupt Descriptor Table Register」を参照のこと。

### IA-32 アーキテクチャにおける互換性

SIDT の 16 ビット形式は、上位 8 ビットが参照されない場合にインテル® 286 プロセッサと互換性がある。インテル 286 プロセッサはこれらのビットを 1 で埋め、インテル® Pentium® 4 プロセッサ、インテル® Xeon™ プロセッサ、P6 ファミリ・プロセッサ、Intel486™ プロセッサ、Intel386™ プロセッサはこれらのビットを 0 で埋める。

### 操作

```

IF instruction is SIDT
  THEN
    IF OperandSize = 16
      THEN
        DEST[0:15] ← IDTR(Limit);
        DEST[16:39] ← IDTR(Base); (* 24 bits of base address loaded; *)
        DEST[40:47] ← 0;
      ELSE (* 32-bit Operand Size *)
        DEST[0:15] ← IDTR(Limit);
        DEST[16:47] ← IDTR(Base); (* full 32-bit base address loaded *)
      FI;
    FI;
  
```

### 影響を受けるフラグ

なし。

## SIDT—Store Interrupt Descriptor Table Register（続き）

### 保護モード例外

- #GP(0) デステイネーションが書き込み不可能なセグメントにある場合。
- メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- DS、ES、FS、または GS レジスタを使用してメモリをアクセスしたが、その内容がヌル・セグメント・セレクタであった場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) アライメント・チェックがイネーブルにされていて、現行特権レベルが 3 のときにアライメントが合わないメモリ参照を行った場合。

### 実アドレスモード例外

- #GP メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

### 仮想 8086 モード例外

- #GP(0) メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照を行った場合。

## SLDT—Store Local Descriptor Table Register

| オペコード    | 命令         | 説明                                        |
|----------|------------|-------------------------------------------|
| 0F 00 /0 | SLDT r/m16 | セグメント・セレクタを LDTR から r/m16 にストアする。         |
| 0F 00 /0 | SLDT r32   | セグメント・セレクタを LDTR から r32 の下位 16 ビットにストアする。 |

### 説明

セグメント・セレクタをローカル・ディスクリプタ・テーブル・レジスタ (LDTR) からデスティネーション・オペランドにストアする。デスティネーション・オペランドには、汎用レジスタまたはメモリ・ロケーションを使用できる。この命令でストアされるセグメント・セレクタは、現在の LDT の (GDT にある) セグメント・ディスクリプタを指す。この命令は、保護モードでしか実行することができない。

デスティネーション・オペランドが 32 ビット・レジスタであるときは、16 ビットのセグメント・セレクタがレジスタの下位 16 ビットにコピーされる。レジスタの上位 16 ビットは、インテル® Pentium® 4 プロセッサ、インテル® Xeon™ プロセッサ、P6 ファミリー・プロセッサではクリアされ、インテル® Pentium® プロセッサ、Intel486™ プロセッサ、Intel386™ プロセッサでは未定義である。デスティネーション・オペランドがメモリ・ロケーションであるときは、セグメント・セレクタは、オペランド・サイズに関係なく、16 ビット幅でメモリに書き込まれる。

SLDT 命令は、オペレーティング・システム・ソフトウェアだけに有用であるが、アプリケーション・プログラムで使用することもできる。

### 操作

```
DEST ← LDTR(SegmentSelector);
```

### 影響を受けるフラグ

なし。

## SLDT—Store Local Descriptor Table Register (続き)

### 保護モード例外

|               |                                                                  |
|---------------|------------------------------------------------------------------|
| #GP(0)        | デステイネーションが書き込み不可能なセグメントにある場合。                                    |
|               | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。               |
|               | DS、ES、FS、および GS レジスタを使用してメモリがアクセスされ、レジスタの内容がヌル・セグメント・セレクタであった場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|     |                           |
|-----|---------------------------|
| #UD | SLDT 命令は実アドレスモードでは認識されない。 |
|-----|---------------------------|

### 仮想 8086 モード例外

|     |                              |
|-----|------------------------------|
| #UD | SLDT 命令は仮想 8086 モードでは認識されない。 |
|-----|------------------------------|

## SMSW—Store Machine Status Word

| オペコード    | 命令                  | 説明                                                                                      |
|----------|---------------------|-----------------------------------------------------------------------------------------|
| 0F 01 /4 | SMSW <i>r/m16</i>   | マシン・ステータス・ワードを <i>r/m16</i> にストアする。                                                     |
| 0F 01 /4 | SMSW <i>r32/m16</i> | マシン・ステータス・ワードを <i>r32</i> の下位 16 ビットまたは <i>m16</i> にストアし、 <i>r32</i> の上位 16 ビットは未定義である。 |

### 説明

マシン・ステータス・ワード（制御レジスタ CR0 のビット 0 ~ 15）をデスティネーション・オペランドにストアする。デスティネーション・オペランドには、16 ビットの汎用レジスタまたはメモリ・ロケーションを使用できる。

デスティネーション・オペランドが 32 ビット・レジスタであるときは、CR0 レジスタの下位 16 ビットがレジスタの下位 16 ビットにコピーされ、レジスタの上位 16 ビットは未定義である。デスティネーション・オペランドがメモリ・ロケーションであるときは、オペランド・サイズに関係なく、CR0 レジスタの下位 16 ビット幅でメモリに書き込まれる。

SMSW 命令は、オペレーティング・システム・ソフトウェアだけに有用であるが、特権命令ではなく、アプリケーション・プログラムで使用することもできる。

この命令は、インテル® 286 プロセッサとの互換性を保つために設けられたものである。インテル® Pentium® 4 プロセッサ、インテル® Xeon™ プロセッサ、P6 ファミリー・プロセッサ、インテル® Pentium® プロセッサ、Intel486™ プロセッサ、Intel386™ プロセッサで実行するように意図されたプログラムおよびプロシージャでは、MOV（制御レジスタ）命令を使用してマシン・ステータス・ワードをロードする必要がある。

### 操作

DEST ← CR0[15:0]; (\* Machine status word \*);

### 影響を受けるフラグ

なし。

## SMSW—Store Machine Status Word (続き)

### 保護モード例外

- #GP(0) デステイネーションが書き込み不可能なセグメントにある場合。  
メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。  
DS、ES、FS、および GS レジスタを使用してメモリがアクセスされ、レジスタの内容がヌル・セグメント・セレクタであった場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

- #GP メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

### 仮想 8086 モード例外

- #GP(0) メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフォルトが発生した場合。
- #AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

## SQRTPD—Compute Square Roots of Packed Double-Precision Floating-Point Values

| オペコード       | 命令                            | 説明                                                             |
|-------------|-------------------------------|----------------------------------------------------------------|
| 66 0F 51 /r | SQRTPD <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> のパックド倍精度浮動小数点値の平方根を計算し、結果を <i>xmm1</i> に格納する。 |

### 説明

ソース・オペランド（第2オペランド）の2つのパックド倍精度浮動小数点値の平方根を SIMD 計算し、結果のパックド倍精度浮動小数点値をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスタである。倍精度浮動小数点値の SIMD 演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 11-3. を参照のこと。

### 操作

```
DEST[63-0] ← SQRT(SRC[63-0]);
DEST[127-64] ← SQRT(SRC[127-64]);
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
SQRTPD      __m128d _mm_sqrt_pd (m128d a)
```

### SIMD 浮動小数点例外

無効、精度、デノーマル。

### 保護モード例外

|               |                                                                                                    |
|---------------|----------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、または GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                                              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                    |
| #NM           | CR0 の TS がセットされた場合。                                                                                |
| #XM           | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                               |

## SQRTPD—Compute Square Roots of Packed Double-Precision Floating-Point Values (続き)

|     |                                                                                                                                   |
|-----|-----------------------------------------------------------------------------------------------------------------------------------|
| #UD | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br>CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。 |
|-----|-----------------------------------------------------------------------------------------------------------------------------------|

### 実アドレスモード例外

|        |                                                                                                                                   |
|--------|-----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                                              |
| #NM    | CR0 の TS がセットされた場合。                                                                                                               |
| #XM    | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                                                              |
| #UD    | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br>CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。 |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## SQRTPS—Compute Square Roots of Packed Single-Precision Floating-Point Values

| オペコード    | 命令                            | 説明                                                             |
|----------|-------------------------------|----------------------------------------------------------------|
| 0F 51 /r | SQRTPS <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> のパックド単精度浮動小数点値の平方根を計算し、結果を <i>xmm1</i> に格納する。 |

### 説明

ソース・オペランド（第2オペランド）の4つのパックド単精度浮動小数点値の平方根を SIMD 計算し、結果のパックド単精度浮動小数点値をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスタである。単精度浮動小数点値の SIMD 演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 10-5. を参照のこと。

### 操作

```
DEST[31-0] ← SQRT(SRC[31-0]);
DEST[63-32] ← SQRT(SRC[63-32]);
DEST[95-64] ← SQRT(SRC[95-64]);
DEST[127-96] ← SQRT(SRC[127-96]);
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

SQRTPS      `__m128 _mm_sqrt_ps(__m128 a)`

### SIMD 浮動小数点例外

無効、精度、デノーマル。

### 保護モード例外

|               |                                                                                                    |
|---------------|----------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、または GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                                              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                    |
| #NM           | CR0 の TS がセットされた場合。                                                                                |
| #XM           | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                               |

## SQRTPS—Compute Square Roots of Packed Single-Precision Floating-Point Values (続き)

|     |                                                                                                                                  |
|-----|----------------------------------------------------------------------------------------------------------------------------------|
| #UD | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br>CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。 |
|-----|----------------------------------------------------------------------------------------------------------------------------------|

### 実アドレスモード例外

|        |                                                                                                                                  |
|--------|----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                                             |
| #NM    | CR0 の TS がセットされた場合。                                                                                                              |
| #XM    | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                                                             |
| #UD    | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br>CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。 |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## SQRTSD—Compute Square Root of Scalar Double-Precision Floating-Point Value

| オペコード       | 命令                           | 説明                                                           |
|-------------|------------------------------|--------------------------------------------------------------|
| F2 0F 51 /r | SQRTSD <i>xmm1, xmm2/m64</i> | <i>xmm2/m64</i> の下位の倍精度浮動小数点値の平方根を計算し、結果を <i>xmm1</i> に格納する。 |

### 説明

ソース・オペランド（第2オペランド）の下位の倍精度浮動小数点値の平方根を計算し、結果の倍精度浮動小数点値をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは 64 ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスタである。デスティネーション・オペランドの上位クワッドワードは変更されない。倍精度浮動小数点値のスカラ演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 11-4. を参照のこと。

### 操作

```
DEST[63-0] ← SQRT(SRC[63-0]);
* DEST[127-64] remains unchanged *;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
SQRTSD      __m128d _mm_sqrt_sd (m128d a)
```

### SIMD 浮動小数点例外

無効、精度、デノーマル。

### 保護モード例外

|               |                                                      |
|---------------|------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、または GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。    |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                      |
| #NM           | CR0 の TS がセットされた場合。                                  |
| #XM           | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。 |
| #UD           | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。 |
|               | CR0 の EM がセットされた場合。                                  |
|               | CR4 の OSFXSR が 0 の場合。                                |
|               | CPUID 機能フラグ SSE2 が 0 の場合。                            |

## SQRTSD—Compute Square Root of Scalar Double-Precision Floating-Point Value (続き)

#AC(0) アライメント・チェックがイネーブルにされていて、現行特権レベルが 3 のときにアライメントが合わないメモリ参照を行った場合。

### 実アドレスモード例外

GP(0) オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。

#NM CR0 の TS がセットされた場合。

#XM マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。

#UD マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。

CR0 の EM がセットされた場合。

CR4 の OSFXSR が 0 の場合。

CPUID 機能フラグ SSE2 が 0 の場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照を行った場合。

## SQRTSS—Compute Square Root of Scalar Single-Precision Floating-Point Value

| オペコード       | 命令                           | 説明                                                            |
|-------------|------------------------------|---------------------------------------------------------------|
| F3 0F 51 /r | SQRTSS <i>xmm1, xmm2/m32</i> | <i>xmm2/m32</i> の最下位の单精度浮動小数点値の平方根を計算し、結果を <i>xmm1</i> に格納する。 |

### 説明

ソース・オペランド（第2オペランド）の最下位の单精度浮動小数点値の平方根を計算し、結果の单精度浮動小数点値をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは32ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスタである。デスティネーション・オペランドの上位3つのダブルワードは変更されない。单精度浮動小数点値のスカラ演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 10-6. を参照のこと。

### 操作

```
DEST[31-0] ← SQRT (SRC[31-0]);
* DEST[127-64] remains unchanged *;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
SQRTSS      __m128 _mm_sqrt_ss(__m128 a)
```

### SIMD 浮動小数点例外

無効、精度、デノーマル。

### 保護モード例外

|               |                                                      |
|---------------|------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。     |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                      |
| #NM           | CR0 の TS がセットされた場合。                                  |
| #XM           | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。 |
| #UD           | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。 |
|               | CR0 の EM がセットされた場合。                                  |
|               | CR4 の OSFXSR が 0 の場合。                                |
|               | CPUID 機能フラグ SSE が 0 の場合。                             |

## SQRTSS—Compute Square Root of Scalar Single-Precision Floating-Point Value (続き)

#AC(0) アライメント・チェックがイネーブルにされていて、現行特権レベルが 3 のときにアライメントが合わないメモリ参照を行った場合。

### 実アドレスモード例外

GP(0) オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。

#NM CR0 の TS がセットされた場合。

#XM マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。

#UD マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。

CR0 の EM がセットされた場合。

CR4 の OSFXSR が 0 の場合。

CPUID 機能フラグ SSE が 0 の場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照を行った場合。

## STC—Set Carry Flag

| オペコード | 命令  | 説明            |
|-------|-----|---------------|
| F9    | STC | CF フラグをセットする。 |

### 説明

EFLAGS レジスタの CF フラグをセットする。

### 操作

$CF \leftarrow 1;$

### 影響を受けるフラグ

CF フラグがセットされる。OF、ZF、SF、AF、PF フラグは影響を受けない。

### 例外（すべての操作モード）

なし。

## STD—Set Direction Flag

| オペコード | 命令  | 説明            |
|-------|-----|---------------|
| FD    | STD | DF フラグをセットする。 |

### 説明

EFLAGS レジスタの DF フラグをセットする。DF フラグが 1 にセットされると、ストリング操作はインデックス・レジスタ（ESI または EDI、またはその両方）をデクリメントする。

### 操作

$DF \leftarrow 1;$

### 影響を受けるフラグ

DF フラグがセットされる。CF、OF、ZF、SF、AF、PF フラグは影響を受けない。

### 例外（すべての操作モード）

なし。

## STI—Set Interrupt Flag

| オペコード | 命令  | 説明                                           |
|-------|-----|----------------------------------------------|
| FB    | STI | 割り込みフラグをセットする。次の命令の最後で、外部マスク可能割り込みがイネーブルになる。 |

### 説明

保護モード仮想割り込みがイネーブルでない場合は、STI 命令は EFLAGS レジスタの割り込みフラグ (IF) をセットする。IF フラグがセットされた後、プロセッサは、次の命令を実行した後に外部マスク可能割り込みへの応答を開始する。この命令のディレイした効果は、プロシージャ（またはサブルーチン）から戻る直前に割り込みをイネーブルにできるように提供されている。例えば、STI 命令の後に RET 命令が続いている場合に、RET 命令は、外部割り込みが認識される前に実行を認められる<sup>3</sup>。STI 命令の後に (IF フラグをクリアする) CLI 命令が続いていると、STI 命令の効果はネガートされる。

IF フラグと STI 命令および CLI 命令は、例外および NMI 割り込みの生成は妨げない。STI 命令の後に続く 1 つのマクロ命令については、NMI 割り込みが妨げられることがある。

保護モード仮想割り込みがイネーブル、CPL が 3、かつ IOPL が 3 より小さい場合は、STI は EFLAGS レジスタの VIF フラグをセットし、IF フラグには影響を与えない。

表 4-1. は、プロセッサの動作モードおよび実行中のプログラムまたはプロシージャの CPL と IOPL の設定によって、STI 命令の処置が決まることを示している。

3. 以降の命令を過ぎて割り込みを個別にディレイさせる命令シーケンスでは、シーケンスの最初の命令は、割り込みをディレイさせることが保証されるが、以降の割り込みディレイ命令は、割り込みをディレイさせない場合があることに注意する。そのため、以下の命令シーケンスでは、

```
STI
MOV SS, AX
MOV ESP, EBP
```

MOV DD, AX が通常は割り込みを 1 命令の間ディレイさせる場合でも、MOV ESP, EBP が実行される前に、割り込みが認識されることがある。

## STI—Set Interrupt Flag (続き)

表 4-1. STI 結果のデシジョン・テーブル

| PE                 | VM | IOPL  | CPL | PVI | VIP | VME | STI 結果  |
|--------------------|----|-------|-----|-----|-----|-----|---------|
| 0                  | X  | X     | X   | X   | X   | X   | IF = 1  |
| 1                  | 0  | ≥ CPL | X   | X   | X   | X   | IF = 1  |
| 1                  | 0  | < CPL | 3   | 1   | 0   | X   | VIF = 1 |
| 1                  | 0  | < CPL | < 3 | X   | X   | X   | GP フォルト |
| 1                  | 0  | < CPL | X   | 0   | X   | X   | GP フォルト |
| 1                  | 0  | < CPL | X   | X   | 1   | X   | GP フォルト |
| 1                  | 1  | 3     | X   | X   | X   | X   | IF = 1  |
| 1                  | 1  | < 3   | X   | X   | 0   | 1   | VIF = 1 |
| 1                  | 1  | < 3   | X   | X   | 1   | X   | GP フォルト |
| 1                  | 1  | < 3   | X   | X   | X   | 0   | GP フォルト |
| X = この設定は影響をあたえない。 |    |       |     |     |     |     |         |

## STI—Set Interrupt Flag（続き）

### 操作

```

IF PE = 0 (* Executing in real-address mode *)
    THEN
        IF ← 1; (* Set Interrupt Flag *)
    ELSE (* Executing in protected mode or virtual-8086 mode *)
        IF VM = 0 (* Executing in protected mode*)
            THEN
                IF IOPL ≥ CPL
                    THEN
                        IF ← 1; (* Set Interrupt Flag *)
                    ELSE
                        IF (IOPL < CPL) AND (CPL = 3) AND (VIP = 0)
                            THEN
                                VIF ← 1; (* Set Virtual Interrupt Flag *)
                            ELSE
                                #GP(0);
                            FI;
                        FI;
                    FI;
                ELSE
                    IF IOPL = 3
                        THEN
                            IF ← 1; (* Set Interrupt Flag *)
                        ELSE
                            IF ((IOPL < 3) AND (VIP = 0) AND (VME = 1))
                                THEN
                                    VIF ← 1; (* Set Virtual Interrupt Flag *)
                                ELSE
                                    #GP(0); (* Trap to virtual-8086 monitor *)
                                FI;
                            FI;
                        FI;
                    FI;
                FI;
            FI;
        FI;
    FI;

```

### 影響を受けるフラグ

IF フラグが 1 にセットされる。または、VIF フラグが 1 にセットされる。

### 保護モード例外

#GP(0)           CPL が現在のプログラムまたはプロシージャの IOPL より大きい（低い特権をもつ）場合。

### 実アドレスモード例外

なし。

## STI—Set Interrupt Flag（続き）

### 仮想 8086 モード例外

#GP(0)

CPL が現在のプログラムまたはプロシージャの IOPL より大きい（低い特権をもつ）場合。

## STMXCSR—Store MXCSR Register State

| オペコード    | 命令                 | 説明                                |
|----------|--------------------|-----------------------------------|
| 0F AE /3 | STMXCSR <i>m32</i> | MXCSR レジスタの内容を <i>m32</i> にストアする。 |

### 説明

MXCSR 制御 / ステータス・レジスタの内容をデスティネーション・オペランドにストアする。デスティネーション・オペランドは、32 ビット・メモリ・ロケーションである。MXCSR レジスタの予約ビットは、ゼロとしてストアされる。

### 操作

*m32* ← MXCSR;

### 同等のインテル® C/C++ コンパイラ組み込み関数

\_mm\_getcsr(void)

### 例外

なし。

### 数値例外

なし。

### 保護モード例外

|               |                                                                                                             |
|---------------|-------------------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。                                                               |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                                                       |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                             |
| #UD           | CR0.EM が 1 の場合。                                                                                             |
| #NM           | CR0 の TS ビットがセットされている場合。                                                                                    |
| #AC           | アライメントの合っていないメモリ参照が行われた場合。#AC 例外をイネーブルにするには、3 つの条件を真にする必要がある (CR0.AM をセットし、EFLAGS.AC をセットし、現行 CPL を 3 にする)。 |
| #UD           | CR4.OSFXSR (ビット 9) が 0 の場合。                                                                                 |
|               | CPUID.SSE (EDX ビット 25) が 0 の場合。                                                                             |

## STMXCSR—Store MXCSR Register State（続き）

### 実アドレスモード例外

- GP(0) オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。
- #UD CR0.EM が 1 の場合。
- #NM CR0 の TS ビットがセットされている場合。
- #UD CR4.OSFXSR（ビット 9）が 0 の場合。
- CPUID.SSE（EDX ビット 25）が 0 の場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

- #PF（フォルトコード） ページフォルトが発生した場合。
- #AC アライメントの合っていないメモリ参照を行った場合。

## STOS/STOSB/STOSW/STOSD—Store String

| オペコード | 命令       | 説明                         |
|-------|----------|----------------------------|
| AA    | STOS m8  | AL をアドレス ES:(E)DI にストアする。  |
| AB    | STOS m16 | AX をアドレス ES:(E)DI にストアする。  |
| AB    | STOS m32 | EAX をアドレス ES:(E)DI にストアする。 |
| AA    | STOSB    | AL をアドレス ES:(E)DI にストアする。  |
| AB    | STOSW    | AX をアドレス ES:(E)DI にストアする。  |
| AB    | STOSD    | EAX をアドレス ES:(E)DI にストアする。 |

### 説明

バイト、ワード、またはダブルワードをそれぞれ AL、AX、または EAX レジスタからデスティネーション・オペランドにストアする。デスティネーション・オペランドはメモリ・ロケーションであり、そのアドレスは、(命令のアドレスサイズ属性、32 または 16 に応じて) それぞれ ES:EDI レジスタまたは ES:DI レジスタから読み取られる。ES セグメントは、セグメント・オーバライド・プリフィックスでオーバライドすることはできない。

アセンブリ・コード・レベルでは、この命令の「明示オペランド」形式と「オペランドなし」形式という 2 つの形式が使用できる。(STOS ニーモニックで指定される) 明示オペランド形式では、デスティネーション・オペランドを明示的に指定することができる。この場合、デスティネーション・オペランドは、デスティネーション値のサイズとロケーションを示す記号でなければならない。ソース・オペランドは、この場合にはデスティネーション・オペランドのサイズに一致するように自動的に選択される(バイト・オペランドでは AL レジスタ、ワード・オペランドでは AX レジスタ、ダブルワード・オペランドでは EAX レジスタ)。この明示オペランド形式は、ドキュメンテーションを可能にするために設けられたものであるが、この形式によって提供されるドキュメンテーションは誤解を招く場合があるので注意する。すなわち、デスティネーション・オペランドの記号は、オペランドの正しいタイプ(サイズ: バイト、ワード、またはダブルワード) を指定しなければならないが、正しいロケーションを指定する必要はない。ロケーションは、常に ES:(E)DI レジスタによって指定されるので、ストリング・ストア命令を実行する前に、これらのレジスタに正しくロードされていなければならない。

オペランドなし形式は、STOS 命令のバイト、ワード、ダブルワード各バージョンの「ショート形式」を提供する。この場合も、ES:(E)DI がデスティネーション・オペランドであると想定され、AL、AX、または EAX レジスタがソース・オペランドであると想定される。デスティネーション・オペランドとソース・オペランドのサイズは、STOSB(レジスタ AL からのバイト読み取り)、STOSW(AX からのワード読み取り)、または STOSD(EAX からのダブルワード読み取り) の各ニーモニックで指定される。

## STOS/STOSB/STOSW/STOSD—Store String（続き）

バイト、ワード、またはダブルワードがAL、AX、またはEAXレジスタからメモリ・ロケーションに転送された後、(E)DIレジスタはEFLAGSレジスタのDFフラグの設定にしたがって自動的にインクリメントまたはデクリメントされる。(DFフラグが0である場合は、(E)DIレジスタはインクリメントされる。DFフラグが1である場合は、(E)DIレジスタはデクリメントされる。)(E)DIレジスタは、バイト操作の場合は1、ワード操作の場合は2、ダブルワード操作の場合は4、それぞれインクリメントまたはデクリメントされる。

STOS、STOSB、STOSW、STOSD命令は、前にREPプリフィックスを付けることにより、ECXバイト、ワード、またはダブルワードのブロックロードを行うことができる。しかし通常は、データをストアするにはその前にAL、AX、またはEAXレジスタに転送する必要があるので、これらの命令はループ構造体で使用されることの方が多い。REPプリフィックスの説明については、本章の「REP/REPE/REPZ/REPNE /REPNZ—Repeat String Operation Prefix」を参照のこと。

### 操作

```

IF (byte store)
  THEN
    DEST ← AL;
    THEN IF DF = 0
      THEN (E)DI ← (E)DI + 1;
      ELSE (E)DI ← (E)DI - 1;
    FI;
  ELSE IF (word store)
    THEN
      DEST ← AX;
      THEN IF DF = 0
        THEN (E)DI ← (E)DI + 2;
        ELSE (E)DI ← (E)DI - 2;
      FI;
    ELSE (* doubleword store *)
      DEST ← EAX;
      THEN IF DF = 0
        THEN (E)DI ← (E)DI + 4;
        ELSE (E)DI ← (E)DI - 4;
      FI;
    FI;
FI;

```

### 影響を受けるフラグ

なし。

## STOS/STOSB/STOSW/STOSD—Store String（続き）

### 保護モード例外

- |               |                                                                                                     |
|---------------|-----------------------------------------------------------------------------------------------------|
| #GP(0)        | デステイネーションが書き込み不可能なセグメントにある場合。<br>メモリ・オペランドの実効アドレスが ES セグメントの範囲外の場合。<br>ES レジスタの内容がヌル・セグメント・セレクタの場合。 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                     |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                    |

### 実アドレスモード例外

- |     |                                    |
|-----|------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが ES セグメントの範囲外の場合。 |
|-----|------------------------------------|

### 仮想 8086 モード例外

- |               |                                                  |
|---------------|--------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが ES セグメントの範囲外の場合。               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                  |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

## STR—Store Task Register

| オペコード    | 命令               | 説明                                     |
|----------|------------------|----------------------------------------|
| OF 00 /1 | STR <i>r/m16</i> | セグメント・セレクタを TR から <i>r/m16</i> にストアする。 |

### 説明

セグメント・セレクタをタスクレジスタ (TR) からデスティネーション・オペランドにストアする。デスティネーション・オペランドには、汎用レジスタまたはメモリ・ロケーションを使用できる。この命令でストアされるセグメント・セレクタは、現在実行中のタスクのタスク・ステート・セグメント (TSS) を指す。

デスティネーション・オペランドが 32 ビット・レジスタであるときは、16 ビットのセグメント・セレクタがレジスタの下位 16 ビットにコピーされ、レジスタの上位 16 ビットはクリアされる。デスティネーション・オペランドがメモリ・ロケーションであるときは、セグメント・セレクタは、オペランド・サイズに関係なく、16 ビット幅でメモリに書き込まれる。

STR 命令は、オペレーティング・システム・ソフトウェアだけに有用である。この命令は、保護モードでしか実行することができない。

### 操作

DEST ← TR(SegmentSelector);

### 影響を受けるフラグ

なし。

### 保護モード例外

#GP(0) デスティネーションが書き込み不可能なセグメントにあるメモリ・オペランドである場合、または実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。

DS、ES、FS、GS レジスタを使用してメモリがアクセスされ、レジスタの内容がヌル・セグメント・セレクタであった場合。

#SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

#UD STR 命令は実アドレスモードでは認識されない。

## STR—Store Task Register（続き）

### 仮想 8086 モード例外

#UD

STR 命令は仮想 8086 モードでは認識されない。

## SUB—Subtract

| オペコード           | 命令                      | 説明                                      |
|-----------------|-------------------------|-----------------------------------------|
| 2C <i>ib</i>    | SUB AL, <i>imm8</i>     | AL から <i>imm8</i> を引く。                  |
| 2D <i>iw</i>    | SUB AX, <i>imm16</i>    | AX から <i>imm16</i> を引く。                 |
| 2D <i>id</i>    | SUB EAX, <i>imm32</i>   | EAX から <i>imm32</i> を引く。                |
| 80 /5 <i>ib</i> | SUB <i>r/m8, imm8</i>   | <i>r/m8</i> から <i>imm8</i> を引く。         |
| 81 /5 <i>iw</i> | SUB <i>r/m16, imm16</i> | <i>r/m16</i> から <i>imm16</i> を引く。       |
| 81 /5 <i>id</i> | SUB <i>r/m32, imm32</i> | <i>r/m32</i> から <i>imm32</i> を引く。       |
| 83 /5 <i>ib</i> | SUB <i>r/m16, imm8</i>  | <i>r/m16</i> から符号拡張された <i>imm8</i> を引く。 |
| 83 /5 <i>ib</i> | SUB <i>r/m32, imm8</i>  | <i>r/m32</i> から符号拡張された <i>imm8</i> を引く。 |
| 28 / <i>r</i>   | SUB <i>r/m8, r8</i>     | <i>r/m8</i> から <i>r8</i> を引く。           |
| 29 / <i>r</i>   | SUB <i>r/m16, r16</i>   | <i>r/m16</i> から <i>r16</i> を引く。         |
| 29 / <i>r</i>   | SUB <i>r/m32, r32</i>   | <i>r/m32</i> から <i>r32</i> を引く。         |
| 2A / <i>r</i>   | SUB <i>r8, r/m8</i>     | <i>r8</i> から <i>r/m8</i> を引く。           |
| 2B / <i>r</i>   | SUB <i>r16, r/m16</i>   | <i>r16</i> から <i>r/m16</i> を引く。         |
| 2B / <i>r</i>   | SUB <i>r32, r/m32</i>   | <i>r32</i> から <i>r/m32</i> を引く。         |

### 説明

第1オペランド（デスティネーション・オペランド）から第2オペランド（ソース・オペランド）を引き、結果をデスティネーション・オペランドにストアする。デスティネーション・オペランドには、レジスタまたはメモリ・ロケーションを使用できる。ソース・オペランドには、即値、レジスタ、またはメモリ・ロケーションを使用できる。（ただし、1つの命令で2つのメモリ・オペランドを使用することはできない。）即値をオペランドとして使用すると、デスティネーション・オペランドのフォーマットの長さまで符号拡張される。

SUB命令は、整数の減算を実行する。SUB命令は、符号付き整数オペランドおよび符号なし整数オペランドの両方の結果を評価し、OFフラグとCFフラグを設定して、それぞれ符号付きの結果または符号なしの結果のオーバーフローを示す。SFフラグは、符号付き結果の符号を示す。

この命令をLOCKプリフィックスと共に使用すると、アトミックに命令を実行させることができる。

### 操作

DEST ← DEST – SRC;

### 影響を受けるフラグ

OF、SF、ZF、AF、PF、CFフラグが結果にしたがって設定される。

## SUB—Subtract（続き）

### 保護モード例外

|              |                                                                  |
|--------------|------------------------------------------------------------------|
| #GP(0)       | デステイネーションが書き込み不可能なセグメントにある場合。                                    |
|              | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。               |
|              | DS、ES、FS、または GS レジスタの内容がマル・セグメント・セレクタの場合。                        |
| #SS(0)       | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                               |
| #PF（フォルトコード） | ページフォルトが発生した場合。                                                  |
| #AC(0)       | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

### 仮想 8086 モード例外

|              |                                                    |
|--------------|----------------------------------------------------|
| #GP(0)       | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)       | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF（フォルトコード） | ページフォルトが発生した場合。                                    |
| #AC(0)       | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## SUBPD—Subtract Packed Double-Precision Floating-Point Values

| オペコード       | 命令                           | 説明                                                 |
|-------------|------------------------------|----------------------------------------------------|
| 66 0F 5C /r | SUBPD <i>xmm1, xmm2/m128</i> | <i>xmm1</i> から <i>xmm2/m128</i> のパックド倍精度浮動小数点値を引く。 |

### 説明

デステイネーション・オペランド（第1オペランド）の2つのパックド倍精度浮動小数点値からソース・オペランド（第2オペランド）の2つのパックド倍精度浮動小数点値を SIMD 減算し、結果のパックド倍精度浮動小数点値をデステイネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デステイネーション・オペランドは XMM レジスタである。倍精度浮動小数点値の SIMD 演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 11-3. を参照のこと。

### 操作

```
DEST[63-0] ← DEST[63-0] – SRC[63-0];
DEST[127-64] ← DEST[127-64] – SRC[127-64];
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
SUBPD      __m128d _mm_sub_pd (m128d a, m128d b)
```

### SIMD 浮動小数点例外

オーバーフロー、アンダーフロー、無効、精度、デノーマル。

### 保護モード例外

|               |                                                      |
|---------------|------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、または GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。    |
|               | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。        |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                      |
| #NM           | CR0 の TS がセットされた場合。                                  |
| #XM           | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。 |

## SUBPD—Subtract Packed Double-Precision Floating-Point Values (続き)

|     |                                                                                                                                   |
|-----|-----------------------------------------------------------------------------------------------------------------------------------|
| #UD | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br>CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。 |
|-----|-----------------------------------------------------------------------------------------------------------------------------------|

### 実アドレスモード例外

|        |                                                                                                                                   |
|--------|-----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                                              |
| #NM    | CR0 の TS がセットされた場合。                                                                                                               |
| #XM    | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                                                              |
| #UD    | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br>CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。 |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## SUBPS—Subtract Packed Single-Precision Floating-Point Values

| オペコード    | 命令                           | 説明                                                                 |
|----------|------------------------------|--------------------------------------------------------------------|
| 0F 5C /r | SUBPS <i>xmm1, xmm2/m128</i> | <i>xmm1</i> のパックド単精度浮動小数点値から<br><i>xmm2/mem</i> のパックド単精度浮動小数点値を引く。 |

### 説明

デステイネーション・オペランド（第1オペランド）の4つのパックド単精度浮動小数点値からソース・オペランド（第2オペランド）の4つのパックド単精度浮動小数点値を SIMD 減算し、結果のパックド単精度浮動小数点値をデステイネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デステイネーション・オペランドは XMM レジスタである。単精度浮動小数点値の SIMD 演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図 10-5. を参照のこと。

### 操作

```
DEST[31-0] ← DEST[31-0] – SRC[31-0];
DEST[63-32] ← DEST[63-32] – SRC[63-32];
DEST[95-64] ← DEST[95-64] – SRC[95-64];
DEST[127-96] ← DEST[127-96] – SRC[127-96];
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

SUBPS        \_\_m128 \_mm\_sub\_ps(\_\_m128 a, \_\_m128 b)

### SIMD 浮動小数点例外

オーバーフロー、アンダーフロー、無効、精度、デノーマル。

### 保護モード例外

|               |                                                                                                    |
|---------------|----------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、または GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                                              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                    |
| #NM           | CR0 の TS がセットされた場合。                                                                                |
| #XM           | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                               |

## SUBPS—Subtract Packed Single-Precision Floating-Point Values (続き)

|     |                                                                                                                                  |
|-----|----------------------------------------------------------------------------------------------------------------------------------|
| #UD | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br>CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。 |
|-----|----------------------------------------------------------------------------------------------------------------------------------|

### 実アドレスモード例外

|        |                                                                                                                                  |
|--------|----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                                             |
| #NM    | CR0 の TS がセットされた場合。                                                                                                              |
| #XM    | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                                                             |
| #UD    | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br>CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。 |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## SUBSD—Subtract Scalar Double-Precision Floating-Point Values

| オペコード       | 命令                          | 説明                                                 |
|-------------|-----------------------------|----------------------------------------------------|
| F2 0F 5C /r | SUBSD <i>xmm1, xmm2/m64</i> | <i>xmm1</i> から <i>xmm2/mem64</i> の下位の倍精度浮動小数点値を引く。 |

### 説明

デスティネーション・オペランド（第1オペランド）の下位の倍精度浮動小数点値からソース・オペランド（第2オペランド）の下位の倍精度浮動小数点値を引き、結果の倍精度浮動小数点値をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは64ビットのメモリ・ロケーションである。デスティネーション・オペランドはXMM レジスタである。デスティネーション・オペランドの上位クワッドワードは変更されない。倍精度浮動小数点値のスカラ演算の図は、『IA-32 インテル® アーキテクチャ・ソフトウェア・開発パッケージ・マニュアル、上巻』の図 11-4. を参照のこと。

### 操作

```
DEST[63-0] ← DEST[63-0] – SRC[63-0];
* DEST[127-64] remains unchanged *;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

|       |                                                   |
|-------|---------------------------------------------------|
| SUBSD | <code>_m128d _mm_sub_sd (m128d a, m128d b)</code> |
|-------|---------------------------------------------------|

### SIMD 浮動小数点例外

オーバーフロー、アンダーフロー、無効、精度、デノーマル。

### 保護モード例外

|               |                                                      |
|---------------|------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。     |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                      |
| #NM           | CR0 の TS がセットされた場合。                                  |
| #XM           | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。 |
| #UD           | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。 |
|               | CR0 の EM がセットされた場合。                                  |
|               | CR4 の OSFXSR が 0 の場合。                                |
|               | CPUID 機能フラグ SSE2 が 0 の場合。                            |

## SUBSD—Subtract Scalar Double-Precision Floating-Point Values (続き)

#AC(0) アライメント・チェックがイネーブルにされていて、現行特権レベルが 3 のときにアライメントが合わないメモリ参照を行った場合。

### 実アドレスモード例外

GP(0) オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。

#NM CR0 の TS がセットされた場合。

#XM マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。

#UD マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。

CR0 の EM がセットされた場合。

CR4 の OSFXSR が 0 の場合。

CPUID 機能フラグ SSE2 が 0 の場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照を行った場合。

## SUBSS—Subtract Scalar Single-Precision Floating-Point Values

| オペコード       | 命令                          | 説明                                                              |
|-------------|-----------------------------|-----------------------------------------------------------------|
| F3 0F 5C /r | SUBSS <i>xmm1, xmm2/m32</i> | <i>xmm1</i> の最下位の単精度浮動小数点値から <i>xmm2/m32</i> の最下位の単精度浮動小数点値を引く。 |

### 説明

デステイネーション・オペランド（第1オペランド）の最下位の単精度浮動小数点値からソース・オペランド（第2オペランド）の最下位の単精度浮動小数点値を引き、結果の単精度浮動小数点値をデステイネーション・オペランドに格納する。ソース・オペランドは、XMMレジスタまたは32ビットのメモリ・ロケーションである。デステイネーション・オペランドはXMMレジスタである。デステイネーション・オペランドの上位3つのダブルワードは変更されない。単精度浮動小数点値のスカラ演算の図は、『IA-32インテル®アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の図10-6.を参照のこと。

### 操作

```
DEST[31-0] ← DEST[31-0] - SRC[31-0];
* DEST[127-96] remains unchanged *;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
SUBSS      __m128 _mm_sub_ss(__m128 a, __m128 b)
```

### SIMD 浮動小数点例外

オーバーフロー、アンダーフロー、無効、精度、デノーマル。

### 保護モード例外

|               |                                                 |
|---------------|-------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、またはGSセグメント内のメモリ・オペランドの実効アドレスが無効の場合。 |
| #SS(0)        | SSセグメント内のアドレスが無効の場合。                            |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                 |
| #NM           | CR0のTSがセットされた場合。                                |
| #XM           | マスクされていないSIMD浮動小数点例外が発生し、CR4のOSXMMEXCPTが1の場合。   |
| #UD           | マスクされていないSIMD浮動小数点例外が発生し、CR4のOSXMMEXCPTが0の場合。   |
|               | CR0のEMがセットされた場合。                                |
|               | CR4のOSFXSRが0の場合。                                |
|               | CPUID機能フラグSSEが0の場合。                             |

## SUBSS—Subtract Scalar Single-Precision Floating-Point Values (続き)

#AC(0) アライメント・チェックがイネーブルにされていて、現行特権レベルが 3 のときにアライメントが合わないメモリ参照を行った場合。

### 実アドレスモード例外

GP(0) オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。

#NM CR0 の TS がセットされた場合。

#XM マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。

#UD マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。

CR0 の EM がセットされた場合。

CR4 の OSFXSR が 0 の場合。

CPUID 機能フラグ SSE が 0 の場合。

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照を行った場合。

## SYSENTER—Fast System Call

| オペコード | 命令       | 説明                           |
|-------|----------|------------------------------|
| 0F 34 | SYSENTER | 特権レベル 0 のシステム・プロシージャへの高速コール。 |

### 説明

特権レベル 0 のシステム・プロシージャまたはルーチンへの高速コールを実行する。この命令は、SYSEXIT 命令に対するコンパニオン命令である。SYSENTER 命令は、特権レベル 3 で実行中のユーザコードからオペレーティング・システムまたは特権レベル 0 で実行中の実行プロシージャへのシステムコールについて、そのパフォーマンスが最高になるように最適化される。

SYSENTER 命令を実行する前に、ソフトウェア上で以下の MSR に値を書き込むことにより、特権レベル 0 のコード・セグメントとコード・エントリ・ポイント、特権レベル 0 のスタック・セグメントとスタックポインタを指定する必要がある。

- SYSENTER\_CS\_MSR — 特権レベル 0 のコード・セグメントの 32 ビット・セグメント・セレクタが入る。(この値は、特権レベル 0 のスタック・セグメントのセグメント・セレクタを計算するのにも使用される)
- SYSENTER\_EIP\_MSR — 選択された操作プロシージャまたはルーチンの先頭の命令に対する、特権レベル 0 のコード・セグメントの 32 ビット・オフセットが入る。
- SYSENTER\_ESP\_MSR — 特権レベル 0 のスタックの 32 ビット・スタック・ポインタが入る。

これらの MSR は、RDMSR 命令およびWRMSR 命令を使用して読み取りおよび書き込みを行うことができる。レジスタアドレスを表 4-2 に示す。これらのアドレスは、今後の IA-32 プロセッサにおいても固定されたままとなるよう定義されている。

表 4-2. SYSENTER 命令および SYSEXIT 命令によって使用される MSR

| MSR              | アドレス |
|------------------|------|
| SYSENTER_CS_MSR  | 174H |
| SYSENTER_ESP_MSR | 175H |
| SYSENTER_EIP_MSR | 176H |

SYSENTER 命令を実行するとき、プロセッサは以下のことを行う。

1. セグメント・セレクタを SYSENTER\_CS\_MSR から CS レジスタにロードする。
2. 命令ポインタを SYSENTER\_EIP\_MSR から EIP レジスタにロードする。
3. SYSENTER\_CS\_MSR の値に 8 を加算し、その合計を SS レジスタにロードする。

## SYSENTER—Fast System Call（続き）

4. スタックポインタを SYSENTER\_ESP\_MSR から ESP レジスタにロードする。
5. 特権レベル 0 に切り替える。
6. （フラグが設定されている場合には）EFLAGS レジスタの VM フラグをクリアする。
7. 選択したシステム・プロシージャの実行を開始する。

プロセッサは、コール元のプロシージャのリターンIPや他の状態情報をセーブしない。

SYSENTER 命令は常に、DPL が 0 の保護モード・コード・セグメントにプログラムの制御を移す。この命令を使用するには、オペレーティング・システムが以下の条件を満たしていなければならない。

- 選択されたシステム・コード・セグメントのセグメント記述子により、実行許可、読み取り許可、アクセス許可、非コンフォーミング許可を持つ最大 4G バイトのフラットな 32 ビット・コード・セグメントが選択されていること。
- 選択されたシステム・スタック・セグメントのセグメント記述子により、読み取り許可、書き込み許可、アクセス許可、拡張許可を持つ最大 4G バイトのフラットな 32 ビット・スタック・セグメントが選択されていること。

SYSENTER 命令は、実アドレスモードを除くすべての操作モードから起動できる。

SYSENTER 命令と SYSEXIT 命令はコンパニオン命令であるが、コール/リターンのペアを形成するものではない。SYSENTER 命令を実行するときに、プロセッサはユーザコードの状態情報をセーブしない。また、SYSENTER 命令も SYSEXIT 命令も、スタックへのパラメータ渡しをサポートしない。

SYSENTER 命令と SYSEXIT 命令をコンパニオン命令として使用し、特権レベル 3 のコードと特権レベル 0 のオペレーティング・システム・プロシージャ間のトランジション（移行）を行うには、以下の規則に従う必要がある。

- 特権レベル 0 のコードとスタック・セグメントのセグメント記述子、特権レベル 3 のコードとスタック・セグメントのセグメント記述子は、グローバル記述子テーブル内で連続していなければならない。この規則により、プロセッサは、SYSENTER\_CS\_MSR MSR に入力された値からセグメント・セレクタを計算することができる。

## SYSENTER—Fast System Call（続き）

- ユーザコードが実行する高速システムコールの「スタブ」ルーチン（通常は、共用ライブラリまたはDLL内にある）では、コール元プロシージャへのリターンが要求される場合、必要なリターンIPとプロセッサ状態情報をセーブしておく必要がある。同様に、SYSENTER命令でコールされるオペレーティング・システムまたは実行プロシージャでは、ユーザコードにリターンするときにアクセス権が必要であると共に、このセーブされているリターンIPと状態に関する情報を使用する必要がある。

SYSENTER命令とSYSEXIT命令は、インテル® Pentium® IIプロセッサでIA-32アーキテクチャに導入された。これらの命令をプロセッサで使用できるかどうかは、CPUID命令によってEDXレジスタに返されるSYSENTER/SYSEXIT Present (SEP)機能フラグの状態によって示される。オペレーティング・システムでSEPフラグを調べる場合は、プロセッサのファミリとモデルも調べて、SYSENTER/SYSEXIT命令を実際にサポートしているかどうかを確認しなければならない。例えば、次のコードを使用できる。

```
IF (CPUID SEP bit is set)
    THEN IF (Family = 6) AND (Model < 3) AND (Stepping < 3)
        THEN
            SYSENTER/SYSEXIT_Not_Supported
        FI;
    ELSE SYSENTER/SYSEXIT_Supported
FI;
```

インテル® Pentium® Proプロセッサ（モデル1）上でCPUID命令を実行すると、SEPフラグがセットされて返されるが、SYSENTER/SYSEXIT命令はサポートされない。

### 操作

```
IF CRO.PE = 0 THEN #GP(0); FI;
IF SYSENTER_CS_MSR = 0 THEN #GP(0); FI;

EFLAGS.VM ← 0          (* Insures protected mode execution *)
EFLAGS.IF ← 0          (* Mask interrupts *)
EFLAGS.RF ← 0

CS.SEL ← SYSENTER_CS_MSR(* Operating system provides CS *)
(* Set rest of CS to a fixed value *)
CS.SEL.CPL ← 0
CS.BASE ← 0           (* Flat segment *)

CS.LIMIT ← FFFFH      (* 4 GByte limit *)
CS.ARbyte.G ← 1        (* 4 KByte granularity *)
CS.ARbyte.S ← 1
CS.ARbyte.TYPE ← 1011B (* Execute + Read, Accessed *)
CS.ARbyte.D ← 1        (* 32-bit code segment*)
```

## SYSENTER—Fast System Call（続き）

```

CS.ARbyte.DPL ← 0
CS.ARbyte.RPL ← 0
CS.ARbyte.P ← 1

SS.SEL ← CS.SEL + 8
(* Set rest of SS to a fixed value *)
SS.BASE ← 0          (* Flat segment *)
SS.LIMIT ← FFFFH     (* 4 GByte limit *)
SS.ARbyte.G ← 1       (* 4 KByte granularity *)
SS.ARbyte.S ←
SS.ARbyte.TYPE ← 0011B (* Read/Write, Accessed *)
SS.ARbyte.D ← 1       (* 32-bit stack segment*)
SS.ARbyte.DPL ← 0
SS.ARbyte.RPL ← 0
SS.ARbyte.P ← 1

ESP ← SYSENTER_ESP_MSR
EIP ← SYSENTER_EIP_MSR

```

### 影響を受けるフラグ

VM、IF、RF（上記の操作を参照）

### 保護モード例外

#GP(0) SYSENTER\_CS\_MSR の値がゼロの場合。

### 実アドレスモード例外

#GP(0) 保護モードがイネーブルになっていない場合。

### 仮想 8086 モード例外

#GP(0) SYSENTER\_CS\_MSR の値がゼロの場合。

## SYSEXIT—Fast Return from Fast System Call

| オペコード | 命令      | 説明                      |
|-------|---------|-------------------------|
| 0F 35 | SYSEXIT | 特権レベル3のユーザコードに高速リターンする。 |

### 説明

特権レベル3のユーザコードへの高速リターンを実行する。この命令は、SYSENTER命令に対するコンパニオン命令である。SYSEXIT命令は、保護レベル0で実行中のシステム・プロシージャから保護レベル3で実行中のユーザ・プロシージャへのリターンについて、そのパフォーマンスが最高になるように最適化される。この命令は、特権レベル0で実行中のコードから実行しなければならない。

SYSEXIT命令を実行する前に、ソフトウェア上で以下のMSRおよび汎用レジスタに値を書き込むことにより、特権レベル3のコード・セグメントとコード・エントリ・ポイント、特権レベル3のスタック・セグメントとスタックポインタを指定する必要がある。

- SYSENTER\_CS\_MSR — プロセッサが現在実行中の特権レベル0のコード・セグメントの32ビット・セグメント・セレクタが入る。(この値は、特権レベル3のコードおよびスタック・セグメントのセグメント・セレクタを計算するのに使用される)
- EDX — ユーザコードで最初に実行される命令に対する、特権レベル3のコード・セグメントの32ビット・オフセットが入る。
- ECX — 特権レベル3のスタックの32ビット・スタック・ポインタが入る。

SYSENTER\_CS\_MSR MSRは、RDMSR命令およびWRMSR命令を使用して読み取りおよび書き込みを行うことができる。レジスタアドレスを表4-2に示す。このアドレスは、今後のIA-32プロセッサにおいても固定されたままとなるよう定義されている。

SYSEXIT命令を実行するとき、プロセッサは以下のことを行う。

1. SYSENTER\_CS\_MSR の値に 16 を加算し、その合計を CS セレクタレジスタにロードする。
2. 命令ポインタを EDX レジスタから EIP レジスタにロードする。
3. SYSENTER\_CS\_MSR の値に 24 を加算し、その合計を SS セレクタレジスタにロードする。
4. スタックポインタを ECX レジスタから ESP レジスタにロードする。
5. 特権レベル3に切り替える。
6. EIP アドレスでユーザコードの実行を開始する。

## SYSEXIT—Fast Return from Fast System Call（続き）

コールおよびリターンのコンパニオン命令として SYSENTER 命令と SYSEXIT 命令を使用する方法については、「SYSENTER—Fast System Call」を参照のこと。

SYSEXIT 命令は常に、DPL が 3 の保護モード・コード・セグメントにプログラムの制御を移す。この命令を使用するには、オペレーティング・システムが以下の条件を満たしていなければならない。

- 選択されたユーザ・コード・セグメントのセグメント記述子により、実行許可、読み取り許可、アクセス許可、非コンフォーミング許可を持つ最大 4G バイトのフラットな 32 ビット・コード・セグメントが選択されていること。
- 選択されたユーザ・スタック・セグメントのセグメント記述子により、拡張許可、読み取り許可、書き込み許可、アクセス許可を持つ最大 4G バイトのフラットな 32 ビット・スタック・セグメントが選択されていること。

SYSENTER は、実アドレスモードを除くすべての操作モードから起動できる。

SYSENTER 命令と SYSEXIT 命令は、インテル® Pentium® II プロセッサで IA-32 アーキテクチャに導入された。これらの命令をプロセッサで使用できるかどうかは、CPUID 命令によって EDX レジスタに返される SYSENTER/SYSEXIT Present (SEP) 機能フラグの状態によって示される。オペレーティング・システムで SEP フラグを調べる場合は、プロセッサのファミリとモデルも調べて、SYSENTER/SYSEXIT 命令を実際にサポートしているかどうかを確認しなければならない。例えば、次のコードを使用できる。

```
IF (CPUID SEP bit is set)
    THEN IF (Family = 6) AND (Model < 3) AND (Stepping < 3)
        THEN
            SYSENTER/SYSEXIT_Not_Supported
        FI;
    ELSE SYSENTER/SYSEXIT_Supported
FI;
```

インテル® Pentium® Pro プロセッサ（モデル 1）上で CPUID 命令を実行すると、SEP フラグがセットされて返されるが、SYSENTER/SYSEXIT 命令はサポートされない。

### 操作

```
IF SYSENTER_CS_MSR = 0 THEN #GP(0); FI;
IF CR0.PE = 0 THEN #GP(0); FI;
IF CPL ≠ 0 THEN #GP(0)
```

```
CS_SEL ← (SYSENTER_CS_MSR + 16)(* Segment selector for return CS *)
(* Set rest of CS to a fixed value *)
CS_BASE ← 0          (* Flat segment *)
CS_LIMIT ← FFFFH     (* 4 GByte limit *)
```

## SYSEXIT—Fast Return from Fast System Call（続き）

```

CS.ARbyte.G ← 1           (* 4 KByte granularity *)
CS.ARbyte.S ← 1
CS.ARbyte.TYPE ← 1011B    (* Execute, Read, Non-Conforming Code *)
CS.ARbyte.D ← 1           (* 32-bit code segment*)
CS.ARbyte.DPL ← 3
CS.ARbyte.RPL ← 3
CS.ARbyte.P ← 1

SS.SEL ← (SYSENTER_CS_MSR + 24)(* Segment selector for return SS *)
(* Set rest of SS to a fixed value *)
SS.BASE ← 0               (* Flat segment *)
SS.LIMIT ← FFFFH          (* 4 GByte limit *)
SS.ARbyte.G ← 1           (* 4 KByte granularity *)
SS.ARbyte.S ←
SS.ARbyte.TYPE ← 0011B     (* Expand Up, Read/Write, Data *)
SS.ARbyte.D ← 1           (* 32-bit stack segment*)
SS.ARbyte.DPL ← 3
SS.ARbyte.RPL ← 3
SS.ARbyte.P ← 1

ESP      ← ECX
EIP      ← EDX

```

### 影響を受けるフラグ

なし。

### 保護モード例外

#GP(0) SYSENTER\_CS\_MSR の値がゼロの場合。

### 実アドレスモード例外

#GP(0) 保護モードがイネーブルになっていない場合。

### 仮想 8086 モード例外

#GP(0) SYSENTER\_CS\_MSR の値がゼロの場合。

## TEST—Logical Compare

| オペコード           | 命令                               | 説明                                                              |
|-----------------|----------------------------------|-----------------------------------------------------------------|
| A8 <i>ib</i>    | TEST AL, <i>imm8</i>             | <i>imm8</i> と AL との ADN をとり、結果にしたがって SF、ZF、PF を設定する。            |
| A9 <i>iw</i>    | TEST AX, <i>imm16</i>            | <i>imm16</i> と AX との ADN をとり、結果にしたがって SF、ZF、PF を設定する。           |
| A9 <i>id</i>    | TEST EAX, <i>imm32</i>           | <i>imm32</i> と EAX との ADN をとり、結果にしたがって SF、ZF、PF を設定する。          |
| F6 /0 <i>ib</i> | TEST <i>r/m8</i> , <i>imm8</i>   | <i>imm8</i> と <i>r/m8</i> との ADN をとり、結果にしたがって SF、ZF、PF を設定する。   |
| F7 /0 <i>iw</i> | TEST <i>r/m16</i> , <i>imm16</i> | <i>imm16</i> と <i>r/m16</i> との ADN をとり、結果にしたがって SF、ZF、PF を設定する。 |
| F7 /0 <i>id</i> | TEST <i>r/m32</i> , <i>imm32</i> | <i>imm32</i> と <i>r/m32</i> との ADN をとり、結果にしたがって SF、ZF、PF を設定する。 |
| 84 / <i>r</i>   | TEST <i>r/m8</i> , <i>r8</i>     | <i>r8</i> と <i>r/m8</i> との ADN をとり、結果にしたがって SF、ZF、PF を設定する。     |
| 85 / <i>r</i>   | TEST <i>r/m16</i> , <i>r16</i>   | <i>r16</i> と <i>r/m16</i> との ADN をとり、結果にしたがって SF、ZF、PF を設定する。   |
| 85 / <i>r</i>   | TEST <i>r/m32</i> , <i>r32</i>   | <i>r32</i> と <i>r/m32</i> との ADN をとり、結果にしたがって SF、ZF、PF を設定する。   |

### 説明

第1オペラント（ソース1オペラント）と第2オペラント（ソース2オペラント）との間のビット単位の AND（論理積）演算を実行し、結果にしたがって SF、ZF、PF ステータス・フラグを設定する。結果は、その後捨てられる。

### 操作

```

TEMP ← SRC1 AND SRC2;
SF ← MSB(TEMP);
IF TEMP = 0
    THEN ZF ← 1;
    ELSE ZF ← 0;
FI;
PF ← BitwiseXNOR(TEMP[0:7]);
CF ← 0;
OF ← 0;
(*AF is Undefined*)

```

### 影響を受けるフラグ

OF および CF フラグが 0 にセットされる。SF、ZF、および PF フラグが結果にしたがって設定される（上記の「操作」の項を参照）。AF フラグの状態は未定義。

## TEST—Logical Compare (続き)

### 保護モード例外

|               |                                                                  |
|---------------|------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。               |
|               | DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。                        |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

### 仮想 8086 モード例外

|               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## UCOMISD—Unordered Compare Scalar Double-Precision Floating-Point Values and Set EFLAGS

| オペコード       | 命令                            | 説明                                                                                   |
|-------------|-------------------------------|--------------------------------------------------------------------------------------|
| 66 0F 2E /r | UCOMISD <i>xmm1, xmm2/m64</i> | <i>xmm1</i> と <i>xmm2/m64</i> の下位の倍精度浮動小数点値を（アンオーダー）比較し、その結果にしたがって EFLAGS フラグをセットする。 |

### 説明

ソース・オペランド1（第1オペランド）とソース・オペランド2（第2オペランド）の下位クワッドワード内の倍精度浮動小数点値のアンオーダー比較を実行し、その結果（アンオーダー、より大きい、より小さい、または等しい）にしたがって、EFLAGS レジスタのZF、PF、CF フラグをセットする。EFLAGS レジスタのOF、SF、AF フラグは0にクリアされる。いずれかのソース・オペランドがNaN (QNaN またはSNaN) の場合は、アンオーダーの結果が返される。

ソース・オペランド1はXMM レジスタである。ソース・オペランド2は、XMM レジスタまたは64ビットのメモリ・ロケーションである。

UCOMISD 命令と COMISD 命令の相違点は、UCOMISD 命令は、ソース・オペランドが SNaN の場合にのみ SIMD 浮動小数点無効操作例外 (#I) を報告することである。COMISD 命令は、ソース・オペランドが QNaN または SNaN の場合に、無効操作例外を報告する。

マスクされていない SIMD 浮動小数点例外が発生した場合は、EFLAGS レジスタは更新されない。

### 操作

```

RESULT ← UnorderedCompare(SRC1[63-0] <> SRC2[63-0]) {
* Set EFLAGS *CASE (RESULT) OF
    UNORDERED:      ZF,PF,CF ← 111;
    GREATER_THAN:   ZF,PF,CF ← 000;
    LESS_THAN:      ZF,PF,CF ← 001;
    EQUAL:          ZF,PF,CF ← 100;
ESAC;
OF,AF,SF ← 0;

```

### 同等のインテル® C/C++ コンパイラ組み込み関数

```

int_mm_ocomieq_sd(__m128d a, __m128d b)
int_mm_ocomilt_sd(__m128d a, __m128d b)
int_mm_ocomile_sd(__m128d a, __m128d b)
int_mm_ocomigt_sd(__m128d a, __m128d b)
int_mm_ocomige_sd(__m128d a, __m128d b)
int_mm_ocomineq_sd(__m128d a, __m128d b)

```

## UCOMISD—Unordered Compare Scalar Double-Precision Floating-Point Values and Set EFLAGS（続き）

### SIMD 浮動小数点例外

無効（SNaN オペランドの場合）、デノーマル。

### 保護モード例外

|              |                                                                                                                                   |
|--------------|-----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)       | CS、DS、ES、FS、または GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。                                                                                 |
| #SS(0)       | SS セグメント内のアドレスが無効の場合。                                                                                                             |
| #PF（フォルトコード） | ページフォルトが発生した場合。                                                                                                                   |
| #NM          | CR0 の TS がセットされた場合。                                                                                                               |
| #XM          | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                                                              |
| #UD          | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br>CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。 |
| #AC(0)       | アライメント・チェックがイネーブルにされていて、現行特権レベルが 3 のときにアライメントが合わないメモリ参照を行った場合。                                                                    |

### 実アドレスモード例外

|       |                                                                                                                                   |
|-------|-----------------------------------------------------------------------------------------------------------------------------------|
| GP(0) | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                                                                                               |
| #NM   | CR0 の TS がセットされた場合。                                                                                                               |
| #XM   | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                                                              |
| #UD   | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br>CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。 |

## UCOMISD—Unordered Compare Scalar Double-Precision Floating-Point Values and Set EFLAGS（続き）

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフェルトが発生した場合。

#AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照を行った場合。

## UCOMISS—Unordered Compare Scalar Single-Precision Floating-Point Values and Set EFLAGS

| オペコード    | 命令                            | 説明                                                                                         |
|----------|-------------------------------|--------------------------------------------------------------------------------------------|
| 0F 2E /r | UCOMISS <i>xmm1, xmm2/m32</i> | <i>xmm1</i> レジスタの最下位の単精度浮動小数点値と <i>xmm2/mem</i> の最下位の単精度浮動小数点値を比較し、結果にしたがってステータス・フラグを設定する。 |

### 説明

ソース・オペランド1（第1オペランド）とソース・オペランド2（第2オペランド）の最下位ダブルワード内の単精度浮動小数点値のアンオーダー比較を実行し、その結果（アンオーダー、より大きい、より小さい、または等しい）にしたがって、EFLAGSレジスタのZF、PF、CFフラグをセットする。EFLAGSレジスタのOF、SF、AFフラグは0にクリアされる。いずれかのソース・オペランドがNaN（QNaNまたはSNaN）の場合は、アンオーダーの結果が返される。

ソース・オペランド1はXMMレジスタである。ソース・オペランド2は、XMMレジスタまたは32ビットのメモリ・ロケーションである。

UCOMISS命令とCOMISS命令の相違点は、UCOMISS命令は、ソース・オペランドがSNaNの場合にのみSIMD浮動小数点無効操作例外 (#I) を報告することである。COMISS命令は、ソース・オペランドがQNaNまたはSNaNの場合に、無効操作例外を報告する。

マスクされていないSIMD浮動小数点例外が発生した場合は、EFLAGSレジスタは更新されない。

### 操作

```
RESULT ← UnorderedCompare(SRC1[63-0] <> SRC2[63-0]) {
* Set EFLAGS *CASE (RESULT) OF
    UNORDERED:      ZF,PF,CF ← 111;
    GREATER_THAN:   ZF,PF,CF ← 000;
    LESS_THAN:      ZF,PF,CF ← 001;
    EQUAL:          ZF,PF,CF ← 100;
ESAC;
OF,AF,SF ← 0;
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
int_mm_ucomieq_ss(__m128 a, __m128 b)
int_mm_ucomilt_ss(__m128 a, __m128 b)
int_mm_ucomile_ss(__m128 a, __m128 b)
int_mm_ucomigt_ss(__m128 a, __m128 b)
int_mm_ucomige_ss(__m128 a, __m128 b)
int_mm_ucomineq_ss(__m128 a, __m128 b)
```

## UCOMISS—Unordered Compare Scalar Single-Precision Floating-Point Values and Set EFLAGS（続き）

### SIMD 浮動小数点例外

無効（SNaN オペランドの場合）、デノーマル。

### 保護モード例外

|              |                                                                                                                                              |
|--------------|----------------------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)       | CS、DS、ES、FS、または GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。                                                                                            |
| #SS(0)       | SS セグメント内のアドレスが無効の場合。                                                                                                                        |
| #PF（フォルトコード） | ページフォルトが発生した場合。                                                                                                                              |
| #NM          | CR0 の TS がセットされた場合。                                                                                                                          |
| #XM          | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                                                                         |
| #UD          | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br><br>CR0 の EM がセットされた場合。<br><br>CR4 の OSFXSR が 0 の場合。<br><br>CPUID 機能フラグ SSE が 0 の場合。 |
| #AC(0)       | アライメント・チェックがイネーブルにされていて、現行特権レベルが 3 のときにアライメントが合わないメモリ参照を行った場合。                                                                               |

### 実アドレスモード例外

|       |                                                                                                                                              |
|-------|----------------------------------------------------------------------------------------------------------------------------------------------|
| GP(0) | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。                                                                                                          |
| #NM   | CR0 の TS がセットされた場合。                                                                                                                          |
| #XM   | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 1 の場合。                                                                                         |
| #UD   | マスクされていない SIMD 浮動小数点例外が発生し、CR4 の OSXMMEXCPT が 0 の場合。<br><br>CR0 の EM がセットされた場合。<br><br>CR4 の OSFXSR が 0 の場合。<br><br>CPUID 機能フラグ SSE が 0 の場合。 |

## UCOMISS—Unordered Compare Scalar Single-Precision Floating-Point Values and Set EFLAGS（続き）

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフェルトが発生した場合。

#AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照を行った場合。

## UD2—Undefined Instruction

| オペコード | 命令  | 説明               |
|-------|-----|------------------|
| 0F 0B | UD2 | 無効オペコード例外を発生させる。 |

### 説明

無効オペコードを生成する。この命令は、無効オペコードを明示的に生成してソフトウェアをテストするために提供されている。この命令のオペコードは、この目的のために予約されている。

無効オペコード例外を発生させる以外は、この命令はNOP命令と同じである。

### 操作

#UD (\* Generates invalid opcode exception \*);

### 影響を受けるフラグ

なし。

### 例外（すべての操作モード）

#UD 命令は、すべての動作モードで無効オペコード例外を発生させることが保証されている。

## UNPCKHPD—Unpack and Interleave High Packed Double-Precision Floating-Point Values

| オペコード       | 命令                                         | 説明                                                                   |
|-------------|--------------------------------------------|----------------------------------------------------------------------|
| 66 0F 15 /r | UNPCKHPD <i>xmm1</i> ,<br><i>xmm2/m128</i> | <i>xmm1</i> と <i>xmm2/m128</i> の上位クワッドワードの倍精度浮動小数点値をアンパックしてインタリーブする。 |

### 説明

ソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）の上位の倍精度浮動小数点値をアンパックしてインタリーブする。図4-14. を参照のこと。ソース・オペランドは、XMMレジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドはXMMレジスタである。



図 4-14. UNPCKHPD 命令の上位アンパックとインタリーブ操作

メモリ・オペランドからアンパックする場合、プロセッサによっては、適切な64ビットだけをフェッチすることがある。この場合も、16バイト・アライメントの条件と通常のセグメント・チェックが適用される。

### 操作

```
DEST[63-0] ← DEST[127-64];
DEST[127-64] ← SRC[127-64];
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
UNPCKHPD __m128d _mm_unpackhi_pd(__m128d a, __m128d b)
```

### SIMD 浮動小数点例外

なし。

## UNPCKHPD—Unpack and Interleave High Packed Double-Precision Floating-Point Values（続き）

### 保護モード例外

|              |                                                                           |
|--------------|---------------------------------------------------------------------------|
| #GP(0)       | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。                          |
|              | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                             |
| #SS(0)       | SS セグメント内のアドレスが無効の場合。                                                     |
| #PF（フォルトコード） | ページフォルトが発生した場合。                                                           |
| #NM          | CR0 の TS がセットされた場合。                                                       |
| #UD          | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。 |

### 実アドレスモード例外

|        |                                                                                      |
|--------|--------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                  |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。            |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF（フォルトコード） ページフォルトが発生した場合。

## UNPCKHPS—Unpack and Interleave High Packed Single-Precision Floating-Point Values

| オペコード    | 命令                                         | 説明                                                                                                   |
|----------|--------------------------------------------|------------------------------------------------------------------------------------------------------|
| 0F 15 /r | UNPCKHPS <i>xmm1</i> ,<br><i>xmm2/m128</i> | <i>xmm1</i> の上位クワッドワードの単精度浮動小数点値と <i>xmm2/mem</i> の上位半分の単精度浮動小数点値を <i>xmm1</i> レジスタにアンパックしてインタリーブする。 |

### 説明

ソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）の上位の単精度浮動小数点値をアンパックしてインタリーブする。図4-15. を参照のこと。ソース・オペランドは、XMMレジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドはXMMレジスタである。



図 4-15. UNPCKHPS 命令の上位アンパックとインタリーブ操作

プロセッサによっては、メモリ・オペランドからのアンパックの際に、適切な64ビットだけをフェッチすることがある。しかしこの場合も、16バイト・アライメントのチェックと通常のセグメント・チェックが行われる。

### 操作

```
DEST[31-0] ← DEST[95-64];
DEST[63-32] ← SRC[95-64];
DEST[95-64] ← DEST[127-96];
DEST[127-96] ← SRC[127-96];
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

UNPCKHPS     \_\_m128 \_mm\_unpackhi\_ps(\_\_m128 a, \_\_m128 b)

## UNPCKHPS—Unpack and Interleave High Packed Single-Precision Floating-Point Values（続き）

### SIMD 浮動小数点例外

なし。

### 保護モード例外

|               |                                                                                                    |
|---------------|----------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、または GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                                              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                    |
| #NM           | CR0 の TS がセットされた場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。                          |

### 実アドレスモード例外

|        |                                                                                      |
|--------|--------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                  |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。            |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## UNPCKLPD—Unpack and Interleave Low Packed Double-Precision Floating-Point Values

| オペコード       | 命令                                         | 説明                                                                   |
|-------------|--------------------------------------------|----------------------------------------------------------------------|
| 66 0F 14 /r | UNPCKLPD <i>xmm1</i> ,<br><i>xmm2/m128</i> | <i>xmm1</i> と <i>xmm2/m128</i> の下位クワッドワードの倍精度浮動小数点値をアンパックしてインタリーブする。 |

### 説明

ソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）の下位の倍精度浮動小数点値をアンパックしてインタリーブする。図4-16. を参照のこと。ソース・オペランドは、XMMレジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドはXMMレジスタである。



図 4-16. UNPCKLPD 命令の下位アンパックとインタリーブ操作

メモリ・オペランドからアンパックする場合、プロセッサによっては、適切な64ビットだけをフェッチすることがある。この場合も、16バイト・アライメントの条件と通常のセグメント・チェックが適用される。

### 操作

```
DEST[63-0] ← DEST[63-0];
DEST[127-64] ← SRC[63-0];
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

```
UNPCKHPD __m128d _mm_unpacklo_pd(__m128d a, __m128d b)
```

### SIMD 浮動小数点例外

なし。

## UNPCKLPD—Unpack and Interleave Low Packed Double-Precision Floating-Point Values（続き）

### 保護モード例外

|              |                                                                           |
|--------------|---------------------------------------------------------------------------|
| #GP(0)       | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。                          |
|              | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。                             |
| #SS(0)       | SS セグメント内のアドレスが無効の場合。                                                     |
| #PF（フォルトコード） | ページフォルトが発生した場合。                                                           |
| #NM          | CR0 の TS がセットされた場合。                                                       |
| #UD          | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。 |

### 実アドレスモード例外

|        |                                                                                      |
|--------|--------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                  |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。            |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF（フォルトコード） ページフォルトが発生した場合。

## UNPCKLPS—Unpack and Interleave Low Packed Single-Precision Floating-Point Values

| オペコード    | 命令                                         | 説明                                                                                                   |
|----------|--------------------------------------------|------------------------------------------------------------------------------------------------------|
| 0F 14 /r | UNPCKLPS <i>xmm1</i> ,<br><i>xmm2/m128</i> | <i>xmm1</i> の下位クワッドワードの単精度浮動小数点値と <i>xmm2/mem</i> の下位半分の単精度浮動小数点値を <i>xmm1</i> レジスタにアンパックしてインタリーブする。 |

### 説明

ソース・オペランド（第2オペランド）とデスティネーション・オペランド（第1オペランド）の下位の単精度浮動小数点値をアンパックしてインタリーブする。図4-17. を参照のこと。ソース・オペランドは、XMMレジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドはXMMレジスタである。



図 4-17. UNPCKLPS 命令の下位アンパックとインタリーブ操作

プロセッサによっては、メモリ・オペランドからのアンパックの際に、適切な64ビットだけをフェッチすることがある。しかしこの場合も、16バイト・アライメントのチェックと通常のセグメント・チェックが行われる。

### 操作

```
DEST[31-0] ← DEST[31-0];
DEST[63-32] ← SRC[31-0];
DEST[95-64] ← DEST[63-32];
DEST[127-96] ← SRC[63-32];
```

### 同等のインテル® C/C++ コンパイラ組み込み関数

UNPCKLPS      `_m128 _mm_unpacklo_ps(_m128 a, _m128 b)`

## UNPCKLPS—Unpack and Interleave Low Packed Single-Precision Floating-Point Values（続き）

### SIMD 浮動小数点例外

なし。

### 保護モード例外

|               |                                                                                                    |
|---------------|----------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、または GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                                              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                    |
| #NM           | CR0 の TS がセットされた場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。                          |

### 実アドレスモード例外

|        |                                                                                      |
|--------|--------------------------------------------------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。<br>オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。 |
| #NM    | CR0 の TS がセットされた場合。                                                                  |
| #UD    | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。            |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## VERR, VERW—Verify a Segment for Reading or Writing

| オペコード    | 命令                | 説明                                             |
|----------|-------------------|------------------------------------------------|
| 0F 00 /4 | VERR <i>r/m16</i> | <i>r/m16</i> で指定されたセグメントを読み取りできる場合 ZF=1 を設定する。 |
| 0F 00 /5 | VERW <i>r/m16</i> | <i>r/m16</i> で指定されたセグメントに書き込みできる場合 ZF=1 を設定する。 |

### 説明

ソース・オペランドで指定されたコード・セグメントまたはデータ・セグメントが現行特権レベル (CPL) から読み取り可能 (VERR) または書き込み可能 (VERW) であるかを検証する。ソース・オペランドは、検証するセグメントのセグメント・セレクタをもつ16ビットのレジスタまたはメモリ・ロケーションである。セグメントがアクセス可能で読み取り可能 (VERR) または書き込み可能 (VERW) である場合は、ZF フラグがセットされる。そうでない場合は、ZF フラグがクリアされる。コード・セグメントが書き込み可能であると検証されることはない。このチェックは、システム・セグメントに行うこととはできない。

ZF フラグをセットするには、以下の条件が満たされていなければならない。

- セグメント・セレクタがヌルでない。
- セレクタは、ディスクリプタ・テーブル (GDT または LDT) の範囲内のディスクリプタを指定していなければならない。
- セレクタは、(システム・セグメントまたはゲートのディスクリプタではなく) コード・セグメントまたはデータ・セグメントのディスクリプタを指定していなければならない。
- VERR 命令では、セグメントは読み取り可能でなければならない。
- VERW 命令では、セグメントは書き込み可能なデータ・セグメントでなければならない。
- セグメントがコンフォーミング・コード・セグメントでない場合は、セグメントのDPLは、CPL およびセグメント・セレクタのRPL の両方以上 (以下の特権をもつ) でなければならない。

この検証動作は、セグメント・セレクタが DS、ES、FS、または GS レジスタにロードされ、指定されたアクセス (読み取りまたは書き込み) が行われる場合と同じ動作である。セグメント・セレクタの値は保護例外を発生させることはなく、ソフトウェアは起り得るセグメント・アクセス問題を前もって処理することができる。

## VERR, VERW—Verify a Segment for Reading or Writing (続き)

### 操作

```

IF SRC[Offset] > (GDTR(Limit) OR (LDTR(Limit))
    THEN
        ZF ← 0
    Read segment descriptor;
    IF SegmentDescriptor(DescriptorType) = 0 (* system segment *)
        OR (SegmentDescriptor(Type) ≠ conforming code segment)
        AND (CPL > DPL) OR (RPL > DPL)
        THEN
            ZF ← 0
    ELSE
        IF ((Instruction = VERR) AND (segment = readable))
            OR ((Instruction = VERW) AND (segment = writable))
            THEN
                ZF ← 1;
        FI;
    FI;

```

### 影響を受けるフラグ

ZF フラグは、セグメントがアクセス可能で読み取り可能 (VERR) または書き込み可能 (VERW) である場合は 1 にセットされ、そうでない場合は 0 にクリアされる。

### 保護モード例外

これらの命令に対して生成される唯一の例外は、ソース・オペランドの不当なアドレス指定に関する例外である。

|               |                                                                  |
|---------------|------------------------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。               |
|               | DS、ES、FS、GS レジスタを使用してメモリがアクセスされ、レジスタの内容がヌル・セグメント・セレクタであった場合。     |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|     |                                       |
|-----|---------------------------------------|
| #UD | VERR 命令および VERW 命令は、実アドレスモードでは認識されない。 |
|-----|---------------------------------------|

### 仮想 8086 モード例外

|     |                                          |
|-----|------------------------------------------|
| #UD | VERR 命令および VERW 命令は、仮想 8086 モードでは認識されない。 |
|-----|------------------------------------------|

## WAIT/FWAIT—Wait

| オペコード | 命令    | 説明                           |
|-------|-------|------------------------------|
| 9B    | WAIT  | 未処理のマスクされていない浮動小数点例外をチェックする。 |
| 9B    | FWAIT | 未処理のマスクされていない浮動小数点例外をチェックする。 |

### 説明

プロセッサは、未処理のマスクされていない浮動小数点例外があるかチェックし、あれば処理してから先に進む。(FWAIT は、WAIT の代替ニーモニックである。)

この命令は、コードの重要な部分で例外を同期させるために有用である。浮動小数点命令の後に WAIT 命令を入れると、この命令が発生させる可能性があるマスクされていない浮動小数点例外があれば、プロセッサはそれらを処理してから命令の結果を修正できることが保証される。WAIT/FWAIT 命令の使用に関する詳細については、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、上巻』の第 8 章の「x87 FPU 例外の同期」の節を参照のこと。

### 操作

CheckForPendingUnmaskedFloatingPointExceptions;

### FPU 影響を受けるフラグ

C0、C1、C2、C3 フラグは未定義。

### 浮動小数点例外

なし。

### 保護モード例外

#NM CR0 の MP および TS がセットされた場合。

### 実アドレスモード例外

#NM CR0 の MP および TS がセットされた場合。

### 仮想 8086 モード例外

#NM CR0 の MP および TS がセットされた場合。

## WBINVD—Write Back and Invalidate Cache

| オペコード | 命令     | 説明                                                  |
|-------|--------|-----------------------------------------------------|
| 0F 09 | WBINVD | ライトバックして内部キャッシュをフラッシュする。外部キャッシュのライトバックとフラッシュを開始させる。 |

### 説明

プロセッサの内部キャッシュで修正されているすべてのキャッシュ・ラインをメインメモリにライトバックし、内部キャッシュを無効化（フラッシュ）する。命令は、その後、外部キャッシュにも、修正されているデータをライトバックするよう指示する特殊機能バスサイクルと、外部キャッシュを無効化するよう指示するもう1つのバスサイクルを発行する。

この命令を実行した後、プロセッサは、外部キャッシュのライトバック操作とフラッシュ操作の完了を待たずに、命令の実行を継続する。キャッシュ・ライトバック信号およびキャッシュ・フラッシュ信号に応答することは、ハードウェアによって行う。

WBINVD命令は特権命令である。プロセッサが保護モードで動作している場合は、この命令を実行するには、プログラムまたはプロシージャのCPLが0でなければならぬ。この命令はシリアル化命令でもある。詳細は『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、下巻』の第7章の「シリアル化命令」の節を参照。

メインメモリとのキャッシュ・コヒーレンシが重要でない場合は、ソフトウェアはINVD命令を使用することができる。

### IA-32 アーキテクチャにおける互換性

WBINVD命令はプロセッサに依存し、その機能は将来のIA-32プロセッサでは異なってサポートされる可能性もある。この命令は、Intel486™プロセッサより以前のIA-32プロセッサではサポートされていない。

### 操作

```
WriteBack(InternalCaches);
Flush(InternalCaches);
SignalWriteBack(ExternalCaches);
SignalFlush(ExternalCaches);
Continue (* Continue execution);
```

### 影響を受けるフラグ

なし。

## WBINVD—Write Back and Invalidate Cache（続き）

### 保護モード例外

#GP(0) 現行特権レベルが 0 でない場合。

### 実アドレスモード例外

なし。

### 仮想 8086 モード例外

#GP(0) WBINVD 命令は仮想 8086 モードで実行することはできない。

## WRMSR—Write to Model Specific Register

| オペコード | 命令    | 説明                                |
|-------|-------|-----------------------------------|
| OF 30 | WRMSR | EDX:EAX の値を ECX で指定される MSR に書き込む。 |

### 説明

レジスタ EDX:EAX の内容を ECX レジスタで指定された 64 ビットのモデル固有レジスタ (MSR) に書き込む。ECX レジスタにロードされる入力値は、書き込み先の MSR のアドレスである。選択された MSR の上位 32 ビットに EDX レジスタの内容がコピーされ、MSR の下位 32 ビットに EAX レジスタの内容がコピーされる。MSR の未定義ビットまたは予約ビットは、以前に読み取られている値に設定される。

この命令は、特権レベル 0 または実アドレスモードで実行しなければならない。そうしないと、一般保護例外 #GP(0) が生成される。予約されているかまたはインプリメントされていない MSR アドレスを ECX に指定しても、一般保護例外が生成される。また、予約されている MSR のビットに書き込もうとすると、一般保護例外が生成される。

WRMSR 命令を使用して MTRR に書き込むと、グローバル・エントリを含めて TLB が無効化される。詳細は『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、下巻』の第 3 章の「トランスレーション・ルックアサイド・バッファ (TLB)」の節を参照のこと。

MSR は、テスト機能、実行トレース、性能モニタリング、マシン・チェック・エラーの機能を制御する。『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、下巻』の付録 B 「モデル固有レジスタ (MSR)」では、この命令で読み込むことができるすべての MSR とそれらのアドレスを一覧している。各プロセッサ・ファミリは、独自に一連の MSR を持っていることに注意すること。

WRMSR 命令はシリアル化命令である。詳細は『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、下巻』の第 7 章の「シリアル化命令」の節を参照のこと。

この命令を使用する前に、CPUID 命令を使用して MSR がサポートされている (EDX[5]=1) かどうかを確認する必要がある。

### IA-32 アーキテクチャにおける互換性

MSR 命令および WRMSR 命令でそれらを読み取る機能は、インテル® Pentium® プロセッサで IA-32 アーキテクチャに導入された。インテル Pentium プロセッサより以前の IA-32 プロセッサでこの命令を実行すると、無効オペコード例外 #UD が生成される。

## WRMSR—Write to Model Specific Register（続き）

### 操作

MSR[ECX] ← EDX:EAX;

### 影響を受けるフラグ

なし。

### 保護モード例外

- #GP(0) 現行特権レベルが 0 でない場合。  
ECX の値が予約されているかまたはインプリメントされていない  
MSR アドレスを指定している場合。

### 実アドレスモード例外

- #GP ECX の値が予約されているかまたはインプリメントされていない  
MSR アドレスを指定している場合。

### 仮想 8086 モード例外

- #GP(0) WRMSR 命令は仮想 8086 モードでは認識されない。

## XADD—Exchange and Add

| オペコード   | 命令                     | 説明                                                      |
|---------|------------------------|---------------------------------------------------------|
| 0F C0/r | XADD <i>r/m8, r8</i>   | <i>r8</i> を <i>r/m8</i> と交換し、合計を <i>r/m8</i> にロードする。    |
| 0F C1/r | XADD <i>r/m16, r16</i> | <i>r16</i> を <i>r/m16</i> と交換し、合計を <i>r/m16</i> にロードする。 |
| 0F C1/r | XADD <i>r/m32, r32</i> | <i>r32</i> を <i>r/m32</i> と交換し、合計を <i>r/m32</i> にロードする。 |

### 説明

第1オペランド（デスティネーション・オペランド）を第2オペランド（ソース・オペランド）と交換し、次に2つの値の合計をデスティネーション・オペランドにロードする。デスティネーション・オペランドには、レジスタまたはメモリ・ロケーションを使用できる。ソース・オペランドは、レジスタである。

この命令をLOCKプリフィックスと共に使用すると、アトミックに命令を実行させることができる。

### IA-32 アーキテクチャにおける互換性

Intel486™ プロセッサより以前の IA-32 プロセッサは、この命令を認識しない。この命令を使用する場合は、以前のプロセッサ上で実行する同等のコード・シーケンスを備えなければならない。

### 操作

```
TEMP ← SRC + DEST
SRC ← DEST
DEST ← TEMP
```

### 影響を受けるフラグ

CF、PF、AF、SF、ZF、OF フラグが、デスティネーション・オペランドにストアされる加算の結果にしたがって設定される。

### 保護モード例外

- |               |                                                                                                                                  |
|---------------|----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | デスティネーションが書き込み不可能なセグメントにある場合。<br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                  |

## XADD—Exchange and Add (続き)

#AC(0) 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

### 実アドレスモード例外

#GP メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。

#SS メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

### 仮想 8086 モード例外

#GP(0) メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。

#SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

#PF (フォルトコード) ページフォルトが発生した場合。

#AC(0) アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。

## XCHG—Exchange Register/Memory with Register

| オペコード | 命令              | 説明                               |
|-------|-----------------|----------------------------------|
| 90+rw | XCHG AX, 16     | r16 を AX と交換する。                  |
| 90+rw | XCHG r16, X     | AX を r16 と交換する。                  |
| 90+rd | XCHG EAX, r32   | r32 を EAX と交換する。                 |
| 90+rd | XCHG r32, EAX   | EAX を r32 と交換する。                 |
| 86 /r | XCHG r/m8, r8   | r8 (バイトレジスタ) を r/m8 からのバイトと交換する。 |
| 86 /r | XCHG r8, r/m8   | r/m8 からのバイトを r8 (バイトレジスタ) と交換する。 |
| 87 /r | XCHG r/m16, r16 | r16 を r/m16 からのワードと交換する。         |
| 87 /r | XCHG r16, r/m16 | r/m16 からのワードを r16 と交換する。         |
| 87 /r | XCHG r/m32, r32 | r32 を r/m32 からのダブルワードと交換する。      |
| 87 /r | XCHG r32, r/m32 | r/m32 からのダブルワードを r32 と交換する。      |

### 説明

デスティネーション・オペランド (第1オペランド) の内容をソース・オペランド (第2オペランド) の内容と交換する。オペランドには、2個の汎用レジスタまたは1つのレジスタと1つのメモリ・ロケーションを使用できる。メモリ・オペランドが参照されていると、LOCKプリフィックスの有無、あるいはIOPLの値に関係なく、プロセッサのロックング・プロトコルが交換操作が持続している間自動的にインプリメントされる。(ロックング・プロトコルに関する詳細については、本章の「LOCKプリフィックスの説明」を参照のこと。)

この命令は、プロセスを同期するためのセマフォまたは同様のデータ構造体のインプリメンテーションに有用である。(バス・ロックングの詳細については、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、下巻』の第7章の「バスのロック」の項を参照のこと。)

XCHG 命令は、16 ビット・オペランドではBSWAP 命令の代わりに使用することもできる。

### 操作

```
TEMP ← DEST
DEST ← SRC
SRC ← TEMP
```

### 影響を受けるフラグ

なし。

## XCHG—Exchange Register/Memory with Register (続き)

### 保護モード例外

|               |                                                                                                                                   |
|---------------|-----------------------------------------------------------------------------------------------------------------------------------|
| #GP(0)        | いずれかのオペランドが書き込み不可能なセグメントにある場合。<br>メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。<br>DS、ES、FS、または GS レジスタの内容がマル・セグメント・セレクタの場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                                                                                                |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                                                   |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。                                                                  |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

### 仮想 8086 モード例外

|               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## XLAT/XLATB—Table Look-up Translation

| オペコード | 命令             | 説明                                    |
|-------|----------------|---------------------------------------|
| D7    | XLAT <i>m8</i> | AL をメモリバイト DS:[(E)BX+ 符号なし AL] に設定する。 |
| D7    | XLATB          | AL をメモリバイト DS:[(E)BX+ 符号なし AL] に設定する。 |

### 説明

AL レジスタの内容をテーブル・インデックスとして使用して、メモリ内のテーブルのバイトエントリの位置を探し、テーブルエントリの内容を AL レジスタにコピーし直す。AL レジスタのインデックスは、符号なし整数として取り扱われる。XLAT 命令および XLATB 命令は、メモリ内のテーブルのベースアドレスを（命令のアドレスサイズ属性、32 または 16 に応じて）それぞれ DS:EBX レジスタまたは DS:BX レジスタから得る。（DS セグメントは、セグメント・オーバライド・プリフィックスを使用してオーバライドすることができる。）

アセンブリ・コード・レベルでは、この命令の「明示オペランド」形式と「オペランドなし」形式という 2 つの形式が使用できる。（XLAT ニーモニックで指定される）明示オペランド形式では、テーブルのベースアドレスを記号で明示的に指定することができる。この明示オペランド形式は、ドキュメンテーションを可能にするために設けられたものであるが、この形式によって提供されるドキュメンテーションは誤解を招く場合があるので注意する。すなわち、記号は、正しいベースアドレスを指定する必要はない。ベースアドレスは、常に DS:(E)BX レジスタによって指定されるので、XLAT 命令を実行する前に、これらのレジスタに正しくロードされていなければならない。

オペランドなし形式 (XLATB) は、XLAT 命令の「ショート形式」を提供する。この場合も、プロセッサは DS:(E)BX レジスタがテーブルのベースアドレスをもっていると想定する。

### 操作

```
IF AddressSize = 16
    THEN
        AL ← (DS:BX + ZeroExtend(AL))
    ELSE (* AddressSize = 32 *)
        AL ← (DS:EBX + ZeroExtend(AL));
FI;
```

### 影響を受けるフラグ

なし。

## XLAT/XLATB—Table Look-up Translation（続き）

### 保護モード例外

- #GP(0) メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。  
DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフォルトが発生した場合。

### 実アドレスモード例外

- #GP メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。

### 仮想 8086 モード例外

- #GP(0) メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。
- #SS(0) メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。
- #PF (フォルトコード) ページフォルトが発生した場合。

## XOR—Logical Exclusive OR

| オペコード           | 命令                              | 説明                                            |
|-----------------|---------------------------------|-----------------------------------------------|
| 34 <i>ib</i>    | XOR AL, <i>imm8</i>             | AL と <i>imm8</i> との XOR をとる。                  |
| 35 <i>iw</i>    | XOR AX, <i>imm16</i>            | AX と <i>imm16</i> との XOR をとる。                 |
| 35 <i>id</i>    | XOR EAX, <i>imm32</i>           | EAX と <i>imm32</i> との XOR をとる。                |
| 80 /6 <i>ib</i> | XOR <i>r/m8</i> , <i>imm8</i>   | <i>r/m8</i> と <i>imm8</i> との XOR をとる。         |
| 81 /6 <i>iw</i> | XOR <i>r/m16</i> , <i>imm16</i> | <i>r/m16</i> と <i>imm16</i> との XOR をとる。       |
| 81 /6 <i>id</i> | XOR <i>r/m32</i> , <i>imm32</i> | <i>r/m32</i> と <i>imm32</i> との XOR をとる。       |
| 83 /6 <i>ib</i> | XOR <i>r/m16</i> , <i>imm8</i>  | <i>r/m16</i> と <i>imm8</i> (符号拡張) との XOR をとる。 |
| 83 /6 <i>id</i> | XOR <i>r/m32</i> , <i>imm8</i>  | <i>r/m32</i> と <i>imm8</i> (符号拡張) との XOR をとる。 |
| 30 / <i>r</i>   | XOR <i>r/m8</i> , <i>r8</i>     | <i>r/m8</i> と <i>r8</i> との XOR をとる。           |
| 31 / <i>r</i>   | XOR <i>r/m16</i> , <i>r16</i>   | <i>r/m16</i> と <i>r16</i> との XOR をとる。         |
| 31 / <i>r</i>   | XOR <i>r/m32</i> , <i>r32</i>   | <i>r/m32</i> と <i>r32</i> との XOR をとる。         |
| 32 / <i>r</i>   | XOR <i>r8</i> , <i>r/m8</i>     | <i>r8</i> と <i>r/m8</i> との XOR をとる。           |
| 33 / <i>r</i>   | XOR <i>r16</i> , <i>r/m16</i>   | <i>r16</i> と <i>r/m16</i> との XOR をとる。         |
| 33 / <i>r</i>   | XOR <i>r32</i> , <i>r/m32</i>   | <i>r32</i> と <i>r/m32</i> との XOR をとる。         |

### 説明

デステイネーション・オペランド（第1オペランド）とソース・オペランド（第2オペランド）との間のビット単位の XOR（排他的論理和）演算を実行し、結果をデステイネーション・オペランド・ロケーションにストアする。ソース・オペランドには、即値、レジスタ、またはメモリ・ロケーションを使用できる。デステイネーション・オペランドには、レジスタまたはメモリ・ロケーションを使用できる。（ただし、1つの命令で2つのメモリ・オペランドを使用することはできない。）各ビットの結果は、オペランドの対応するビットが異なる場合は1になり、対応するビットが同じ場合は0になる。

この命令をLOCKプリフィックスと共に使用すると、アトミックに命令を実行させることができる。

### 操作

DEST ← DEST XOR SRC;

### 影響を受けるフラグ

OF および CF フラグがクリアされる。SF、ZF、PF フラグが結果にしたがって設定される。AF フラグの状態は未定義。

## XOR—Logical Exclusive OR (続き)

### 保護モード例外

|               |                                                                  |
|---------------|------------------------------------------------------------------|
| #GP(0)        | デステイネーション・オペランドの指示先が書き込み不可能なセグメントの場合。                            |
|               | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。               |
|               | DS、ES、FS、または GS レジスタの内容がヌル・セグメント・セレクタの場合。                        |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                               |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                  |
| #AC(0)        | 現行特権レベルが 3 のときに、アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。 |

### 実アドレスモード例外

|     |                                                    |
|-----|----------------------------------------------------|
| #GP | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |

### 仮想 8086 モード例外

|               |                                                    |
|---------------|----------------------------------------------------|
| #GP(0)        | メモリ・オペランドの実効アドレスが CS、DS、ES、FS、または GS セグメントの範囲外の場合。 |
| #SS(0)        | メモリ・オペランドの実効アドレスが SS セグメントの範囲外の場合。                 |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                    |
| #AC(0)        | アライメント・チェックがイネーブルにされていて、アライメントが合わないメモリ参照が行われた場合。   |

## XORPD—Bitwise Logical XOR for Double-Precision Floating-Point Values

| オペコード       | 命令                           | 説明                                                         |
|-------------|------------------------------|------------------------------------------------------------|
| 66 0F 57 /r | XORPD <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のビット単位の XOR（排他的論理和）演算を実行する。 |

### 説明

ソース・オペランド（第2オペランド）の2つのパックド倍精度浮動小数点値とデスティネーション・オペランド（第1オペランド）の2つのパックド倍精度浮動小数点値の間でビット単位の XOR（排他的論理和）演算を実行し、結果をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは 128 ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスターである。

### 操作

DEST[127-0] ← DEST[127-0] BitwiseXOR SRC[127-0];

### 同等のインテル® C/C++ コンパイラ組み込み関数

XORPD        \_\_m128d \_mm\_xor\_pd(\_\_m128d a, \_\_m128d b)

### SIMD 浮動小数点例外

なし。

### 保護モード例外

|               |                                                                                                    |
|---------------|----------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、または GS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                                              |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                    |
| #NM           | CR0 の TS がセットされた場合。                                                                                |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE2 が 0 の場合。                          |

## XORPD—Bitwise Logical XOR for Double-Precision Floating-Point Values（続き）

### 実アドレスモード例外

|        |                                               |
|--------|-----------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
|        | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。           |
| #NM    | CR0 の TS がセットされた場合。                           |
| #UD    | CR0 の EM がセットされた場合。                           |
|        | CR4 の OSFXSR が 0 の場合。                         |
|        | CPUID 機能フラグ SSE2 が 0 の場合。                     |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。

## XORPS—Bitwise Logical XOR for Single-Precision Floating-Point Values

| オペコード    | 命令                           | 説明                                                           |
|----------|------------------------------|--------------------------------------------------------------|
| 0F 57 /r | XORPS <i>xmm1, xmm2/m128</i> | <i>xmm2/m128</i> と <i>xmm1</i> のビット単位の XOR (排他的論理和) 演算を実行する。 |

### 説明

ソース・オペランド（第2オペランド）の4つのパックド単精度浮動小数点値とデスティネーション・オペランド（第1オペランド）の4つのパックド単精度浮動小数点値の間でビット単位の XOR (排他的論理和) 演算を実行し、結果をデスティネーション・オペランドに格納する。ソース・オペランドは、XMM レジスタまたは128ビットのメモリ・ロケーションである。デスティネーション・オペランドは XMM レジスターである。

### 操作

DEST[127-0] ← DEST[127-0] BitwiseXOR SRC[127-0];

### 同等のインテル® C/C++ コンパイラ組み込み関数

XORPS        \_\_m128 \_mm\_xor\_ps(\_\_m128 a, \_\_m128 b)

### SIMD 浮動小数点例外

なし

### 保護モード例外

|               |                                                                                                   |
|---------------|---------------------------------------------------------------------------------------------------|
| #GP(0)        | CS、DS、ES、FS、またはGS セグメント内のメモリ・オペランドの実効アドレスが無効の場合。<br>セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
| #SS(0)        | SS セグメント内のアドレスが無効の場合。                                                                             |
| #PF (フォルトコード) | ページフォルトが発生した場合。                                                                                   |
| #NM           | CR0 の TS がセットされた場合。                                                                               |
| #UD           | CR0 の EM がセットされた場合。<br>CR4 の OSFXSR が 0 の場合。<br>CPUID 機能フラグ SSE が 0 の場合。                          |

## XORPS—Bitwise Logical XOR for Single-Precision Floating-Point Values（続き）

### 実アドレスモード例外

|        |                                               |
|--------|-----------------------------------------------|
| #GP(0) | セグメントに関係なく、メモリ・オペランドのアライメントが 16 バイトに合っていない場合。 |
|        | オペランドの一部が 0～FFFFH の実効アドレス空間の範囲外の場合。           |
| #NM    | CR0 の TS がセットされた場合。                           |
| #UD    | CR0 の EM がセットされた場合。                           |
|        | CR4 の OSFXSR が 0 の場合。                         |
|        | CPUID 機能フラグ SSE が 0 の場合。                      |

### 仮想 8086 モード例外

実アドレスモードと同じ例外。

#PF (フォルトコード) ページフォルトが発生した場合。



# A



オペコード・マップ



# 付録 A オペコード・マップ

A

本付録にあるオペコード・テーブルは、IA-32 オブジェクト・コードを解釈する際に便利である。命令は3つのエンコーディング・グループに分かれている。そのグループとは、1バイト・オペコードのエンコーディング、2バイト・オペコードのエンコーディング、およびエスケープ（浮動小数点）エンコーディングである。

1バイトと2バイトのオペコードのエンコーディングは、整数、システム、MMX®テクノロジ、SSE、SSE2、SSE3 のエンコーディングに使用される。これらの命令のオペコード・マップを表 A-2. ~ A-3. に示す。A.3.1. 項「1バイト・オペコード命令」～A.3.4. 項「1バイトと2バイトのオペコードのオペコード拡張」項では、1バイトと2バイトのオペコード・マップを解釈するための命令を示している。

エスケープ・エンコーディングは、浮動小数点命令をコード化するために使用される。表 A-5. ~ A-20. に、これらの命令のオペコード・マップを示す。A.3.5. 項「エスケープ・オペコード命令」では、エスケープ・オペコード・マップを解釈するための命令を示している。

## A.1. オペコード・テーブルの使用に関する注意

本付録の表では、基本オペコード（命令プリフィックスを含む）と ModR/M バイトについて定義する。表中の空白の項目は、予約済みまたは未定義のオペコードを示す。

基本オペコードの上位4ビットを、オペコードの表の行に対するインデックスとして使用する。オペコードの下位4ビットを、表の列に対するインデックスとして使用する。基本オペコードの最初のバイトが0FHであるか、または66H、F2H、F3H のいずれかの後に0 FHがある場合は、2バイトのオペコードの表を参照し、オペコードの第2バイトをその表の行と列に対するインデックスとして使用する。

ModR/M バイトにオペコード拡張が含まれる場合は、その命令は表 A-2、表 A-3 の命令グループである。ModR/M バイト内のオペコード拡張については、表 A-4 で説明する。

浮動小数点命令用のエスケープ（ESC）オペコードの表では、各ページの一番上にオペコードの上位8ビットを示す。オペコードに付随する ModR/M バイトが00H～BFH の範囲内である場合は、各ページの3番目の表の一番上の行に示す ModR/M バイトのビット3～5とREGビットによってオペコードが決まる。ModR/M バイトが00H～BFH の範囲外である場合のオペコード・マップは、各ページの最後の2つの表に示す。

ModR/M バイト、レジスタ値、アドレス指定形式の詳細については、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、中巻 A』の第2章を参照のこと。

## A.2. 略語の説明

オペランドは、形式 Zz の 2 文字のコードによって識別される。最初の文字 (Z) は、アドレス指定方式を指定する。2番目の文字 (z) は、オペランドのタイプを指定する。

### A.2.1. アドレス指定方式のコード

以下の略号は、アドレス指定方式に使用される。

- A 直接アドレス。命令は、ModR/M バイトをもたない。オペランドのアドレスは、命令内にコード化されている。ベースレジスタ、インデックス・レジスタ、またはスケーリング・ファクタを適用することはできない。例えば、far JMP (EA)。
- C ModR/M バイトの reg フィールドで制御レジスタを選択する（例、MOV (0F20, 0F22)）。
- D ModR/M バイトの reg フィールドでデバッグレジスタを選択する。例えば、MOV (0F21,0F23)。
- E ModR/M バイトがオペコードの後に続き、オペランドを指定する。オペランドは、汎用レジスタまたはメモリアドレスである。オペランドがメモリアドレスである場合は、アドレスは、セグメント・レジスタと、ベースレジスタ、インデックス・レジスタ、スケーリング・ファクタ、ディスプレースメントの任意の組み合わせから計算される。
- F EFLAGS レジスタ。
- G ModR/M バイトの reg フィールドで汎用レジスタを選択する（例、AX(000)）。
- I 即値データ。オペランド値は命令の後続バイト内にコード化される。
- J 命令は、命令ポインタレジスタに付加する相対オフセットをもつ（例、JMP(0E9)、LOOP）。
- M ModR/M バイトは、メモリだけを参照することができる : mod!=11B (BOUND、LEA、LES、LDS、LSS、LFS、LGS、CMPXCHG8B、LDDQU)。
- O 命令は、ModR/M バイトをもたない。オペランドのオフセットが命令内に（アドレスサイズ属性に応じて）ワードまたはダブルワードとして入れられる。ベースレジスタ、インデックス・レジスタ、またはスケーリング・ファクタを適用することはできない（例、MOV (A0-A3)）。
- P ModR/M バイトの reg フィールドでパックド・クワッドワード MMX テクノロジ・レジスタを選択する。

- Q ModR/M バイトがオペコードの後に続き、オペランドを指定する。オペランドは、MMX テクノロジ・レジスタまたはメモリアドレスである。オペランドがメモリアドレスである場合は、アドレスは、セグメント・レジスタと、ベースレジスタ、インデックス・レジスタ、スケーリング・ファクタ、ディスプレースメントの任意の組み合わせから計算される。
- R ModR/M バイトの mod フィールドは、汎用レジスタだけを参照することがある（例、MOV (0F20-0F24, 0F26)）。
- S ModR/M バイトの reg フィールドでセグメント・レジスタを選択する（例、MOV (8C, 8E)）。
- T ModR/M バイトの reg フィールドでテストレジスタを選択する（例、MOV (0F24, 0F26)）。
- V ModR/M バイトの reg フィールドで 128 ビット XMM レジスタを選択する。
- W ModR/M バイトがオペコードの後に続き、オペランドを指定する。オペランドは 128 ビット XMM レジスタまたはメモリアドレスである。オペランドがメモリアドレスの場合、アドレスは、セグメント・レジスタと、ベースレジスタ、インデックス・レジスタ、スケーリング・レジスタ、ディスプレースメントの任意の組み合わせから計算される。
- X DS:SI レジスタペアによってアドレス指定されるメモリ（例、MOVS、CMPS、OUTS、または LODS）。
- Y ES:DI レジスタペアによってアドレス指定されるメモリ（例、MOVS、CMPS、INS、STOS、または SCAS）。

## A.2.2. オペランド・タイプのコード

以下の略号は、オペランド・タイプに使用される。

- a メモリ内の 2 つの 1 ワード・オペランドまたはメモリ内の 2 つのダブルワード・オペランド。オペランド・サイズ属性に依存する（BOUND 命令だけに使用される）。
- b バイト。オペランド・サイズ属性に関係ない。
- c バイトまたはワード。オペランド・サイズ属性に依存する。
- d ダブルワード。オペランド・サイズ属性に関係ない。
- dq ダブル・クワッドワード。オペランド・サイズ属性に関係ない。
- p 32 ビットまたは 48 ビットのポインタ。オペランド・サイズ属性に依存する。
- pi クワッドワードの MMX テクノロジ・レジスタ（例えば、mm0）。
- pd 128 ビット・パックド倍精度浮動小数点データ。
- ps 128 ビットのパックド単精度浮動小数点データ。
- q クワッドワード。オペランド・サイズ属性に関係ない。
- s 6 バイトの疑似ディスクリプタ。

|    |                                |
|----|--------------------------------|
| sd | 128 ビット・パックド倍精度浮動小数点データのスカラ要素。 |
| ss | 128 ビットのパックド単精度浮動小数点データのスカラ要素。 |
| si | ダブルワードの整数レジスタ（例えば、eax）。        |
| v  | ワードまたはダブルワード。オペランド・サイズ属性に依存する。 |
| w  | ワード。オペランド・サイズ属性に関係ない。          |

### A.2.3. レジスタコード

オペランドがオペコード内にコード化された特定のレジスタであるときは、レジスタはその名前（例えば、AX、CL、ESI）によって識別される。レジスタの名前は、そのレジスタの幅が32ビット、16ビット、または8ビットのいずれであるかを示す。レジスタの幅がオペランド・サイズ属性に依存する場合は、形式eXXのレジスタ識別子が使用される。例えば、eAXは、オペランド・サイズ属性が16であるときはAXレジスタが使用され、オペランド・サイズ属性が32であるときはEAXレジスタが使用されることを示す。

## A.3. オペコードの見つけ方の例

ここでは、オペコードマップの使い方の例をいくつか示す。

### A.3.1. 1バイト・オペコード命令

表 A-2. に、1バイト・オペコードのオペコード・マップを示す。1バイト・オペコード・マップでは、命令ニーモニックおよびそのオペランドは、16進の1バイト・オペコードの値から決定できる。1バイト・オペコードのオペコード・マップは、行（16進値の最下位4ビット）と列（16進値の最上位4ビット）で構成される。表中の各項目は、次のいずれかのタイプのオペコードを示す。

- 命令ニーモニックと、付録 A.2.2. に示した表記を使用するオペランド・タイプ
- 命令プリフィックスとして使用されるオペコード

1つの命令に対応するオペコード・マップの各項目について、基本オペコードの後に続く次のバイトの解釈規則は、次のいずれかの条件に該当する。

- ModR/M バイトが必要である。ModR/M バイトは、付録 A.2. に示した省略形にしたがって解釈される。『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、中巻 A』の第2章を参照のこと。オペランド・タイプは、付録 A.2.2. に示した表記にしたがって示される。
- ModR/M バイトが必要である。ModR/M バイト内の reg フィールドにオペコード拡張が含まれる。ModR/M バイトの解釈には、表 A-4 を使用する。

- ModR/M バイトの使用は予約済みまたは未定義である。この条件は、命令プリフィックスを表す項目や、ModR/M に関連するオペランドを持たない命令を表す項目（例えば、60H, PUSH A や 06H, PUSH ES）に適用される。

例えば、以下のオペコード・シーケンスを見付ける場合を考える。

オペコード : 030500000000H

| LSB アドレス |    |    |    |    | MSB アドレス |
|----------|----|----|----|----|----------|
| 03       | 05 | 00 | 00 | 00 | 00       |

ADD 命令のオペコード 030500000000H は、1 バイト・オペコード・マップから次のように解釈することができる。すなわち、オペコードの 1 ケタ目 (0) はオペコード・マップ・テーブルの行を示し、2 ケタ目 (3) は列を示す。第 1 オペランド（タイプ Gv）は、オペランド・サイズ属性に応じてワードまたはダブルワードである汎用レジスタを示している。第 2 オペランド（タイプ Ev）は、オペランドがワードまたはダブルワードの汎用レジスタあるいはメモリアドレスのいずれであるかを指定する ModR/M バイトが後に続くことを示している。この命令の ModR/M バイトは 05H であり、これは、32 ビットのディスペリースメント (00000000H) が後に続くことを示している。ModR/M バイトの reg/ オペコード部分（ビット 3～5）は、EAX レジスタを示す 000 である。したがって、このオペコードの命令は、ADD EAX,mem\_op であり、mem\_op のオフセットは 00000000H であると決定することができる。

1 バイトと 2 バイトのオペコードは、「グループ」番号を指す場合もある。これらのグループ番号は、命令が ModR/M バイトの reg/ オペコード・ビットをオペコード拡張として使用することを示している（A.3.4. 項「1 バイトと 2 バイトのオペコードのオペコード拡張」を参照）。

### A.3.2. 2 バイト・オペコード命令

表 A-3 の 2 バイト・オペコード・マップには、長さ 2 バイトまたは 3 バイトの基本オペコードが含まれている。長さ 2 バイトの基本オペコードは、エスケープ・オペコード 0FH から始まる。第 2 バイトの上位 4 ビットと下位 4 ビットは、表 A-3 の特定の行と列へのインデックスとして使用される。長さ 3 バイトの 2 バイト・オペコードは、必須のプリフィックス (66H, F2H、または F3H) から始まり、エスケープ・オペコードが後に続く。第 3 バイトの上位 4 ビットと下位 4 ビットは、表 A-3 の特定の行と列へのインデックスとして使用される。2 バイトのエスケープ・シーケンスは、必須のプリフィックス (66H, F2H、または F3H) と、その後に続くエスケープ・プリフィックス・バイト 0FH で構成される。

オペコード・マップの各項目について、基本オペコードの後に続く次のバイトの解釈規則は、次のいずれかの条件に該当する。

- ModR/M バイトが必要である。ModR/M バイトは、付録 A.2. に示した省略形にしたがって解釈される。ModR/M バイト、レジスタ値、および各種のアドレス指定形式については、『IA-32 インテル® アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル、中巻 A』の第 2 章を参照のこと。オペランド・タイプは、付録 A.2.2. に示した表記にしたがって示される。
- ModR/M バイトが必要である。ModR/M バイト内の reg フィールドにオペコード拡張が含まれる。ModR/M バイトの解釈には、表 A-4 を使用する。
- ModR/M バイトの使用は予約済みまたは未定義である。この条件は、ModR/M を使用してエンコードされるオペランドを持たない命令を表す項目（例えば、0F77H, EMMS）に適用される。

例えば、オペコード 0FA405000000003H は、2 バイトのオペコード・マップの行 A、列 4 にある。このオペコードは、オペランド Ev、Gv、および Ib の SHLD 命令を指している。これらのオペランドは、次のように解釈される。

- Ev ワードまたはダブルワードのオペランドを指定する ModR/M バイトがオペコードの後に続く。
- Cv ModR/M バイトの reg フィールドが汎用レジスタを選択する。
- Ib 即値データが命令の後続バイト内にコード化されている。

第 3 バイトは、ModR/M バイト (05H) である。mod およびオペコード/reg フィールドは、32 ビットのディスプレースメントが後に続くことおよび EAX レジスタがソースであることを示している。

オペコードの次の部分は、デスティネーション・メモリ・オペランドの 32 ビット・ディスプレースメント (00000000H) である。最後の部分は、シフトのカウントを表す即値バイト (03H) である。

このような分析により、このオペコードが次の命令を表すことが示される。

**SHLD DS:00000000H, EAX, 3**

SHLD オペコードの次の部分は、デスティネーション・メモリ・オペランドの 32 ビット・ディスプレースメント (00000000H) であり、この後に、シフトのカウントを表す即値バイト (03H) が続く。このブレークダウンによって、オペコード OFA405000000003H が命令 SHLD DS: 00000000H, EAX, 3 を表すことが示されている。

**SHLD DS:00000000H, EAX, 3.**

以下の表では、MMX® テクノロジ、SSE、および SSE2 によって追加されたニーモニックを小文字で強調する。

### A.3.3. オペコード・マップの注意事項

表 A-1. は、オペコード・マップ表の特定のエンコーディングについての注意事項を示している。以下のオペコード・マップ（表 A-2. と A-3.）では、これらの注意を上付き文字で示す。

1 バイト・オペコード・マップ（表 A-2.）については、グレー表示で命令グループを示す。

表 A-1. オペコード・マップ表の命令エンコーディングについての注意事項

| 記号 | 注意                                                                                                                                                                                                                                                                      |
|----|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1A | ModR/M バイトのビット 5、4、3 をオペコード拡張として使用（A.3.4. 項「1 バイトと 2 バイトのオペコードのオペコード拡張」を参照のこと）。                                                                                                                                                                                         |
| 1B | 故意に無効オペコード例外 (#UD) を発生させる場合は、0F0B オペコード（UD2 命令）または 0FB9H オペコードを使用する。                                                                                                                                                                                                    |
| 1C | インテル® Pentium® III プロセッサに追加された命令の中には、同じ 2 バイト・オペコードを使用するものがある。命令にバリエーションがある場合、またはオペコードが別々の命令を表す場合は、その命令を区別するために ModR/M バイトが使用される。命令を完全にデコードするために必要な ModR/M バイトの値については、表 A-4. を参照のこと（このような命令としては、PREFETCH およびそのバリエーションだけではなく、SFENCE、STMXCSR、LDMXCSR、FXRSTOR、FXSAVE がある）。 |
| 1D | このオペコード表現で表される命令は、基本オペコードの後に続く ModR/M バイトを持たない。                                                                                                                                                                                                                         |
| 1E | ModR/M バイトの r/m フィールドの有効なエンコーディングは、カッコ内に示される。                                                                                                                                                                                                                           |
| 1F | このオペコード表現で表される命令は、ソース・オペランドとデスティネーション・オペランドの両方がレジスタである場合をサポートしない。                                                                                                                                                                                                       |
| 1G | ソース・オペランドがレジスタの場合、そのオペランドは XMM レジスタでなければならない。                                                                                                                                                                                                                           |
| 1H | このオペコード表現で表される命令は、オペランドがメモリ上の位置である場合をサポートしない。                                                                                                                                                                                                                           |
| 1J | このオペコード表現で表される命令は、レジスタ・オペランドをサポートしない。                                                                                                                                                                                                                                   |
| 1K | ModR/M バイトの reg オペコード・フィールドの有効なエンコーディングは、カッコ内に示される。                                                                                                                                                                                                                     |

表 A-2. 1 バイトのオペコード・マップ<sup>1,2</sup>

|   | 0                                     | 1                                   | 2                                                   | 3                                                        | 4                                      | 5                                                | 6                                      | 7                                       |
|---|---------------------------------------|-------------------------------------|-----------------------------------------------------|----------------------------------------------------------|----------------------------------------|--------------------------------------------------|----------------------------------------|-----------------------------------------|
| 0 |                                       |                                     |                                                     | ADD                                                      |                                        |                                                  | PUSH<br>ES <sup>ID</sup>               | POP<br>ES <sup>ID</sup>                 |
|   | Eb, Gb                                | Ev, Gv                              | Gb, Eb                                              | Gv, Ev                                                   | AL, Ib <sup>ID</sup>                   | eAX, Iv <sup>ID</sup>                            |                                        |                                         |
| 1 |                                       |                                     |                                                     | ADC                                                      |                                        |                                                  | PUSH<br>SS <sup>ID</sup>               | POP<br>SS <sup>ID</sup>                 |
|   | Eb, Gb                                | Ev, Gv                              | Gb, Eb                                              | Gv, Ev                                                   | AL, Ib <sup>ID</sup>                   | eAX, Iv <sup>ID</sup>                            |                                        |                                         |
| 2 |                                       |                                     |                                                     | AND                                                      |                                        |                                                  | SEG=ES<br>Prefix                       | DAA <sup>ID</sup>                       |
|   | Eb, Gb                                | Ev, Gv                              | Gb, Eb                                              | Gv, Ev                                                   | AL, Ib <sup>ID</sup>                   | eAX, Iv <sup>ID</sup>                            |                                        |                                         |
| 3 |                                       |                                     |                                                     | XOR                                                      |                                        |                                                  | SEG=SS<br>Prefix                       | AAA <sup>ID</sup>                       |
|   | Eb, Gb                                | Ev, Gv                              | Gb, Eb                                              | Gv, Ev                                                   | AL, Ib <sup>ID</sup>                   | eAX, Iv <sup>ID</sup>                            |                                        |                                         |
| 4 |                                       |                                     |                                                     | INC general register                                     |                                        |                                                  |                                        |                                         |
|   | eAX <sup>ID</sup>                     | eCX <sup>ID</sup>                   | eDX <sup>ID</sup>                                   | eBX <sup>ID</sup>                                        | eSP <sup>ID</sup>                      | eBP <sup>ID</sup>                                | eSI <sup>ID</sup>                      | eDI <sup>ID</sup>                       |
| 5 |                                       |                                     |                                                     | PUSH general register <sup>ID</sup>                      |                                        |                                                  |                                        |                                         |
|   | eAX                                   | eCX                                 | eDX                                                 | eBX                                                      | eSP                                    | eBP                                              | eSI                                    | eDI                                     |
| 6 | PUSHA/<br>PUSHAD <sup>ID</sup>        | POPA/<br>POPAD <sup>ID</sup>        | BOUND<br>Gv, Ma                                     | ARPL<br>Ew, Gw                                           | SEG=FS<br>Prefix                       | SEG=GS<br>Prefix                                 | Opd<br>Size<br>Prefix                  | Addr<br>Size<br>Prefix                  |
| 7 |                                       |                                     |                                                     | Jcc, Jb - Short-displacement jump on condition           |                                        |                                                  |                                        |                                         |
|   | O <sup>ID</sup>                       | NO <sup>ID</sup>                    | B/NAE/C <sup>ID</sup>                               | NB/AE/NC <sup>ID</sup>                                   | Z/E <sup>ID</sup>                      | NZ/NE <sup>ID</sup>                              | BE/NA <sup>ID</sup>                    | NBE/A <sup>ID</sup>                     |
| 8 |                                       |                                     |                                                     | Immediate Grp 1 <sup>1A</sup>                            |                                        | TEST                                             |                                        | XCHG                                    |
|   | Eb, Ib                                | Ev, Iv                              | Eb, Ib                                              | Ev, Ib                                                   | Eb, Gb                                 | Ev, Gv                                           | Eb, Gb                                 | Ev, Gv                                  |
| 9 | NOP <sup>ID</sup>                     |                                     |                                                     | XCHG word or double-word register with eAX <sup>ID</sup> |                                        |                                                  |                                        |                                         |
|   |                                       | eCX                                 | eDX                                                 | eBX                                                      | eSP                                    | eBP                                              | eSI                                    | eDI                                     |
| A |                                       |                                     | MOV <sup>ID</sup>                                   |                                                          | MOVS/<br>MOVSB<br>Yb, Xb <sup>ID</sup> | MOVS/<br>MOVSW/<br>MOVSD<br>Yv, Xv <sup>ID</sup> | CMPS/<br>CMPSB<br>Yb, Xb <sup>ID</sup> | CMPSW/<br>CMPSD<br>Xv, Yv <sup>ID</sup> |
|   | AL, Ob                                | eAX, Ov                             | Ob, AL                                              | Ov, eAX                                                  |                                        |                                                  |                                        |                                         |
| B |                                       |                                     | MOV immediate byte into byte register <sup>ID</sup> |                                                          |                                        |                                                  |                                        |                                         |
|   | AL                                    | CL                                  | DL                                                  | BL                                                       | AH                                     | CH                                               | DH                                     | BH                                      |
| C |                                       | Shift Grp 2 <sup>1A</sup>           |                                                     | RET<br>Iw <sup>ID</sup>                                  | RET <sup>ID</sup>                      | LES<br>Gv, Mp                                    | LDS<br>Gv, Mp                          | Grp 1 <sup>1A</sup> - MOV<br>Eb, Ib     |
|   | Eb, Ib                                | Ev, Ib                              |                                                     |                                                          |                                        |                                                  |                                        | Ev, Iv                                  |
| D |                                       | Shift Grp 2 <sup>1A</sup>           |                                                     |                                                          | AAM<br>Ib <sup>ID</sup>                | AAD<br>Ib <sup>ID</sup>                          |                                        | XLAT/<br>XLATB <sup>ID</sup>            |
|   | Eb, 1                                 | Ev, 1                               | Eb, CL                                              | Ev, CL                                                   |                                        |                                                  |                                        |                                         |
| E | LOOPNE/<br>LOOPNZ<br>Jb <sup>ID</sup> | LOOPE/<br>LOOPZ<br>Jb <sup>ID</sup> | LOOP<br>Jb <sup>ID</sup>                            | JCXZ/<br>JECXZ<br>Jb <sup>ID</sup>                       | IN<br>AL, Ib <sup>ID</sup>             | eAX, Ib <sup>ID</sup>                            | OUT<br>Ib, AL <sup>ID</sup>            | Ib, eAX <sup>ID</sup>                   |
| F | LOCK<br>Prefix                        |                                     | REPNE<br>Prefix                                     | REP/<br>REPE<br>Prefix                                   | HLT <sup>ID</sup>                      | CMC <sup>ID</sup>                                | Unary Grp 3 <sup>1A</sup><br>Eb        | Ev                                      |

## 注：

1. オペコード・マップ表 A-2. にあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードまたは予約されているオペコードの動作に依存してはならない。
2. この表では、行番号がオペコードの最初の 16 進数文字に対応し、列番号が 2 番目の 16 進数文字に対応する。例えば、[ POP ES ] のオペコードは 07H になる。

表 A-2. 1 バイトのオペコード・マップ (続き)

|   | 8                          | 9                      | A                                                                       | B                                             | C                                        | D                                    | E                                        | F                                       |
|---|----------------------------|------------------------|-------------------------------------------------------------------------|-----------------------------------------------|------------------------------------------|--------------------------------------|------------------------------------------|-----------------------------------------|
| 0 |                            |                        |                                                                         | OR                                            |                                          |                                      | PUSH CS <sup>ID</sup>                    | Escape opcode to 2-byte                 |
|   | Eb, Gb                     | Ev, Gv                 | Gb, Eb                                                                  | Gv, Ev                                        | AL, Ib <sup>ID</sup>                     | eAX, Iv <sup>ID</sup>                |                                          |                                         |
| 1 |                            |                        |                                                                         | SBB                                           |                                          |                                      | PUSH DS <sup>ID</sup>                    | POP DS <sup>ID</sup>                    |
|   | Eb, Gb                     | Ev, Gv                 | Gb, Eb                                                                  | Gv, Ev                                        | AL, Ib <sup>ID</sup>                     | eAX, Iv <sup>ID</sup>                |                                          |                                         |
| 2 |                            |                        |                                                                         | SUB                                           |                                          |                                      | SEG=CS Prefix                            | DAS <sup>ID</sup>                       |
|   | Eb, Gb                     | Ev, Gv                 | Gb, Eb                                                                  | Gv, Ev                                        | AL, Ib <sup>ID</sup>                     | eAX, Iv <sup>ID</sup>                |                                          |                                         |
| 3 |                            |                        |                                                                         | CMP                                           |                                          |                                      | SEG=DS Prefix                            | AAS <sup>ID</sup>                       |
|   | Eb, Gb                     | Ev, Gv                 | Gb, Eb                                                                  | Gv, Ev                                        | AL, Ib <sup>ID</sup>                     | eAX, Iv <sup>ID</sup>                |                                          |                                         |
| 4 |                            |                        |                                                                         | DEC general register                          |                                          |                                      |                                          | eDI <sup>ID</sup>                       |
|   | eAX <sup>ID</sup>          | eCX <sup>ID</sup>      | eDX <sup>ID</sup>                                                       | eBX <sup>ID</sup>                             | eSP <sup>ID</sup>                        | eBP <sup>ID</sup>                    | eSI <sup>ID</sup>                        |                                         |
| 5 |                            |                        |                                                                         | POP into general register <sup>ID</sup>       |                                          |                                      |                                          | eDI                                     |
|   | eAX                        | eCX                    | eDX                                                                     | eBX                                           | eSP                                      | eBP                                  | eSI                                      |                                         |
| 6 | PUSH Iv <sup>ID</sup>      | IMUL Gv, Ev, Iv        | PUSH Ib <sup>ID</sup>                                                   | IMUL Gv, Ev, Ib                               | INS/ INSB Yb, DX <sup>ID</sup>           | INS/ INSW/ INSD Yv, DX <sup>ID</sup> | OUTS/ OUTSB DX, Xb <sup>ID</sup>         | OUTS/ OUTSW/ OUTSD DX, Xv <sup>ID</sup> |
|   |                            |                        |                                                                         |                                               |                                          |                                      |                                          |                                         |
| 7 |                            |                        |                                                                         | Jcc, Jb- Short displacement jump on condition |                                          |                                      |                                          | NLE/G <sup>ID</sup>                     |
|   | S <sup>ID</sup>            | NSID                   | P/PE <sup>ID</sup>                                                      | NP/PO <sup>ID</sup>                           | L/NGE <sup>ID</sup>                      | NL/GE <sup>ID</sup>                  | LE/NG <sup>ID</sup>                      |                                         |
| 8 |                            |                        | MOV                                                                     |                                               | MOV Ew, Sw                               | LEA Gv, M                            | MOV Sw, Ew                               | POP Ev                                  |
|   | Eb, Gb                     | Ev, Gv                 | Gb, Eb                                                                  | Gv, Ev                                        |                                          |                                      |                                          |                                         |
| 9 | CBW/ CWDE <sup>ID</sup>    | CWD/ CDQ <sup>ID</sup> | CALLF Ap <sup>ID</sup>                                                  | FWAIT/ WAIT <sup>ID</sup>                     | PUSHF/ PUSHFD Fv <sup>ID</sup>           | POPF/ POPFD Fv <sup>ID</sup>         | SAHF <sup>ID</sup>                       | LAHF <sup>ID</sup>                      |
|   |                            |                        |                                                                         |                                               |                                          |                                      |                                          |                                         |
| A |                            | TEST <sup>ID</sup>     |                                                                         | STOS/ STOSB Yb, AL <sup>ID</sup>              | STOS/ STOSW/ STOSD Yv, eAX <sup>ID</sup> | LODS/ LODSB AL, Xb <sup>ID</sup>     | LODS/ LODSW/ LODSD eAX, Xv <sup>ID</sup> | SCAS/ SCASB AL, Yb <sup>ID</sup>        |
|   | AL, Ib                     | eAX, Iv                |                                                                         |                                               |                                          |                                      |                                          |                                         |
| B |                            |                        | MOV immediate word or double into word or double register <sup>ID</sup> |                                               |                                          |                                      |                                          | eDI                                     |
|   | eAX                        | eCX                    | eDX                                                                     | eBX                                           | eSP                                      | eBP                                  | eSI                                      |                                         |
| C | ENTER Iw, Ib <sup>ID</sup> | LEAVE <sup>ID</sup>    | RETF                                                                    | RETF <sup>ID</sup>                            | INT 3 <sup>ID</sup>                      | INT Ib <sup>ID</sup>                 | INTO <sup>ID</sup>                       | IRET <sup>ID</sup>                      |
|   |                            |                        |                                                                         |                                               |                                          |                                      |                                          |                                         |
| D |                            |                        |                                                                         |                                               |                                          |                                      |                                          |                                         |
|   |                            |                        |                                                                         |                                               |                                          |                                      |                                          |                                         |
| E | CALL Jv <sup>ID</sup>      | near Jv <sup>ID</sup>  | JMP far Ap <sup>ID</sup>                                                | short Jb <sup>ID</sup>                        | IN AL, DX <sup>ID</sup>                  | OUT eAX, DX <sup>ID</sup>            | DX, AL <sup>ID</sup>                     | DX, eAX <sup>ID</sup>                   |
|   |                            |                        |                                                                         |                                               |                                          |                                      |                                          |                                         |
| F | CLC <sup>ID</sup>          | STC <sup>ID</sup>      | CLI <sup>ID</sup>                                                       | STI <sup>ID</sup>                             | CLD <sup>ID</sup>                        | STD <sup>ID</sup>                    | INC/DEC Grp 4 <sup>1A</sup>              | INC/DEC Grp 5 <sup>1A</sup>             |
|   |                            |                        |                                                                         |                                               |                                          |                                      |                                          |                                         |

表 A-3. 2 バイトのオペコード・マップ（第 1 バイトは 0FH）1,2

|   | 0                                                                                                                  | 1                                                                                                  | 2                                                                                                                                                                     | 3                                                                                             | 4                                                    | 5                                                    | 6                                                                                                                            | 7                                                                       |
|---|--------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------|------------------------------------------------------|------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------|-------------------------------------------------------------------------|
| 0 | Grp 6 <sup>1A</sup>                                                                                                | Grp 7 <sup>1A</sup>                                                                                | LAR<br>Gv, Ew                                                                                                                                                         | LSL<br>Gv, Ew                                                                                 |                                                      |                                                      | CLTS <sup>1D</sup>                                                                                                           |                                                                         |
| 1 | MOVUPS<br>Vps, Wps<br>MOVSS (F3)<br>Vss, Wss<br>MOVUPD (66)<br>Vpd, Wpd<br>MOVSD (F2)<br>Vsd, Wsd                  | MOVUPS<br>Wps, Vps<br>MOVSS (F3)<br>Wss, Vss<br>MOVUPD (66)<br>Wpd, Vpd<br>MOVSD (F2)<br>Wsd, Vsd  | MOVLP\$<br>Vq, Mq <sup>1F</sup><br>MOVLPD (66)<br>Vq, Mq <sup>1F</sup><br>MOVHLPS<br>Vps, Vps<br>MOVDDUP (P2)<br>Vq, Wq <sup>1G</sup><br>MOVSLDUP<br>(F3)<br>Vps, Wps | MOVLP\$<br>Mq, Vq <sup>1F</sup><br>MOVLPD (66)<br>Mq, Vq <sup>1F</sup><br>MOVHLPS<br>Vpd, Wpd | UNPCKLPS<br>Vps, Wps<br>UNPCKLPD<br>(66)<br>Vpd, Wpd | UNPCKHPS<br>Vps, Wps<br>UNPCKHPD<br>(66)<br>Vpd, Wpd | MOVHPS<br>Vq, Mq <sup>1F</sup><br>MOVHPD (66)<br>Vq, Mq <sup>1F</sup><br>MOVLHPS<br>Vps, Vps<br>MOVSHDUP<br>(F3)<br>Vps, Wps | MOVHPS<br>Mq, Vps <sup>1F</sup><br>MOVHPD (66)<br>Mq, Vpd <sup>1F</sup> |
| 2 | MOV<br>Rd, Cd <sup>1H</sup>                                                                                        | MOV<br>Rd, Dd <sup>1H</sup>                                                                        | MOV<br>Cd, Rd <sup>1H</sup>                                                                                                                                           | MOV<br>Dd, Rd <sup>1H</sup>                                                                   | MOV<br>Rd, Td <sup>3</sup>                           |                                                      | MOV<br>Td, Rd <sup>3</sup>                                                                                                   |                                                                         |
| 3 | WRMSR <sup>1D</sup>                                                                                                | RDTSC <sup>1D</sup>                                                                                | RDMSR <sup>1D</sup>                                                                                                                                                   | RDPMC <sup>1D</sup>                                                                           | SYSENTER <sup>1D</sup>                               | SYSEXIT <sup>1D</sup>                                |                                                                                                                              |                                                                         |
| 4 | O                                                                                                                  | NO                                                                                                 | B/C/NAE                                                                                                                                                               | AE/NB/NC                                                                                      | E/Z                                                  | NE/NZ                                                | BE/NA                                                                                                                        | A/NBE                                                                   |
| 5 | MOVMSKPS<br>Gd, Vps <sup>1H</sup><br>MOVMSKPD<br>(66)<br>Gd, Vpd <sup>1H</sup>                                     | SQRTPS<br>Vps, Wps<br>SQRTSS (F3)<br>Vss, Wss<br>SQRTPD (66)<br>Vpd, Wpd<br>SQRTS (F2)<br>Vsd, Wsd | RSQRTPS<br>Vps, Wps<br>RSQRTSS (F3)<br>Vss, Wss                                                                                                                       | RCPPS<br>Vps, Wps<br>RCPPS (F3)<br>Vss, Wss                                                   | ANDPS<br>Vps, Wps<br>ANDPD (66)<br>Vpd, Wpd          | ANDNPS<br>Vps, Wps<br>ANDNPD (66)<br>Vpd, Wpd        | ORPS<br>Vps, Wps<br>ORPD (66)<br>Vpd, Wpd                                                                                    | XORPS<br>Vps, Wps<br>XORPD (66)<br>Vpd, Wpd                             |
| 6 | PUNPCKLBW<br>Pq, Qd<br>PUNPCKLBW<br>(66)<br>Vdq, Wdq                                                               | PUNPCKLWD<br>Pq, Qd<br>PUNPCKLWD<br>(66)<br>Vdq, Wdq                                               | PUNPCKLDQ<br>Pq, Qd<br>PUNPCKLDQ<br>(66)<br>Vdq, Wdq                                                                                                                  | PACKSSWB<br>Pq, Qq<br>PACKSSWB<br>(66)<br>Vdq, Wdq                                            | PCMPGTB<br>Pq, Qq<br>PCMPGTB (66)<br>Vdq, Wdq        | PCMPGTW<br>Pq, Qq<br>PCMPGTW (66)<br>Vdq, Wdq        | PCMPGTD<br>Pq, Qq<br>PCMPGTD (66)<br>Vdq, Wdq                                                                                | PACKUSWB<br>Pq, Qq<br>PACKUSWB<br>(66)<br>Vdq, Wdq                      |
| 7 | PSHUFW<br>Pq, Qq, Ib<br>PSHUFD (66)<br>Vdq, Wdq, Ib<br>PSHUFW (F3)<br>Vdq, Wdq, Ib<br>PSHUFLW (F2)<br>Vdq, Wdq, Ib | (Grp 12 <sup>1A</sup> )                                                                            | (Grp 13 <sup>1A</sup> )                                                                                                                                               | (Grp 14 <sup>1A</sup> )                                                                       | PCMPEQB<br>Pq, Qq<br>PCMPEQB (66)<br>Vdq, Wdq        | PCMPEQW<br>Pq, Qq<br>PCMPEQW (66)<br>Vdq, Wdq        | PCMPEQD<br>Pq, Qq<br>PCMPEQD (66)<br>Vdq, Wdq                                                                                | EMMS <sup>1D</sup>                                                      |

## 注：

- オペコード・マップ表 A-3. にあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードまたは予約されているオペコードの動作に依存してはならない。
- この表では、オペコードの第 1 バイトには 0FH を使用する。第 2 バイトについては、行番号が最初の 16 進数文字に対応し、列番号が 2 番目の 16 進数文字に対応する。例えば、[ LSL GV, EW ] のオペコードは 0F03H になる。
- インテル® Pentium® Pro プロセッサおよびインテル® Pentium® II プロセッサ・ファミリ以降、現在ではサポートしていない。現在の世代のプロセッサ上でこのオペコードを使用すると、#UD が発生する。将来のプロセッサでは、この値は予約されている。

表 A-3. 2 バイトのオペコード・マップ (先頭バイトは 0FH) (続き)

|   | 8                                                                                                | 9                                                                                               | A                                                                                                          | B                                                                                 | C                                                                                                             | D                                                                                                      | E                                                                                               | F                                                                                               |
|---|--------------------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------------------|
| 0 | INVD <sup>ID</sup>                                                                               | WBINVD <sup>ID</sup>                                                                            |                                                                                                            | UD2                                                                               |                                                                                                               |                                                                                                        |                                                                                                 |                                                                                                 |
| 1 | PREFETCH <sup>IC</sup><br>(Grp 16 <sup>1A</sup> )                                                |                                                                                                 |                                                                                                            |                                                                                   |                                                                                                               |                                                                                                        |                                                                                                 |                                                                                                 |
| 2 | MOVAPS<br>Vps, Wps<br>MOVAPD (66)<br>Vpd, Wpd                                                    | MOVAPS<br>Wps, Vps<br>MOVAPD (66)<br>Wpd, Vpd                                                   | CVTP12PS<br>Vps, Qq<br>CVTSI2SS (F3)<br>Vss, Ed<br>CVTP12PD (66)<br>Vpd, Qq<br>CVTSI2SD (F2)<br>Vsd, Ed    | MOVNTPS<br>Mps, Vps <sup>1F</sup><br>MOVNTPD (66)<br>Mpd, Vpd <sup>1F</sup>       | CVTPS2PI<br>Pq, Wq<br>CVTTSS2SI (F3)<br>Gd, Wss<br>CVTPD2PI<br>(66)<br>Pq, Wpd<br>CVTSD2SI<br>(F2)<br>Gd, Wsd | CVTPS2PI<br>Pq, Wq<br>CVTSS2SI (F3)<br>Gd, Wss<br>CVTPD2PI (66)<br>Pq, Wpd<br>CVTSD2SI (F2)<br>Gd, Wsd | UCOMISS<br>Vss, Wss<br>UCOMISD (66)<br>Vsd, Wsd                                                 | COMISS<br>Vps, Wps<br>COMISD (66)<br>Vsd, Wsd                                                   |
| 3 |                                                                                                  |                                                                                                 |                                                                                                            |                                                                                   |                                                                                                               |                                                                                                        |                                                                                                 |                                                                                                 |
| 4 | CMOVcc(Gv, Ev) - Conditional Move                                                                |                                                                                                 |                                                                                                            |                                                                                   |                                                                                                               |                                                                                                        |                                                                                                 |                                                                                                 |
|   | S                                                                                                | NS                                                                                              | P/PE                                                                                                       | NP/PO                                                                             | L/NGE                                                                                                         | NL/GE                                                                                                  | LE/NG                                                                                           | NLE/G                                                                                           |
| 5 | ADDP S<br>Vps, Wps<br>ADDSS (F3)<br>Vss, Wss<br>ADDPD (66)<br>Vpd, Wpd<br>ADDSD (F2)<br>Vsd, Wsd | MULPS<br>Vps, Wps<br>MULSS (F3)<br>Vss, Wss<br>MULPD (66)<br>Vpd, Wpd<br>MULSD (F2)<br>Vsd, Wsd | CVTPS2PD<br>Vpd, Wq<br>CVTSS2SD (F3)<br>Vsd, Wss<br>CVTPD2PS (66)<br>Vps, Wpd<br>CVTSD2SS (F2)<br>Vss, Wsd | CVTDQ2PS<br>Vps, Wdq<br>CVTPS2DQ (66)<br>Vdq, Wps<br>CVTPS2DQ<br>(F3)<br>Vdq, Wps | SUBPS<br>Vps, Wps<br>SUBSS (F3)<br>Vss, Wss<br>SUBPD (66)<br>Vpd, Wpd<br>SUBSD (F2)<br>Vsd, Wsd               | MINPS<br>Vps, Wps<br>MINSS (F3)<br>Vss, Wss<br>MINPD (66)<br>Vpd, Wpd<br>MINSD (F2)<br>Vsd, Wsd        | DIVPS<br>Vps, Wps<br>DIVSS (F3)<br>Vss, Wss<br>DIVPD (66)<br>Vpd, Wpd<br>DIVSD (F2)<br>Vsd, Wsd | MAXPS<br>Vps, Wps<br>MAXSS (F3)<br>Vss, Wss<br>MAXPD (66)<br>Vpd, Wpd<br>MAXSD (F2)<br>Vsd, Wsd |
| 6 | PUNPCKHBW<br>Pq, Qq<br>PUNPCKHBW<br>(66)<br>Vdq, Qdq                                             | PUNPCKHWD<br>Pq, Qq<br>PUNPCKHWD<br>(66)<br>Vdq, Qdq                                            | PUNPCKHDQ<br>Pq, Qq<br>PUNPCKHDQ<br>(66)<br>Vdq, Qdq                                                       | PACKSSDW<br>Pq, Qq<br>PACKSSDW<br>(66)<br>Vdq, Qdq                                | PUNPCKLQDQ<br>(66)<br>Vdq, Wdq                                                                                | PUNPCKHQDQ<br>(66)<br>Vdq, Wdq                                                                         | MOVD<br>Pd, Ed<br>MOVD (66)<br>Vd, Ed                                                           | MOVQ<br>Pq, Qq<br>MOVDQA (66)<br>Vdq, Wdq<br>MOVQDU (F3)<br>Vdq, Wdq                            |
| 7 | MMX UD (Reserved for future use)                                                                 |                                                                                                 |                                                                                                            |                                                                                   | HADDPD (66)<br>Vpd, Wpd<br>HADDP S (F2)<br>Vps, Wps                                                           | HSUBPD (66)<br>Vpd, Wpd<br>HSUBPS (F2)<br>Vps, Wps                                                     | MOVD<br>Ed, Pd<br>MOVD (66)<br>Ed, Vd<br>MOVQ (F3)<br>Vq, Wq                                    | MOVQ<br>Qq, Pq<br>MOVDQA (66)<br>Wdq, Vdq<br>MOVQDU (F3)<br>Wdq, Vdq                            |

表 A-3. 2 バイトのオペコード・マップ（先頭バイトは 0FH）（続き）

|   | 0                                                            | 1                                         | 2                                                                                                                | 3                                         | 4                                                 | 5                                                                             | 6                                                                                                   | 7                                                                                  |
|---|--------------------------------------------------------------|-------------------------------------------|------------------------------------------------------------------------------------------------------------------|-------------------------------------------|---------------------------------------------------|-------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------|
| 8 | O <sup>ID</sup>                                              | NO <sup>ID</sup>                          | B/C/NAE <sup>ID</sup>                                                                                            | AE/NB/NC <sup>ID</sup>                    | E/Z <sup>ID</sup>                                 | NE/NZ <sup>ID</sup>                                                           | BE/NA <sup>ID</sup>                                                                                 | A/NBE <sup>ID</sup>                                                                |
| 9 | O                                                            | NO                                        | B/C/NAE                                                                                                          | AE/NB/NC                                  | E/Z                                               | NE/NZ                                                                         | BE/NA                                                                                               | A/NBE                                                                              |
| A | PUSH FS <sup>ID</sup>                                        | POP FS <sup>ID</sup>                      | CPUID <sup>ID</sup>                                                                                              | BT Ev, Gv                                 | SHLD Ev, Gv, lb                                   | SHLD Ev, Gv, CL                                                               |                                                                                                     |                                                                                    |
| B | CMPXCHG<br>Eb, Gb                                            | Ev, Gv                                    | LSS Mp                                                                                                           | BTR Ev, Gv                                | LFS Mp                                            | LGS Mp                                                                        | MOVZX<br>Gv, Eb                                                                                     | Gv, Ew                                                                             |
| C | XADD<br>Eb, Gb                                               | XADD<br>Ev, Gv                            | CMPPPS<br>Vps, Wps, Ib<br>CMPSS (F3)<br>Vss, Wss, Ib<br>CMPPD (66)<br>Vpd, Wpd, Ib<br>CMPSD (F2)<br>Vsd, Wsd, Ib | MOVNTI<br>Md, Gd <sup>HF</sup>            | PINSRW<br>Pw, Ew, Ib<br>PINSRW (66)<br>Vw, Ew, Ib | PEXTRW<br>Gw, Pw, Ib <sup>1H</sup><br>PEXTRW (66)<br>Gw, Vw, Ib <sup>1H</sup> | SHUFPS<br>Vps, Wps, Ib<br>SHUFPD (66)<br>Vpd, Wpd, Ib                                               | Grp 9 <sup>IA</sup>                                                                |
| D | ADDSUBPD<br>(66)<br>Vpd, Wpd<br>ADDSUBPS<br>(F2)<br>Vps, Wps | PSRLW<br>Pq, Qq<br>PSRLW (66)<br>Vdq, Wdq | PSRLD<br>Pq, Qq<br>PSRLD (66)<br>Vdq, Wdq                                                                        | PSRLQ<br>Pq, Qq<br>PSRLQ (66)<br>Vdq, Wdq | PADDQ<br>Pq, Qq<br>PADDQ (66)<br>Vdq, Wdq         | PMULLW<br>Pq, Qq<br>PMULLW (66)<br>Vdq, Wdq                                   | MOVQ (66)<br>Wq, Vq<br>MOVQ2DQ (F3)<br>Vdq, Qq <sup>1H</sup><br>MOVQ2Q (F2)<br>Pq, Vq <sup>1H</sup> | PMOVMSKB<br>Gd, Pq <sup>1H</sup><br>PMOVMSKB<br>(66)<br>Gd, Vdq <sup>1H</sup>      |
| E | PAVGB<br>Pq, Qq<br>PAVGB (66)<br>Vdq, Wdq                    | PSRAW<br>Pq, Qq<br>PSRAW (66)<br>Vdq, Wdq | PSRAD<br>Pq, Qq<br>PSRAD (66)<br>Vdq, Wdq                                                                        | PAVGW<br>Pq, Qq<br>PAVGW (66)<br>Vdq, Wdq | PMULHUW<br>Pq, Qq<br>PMULHUW (66)<br>Vdq, Wdq     | PMULHW<br>Pq, Qq<br>PMULHW (66)<br>Vdq, Wdq                                   | CVTPD2DQ<br>(F2)<br>Vdq, Wpd<br>CVTPD2DQ<br>(66)<br>Vdq, Wpd<br>CVTDQ2PD<br>(F3)<br>Vpd, Wq         | MOVNTQ<br>Mq, Vq <sup>1F</sup><br>MOVNTDQ (66)<br>Mdq, Vdq <sup>1F</sup>           |
| F | LDDQU (F2)<br>Vdq, Mdq                                       | PSLLW<br>Pq, Qq<br>PSLLW (66)<br>Vdq, Wdq | PSLLD<br>Pq, Qq<br>PSLLD (66)<br>Vdq, Wdq                                                                        | PSLLQ<br>Pq, Qq<br>PSLLQ (66)<br>Vdq, Wdq | PMULUDQ<br>Pq, Qq<br>PMULUDQ (66)<br>Vdq, Wdq     | PMADDWD<br>Pq, Qq<br>PMADDWD (66)<br>Vdq, Wdq                                 | PSADBW<br>Pq, Qq<br>PSADBW (66)<br>Vdq, Wdq                                                         | MASKMOVQ<br>Pq, Pq <sup>1H</sup><br>MASKMOV-<br>DQU (66)<br>Vdq, Vdq <sup>1H</sup> |

表 A-3. 2 バイトのオペコード・マップ (先頭バイトは 0FH) (続き)

|   | 8                                             | 9                                                    | A                                           | B                                             | C                                                     | D                                             | E                                           | F                                         |
|---|-----------------------------------------------|------------------------------------------------------|---------------------------------------------|-----------------------------------------------|-------------------------------------------------------|-----------------------------------------------|---------------------------------------------|-------------------------------------------|
| 8 | S <sup>1D</sup>                               | NS <sup>1D</sup>                                     | P/PE <sup>1D</sup>                          | NP/PO <sup>1D</sup>                           | L/NGE <sup>1D</sup>                                   | NL/GE <sup>1D</sup>                           | LE/NG <sup>1D</sup>                         | NLE/G <sup>1D</sup>                       |
| 9 |                                               |                                                      |                                             | Jcc, Jv - Long-displacement jump on condition | SETcc, Eb - Byte Set on condition (000) <sup>1K</sup> |                                               |                                             |                                           |
| A | PUSH GS <sup>1D</sup>                         | POP GS <sup>1D</sup>                                 | RSM <sup>1D</sup>                           | BTS Ev, Gv                                    | SHRD Ev, Gv, Ib                                       | SHRD Ev, Gv, CL                               | (Grp 15 <sup>1A</sup> ) <sup>1C</sup>       | IMUL Gv, Ev                               |
| B |                                               | Grp 10 <sup>1A</sup><br>Invalid Opcode <sup>1B</sup> | Grp 8 <sup>1A</sup><br>Ev, Ib               | BTC Ev, Gv                                    | BSF Gv, Ev                                            | BSR Gv, Ev                                    | MOVSX Gv, Eb                                | Gv, Ew                                    |
| C | EAX                                           | ECX                                                  | EDX                                         | EBX                                           | ESP                                                   | EBP                                           | ESI                                         | EDI                                       |
| D | PSUBUSB<br>Pq, Qq<br>PSUBUSB (66)<br>Vdq, Wdq | PSUBUSW<br>Pq, Qq<br>PSUBUSW (66)<br>Vdq, Wdq        | PMINUB<br>Pq, Qq<br>PMINUB (66)<br>Vdq, Wdq | PAND<br>Pq, Qq<br>PAND (66)<br>Vdq, Wdq       | PADDUSB<br>Pq, Qq<br>PADDUSB (66)<br>Vdq, Wdq         | PADDUSW<br>Pq, Qq<br>PADDUSW (66)<br>Vdq, Wdq | PMAXUB<br>Pq, Qq<br>PMAXUB (66)<br>Vdq, Wdq | PANDN<br>Pq, Qq<br>PANDN (66)<br>Vdq, Wdq |
| E | PSUBSB<br>Pq, Qq<br>PSUBSB (66)<br>Vdq, Wdq   | PSUBSW<br>Pq, Qq<br>PSUBSW (66)<br>Vdq, Wdq          | PMINSW<br>Pq, Qq<br>PMINSW (66)<br>Vdq, Wdq | POR<br>Pq, Qq<br>POR (66)<br>Vdq, Wdq         | PADDSB<br>Pq, Qq<br>PADDSB (66)<br>Vdq, Wdq           | PADDSW<br>Pq, Qq<br>PADDSW (66)<br>Vdq, Wdq   | PMAXSW<br>Pq, Qq<br>PMAXSW (66)<br>Vdq, Wdq | PXOR<br>Pq, Qq<br>PXOR (66)<br>Vdq, Wdq   |
| F | PSUBB<br>Pq, Qq<br>PSUBB (66)<br>Vdq, Wdq     | PSUBW<br>Pq, Qq<br>PSUBW (66)<br>Vdq, Wdq            | PSUBD<br>Pq, Qq<br>PSUBD (66)<br>Vdq, Wdq   | PSUBQ<br>Pq, Qq<br>PSUBQ (66)<br>Vdq, Wdq     | PADDB<br>Pq, Qq<br>PADDB (66)<br>Vdq, Wdq             | PADDW<br>Pq, Qq<br>PADDW (66)<br>Vdq, Wdq     | PADDD<br>Pq, Qq<br>PADDD (66)<br>Vdq, Wdq   |                                           |

### A.3.4. 1 バイトと 2 バイトのオペコードのオペコード拡張

1 バイトと 2 バイトのオペコードの一部は、ModR/M バイトのビット 5、4、3（図 A-1 の nnn フィールド）をオペコードの拡張として使用する。ModR/M バイトのビット 5、4、3 の値は、第 3 章で説明したオペコード表記の “/digit” の部分にも対応する。オペコード拡張をもつオペコードは、表 A-4. でグループ番号（グループ 1、グループ 2 など）で示している。2 列目の（1 から 16 までの範囲）グループ番号は、オペコード拡張フィールドのエンコーディングがある表 A-4. へのエントリポイントを提供する。各命令の ModR/M バイトの r/m フィールドの有効なエンコーディングは、3 番目の列から推測できる。

例えば、80H の 1 バイト・オペコードをもつ ADD 命令は、グループ 1 の命令である。表 A-4 は、この命令の ModR/M バイト内にエンコードされていなければならないオペコード拡張フィールドが 000B であることを示している。この命令の r/m フィールドは、レジスタにアクセスするようにエンコードすることも（11B）、アドレス指定モードを使用してメモリアドレスにアクセスするようにエンコードすることもできる（例えば、mem = 00B、01B、10B）。

| mod | nnn | R/M |
|-----|-----|-----|
|-----|-----|-----|

図 A-1. ModR/M バイトの nnn フィールド（ビット 5、4、3）

表 A-4. グループ番号による 1 バイトと 2 バイトのオペコードのオペコード拡張<sup>1</sup>

| オペコード                                              | グループ | Mod 7,6  | ModR/M バイトのビット 5、4、3 のエンコーディング |                                     |             |                           |               |                          |               |                |  |  |  |
|----------------------------------------------------|------|----------|--------------------------------|-------------------------------------|-------------|---------------------------|---------------|--------------------------|---------------|----------------|--|--|--|
|                                                    |      |          | 000                            | 001                                 | 010         | 011                       | 100           | 101                      | 110           | 111            |  |  |  |
| 80-83                                              | 1    | mem, 11B | ADD                            | OR                                  | ADC         | SBB                       | AND           | SUB                      | XOR           | CMP            |  |  |  |
| C0, C1 reg, imm<br>D0, D1 reg, 1<br>D2, D3 reg, CL | 2    | mem, 11B | ROL                            | ROR                                 | RCL         | RCR                       | SHL/SAL       | SHR                      |               | SAR            |  |  |  |
| F6, F7                                             | 3    | mem, 11B | TEST<br>lb/lv                  |                                     | NOT         | NEG                       | MUL<br>AL/eAX | IMUL<br>AL/eAX           | DIV<br>AL/eAX | IDIV<br>AL/eAX |  |  |  |
| FE                                                 | 4    | mem, 11B | INC<br>Eb                      | DEC<br>Eb                           |             |                           |               |                          |               |                |  |  |  |
| FF                                                 | 5    | mem, 11B | INC<br>Ev                      | DEC<br>Ev                           | CALLN<br>Ev | CALLF<br>Ep <sup>1J</sup> | JMPN<br>Ev    | JMPF<br>Ep <sup>1J</sup> | PUSH<br>Ev    |                |  |  |  |
| OF OO                                              | 6    | mem, 11B | SLDT<br>Ew                     | STR<br>Ev                           | LLDT<br>Ew  | LTR<br>Ew                 | VERR<br>Ew    | VERW<br>Ew               |               |                |  |  |  |
| OF 01                                              | 7    | mem      | SGDT<br>Ms                     | SIDT<br>Ms                          | LGDT<br>Ms  | LIDT<br>Ms                | SMSW<br>Ew    |                          | LMSW<br>Ew    | INVLPG<br>Mb   |  |  |  |
|                                                    |      | 11B      |                                | MONITOR<br>eAX, eCX,<br>eDX (000)IE |             |                           |               |                          |               |                |  |  |  |
|                                                    |      |          |                                | MWAIT<br>eAX, eCX<br>(001)IE        |             |                           |               |                          |               |                |  |  |  |
| OF BA                                              | 8    | mem, 11B |                                |                                     |             |                           | BT            | BTS                      | BTR           | BTC            |  |  |  |
| OF C7                                              | 9    | mem      |                                | CMPXCH8B<br>Mq                      |             |                           |               |                          |               |                |  |  |  |
|                                                    |      | 11B      |                                |                                     |             |                           |               |                          |               |                |  |  |  |

表 A-4. グループ番号による 1 バイトと 2 バイトのオペコードのオペコード拡張<sup>1</sup> (続き)

| オペコード | グループ | Mod 7,6  | ModR/M バイトのビット 5、4、3 のエンコーディング |                 |                                          |                           |                                          |                               |                                          |                               |
|-------|------|----------|--------------------------------|-----------------|------------------------------------------|---------------------------|------------------------------------------|-------------------------------|------------------------------------------|-------------------------------|
|       |      |          | 000                            | 001             | 010                                      | 011                       | 100                                      | 101                           | 110                                      | 111                           |
| OF B9 | 10   | mem      |                                |                 |                                          |                           |                                          |                               |                                          |                               |
|       |      | 11B      |                                |                 |                                          |                           |                                          |                               |                                          |                               |
| C6    | 11   | mem, 11B | MOV<br>Eb, Ib                  |                 |                                          |                           |                                          |                               |                                          |                               |
| C7    |      | mem, 11B | MOV<br>Ev, Iv                  |                 |                                          |                           |                                          |                               |                                          |                               |
| OF 71 | 12   | mem      |                                |                 |                                          |                           |                                          |                               |                                          |                               |
|       |      | 11B      |                                |                 | PSRLW<br>Pq, Ib<br>PSRLW (66)<br>Pdq, Ib |                           | PSRAW<br>Pq, Ib<br>PSRAW (66)<br>Pdq, Ib |                               | PSLLW<br>Pq, Ib<br>PSLLW (66)<br>Pdq, Ib |                               |
| OF 72 | 13   | mem      |                                |                 |                                          |                           |                                          |                               |                                          |                               |
|       |      | 11B      |                                |                 | PSRLD<br>Pq, Ib<br>PSRLD (66)<br>Wdq, Ib |                           | PSRAD<br>Pq, Ib<br>PSRAD (66)<br>Wdq, Ib |                               | PSLLD<br>Pq, Ib<br>PSLLD (66)<br>Wdq, Ib |                               |
| OF 73 | 14   | mem      |                                |                 |                                          |                           |                                          |                               |                                          |                               |
|       |      | 11B      |                                |                 | PSRLQ<br>Pq, Ib<br>PSRLQ (66)<br>Wdq, Ib | PSRLDQ<br>(66)<br>Wdq, Ib |                                          |                               | PSLLQ<br>Pq, Ib<br>PSLLQ (66)<br>Wdq, Ib | PSLLDQ<br>(66)<br>Wdq, Ib     |
| OF AE | 15   | mem      | FXSAVE                         | FXRSTOR         | LDMXCSR                                  | STMXCSR                   |                                          |                               |                                          | CLFLUSH                       |
|       |      | 11B      |                                |                 |                                          |                           |                                          | LFENCE<br>(000) <sup>1E</sup> | MFENCE<br>(000) <sup>1E</sup>            | SFENCE<br>(000) <sup>1E</sup> |
| OF 18 | 16   | mem      | PREFETCH-<br>NTA               | PREFETCH-<br>T0 | PREFETCH-<br>T1                          | PREFETCH-<br>T2           |                                          |                               |                                          |                               |
|       |      | 11B      |                                |                 |                                          |                           |                                          |                               |                                          |                               |

注:

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードまたは予約されているオペコードの動作に依存してはならない。

### A.3.5. エスケープ・オペコード命令

表 A-5.～A-20. に、算術演算コプロセッサのエスケープ命令オペコード (x87 浮動小数点命令オペコード) のオペコード・マップを示す。これらのオペコード・マップは、D8～DF のオペコードの第 1 バイトによってグループ化される。これらのオペコードはそれぞれ、ModR/M バイトをもつ。ModR/M バイトが 00H～BFH の範囲内にある場合は、ModR/M バイトのビット 5、4、3 がオペコード拡張として使用され、1 バイトと 2 バイトのオペコードに使用された技法と同様である (A.3.4. 項「1 バイトと 2 バイトのオペコードのオペコード拡張」を参照)。ModR/M バイトが 00H～BFH の範囲外にある場合は、ModR/M バイト全体がオペコード拡張として使用される。

#### A.3.5.1. ModR/M バイトが 00H～BFH の範囲内にある場合のオペコード

オペコード DD0504000000H は、次のように解釈することができる。すなわち、このオペコードでコード化される命令は、A.3.5.8. 項「第 1 バイトとして DD をもつエスケープ・オペコード」にある。ModR/M バイト (05H) は、00H～BFH の範囲内にあるので、このバイトのビット 3～5 は、オペコードが FLD 倍精度実数命令用であることを示している (表 A-7. を参照)。ロードされる倍精度実数値は、00000004H にであり、これは、このオペコードの後に続き、このオペコードに属している 32 ビットのディスプレースメントである。

#### A.3.5.2. ModR/M バイトが 00H～BFH の範囲外にある場合のオペコード

オペコード D8C1H は、00H～BFH の範囲外にある ModR/M バイトをもつオペコードの例を示している。ここでコード化される命令は、A.3.4. 項「1 バイトと 2 バイトのオペコードのオペコード拡張」にある。表 A-6. で、ModR/M バイト C1H は行 C 列 1 を示し、これは ST(0)、ST(1) をオペランドとして使用する FADD 命令である。

### A.3.5.3. 第1バイトとしてD8をもつエスケープ・オペコード

表A-5.とA-6.は、D8Hで始まるエスケープ命令オペコードのオペコード・マップである。表A-5.に、付随するModR/Mバイトが00H～BFHの範囲内にある場合のオペコード・マップを示す。ここでは、ビット5、4、3(図A-1.のnnnフィールド)の値が命令を選択する。

表A-5. ModR/Mバイトが00H～BFH内にあるときのD8オペコード・マップ<sup>1</sup>

| ModR/M バイトの nnn フィールド (図 A-1. を参照) |      |      |      |      |      |      |      |
|------------------------------------|------|------|------|------|------|------|------|
| 000B                               | 001B | 010B | 011B | 100B | 101B | 110B | 111B |

注:

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

表A-6.に、付随するModR/Mバイトが00H～BFHの範囲外にある場合のオペコード・マップを示す。この場合は、ModR/Mバイトの1ケタ目が表の行を選択し、2ケタ目が列を選択する。

表A-6. ModR/Mバイトが00H～BFH外にあるときのD8オペコード・マップ<sup>1</sup>

|   | 0           | 1           | 2           | 3           | 4           | 5           | 6           | 7           |
|---|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| C | FADD        |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| D | FCOM        |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),T(2)  | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| E | FSUB        |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| F | FDIV        |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |

|   | 8           | 9           | A           | B           | C           | D           | E           | F           |
|---|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| C | FMUL        |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| D | FCOMP       |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),T(2)  | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| E | FSUBR       |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| F | FDIVR       |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |

注:

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

### A.3.5.4. 第1バイトとしてD9 をもつエスケープ・オペコード

表 A-7. と A-8. は、D9H で始まるエスケープ命令オペコードのオペコード・マップである。表 A-7. に、付随する ModR/M バイトが 00H ~ BFH の範囲内にある場合のオペコード・マップを示す。ここでは、ビット 5、4、3 (図 A-1. の nnn フィールド) の値が命令を選択する。

表 A-7. ModR/M バイトが 00H ~ BFH 内にあるときの D9 オペコード・マップ<sup>1</sup>

| ModR/M バイトの nnn フィールド (図 A-1. を参照) |      |              |               |                     |                |                     |                |
|------------------------------------|------|--------------|---------------|---------------------|----------------|---------------------|----------------|
| 000B                               | 001B | 010B         | 011B          | 100B                | 101B           | 110B                | 111B           |
| FLD<br>単精度実数                       |      | FST<br>単精度実数 | FSTP<br>単精度実数 | FLDENV<br>14/28 バイト | FLDCW<br>2 バイト | FSTENV<br>14/28 バイト | FSTCW<br>2 バイト |

注：

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

表 A-8. に、付随する ModR/M バイトが 00H ~ BFH の範囲外にある場合のオペコード・マップを示す。この場合は、ModR/M バイトの 1 ケタ目が表の行を選択し、2 ケタ目が列を選択する。

表 A-8. ModR/M バイトが 00H ~ BFH 外にあるときの D9 オペコード・マップ<sup>1</sup>

|     | 0           | 1           | 2           | 3           | 4           | 5           | 6           | 7           |
|-----|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| FLD |             |             |             |             |             |             |             |             |
| C   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| D   | FNOP        |             |             |             |             |             |             |             |
| E   | FCHS        | FABS        |             |             | FTST        | FXAM        |             |             |
| F   | F2XM1       | FYL2X       | FPTAN       | FPATAN      | FXTRACT     | FPREM1      | FDECSTP     | FINCSTP     |

|      | 8           | 9           | A           | B           | C           | D           | E           | F           |
|------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| FXCH |             |             |             |             |             |             |             |             |
| C    | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| D    |             |             |             |             |             |             |             |             |
| E    | FLD1        | FLDL2T      | FLDL2E      | FLDP1       | FLDLG2      | FLDLN2      | FLDZ        |             |
| F    | FPREM       | FYL2XP1     | FSQRT       | FSINCOS     | FRNDINT     | FSCALE      | FSIN        | FCOS        |

注：

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

### A.3.5.5. 第1バイトとして DA をもつエスケープ・オペコード

表 A-9. と A-10. は、DAH で始まるエスケープ命令オペコードのオペコード・マップである。表 A-9. に、付随する ModR/M バイトが 00H ~ BFH の範囲内にある場合のオペコード・マップを示す。ここでは、ビット 5、4、3 (図 A-1. の nnn フィールド) の値が命令を選択する。

表 A-9. ModR/M バイトが 00H ~ BFH 内にあるときの DA オペコード・マップ<sup>1</sup>

| ModR/M バイトの nnn フィールド (図 A-1. を参照) |                   |                   |                    |                   |                    |                   |                    |
|------------------------------------|-------------------|-------------------|--------------------|-------------------|--------------------|-------------------|--------------------|
| 000B                               | 001B              | 010B              | 011B               | 100B              | 101B               | 110B              | 111B               |
| FIADD<br>dword 整数                  | FIMUL<br>dword 整数 | FICOM<br>dword 整数 | FICOMP<br>dword 整数 | FISUB<br>dword 整数 | FISUBR<br>dword 整数 | FIDIV<br>dword 整数 | FIDIVR<br>dword 整数 |

注：

1. オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

表 A-10. に、付随する ModR/M バイトが 00H ~ BFH の範囲外にある場合のオペコード・マップを示す。この場合は、ModR/M バイトの 1 ケタ目が表の行を選択し、2 ケタ目が列を選択する。

表 A-10. ModR/M バイトが 00H ~ BFH 外にあるときの DA オペコード・マップ<sup>1</sup>

|   | 0           | 1           | 2           | 3           | 4           | 5           |             | 7           |
|---|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| C | FCMOVB      |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| D | FCMOVBE     |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| E |             |             |             |             |             |             |             |             |
| F |             |             |             |             |             |             |             |             |

|   | 8           | 9           | A           | B           | C           | D           | E           | F           |
|---|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| C | FCMOVE      |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| D | FCMOVU      |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| E |             | FUCOMPP     |             |             |             |             |             |             |
| F |             |             |             |             |             |             |             |             |

注：

1. オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

### A.3.5.6. 第1バイトとして DB をもつエスケープ・オペコード

表 A-11. と A-12. は、DBH で始まるエスケープ命令オペコードのオペコード・マップである。表 A-11. に、付随する ModR/M バイトが 00H ~ BFH の範囲内にある場合のオペコード・マップを示す。ここでは、ビット 5、4、3 (図 A-1. の nnn フィールド) の値が命令を選択する。

表 A-11. ModR/M バイトが 00H ~ BFH 内にあるときの DB オペコード・マップ<sup>1</sup>

| ModR/M バイトの nnn フィールド (図 A-1. を参照) |                    |                  |                   |      |             |      |              |
|------------------------------------|--------------------|------------------|-------------------|------|-------------|------|--------------|
| 000B                               | 001B               | 010B             | 011B              | 100B | 101B        | 110B | 111B         |
| FILD<br>dword 整数                   | FISTTP<br>dword 整数 | FIST<br>dword 整数 | FISTP<br>dword 整数 |      | FLD<br>拡張実数 |      | FSTP<br>拡張実数 |

注：

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

表 A-12. に、付随する ModR/M バイトが 00H ~ BFH の範囲外にある場合のオペコード・マップを示す。この場合は、ModR/M バイトの 1 ケタ目が表の行を選択し、2 ケタ目が列を選択する。

表 A-12. ModR/M バイトが 00H ~ BFH 外にあるときの DB オペコード・マップ<sup>1</sup>

|                 | 0           | 1           | 2           | 3           | 4           | 5           |             | 7           |
|-----------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| C FCMOVNB       |             |             |             |             |             |             |             |             |
|                 | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| D FCMOVNBE      |             |             |             |             |             |             |             |             |
|                 | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| E FNCLEX FNINIT |             |             |             |             |             |             |             |             |
| F FCOMI         |             |             |             |             |             |             |             |             |
|                 | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |

|           | 8           | 9           | A           | B           | C           | D           | E           | F           |
|-----------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| C FCMOVNE |             |             |             |             |             |             |             |             |
|           | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| D FCMOVNU |             |             |             |             |             |             |             |             |
|           | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| E FUCOMI  |             |             |             |             |             |             |             |             |
|           | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| F         |             |             |             |             |             |             |             |             |

注：

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

### A.3.5.7. 第1バイトとして DC をもつエスケープ・オペコード

表 A-13. と A-14. は、DCH で始まるエスケープ命令オペコードのオペコード・マップである。表 A-13. に、付随する ModR/M バイトが 00H ~ BFH の範囲内にある場合のオペコード・マップを示す。ここでは、ビット 5、4、3 (図 A-1. の nnn フィールド) の値が命令を選択する。

表 A-13. ModR/M バイトが 00H ~ BFH 内にあるときの DC オペコード・マップ<sup>1</sup>

| ModR/M バイトの nnn フィールド (図 A-1. を参照) |               |               |                |               |                |               |                |
|------------------------------------|---------------|---------------|----------------|---------------|----------------|---------------|----------------|
| 000B                               | 001B          | 010B          | 011B           | 100B          | 101B           | 110B          | 111B           |
| FADD<br>倍精度実数                      | FMUL<br>倍精度実数 | FCOM<br>倍精度実数 | FCOMP<br>倍精度実数 | FSUB<br>倍精度実数 | FSUBR<br>倍精度実数 | FDIV<br>倍精度実数 | FDIVR<br>倍精度実数 |

注：

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

表 A-14. に、付随する ModR/M バイトが 00H ~ BFH の範囲外にある場合のオペコード・マップを示す。この場合は、ModR/M バイトの 1 ケタ目が表の行を選択し、2 ケタ目が列を選択する。

表 A-14. ModR/M バイトが 00H ~ BFH 外にあるときの DC オペコード・マップ<sup>1</sup>

|       | 0           | 1           | 2           | 3           | 4           | 5           |             | 7           |
|-------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| FADD  |             |             |             |             |             |             |             |             |
| C     | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |
| FSUBR |             |             |             |             |             |             |             |             |
| D     |             |             |             |             |             |             |             |             |
| E     | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |
| FDIVR |             |             |             |             |             |             |             |             |
| F     | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |

|      | 8           | 9           | A           | B           | C           | D           | E           | F           |
|------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| FMUL |             |             |             |             |             |             |             |             |
| C    | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |
| FSUB |             |             |             |             |             |             |             |             |
| E    | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |
| FDIV |             |             |             |             |             |             |             |             |
| F    | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |

注：

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

### A.3.5.8. 第1バイトとして DD をもつエスケープ・オペコード

表 A-15. と A-16. は、DDH で始まるエスケープ命令オペコードのオペコード・マップである。表 A-15. に、付随する ModR/M バイトが 00H～BFH の範囲内にある場合のオペコード・マップを示す。ここでは、ビット 5、4、3 (図 A-1. の nnn フィールド) の値が命令を選択する。

表 A-15. ModR/M バイトが 00H～BFH 内にあるときの DD オペコード・マップ<sup>1</sup>

| ModR/M バイトの nnn フィールド (図 A-1. を参照) |      |      |      |      |      |      |      |
|------------------------------------|------|------|------|------|------|------|------|
| 000B                               | 001B | 010B | 011B | 100B | 101B | 110B | 111B |

注：

1. オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

表 A-16. に、付随する ModR/M バイトが 00H～BFH の範囲外にある場合のオペコード・マップを示す。この場合は、ModR/M バイトの 1 ケタ目が表の行を選択し、2 ケタ目が列を選択する。

表 A-16. ModR/M バイトが 00H～BFH 外にあるときの DD オペコード・マップ<sup>1</sup>

|         |             |             |             |             |             |             |             |             |
|---------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
|         | 0           | 1           | 2           | 3           | 4           | 5           |             | 7           |
| C FFREE |             |             |             |             |             |             |             |             |
|         | ST(0)       | ST(1)       | ST(2)       | ST(3)       | ST(4)       | ST(5)       | ST(6)       | ST(7)       |
| D FST   |             |             |             |             |             |             |             |             |
|         | ST(0)       | ST(1)       | ST(2)       | ST(3)       | ST(4)       | ST(5)       | ST(6)       | ST(7)       |
| E FUCOM |             |             |             |             |             |             |             |             |
|         | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |
| F       |             |             |             |             |             |             |             |             |

|          |       |       |       |       |       |       |       |       |
|----------|-------|-------|-------|-------|-------|-------|-------|-------|
|          | 8     | 9     | A     | B     | C     | D     | E     | F     |
| C        |       |       |       |       |       |       |       |       |
|          | ST(0) | ST(1) | ST(2) | ST(3) | ST(4) | ST(5) | ST(6) | ST(7) |
| D FSTP   |       |       |       |       |       |       |       |       |
|          | ST(0) | ST(1) | ST(2) | ST(3) | ST(4) | ST(5) | ST(6) | ST(7) |
| E FUCOMP |       |       |       |       |       |       |       |       |
|          | ST(0) | ST(1) | ST(2) | ST(3) | ST(4) | ST(5) | ST(6) | ST(7) |
| F        |       |       |       |       |       |       |       |       |

注：

1. オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

### A.3.5.9. 第1バイトとして DE をもつエスケープ・オペコード

表 A-17. と A-18. は、DEH で始まるエスケープ命令オペコードのオペコード・マップである。表 A-17. に、付随する ModR/M バイトが 00H～BFH の範囲内にある場合のオペコード・マップを示す。ここでは、ビット 5、4、3 (図 A-1. の nnn フィールド) の値が命令を選択する。

表 A-17. ModR/M バイトが 00H～BFH 内にあるときの DE オペコード・マップ<sup>1</sup>

| ModR/M バイトの nnn フィールド (図 A-1. を参照) |      |      |      |      |      |      |      |
|------------------------------------|------|------|------|------|------|------|------|
| 000B                               | 001B | 010B | 011B | 100B | 101B | 110B | 111B |

注：

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

表 A-18. に、付随する ModR/M バイトが 00H～BFH の範囲外にある場合のオペコード・マップを示す。この場合は、ModR/M バイトの 1 ケタ目が表の行を選択し、2 ケタ目が列を選択する。

表 A-18. ModR/M バイトが 00H～BFH 外にあるときの DE オペコード・マップ<sup>1</sup>

|   | 0           | 1           | 2           | 3           | 4           | 5           |             | 7           |
|---|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| C |             |             |             | FADDP       |             |             |             |             |
|   | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |
| D |             |             |             |             |             |             |             |             |
| E |             |             |             | FSUBRP      |             |             |             |             |
|   | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |
| F |             |             |             | FDIVRP      |             |             |             |             |
|   | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |

|   | 8           | 9           | A           | B           | C           | D           | E           | F           |
|---|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| C |             |             |             | FMULP       |             |             |             |             |
|   | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |
| D |             |             | FCOMPP      |             |             |             |             |             |
| E |             |             |             | FSUBP       |             |             |             |             |
|   | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |
| F |             |             |             | FDIVP       |             |             |             |             |
|   | ST(0),ST(0) | ST(1),ST(0) | ST(2),ST(0) | ST(3),ST(0) | ST(4),ST(0) | ST(5),ST(0) | ST(6),ST(0) | ST(7),ST(0) |

注：

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

### A.3.5.10. 第1バイトとして DF をもつエスケープ・オペコード

表 A-19. と A-20. は、DFH で始まるエスケープ命令オペコードのオペコード・マップである。表 A-19. に、付随する ModR/M バイトが 00H ~ BFH の範囲内にある場合のオペコード・マップを示す。ここでは、ビット 5、4、3 (図 A-1. の nnn フィールド) の値が命令を選択する。

表 A-19. ModR/M バイトが 00H ~ BFH 内にあるときの DF オペコード・マップ<sup>1</sup>

| ModR/M バイトの nnn フィールド (図 A-1. を参照) |                 |               |                |                  |                  |                   |                   |
|------------------------------------|-----------------|---------------|----------------|------------------|------------------|-------------------|-------------------|
| 000B                               | 001B            | 010B          | 011B           | 100B             | 101B             | 110B              | 111B              |
| FILD<br>ワード整数                      | FISTTP<br>ワード整数 | FIST<br>ワード整数 | FISTP<br>ワード整数 | FBLD<br>パックド BCD | FILD<br>qword 整数 | FBSTP<br>パックド BCD | FISTP<br>qword 整数 |

注：

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

表 A-20. に、付随する ModR/M バイトが 00H ~ BFH の範囲外にある場合のオペコード・マップを示す。この場合は、ModR/M バイトの 1 ケタ目が表の行を選択し、2 ケタ目が列を選択する。

表 A-20. ModR/M バイトが 00H ~ BFH 外にあるときの DF オペコード・マップ<sup>1</sup>

|   | 0           | 1           | 2           | 3           | 4           | 5           |             | 7           |
|---|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| C |             |             |             |             |             |             |             |             |
| D |             |             |             |             |             |             |             |             |
| E | FSTSW<br>AX |             |             |             |             |             |             |             |
| F | FCOMIP      |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |

|   | 8           | 9           | A           | B           | C           | D           | E           | F           |
|---|-------------|-------------|-------------|-------------|-------------|-------------|-------------|-------------|
| C |             |             |             |             |             |             |             |             |
| D |             |             |             |             |             |             |             |             |
| E | FUCOMIP     |             |             |             |             |             |             |             |
|   | ST(0),ST(0) | ST(0),ST(1) | ST(0),ST(2) | ST(0),ST(3) | ST(0),ST(4) | ST(0),ST(5) | ST(0),ST(6) | ST(0),ST(7) |
| F |             |             |             |             |             |             |             |             |

注：

- オペコード・マップにあるすべての空白は、予約されており、使用してはならない。これらの未定義オペコードの動作に依存してはならない。

# B

---

命令フォーマット  
および  
エンコーディング



# 付録 B 命令フォーマットおよび エンコーディング

B

本付録では、IA-32 アーキテクチャ命令の機械語命令のフォーマットとエンコーディングを説明する。最初のセクションでは、IA-32アーキテクチャの機械語命令のフォーマットを詳しく説明する。次のセクションでは、汎用、MMX、P6 ファミリ、SSE、SSE2、SSE3、x87 FPU の各命令のフォーマットとエンコーディングを説明する。

## B.1. マシン命令フォーマット

すべてのインテル・アーキテクチャ命令は、図 B-1. に示す汎用のマシン命令フォーマットのサブセットを使用してコード化される。各命令は、オペコード、ModR/M バイトを構成するレジスタ指定子とアドレスモード指定子（必要な場合）、必要な場合には、スケール・インデックス・ベース（SIB）バイト、ディスプレースメント、即値データ・フィールドからなる。



図 B-1. 汎用マシン命令フォーマット

命令のプライマリ・オペコードは、命令の 1 バイトまたは 2 バイトにコード化される。一部の命令では、ModR/M バイトのビット 5、4、3 にコード化されるオペコード拡張フィールドも使用する。プライマリ・オペコード内では、それより小さいエンコーディング・フィールドを定義することができる。これらのフィールドは、実行される操作のクラスによって変わる。フィールドでは、レジスタ・エンコーディング、実行する条件付きテスト、または即値バイトの符号拡張などの情報を定義する。

レジスタやメモリのオペランドを参照するほとんどすべての命令は、オペコードの後にレジスタバイトやアドレス・モード・バイトをもつ。このModR/M バイトは、mod フィールド、reg フィールド、R/M フィールドからなる。ModR/M バイトの一定のエンコーディングは、第2アドレス・モード・バイトであるSIB バイトを使用しなければならないことを指定する。

選択されているアドレス指定モードがディスプレースメントを指定している場合は、ディスプレースメント値がModR/M バイトまたはSIB バイトの直後に置かれる。ディスプレースメントが存在している場合は、可能なサイズは、8、16、または32 ビットである。

命令が即値オペランドを指定している場合は、即値がディスプレースメントの後に続く。即値オペランドは、指定する場合は、常に命令の最終フィールドである。

表B-1に、一定の命令に、オペコード・バイト自体の中にも現れることもあるいくつかのより小さいフィールドまたはビットの一覧を示す。以降の表では、これらのフィールドとビットについて説明し、許容可能な値の一覧を示す。(d ビットを除く) これらのフィールドのすべては、表B-11に示す汎用命令フォーマットで示している。

表 B-1. 命令エンコーディング内の特殊フィールド

| フィールド名 | 説明                                                                        | ビット数 |
|--------|---------------------------------------------------------------------------|------|
| reg    | 汎用レジスタ指定子（表 B-2. または B-3. を参照）。                                           | 3    |
| w      | データがバイトであるかまたはフルサイズであるかを指定する。ここで、フルサイズとは 16 ビットまたは 32 ビットである（表 B-4. を参照）。 | 1    |
| s      | 即値データ・フィールドの符号拡張を指定する（表 B-5. を参照）。                                        | 1    |
| sreg2  | CS、SS、DS、ES のセグメント・レジスタ指定子（表 B-6. を参照）。                                   | 2    |
| sreg3  | CS、SS、DS、ES、FS、GS のセグメント・レジスタ指定子（表 B-6. を参照）。                             | 3    |
| eee    | 特殊目的（制御またはデバッグ）レジスタを指定する（表 B-7. を参照）。                                     | 3    |
| tttn   | 条件付き命令の場合に、アサートされる条件またはネガートされる条件を指定する（表 B-8. を参照）。                        | 4    |
| d      | データ操作の方向を指定する（表 B-9. を参照）。                                                | 1    |

### B.1.1. reg フィールド (reg)

ModR/M バイトの reg フィールドでは、汎用レジスタ・オペランドを指定する。指定されるレジスタのグループは、エンコーディングにおける w ビットの存在と状態によって決定される（表 B-4. を参照）。表 B-2. に、w ビットがエンコーディングで存在していないときの reg フィールドのエンコーディングを示し、表 B-3. に、w ビットが存在しているときの reg フィールドのエンコーディングを示す。

表 B-2. w フィールドが命令に存在していないときの reg フィールドのエンコーディング

| reg フィールド | 16 ビット・データ操作中に選択されるレジスタ | 32 ビット・データ操作中に選択されるレジスタ |
|-----------|-------------------------|-------------------------|
| 000       | AX                      | EAX                     |
| 001       | CX                      | ECX                     |
| 010       | DX                      | EDX                     |
| 011       | BX                      | EBX                     |
| 100       | SP                      | ESP                     |
| 101       | BP                      | EBP                     |
| 110       | SI                      | ESI                     |
| 111       | DI                      | EDI                     |

表 B-3. w フィールドが命令に存在しているときの reg フィールドのエンコーディング

| 16 ビット・データ操作中に<br>reg フィールドによって指定されるレジスタ |            |           | 32 ビット・データ操作中に<br>reg フィールドによって指定されるレジスタ |            |           |
|------------------------------------------|------------|-----------|------------------------------------------|------------|-----------|
| reg                                      | w フィールドの機能 |           | reg                                      | w フィールドの機能 |           |
|                                          | w = 0 のとき  | w = 1 のとき |                                          | w = 0 のとき  | w = 1 のとき |
| 000                                      | AL         | AX        | 000                                      | AL         | EAX       |
| 001                                      | CL         | CX        | 001                                      | CL         | ECX       |
| 010                                      | DL         | DX        | 010                                      | DL         | EDX       |
| 011                                      | BL         | BX        | 011                                      | BL         | EBX       |
| 100                                      | AH         | SP        | 100                                      | AH         | ESP       |
| 101                                      | CH         | BP        | 101                                      | CH         | EBP       |
| 110                                      | DH         | SI        | 110                                      | DH         | ESI       |
| 111                                      | BH         | DI        | 111                                      | BH         | EDI       |

### B.1.2. オペランド・サイズ・ビット (w) のエンコーディング

現在のオペランド・サイズ属性によって、プロセッサが 16 ビットまたは 32 ビットどちらの操作を実行するかが決まる。現在のオペランド・サイズ属性の制約内で、オペランド・サイズ・ビット (w) を使用して、8 ビット・オペランドまたはオペランド・サイズ属性で指定されたオペランド・サイズ全体（16 ビットまたは 32 ビット）への操作を指定することができる。表 B-4. に、現在のオペランド・サイズ属性に依存した w ビットのエンコーディングを示す。

表 B-4. オペランド・サイズ (w) ビットのエンコーディング

| w ビット | オペランド・サイズ属性が 16 ビットであるときのオペランド・サイズ | オペランド・サイズ属性が 32 ビットであるときのオペランド・サイズ |
|-------|------------------------------------|------------------------------------|
| 0     | 8 ビット                              | 8 ビット                              |
| 1     | 16 ビット                             | 32 ビット                             |

### B.1.3. 符号拡張 (s) ビット

符号拡張 (s) ビットは、8 ビットから 16 ビットまたは 32 ビットに拡張される即値データ・フィールドをもつ命令に主に現れる。表 B-5. に、s ビットのエンコーディングを示す。

表 B-5. 符号拡張 (s) ビットのエンコーディング

| s | 8 ビット即値データへの影響                       | 16 ビットまたは 32 ビット即値データへの影響 |
|---|--------------------------------------|---------------------------|
| 0 | なし                                   | なし                        |
| 1 | 16 ビットまたは 32 ビットのデスティネーションに合うように符号拡張 | なし                        |

### B.1.4. セグメント・レジスタ・フィールド (sreg)

命令がセグメント・レジスタを操作するときは、ModR/M バイトの reg フィールドを sreg フィールドといい、セグメント・レジスタの指定に使用する。表 B-6. に、sreg フィールドのエンコーディングを示す。このフィールドは、2 ビット・フィールド (sreg2) のときと、3 ビット・フィールド (sreg3) のときがある。

表 B-6. セグメント・レジスタ (sreg) フィールドのエンコーディング

| 2 ビット sreg フィールド | 選択されるセグメント・レジスタ | 3 ビット sreg フィールド | 選択されるセグメント・レジスタ |
|------------------|-----------------|------------------|-----------------|
| 00               | ES              | 000              | ES              |
| 01               | CS              | 001              | CS              |
| 10               | SS              | 010              | SS              |
| 11               | DS              | 011              | DS              |
|                  |                 | 100              | FS              |
|                  |                 | 101              | GS              |
|                  |                 | 110              | 予約済み *          |
|                  |                 | 111              | 予約済み *          |

\* 予約エンコーディングを使用してはならない。

### B.1.5. 特殊目的レジスタ (eee) フィールド

制御レジスタまたはデバッグレジスタが命令で参照されているときは、それらのレジスタは、ModR/M バイトのビット 5、4、3 にある eee フィールド内にコード化される。表 B-7. に、eee フィールドのエンコーディングを示す。

表 B-7. 特殊目的レジスタ (eee) フィールドのエンコーディング

| eee | 制御レジスタ | デバッグレジスタ |
|-----|--------|----------|
| 000 | CR0    | DR0      |
| 001 | 予約済み * | DR1      |
| 010 | CR2    | DR2      |
| 011 | CR3    | DR3      |
| 100 | CR4    | 予約済み *   |
| 101 | 予約済み * | 予約済み *   |
| 110 | 予約済み * | DR6      |
| 111 | 予約済み * | DR7      |

\* 予約エンコーディングを使用してはならない。

### B.1.6. 条件テスト・フィールド (tttn)

(条件付きジャンプや条件での設定などの) 条件付き命令では、条件テスト・フィールド (tttn) は、テストされる条件に対してコード化される。フィールドの tt 部分では、テストする条件を指定し、n 部分では、条件 (n=0) またはその否定 (n=1) のどちらを使用するかを指定する。1 バイト・プライマリ・オペコードでは、tttn フィールドは、オペコード・バイトのビット 3、2、1、0 になる。2 バイト・プライマリ・オペコードでは、tttn フィールドは、第 2 オペコード・バイトのビット 3、2、1、0 になる。表 B-8 に、tttn フィールドのエンコーディングを示す。

表 B-8. 条件付きテスト (tttn) フィールドのエンコーディング

| tttn | ニーモニック | 条件                 |
|------|--------|--------------------|
| 0000 | O      | オーバーフローがある         |
| 0001 | NO     | オーバーフローがない         |
| 0010 | B, NAE | より下、より上でなく等しくない    |
| 0011 | NB, AE | より下でない、より上か等しい     |
| 0100 | E, Z   | 等しい、ゼロ             |
| 0101 | NE, NZ | 等しくない、ゼロでない        |
| 0110 | BE, NA | より下か等しい、より上でない     |
| 0111 | NBE, A | より下でなく等しくない、より上    |
| 1000 | S      | 符号がある              |
| 1001 | NS     | 符号がない              |
| 1010 | P, PE  | パリティがある、パリティ偶数     |
| 1011 | NP, PO | パリティがない、パリティ奇数     |
| 1100 | L, NGE | より小さい、より大きくなく等しくない |
| 1101 | NL, GE | より小さくない、より大きいか等しい  |
| 1110 | LE, NG | より小さいか等しい、より大きくなない |
| 1111 | NLE, G | より小さくなく等しくない、より大きい |

### B.1.7. 方向 (d) ビット

多くの2オペランド命令では、方向ビット (d) は、どちらのオペランドをソースと考え、どちらのオペランドをデスティネーションと考えるかを指定する。表 B-9. に、d ビットのエンコーディングを示す。整数命令に使用するときは、d ビットは1バイト・プライマリ・オペコードのビット1になる。このビットは、表 B-11. には記号 "d" として表されていない。その代わりに、1 または 0 としてビットの実際のエンコーディングが示されている。(表 B-16. にある) 浮動小数点命令に使用するときは、d ビットはプライマリ・オペコードの第1バイトのビット2として示される。

表 B-9. 操作方向 (d) ビットのエンコーディング

| d | ソース                   | デスティネーション             |
|---|-----------------------|-----------------------|
| 0 | reg フィールド             | ModR/M バイトまたは SIB バイト |
| 1 | ModR/M バイトまたは SIB バイト | reg フィールド             |

### B.1.8. その他の注意事項

表 B-10 に、特定のエンコーディングに関する注意事項を示す。以下の各項では、表中の注を上付き文字で示す。

表 B-10. 命令のエンコーディングに関する注意事項

| 記号 | 注意事項                                     |
|----|------------------------------------------|
| A  | ModR/M バイトのビット 7 とビット 6 の値 11B は予約されている。 |

## B.2. 汎用命令のフォーマットおよびエンコーディング

表 B-11. に、汎用命令のマシン命令フォーマットおよびエンコーディングを示す。

表 B-11. 汎用命令のフォーマットおよびエンコーディング

| 命令およびフォーマット                                    | エンコーディング                                 |
|------------------------------------------------|------------------------------------------|
| <b>AAA – ASCII Adjust after Addition</b>       | 0011 0111                                |
| <b>AAD – ASCII Adjust AX before Division</b>   | 1101 0101 : 0000 1010                    |
| <b>AAM – ASCII Adjust AX after Multiply</b>    | 1101 0100 : 0000 1010                    |
| <b>AAS – ASCII Adjust AL after Subtraction</b> | 0011 1111                                |
| <b>ADC – ADD with Carry</b>                    |                                          |
| register1 to register2                         | 0001 000w : 11 reg1 reg2                 |
| register2 to register1                         | 0001 001w : 11 reg1 reg2                 |
| memory to register                             | 0001 001w : mod reg r/m                  |
| register to memory                             | 0001 000w : mod reg r/m                  |
| immediate to register                          | 1000 00sw : 11 010 reg : immediate data  |
| immediate to AL, AX, or EAX                    | 0001 010w : immediate data               |
| immediate to memory                            | 1000 00sw : mod 010 r/m : immediate data |
| <b>ADD – Add</b>                               |                                          |
| register1 to register2                         | 0000 000w : 11 reg1 reg2                 |
| register2 to register1                         | 0000 001w : 11 reg1 reg2                 |
| memory to register                             | 0000 001w : mod reg r/m                  |
| register to memory                             | 0000 000w : mod reg r/m                  |
| immediate to register                          | 1000 00sw : 11 000 reg : immediate data  |
| immediate to AL, AX, or EAX                    | 0000 010w : immediate data               |
| immediate to memory                            | 1000 00sw : mod 000 r/m : immediate data |
| <b>AND – Logical AND</b>                       |                                          |
| register1 to register2                         | 0010 000w : 11 reg1 reg2                 |
| register2 to register1                         | 0010 001w : 11 reg1 reg2                 |
| memory to register                             | 0010 001w : mod reg r/m                  |
| register to memory                             | 0010 000w : mod reg r/m                  |
| immediate to register                          | 1000 00sw: 11 100 reg: immediate data    |
| immediate to AL, AX, or EAX                    | 0010 010w : immediate data               |
| immediate to memory                            | 1000 00sw : mod 100 r/m : immediate data |
| <b>ARPL – Adjust RPL Field of Selector</b>     |                                          |
| from register                                  | 0110 0011 : 11 reg1 reg2                 |
| from memory                                    | 0110 0011 : mod reg r/m                  |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                     | エンコーディング                                        |
|-------------------------------------------------|-------------------------------------------------|
| <b>BOUND – Check Array Against Bounds</b>       | 0110 0010 : mod <sup>A</sup> reg r/m            |
| <b>BSF – Bit Scan Forward</b>                   |                                                 |
| register1, register2                            | 0000 1111 : 1011 1100 : 11 reg1 reg2            |
| memory, register                                | 0000 1111 : 1011 1100 : mod reg r/m             |
| <b>BSR – Bit Scan Reverse</b>                   |                                                 |
| register1, register2                            | 0000 1111 : 1011 1101 : 11 reg1 reg2            |
| memory, register                                | 0000 1111 : 1011 1101 : mod reg r/m             |
| <b>BSWAP – Byte Swap</b>                        | 0000 1111 : 1100 1 reg                          |
| <b>BT – Bit Test</b>                            |                                                 |
| register, immediate                             | 0000 1111 : 1011 1010 : 11 100 reg: imm8 data   |
| memory, immediate                               | 0000 1111 : 1011 1010 : mod 100 r/m : imm8 data |
| register1, register2                            | 0000 1111 : 1010 0011 : 11 reg2 reg1            |
| memory, reg                                     | 0000 1111 : 1010 0011 : mod reg r/m             |
| <b>BTC – Bit Test and Complement</b>            |                                                 |
| register, immediate                             | 0000 1111 : 1011 1010 : 11 111 reg: imm8 data   |
| memory, immediate                               | 0000 1111 : 1011 1010 : mod 111 r/m : imm8 data |
| register1, register2                            | 0000 1111 : 1011 1011 : 11 reg2 reg1            |
| memory, reg                                     | 0000 1111 : 1011 1011 : mod reg r/m             |
| <b>BTR – Bit Test and Reset</b>                 |                                                 |
| register, immediate                             | 0000 1111 : 1011 1010 : 11 110 reg: imm8 data   |
| memory, immediate                               | 0000 1111 : 1011 1010 : mod 110 r/m : imm8 data |
| register1, register2                            | 0000 1111 : 1011 0011 : 11 reg2 reg1            |
| memory, reg                                     | 0000 1111 : 1011 0011 : mod reg r/m             |
| <b>BTS – Bit Test and Set</b>                   |                                                 |
| register, immediate                             | 0000 1111 : 1011 1010 : 11 101 reg: imm8 data   |
| memory, immediate                               | 0000 1111 : 1011 1010 : mod 101 r/m : imm8 data |
| register1, register2                            | 0000 1111 : 1010 1011 : 11 reg2 reg1            |
| memory, reg                                     | 0000 1111 : 1010 1011 : mod reg r/m             |
| <b>CALL – Call Procedure (in same segment)</b>  |                                                 |
| direct                                          | 1110 1000 : full displacement                   |
| register indirect                               | 1111 1111 : 11 010 reg                          |
| memory indirect                                 | 1111 1111 : mod 010 r/m                         |
| <b>CALL – Call Procedure (in other segment)</b> |                                                 |
| direct                                          | 1001 1010 : unsigned full offset, selector      |
| indirect                                        | 1111 1111 : mod 011 r/m                         |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                             | エンコーディング                                 |
|---------------------------------------------------------|------------------------------------------|
| <b>CBW – Convert Byte to Word</b>                       | 1001 1000                                |
| <b>CDQ – Convert Doubleword to Qword</b>                | 1001 1001                                |
| <b>CLC – Clear Carry Flag</b>                           | 1111 1000                                |
| <b>CLD – Clear Direction Flag</b>                       | 1111 1100                                |
| <b>CLI – Clear Interrupt Flag</b>                       | 1111 1010                                |
| <b>CLTS – Clear Task-Switched Flag in CR0</b>           | 0000 1111 : 0000 0110                    |
| <b>CMC – Complement Carry Flag</b>                      | 1111 0101                                |
| <b>CMP – Compare Two Operands</b>                       |                                          |
| register1 with register2                                | 0011 100w : 11 reg1 reg2                 |
| register2 with register1                                | 0011 101w : 11 reg1 reg2                 |
| memory with register                                    | 0011 100w : mod reg r/m                  |
| register with memory                                    | 0011 101w : mod reg r/m                  |
| immediate with register                                 | 1000 00sw : 11 111 reg : immediate data  |
| immediate with AL, AX, or EAX                           | 0011 110w : immediate data               |
| immediate with memory                                   | 1000 00sw : mod 111 r/m : immediate data |
| <b>CMPS/CMPSB/CMPSW CMPSD – Compare String Operands</b> | 1010 011w                                |
| <b>CMPXCHG – Compare and Exchange</b>                   |                                          |
| register1, register2                                    | 0000 1111 : 1011 000w : 11 reg2 reg1     |
| memory, register                                        | 0000 1111 : 1011 000w : mod reg r/m      |
| <b>CPUID – CPU Identification</b>                       | 0000 1111 : 1010 0010                    |
| <b>CWD – Convert Word to Doubleword</b>                 | 1001 1001                                |
| <b>CWDE – Convert Word to Doubleword</b>                | 1001 1000                                |
| <b>DAA – Decimal Adjust AL after Addition</b>           | 0010 0111                                |
| <b>DAS – Decimal Adjust AL after Subtraction</b>        | 0010 1111                                |
| <b>DEC – Decrement by 1</b>                             |                                          |
| register                                                | 1111 111w : 11 001 reg                   |
| register (alternate encoding)                           | 0100 1 reg                               |
| memory                                                  | 1111 111w : mod 001 r/m                  |
| <b>DIV – Unsigned Divide</b>                            |                                          |
| AL, AX, or EAX by register                              | 1111 011w : 11 110 reg                   |
| AL, AX, or EAX by memory                                | 1111 011w : mod 110 r/m                  |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                                                                  | エンコーディング                                          |
|----------------------------------------------------------------------------------------------|---------------------------------------------------|
| <b>ENTER – Make Stack Frame for High Level Procedure</b>                                     | 1100 1000 : 16-bit displacement : 8-bit level (L) |
| <b>HLT – Halt</b>                                                                            | 1111 0100                                         |
| <b>IDIV – Signed Divide</b>                                                                  |                                                   |
| AL, AX, or EAX by register                                                                   | 1111 011w : 11 111 reg                            |
| AL, AX, or EAX by memory                                                                     | 1111 011w : mod 111 r/m                           |
| <b>IMUL – Signed Multiply</b>                                                                |                                                   |
| AL, AX, or EAX with register                                                                 | 1111 011w : 11 101 reg                            |
| AL, AX, or EAX with memory                                                                   | 1111 011w : mod 101 reg                           |
| register1 with register2                                                                     | 0000 1111 : 1010 1111 : 11 : reg1 reg2            |
| register with memory                                                                         | 0000 1111 : 1010 1111 : mod reg r/m               |
| register1 with immediate to register2                                                        | 0110 10s1 : 11 reg1 reg2 : immediate data         |
| memory with immediate to register                                                            | 0110 10s1 : mod reg r/m : immediate data          |
| <b>IN – Input From Port</b>                                                                  |                                                   |
| fixed port                                                                                   | 1110 010w : port number                           |
| variable port                                                                                | 1110 110w                                         |
| <b>INC – Increment by 1</b>                                                                  |                                                   |
| reg                                                                                          | 1111 111w : 11 000 reg                            |
| reg (alternate encoding)                                                                     | 0100 0 reg                                        |
| memory                                                                                       | 1111 111w : mod 000 r/m                           |
| <b>INS – Input from DX Port</b>                                                              | 0110 110w                                         |
| <b>INT n – Interrupt Type n</b>                                                              | 1100 1101 : type                                  |
| <b>INT – Single-Step Interrupt 3</b>                                                         | 1100 1100                                         |
| <b>INTO – Interrupt 4 on Overflow</b>                                                        | 1100 1110                                         |
| <b>INVD – Invalidate Cache</b>                                                               | 0000 1111 : 0000 1000                             |
| <b>INVLPG – Invalidate TLB Entry</b>                                                         | 0000 1111 : 0000 0001 : mod 111 r/m               |
| <b>IRET/IRETD – Interrupt Return</b>                                                         | 1100 1111                                         |
| <b>Jcc – Jump if Condition is Met</b>                                                        |                                                   |
| 8-bit displacement                                                                           | 0111 tttn : 8-bit displacement                    |
| full displacement                                                                            | 0000 1111 : 1000 tttn : full displacement         |
| <b>JCXZ/JECXZ – Jump on CX/ECX Zero</b><br>Address-size prefix differentiates JCXZ and JECXZ | 1110 0011 : 8-bit displacement                    |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                            | エンコーディング                                         |
|--------------------------------------------------------|--------------------------------------------------|
| <b>JMP – Unconditional Jump (to same segment)</b>      |                                                  |
| short                                                  | 1110 1011 : 8-bit displacement                   |
| direct                                                 | 1110 1001 : full displacement                    |
| register indirect                                      | 1111 1111 : 11 100 reg                           |
| memory indirect                                        | 1111 1111 : mod 100 r/m                          |
| <b>JMP – Unconditional Jump (to other segment)</b>     |                                                  |
| direct intersegment                                    | 1110 1010 : unsigned full offset, selector       |
| indirect intersegment                                  | 1111 1111 : mod 101 r/m                          |
| <b>LAHF – Load Flags into AHRegister</b>               | 1001 1111                                        |
| <b>LAR – Load Access Rights Byte</b>                   |                                                  |
| from register                                          | 0000 1111 : 0000 0010 : 11 reg1 reg2             |
| from memory                                            | 0000 1111 : 0000 0010 : mod reg r/m              |
| <b>LDS – Load Pointer to DS</b>                        | 1100 0101 : mod <sup>A</sup> reg r/m             |
| <b>LEA – Load Effective Address</b>                    | 1000 1101 : mod <sup>A</sup> reg r/m             |
| <b>LEAVE – High Level Procedure Exit</b>               | 1100 1001                                        |
| <b>LES – Load Pointer to ES</b>                        | 1100 0100 : mod <sup>A</sup> reg r/m             |
| <b>LFS – Load Pointer to FS</b>                        | 0000 1111 : 1011 0100 : mod <sup>A</sup> reg r/m |
| <b>LGDT – Load Global Descriptor Table Register</b>    | 0000 1111 : 0000 0001 : mod <sup>A</sup> 010 r/m |
| <b>LGS – Load Pointer to GS</b>                        | 0000 1111 : 1011 0101 : mod <sup>A</sup> reg r/m |
| <b>LIDT – Load Interrupt Descriptor Table Register</b> | 0000 1111 : 0000 0001 : mod <sup>A</sup> 011 r/m |
| <b>LLDT – Load Local Descriptor Table Register</b>     |                                                  |
| LDTR from register                                     | 0000 1111 : 0000 0000 : 11 010 reg               |
| LDTR from memory                                       | 0000 1111 : 0000 0000 : mod 010 r/m              |
| <b>LMSW – Load Machine Status Word</b>                 |                                                  |
| from register                                          | 0000 1111 : 0000 0001 : 11 110 reg               |
| from memory                                            | 0000 1111 : 0000 0001 : mod 110 r/m              |
| <b>LOCK – Assert LOCK# Signal Prefix</b>               | 1111 0000                                        |
| <b>LODS/LODSB/LODSW/LODSD – Load String Operand</b>    | 1010 110w                                        |
| <b>LOOP – Loop Count</b>                               | 1110 0010 : 8-bit displacement                   |
| <b>LOOPZ/LOOPE – Loop Count while Zero/Equal</b>       | 1110 0001 : 8-bit displacement                   |
| <b>LOOPNZ/LOOPNE – Loop Count while not Zero/Equal</b> | 1110 0000 : 8-bit displacement                   |
| <b>LSL – Load Segment Limit</b>                        |                                                  |
| from register                                          | 0000 1111 : 0000 0011 : 11 reg1 reg2             |
| from memory                                            | 0000 1111 : 0000 0011 : mod reg r/m              |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                 | エンコーディング                                         |
|---------------------------------------------|--------------------------------------------------|
| <b>LSS – Load Pointer to SS</b>             | 0000 1111 : 1011 0010 : mod <sup>A</sup> reg r/m |
| <b>LTR – Load Task Register</b>             |                                                  |
| from register                               | 0000 1111 : 0000 0000 : 11 011 reg               |
| from memory                                 | 0000 1111 : 0000 0000 : mod 011 r/m              |
| <b>MOV – Move Data</b>                      |                                                  |
| register1 to register2                      | 1000 100w : 11 reg1 reg2                         |
| register2 to register1                      | 1000 101w : 11 reg1 reg2                         |
| memory to reg                               | 1000 101w : mod reg r/m                          |
| reg to memory                               | 1000 100w : mod reg r/m                          |
| immediate to register                       | 1100 011w : 11 000 reg : immediate data          |
| immediate to register (alternate encoding)  | 1011 w reg : immediate data                      |
| immediate to memory                         | 1100 011w : mod 000 r/m : immediate data         |
| memory to AL, AX, or EAX                    | 1010 000w : full displacement                    |
| AL, AX, or EAX to memory                    | 1010 001w : full displacement                    |
| <b>MOV – Move to/from Control Registers</b> |                                                  |
| CR0 from register                           | 0000 1111 : 0010 0010 : 11 000 reg               |
| CR2 from register                           | 0000 1111 : 0010 0010 : 11 010 reg               |
| CR3 from register                           | 0000 1111 : 0010 0010 : 11 011 reg               |
| CR4 from register                           | 0000 1111 : 0010 0010 : 11 100 reg               |
| register from CR0-CR4                       | 0000 1111 : 0010 0000 : 11 eee reg               |
| <b>MOV – Move to/from Debug Registers</b>   |                                                  |
| DR0-DR3 from register                       | 0000 1111 : 0010 0011 : 11 eee reg               |
| DR4-DR5 from register                       | 0000 1111 : 0010 0011 : 11 eee reg               |
| DR6-DR7 from register                       | 0000 1111 : 0010 0011 : 11 eee reg               |
| register from DR6-DR7                       | 0000 1111 : 0010 0001 : 11 eee reg               |
| register from DR4-DR5                       | 0000 1111 : 0010 0001 : 11 eee reg               |
| register from DR0-DR3                       | 0000 1111 : 0010 0001 : 11 eee reg               |
| <b>MOV – Move to/from Segment Registers</b> |                                                  |
| register to segment register                | 1000 1110 : 11 sreg3 reg                         |
| register to SS                              | 1000 1110 : 11 sreg3 reg                         |
| memory to segment reg                       | 1000 1110 : mod sreg3 r/m                        |
| memory to SS                                | 1000 1110 : mod sreg3 r/m                        |
| segment register to register                | 1000 1100 : 11 sreg3 reg                         |
| segment register to memory                  | 1000 1100 : mod sreg3 r/m                        |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                                  | エンコーディング                                                                    |
|--------------------------------------------------------------|-----------------------------------------------------------------------------|
| <b>MOV/S/BS/MOVSW/MOVS – Move Data from String to String</b> | 1010 010w                                                                   |
| <b>MOVSX – Move with Sign-Extend</b>                         | 0000 1111 : 1011 111w : 11 reg1 reg2<br>0000 1111 : 1011 111w : mod reg r/m |
| <b>MOVZX – Move with Zero-Extend</b>                         | 0000 1111 : 1011 011w : 11 reg1 reg2<br>0000 1111 : 1011 011w : mod reg r/m |
| <b>MUL – Unsigned Multiply</b>                               | 1111 011w : 11 100 reg<br>1111 011w : mod 100 reg                           |
| AL, AX, or EAX with register                                 | 1111 011w : 11 011 reg                                                      |
| AL, AX, or EAX with memory                                   | 1111 011w : mod 011 r/m                                                     |
| <b>NEG – Two's Complement Negation</b>                       | 1001 0000                                                                   |
| register                                                     | 1111 011w : 11 011 reg                                                      |
| memory                                                       | 1111 011w : mod 011 r/m                                                     |
| <b>NOP – No Operation</b>                                    |                                                                             |
| <b>NOT – One's Complement Negation</b>                       |                                                                             |
| register                                                     | 1111 011w : 11 010 reg                                                      |
| memory                                                       | 1111 011w : mod 010 r/m                                                     |
| <b>OR – Logical Inclusive OR</b>                             |                                                                             |
| register1 to register2                                       | 0000 100w : 11 reg1 reg2                                                    |
| register2 to register1                                       | 0000 101w : 11 reg1 reg2                                                    |
| memory to register                                           | 0000 101w : mod reg r/m                                                     |
| register to memory                                           | 0000 100w : mod reg r/m                                                     |
| immediate to register                                        | 1000 00sw : 11 001 reg : immediate data                                     |
| immediate to AL, AX, or EAX                                  | 0000 110w : immediate data                                                  |
| immediate to memory                                          | 1000 00sw : mod 001 r/m : immediate data                                    |
| <b>OUT – Output to Port</b>                                  |                                                                             |
| fixed port                                                   | 1110 011w : port number                                                     |
| variable port                                                | 1110 111w                                                                   |
| <b>OUTS – Output to DX Port</b>                              | 0110 111w                                                                   |
| <b>POP – Pop a Word from the Stack</b>                       |                                                                             |
| register                                                     | 1000 1111 : 11 000 reg                                                      |
| register (alternate encoding)                                | 0101 1 reg                                                                  |
| memory                                                       | 1000 1111 : mod 000 r/m                                                     |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                                 | エンコーディング                            |
|-------------------------------------------------------------|-------------------------------------|
| <b>POP – Pop a Segment Register from the Stack</b>          |                                     |
| (注 : CS はこの使用法では sreg2 になれない)                               |                                     |
| segment register DS, ES                                     | 000 sreg2 111                       |
| segment register SS                                         | 000 sreg2 111                       |
| segment register FS, GS                                     | 0000 1111: 10 sreg3 001             |
| <b>POPA/POPAD – Pop All General Registers</b>               | 0110 0001                           |
| <b>POPF/POPFD – Pop Stack into FLAGS or EFLAGS Register</b> | 1001 1101                           |
| <b>PUSH – Push Operand onto the Stack</b>                   |                                     |
| register                                                    | 1111 1111 : 11 110 reg              |
| register (alternate encoding)                               | 0101 0 reg                          |
| memory                                                      | 1111 1111 : mod 110 r/m             |
| immediate                                                   | 0110 10s0 : immediate data          |
| <b>PUSH – Push Segment Register onto the Stack</b>          |                                     |
| segment register CS,DS,ES,SS                                | 000 sreg2 110                       |
| segment register FS,GS                                      | 0000 1111: 10 sreg3 000             |
| <b>PUSHA/PUSHAD – Push All General Registers</b>            | 0110 0000                           |
| <b>PUSHF/PUSHFD – Push Flags Register onto the Stack</b>    | 1001 1100                           |
| <b>RCL – Rotate thru Carry Left</b>                         |                                     |
| register by 1                                               | 1101 000w : 11 010 reg              |
| memory by 1                                                 | 1101 000w : mod 010 r/m             |
| register by CL                                              | 1101 001w : 11 010 reg              |
| memory by CL                                                | 1101 001w : mod 010 r/m             |
| register by immediate count                                 | 1100 000w : 11 010 reg : imm8 data  |
| memory by immediate count                                   | 1100 000w : mod 010 r/m : imm8 data |
| <b>RCR – Rotate thru Carry Right</b>                        |                                     |
| register by 1                                               | 1101 000w : 11 011 reg              |
| memory by 1                                                 | 1101 000w : mod 011 r/m             |
| register by CL                                              | 1101 001w : 11 011 reg              |
| memory by CL                                                | 1101 001w : mod 011 r/m             |
| register by immediate count                                 | 1100 000w : 11 011 reg : imm8 data  |
| memory by immediate count                                   | 1100 000w : mod 011 r/m : imm8 data |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                           | エンコーディング                            |
|-------------------------------------------------------|-------------------------------------|
| <b>RDMSR – Read from Model-Specific Register</b>      | 0000 1111 : 0011 0010               |
| <b>RDPMC – Read Performance Monitoring Counters</b>   | 0000 1111 : 0011 0011               |
| <b>RDTSC – Read Time-Stamp Counter</b>                | 0000 1111 : 0011 0001               |
| <b>REP INS – Input String</b>                         | 1111 0011 : 0110 110w               |
| <b>REP LODS – Load String</b>                         | 1111 0011 : 1010 110w               |
| <b>REP MOVS – Move String</b>                         | 1111 0011 : 1010 010w               |
| <b>REP OUTS – Output String</b>                       | 1111 0011 : 0110 111w               |
| <b>REP STOS – Store String</b>                        | 1111 0011 : 1010 101w               |
| <b>REPE CMPS – Compare String</b>                     | 1111 0011 : 1010 011w               |
| <b>REPE SCAS – Scan String</b>                        | 1111 0011 : 1010 111w               |
| <b>REPNE CMPS – Compare String</b>                    | 1111 0010 : 1010 011w               |
| <b>REPNE SCAS – Scan String</b>                       | 1111 0010 : 1010 111w               |
| <b>RET – Return from Procedure (to same segment)</b>  |                                     |
| no argument                                           | 1100 0011                           |
| adding immediate to SP                                | 1100 0010 : 16-bit displacement     |
| <b>RET – Return from Procedure (to other segment)</b> |                                     |
| intersegment                                          | 1100 1011                           |
| adding immediate to SP                                | 1100 1010 : 16-bit displacement     |
| <b>ROL – Rotate Left</b>                              |                                     |
| register by 1                                         | 1101 000w : 11 000 reg              |
| memory by 1                                           | 1101 000w : mod 000 r/m             |
| register by CL                                        | 1101 001w : 11 000 reg              |
| memory by CL                                          | 1101 001w : mod 000 r/m             |
| register by immediate count                           | 1100 000w : 11 000 reg : imm8 data  |
| memory by immediate count                             | 1100 000w : mod 000 r/m : imm8 data |
| <b>ROR – Rotate Right</b>                             |                                     |
| register by 1                                         | 1101 000w : 11 001 reg              |
| memory by 1                                           | 1101 000w : mod 001 r/m             |
| register by CL                                        | 1101 001w : 11 001 reg              |
| memory by CL                                          | 1101 001w : mod 001 r/m             |
| register by immediate count                           | 1100 000w : 11 001 reg : imm8 data  |
| memory by immediate count                             | 1100 000w : mod 001 r/m : imm8 data |
| <b>RSM – Resume from System Management Mode</b>       | 0000 1111 : 1010 1010               |
| <b>SAHF – Store AH into Flags</b>                     | 1001 1110                           |
| <b>SAL – Shift Arithmetic Left</b>                    | same instruction as SHL             |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                          | エンコーディング                                         |
|------------------------------------------------------|--------------------------------------------------|
| <b>SAR – Shift Arithmetic Right</b>                  |                                                  |
| register by 1                                        | 1101 000w : 11 111 reg                           |
| memory by 1                                          | 1101 000w : mod 111 r/m                          |
| register by CL                                       | 1101 001w : 11 111 reg                           |
| memory by CL                                         | 1101 001w : mod 111 r/m                          |
| register by immediate count                          | 1100 000w : 11 111 reg : imm8 data               |
| memory by immediate count                            | 1100 000w : mod 111 r/m : imm8 data              |
| <b>SBB – Integer Subtraction with Borrow</b>         |                                                  |
| register1 to register2                               | 0001 100w : 11 reg1 reg2                         |
| register2 to register1                               | 0001 101w : 11 reg1 reg2                         |
| memory to register                                   | 0001 101w : mod reg r/m                          |
| register to memory                                   | 0001 100w : mod reg r/m                          |
| immediate to register                                | 1000 00sw : 11 011 reg : immediate data          |
| immediate to AL, AX, or EAX                          | 0001 110w : immediate data                       |
| immediate to memory                                  | 1000 00sw : mod 011 r/m : immediate data         |
| <b>SCAS/SCASB/SCASW/SCASD – Scan String</b>          | 1010 111w                                        |
| <b>SETcc – Byte Set on Condition</b>                 |                                                  |
| register                                             | 0000 1111 : 1001 tttn : 11 000 reg               |
| memory                                               | 0000 1111 : 1001 tttn : mod 000 r/m              |
| <b>SGDT – Store Global Descriptor Table Register</b> | 0000 1111 : 0000 0001 : mod <sup>A</sup> 000 r/m |
| <b>SHL – Shift Left</b>                              |                                                  |
| register by 1                                        | 1101 000w : 11 100 reg                           |
| memory by 1                                          | 1101 000w : mod 100 r/m                          |
| register by CL                                       | 1101 001w : 11 100 reg                           |
| memory by CL                                         | 1101 001w : mod 100 r/m                          |
| register by immediate count                          | 1100 000w : 11 100 reg : imm8 data               |
| memory by immediate count                            | 1100 000w : mod 100 r/m : imm8 data              |
| <b>SHLD – Double Precision Shift Left</b>            |                                                  |
| register by immediate count                          | 0000 1111 : 1010 0100 : 11 reg2 reg1 : imm8      |
| memory by immediate count                            | 0000 1111 : 1010 0100 : mod reg r/m : imm8       |
| register by CL                                       | 0000 1111 : 1010 0101 : 11 reg2 reg1             |
| memory by CL                                         | 0000 1111 : 1010 0101 : mod reg r/m              |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                             | エンコーディング                                         |
|---------------------------------------------------------|--------------------------------------------------|
| <b>SHR – Shift Right</b>                                |                                                  |
| register by 1                                           | 1101 000w : 11 101 reg                           |
| memory by 1                                             | 1101 000w : mod 101 r/m                          |
| register by CL                                          | 1101 001w : 11 101 reg                           |
| memory by CL                                            | 1101 001w : mod 101 r/m                          |
| register by immediate count                             | 1100 000w : 11 101 reg : imm8 data               |
| memory by immediate count                               | 1100 000w : mod 101 r/m : imm8 data              |
| <b>SHRD – Double Precision Shift Right</b>              |                                                  |
| register by immediate count                             | 0000 1111 : 1010 1100 : 11 reg2 reg1 : imm8      |
| memory by immediate count                               | 0000 1111 : 1010 1100 : mod reg r/m : imm8       |
| register by CL                                          | 0000 1111 : 1010 1101 : 11 reg2 reg1             |
| memory by CL                                            | 0000 1111 : 1010 1101 : mod reg r/m              |
| <b>SIDT – Store Interrupt Descriptor Table Register</b> | 0000 1111 : 0000 0001 : mod <sup>A</sup> 001 r/m |
| <b>SLDT – Store Local Descriptor Table Register</b>     |                                                  |
| to register                                             | 0000 1111 : 0000 0000 : 11 000 reg               |
| to memory                                               | 0000 1111 : 0000 0000 : mod 000 r/m              |
| <b>SMSW – Store Machine Status Word</b>                 |                                                  |
| to register                                             | 0000 1111 : 0000 0001 : 11 100 reg               |
| to memory                                               | 0000 1111 : 0000 0001 : mod 100 r/m              |
| <b>STC – Set Carry Flag</b>                             | 1111 1001                                        |
| <b>STD – Set Direction Flag</b>                         | 1111 1101                                        |
| <b>STI – Set Interrupt Flag</b>                         | 1111 1011                                        |
| <b>STOS/STOSB/STOSW/STOSD – Store String Data</b>       | 1010 101w                                        |
| <b>STR – Store Task Register</b>                        |                                                  |
| to register                                             | 0000 1111 : 0000 0000 : 11 001 reg               |
| to memory                                               | 0000 1111 : 0000 0000 : mod 001 r/m              |
| <b>SUB – Integer Subtraction</b>                        |                                                  |
| register1 to register2                                  | 0010 100w : 11 reg1 reg2                         |
| register2 to register1                                  | 0010 101w : 11 reg1 reg2                         |
| memory to register                                      | 0010 101w : mod reg r/m                          |
| register to memory                                      | 0010 100w : mod reg r/m                          |
| immediate to register                                   | 1000 00sw : 11 101 reg : immediate data          |
| immediate to AL, AX, or EAX                             | 0010 110w : immediate data                       |
| immediate to memory                                     | 1000 00sw : mod 101 r/m : immediate data         |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                          | エンコーディング                                 |
|------------------------------------------------------|------------------------------------------|
| <b>TEST – Logical Compare</b>                        |                                          |
| register1 and register2                              | 1000 010w : 11 reg1 reg2                 |
| memory and register                                  | 1000 010w : mod reg r/m                  |
| immediate and register                               | 1111 011w : 11 000 reg : immediate data  |
| immediate and AL, AX, or EAX                         | 1010 100w : immediate data               |
| immediate and memory                                 | 1111 011w : mod 000 r/m : immediate data |
| <b>UD2 – Undefined instruction</b>                   | 0000 FFFF : 0000 1011                    |
| <b>VERR – Verify a Segment for Reading</b>           |                                          |
| register                                             | 0000 1111 : 0000 0000 : 11 100 reg       |
| memory                                               | 0000 1111 : 0000 0000 : mod 100 r/m      |
| <b>VERW – Verify a Segment for Writing</b>           |                                          |
| register                                             | 0000 1111 : 0000 0000 : 11 101 reg       |
| memory                                               | 0000 1111 : 0000 0000 : mod 101 r/m      |
| <b>WAIT – Wait</b>                                   | 1001 1011                                |
| <b>WBINVD – Writeback and Invalidate Data Cache</b>  | 0000 1111 : 0000 1001                    |
| <b>WRMSR – Write to Model-Specific Register</b>      | 0000 1111 : 0011 0000                    |
| <b>XADD – Exchange and Add</b>                       |                                          |
| register1, register2                                 | 0000 1111 : 1100 000w : 11 reg2 reg1     |
| memory, reg                                          | 0000 1111 : 1100 000w : mod reg r/m      |
| <b>XCHG – Exchange Register/Memory with Register</b> |                                          |
| register1 with register2                             | 1000 011w : 11 reg1 reg2                 |
| AX or EAX with reg                                   | 1001 0 reg                               |
| memory with reg                                      | 1000 011w : mod reg r/m                  |
| <b>XLAT/XLATB – Table Look-up Translation</b>        | 1101 0111                                |
| <b>XOR – Logical Exclusive OR</b>                    |                                          |
| register1 to register2                               | 0011 000w : 11 reg1 reg2                 |
| register2 to register1                               | 0011 001w : 11 reg1 reg2                 |
| memory to register                                   | 0011 001w : mod reg r/m                  |
| register to memory                                   | 0011 000w : mod reg r/m                  |
| immediate to register                                | 1000 00sw : 11 110 reg : immediate data  |
| immediate to AL, AX, or EAX                          | 0011 010w : immediate data               |
| immediate to memory                                  | 1000 00sw : mod 110 r/m : immediate data |

表 B-11. 汎用命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット         | エンコーディング  |
|---------------------|-----------|
| <b>Prefix Bytes</b> |           |
| address size        | 0110 0111 |
| LOCK                | 1111 0000 |
| operand size        | 0110 0110 |
| CS segment override | 0010 1110 |
| DS segment override | 0011 1110 |
| ES segment override | 0010 0110 |
| FS segment override | 0110 0100 |
| GS segment override | 0110 0101 |
| SS segment override | 0011 0110 |

### B.3. インテル® Pentium® プロセッサ・ファミリ命令の フォーマットとエンコーディング

以下の表に、インテル® Pentium® プロセッサ・ファミリで導入されたフォーマットとエンコーディングを示す。

表 B-12. インテル® Pentium® プロセッサ・ファミリ命令のフォーマットとエンコーディング

| 命令およびフォーマット                                     | エンコーディング                            |
|-------------------------------------------------|-------------------------------------|
| <b>CMPXCHG8B – Compare and Exchange 8 Bytes</b> |                                     |
| memory, register                                | 0000 1111 : 1100 0111 : mod 001 r/m |

## B.4. MMX® 命令のフォーマットおよびエンコーディング

EMMS 命令を除くすべての MMX® 命令は、2 バイトのインテル・アーキテクチャ整数フォーマットと同様のフォーマットを使用する。これらのフォーマット内のサブフィールド・エンコーディングの詳細について以下に説明する。

### B.4.1. グラニュラリティ・フィールド (gg)

グラニュラリティ・フィールド (gg) では、命令が操作するパックド・オペランドのサイズを指定する。このフィールドは、使用するときは、第 2 オペコード・バイトのビット 1 と 0 になる。表 B-13. に、この gg フィールドのエンコーディングを示す。

表 B-13. データ・フィールドのグラニュラリティ (gg) のエンコーディング

| gg | データのグラニュラリティ |
|----|--------------|
| 00 | パックドバイト      |
| 01 | パックドワード      |
| 10 | パックド・ダブルワード  |
| 11 | クワッドワード      |

### B.4.2. MMX® テクノロジおよび汎用レジスタ・フィールド (mmxreg および reg)

MMX® テクノロジ・レジスタ (mmxreg) は、オペランドとして使用すると、ModR/M バイトの reg フィールド (ビット 5, 4, 3) または R/M フィールド (ビット 2, 1, 0)、またはその両方にコード化される。

MMX 命令が汎用レジスタ (reg) を操作する場合は、レジスタは ModR/M バイトの R/M フィールドにコード化される。

### B.4.3. MMX® 命令のフォーマットおよびエンコーディングの表

表 B-14. に、整数命令のフォーマットとエンコーディングを示す。

表 B-14. MMX® 命令のフォーマットおよびエンコーディング

| 命令およびフォーマット                                                                     | エンコーディング                                |
|---------------------------------------------------------------------------------|-----------------------------------------|
| <b>EMMS – Empty MMX technology state</b>                                        | 0000 1111:01110111                      |
| <b>MOVD – Move doubleword</b>                                                   |                                         |
| reg to mmxreg                                                                   | 0000 1111:01101110: 11 mmxreg reg       |
| reg from mmxreg                                                                 | 0000 1111:01111110: 11 mmxreg reg       |
| mem to mmxreg                                                                   | 0000 1111:01101110: mod mmxreg r/m      |
| mem from mmxreg                                                                 | 0000 1111:01111110: mod mmxreg r/m      |
| <b>MOVQ – Move quadword</b>                                                     |                                         |
| mmxreg2 to mmxreg1                                                              | 0000 1111:01101111: 11 mmxreg1 mmxreg2  |
| mmxreg2 from mmxreg1                                                            | 0000 1111:01111111: 11 mmxreg1 mmxreg2  |
| mem to mmxreg                                                                   | 0000 1111:01101111: mod mmxreg r/m      |
| mem from mmxreg                                                                 | 0000 1111:01111111: mod mmxreg r/m      |
| <b>PACKSSDW<sup>1</sup> – Pack dword to word data (signed with saturation)</b>  |                                         |
| mmxreg2 to mmxreg1                                                              | 0000 1111:01101011: 11 mmxreg1 mmxreg2  |
| memory to mmxreg                                                                | 0000 1111:01101011: mod mmxreg r/m      |
| <b>PACKSSWB<sup>1</sup> – Pack word to byte data (signed with saturation)</b>   |                                         |
| mmxreg2 to mmxreg1                                                              | 0000 1111:01100011: 11 mmxreg1 mmxreg2  |
| memory to mmxreg                                                                | 0000 1111:01100011: mod mmxreg r/m      |
| <b>PACKUSWB<sup>1</sup> – Pack word to byte data (unsigned with saturation)</b> |                                         |
| mmxreg2 to mmxreg1                                                              | 0000 1111:01100111: 11 mmxreg1 mmxreg2  |
| memory to mmxreg                                                                | 0000 1111:01100111: mod mmxreg r/m      |
| <b>PADD – Add with wrap-around</b>                                              |                                         |
| mmxreg2 to mmxreg1                                                              | 0000 1111: 111111gg: 11 mmxreg1 mmxreg2 |
| memory to mmxreg                                                                | 0000 1111: 111111gg: mod mmxreg r/m     |
| <b>PADDS – Add signed with saturation</b>                                       |                                         |
| mmxreg2 to mmxreg1                                                              | 0000 1111: 111011gg: 11 mmxreg1 mmxreg2 |
| memory to mmxreg                                                                | 0000 1111: 111011gg: mod mmxreg r/m     |
| <b>PADDUS – Add unsigned with saturation</b>                                    |                                         |
| mmxreg2 to mmxreg1                                                              | 0000 1111: 110111gg: 11 mmxreg1 mmxreg2 |
| memory to mmxreg                                                                | 0000 1111: 110111gg: mod mmxreg r/m     |
| <b>PAND – Bitwise And</b>                                                       |                                         |
| mmxreg2 to mmxreg1                                                              | 0000 1111:11011011: 11 mmxreg1 mmxreg2  |
| memory to mmxreg                                                                | 0000 1111:11011011: mod mmxreg r/m      |

表 B-14. MMX® 命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                                     | エンコーディング                                     |
|-----------------------------------------------------------------|----------------------------------------------|
| <b>PANDN – Bitwise AndNot</b>                                   |                                              |
| mmxreg2 to mmxreg1                                              | 0000 1111:11011111: 11 mmxreg1 mmxreg2       |
| memory to mmxreg                                                | 0000 1111:11011111: mod mmxreg r/m           |
| <b>PCMPEQ – Packed compare for equality</b>                     |                                              |
| mmxreg1 with mmxreg2                                            | 0000 1111:011101gg: 11 mmxreg1 mmxreg2       |
| mmxreg with memory                                              | 0000 1111:011101gg: mod mmxreg r/m           |
| <b>PCMPGT – Packed compare greater (signed)</b>                 |                                              |
| mmxreg1 with mmxreg2                                            | 0000 1111:011001gg: 11 mmxreg1 mmxreg2       |
| mmxreg with memory                                              | 0000 1111:011001gg: mod mmxreg r/m           |
| <b>PMADDWD – Packed multiply add</b>                            |                                              |
| mmxreg2 to mmxreg1                                              | 0000 1111:11110101: 11 mmxreg1 mmxreg2       |
| memory to mmxreg                                                | 0000 1111:11110101: mod mmxreg r/m           |
| <b>PMUL</b>                                                     |                                              |
| <b>\HUW – Packed multiplication, store high word (unsigned)</b> |                                              |
| mmxreg2 to mmxreg1                                              | 0000 1111: 1110 0100: 11 mmxreg1 mmxreg2     |
| memory to mmxreg                                                | 0000 1111: 1110 0100: mod mmxreg r/m         |
| <b>PMULHW – Packed multiplication, store high word</b>          |                                              |
| mmxreg2 to mmxreg1                                              | 0000 1111:11100101: 11 mmxreg1 mmxreg2       |
| memory to mmxreg                                                | 0000 1111:11100101: mod mmxreg r/m           |
| <b>PMULLW – Packed multiplication, store high word</b>          |                                              |
| mmxreg2 to mmxreg1                                              | 0000 1111:11010101: 11 mmxreg1 mmxreg2       |
| memory to mmxreg                                                | 0000 1111:11010101: mod mmxreg r/m           |
| <b>POR – Bitwise Or</b>                                         |                                              |
| mmxreg2 to mmxreg1                                              | 0000 1111:11101011: 11 mmxreg1 mmxreg2       |
| memory to mmxreg                                                | 0000 1111:11101011: mod mmxreg r/m           |
| <b>PSLL<sup>2</sup> – Packed shift left logical</b>             |                                              |
| mmxreg1 by mmxreg2                                              | 0000 1111:111100gg: 11 mmxreg1 mmxreg2       |
| mmxreg by memory                                                | 0000 1111:111100gg: mod mmxreg r/m           |
| mmxreg by immediate                                             | 0000 1111:011100gg: 11 110 mmxreg: imm8 data |
| <b>PSRA<sup>2</sup> – Packed shift right arithmetic</b>         |                                              |
| mmxreg1 by mmxreg2                                              | 0000 1111:111000gg: 11 mmxreg1 mmxreg2       |
| mmxreg by memory                                                | 0000 1111:111000gg: mod mmxreg r/m           |
| mmxreg by immediate                                             | 0000 1111:011100gg: 11 100 mmxreg: imm8 data |

表 B-14. MMX® 命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                           | エンコーディング                                     |
|-------------------------------------------------------|----------------------------------------------|
| <b>PSRL<sup>2</sup> – Packed shift right logical</b>  |                                              |
| mmxreg1 by mmxreg2                                    | 0000 1111:110100gg: 11 mmxreg1 mmxreg2       |
| mmxreg by memory                                      | 0000 1111:110100gg: mod mmxreg r/m           |
| mmxreg by immediate                                   | 0000 1111:011100gg: 11 010 mmxreg: imm8 data |
| <b>PSUB – Subtract with wrap-around</b>               |                                              |
| mmxreg2 from mmxreg1                                  | 0000 1111:111110gg: 11 mmxreg1 mmxreg2       |
| memory from mmxreg                                    | 0000 1111:111110gg: mod mmxreg r/m           |
| <b>PSUBS – Subtract signed with saturation</b>        |                                              |
| mmxreg2 from mmxreg1                                  | 0000 1111:111010gg: 11 mmxreg1 mmxreg2       |
| memory from mmxreg                                    | 0000 1111:111010gg: mod mmxreg r/m           |
| <b>PSUBUS – Subtract unsigned with saturation</b>     |                                              |
| mmxreg2 from mmxreg1                                  | 0000 1111:110110gg: 11 mmxreg1 mmxreg2       |
| memory from mmxreg                                    | 0000 1111:110110gg: mod mmxreg r/m           |
| <b>PUNPCKH – Unpack high data to next larger type</b> |                                              |
| mmxreg2 to mmxreg1                                    | 0000 1111:011010gg: 11 mmxreg1 mmxreg2       |
| memory to mmxreg                                      | 0000 1111:011010gg: mod mmxreg r/m           |
| <b>PUNPCKL – Unpack low data to next larger type</b>  |                                              |
| mmxreg2 to mmxreg1                                    | 0000 1111:011000gg: 11 mmxreg1 mmxreg2       |
| memory to mmxreg                                      | 0000 1111:011000gg: mod mmxreg r/m           |
| <b>PXOR – Bitwise Xor</b>                             |                                              |
| mmxreg2 to mmxreg1                                    | 0000 1111:11101111: 11 mmxreg1 mmxreg2       |
| memory to mmxreg                                      | 0000 1111:11101111: mod mmxreg r/m           |

注：

- パック命令は、1つの型の符号付きパックドデータを次に小さい型の符号付きまたは符号なしデータに飽和させる。
- シフト命令のフォーマットには、即値シフトカウントによるシフトをサポートするためのもう1つのフォーマットがある。シフト操作は、すべてのデータ型に対して等しくサポートされているわけではない。

## B.5. P6 ファミリ命令のフォーマットとエンコーディング

表 B-15. に、P6 ファミリ・プロセッサにおいて IA-32 アーキテクチャに導入された命令のいくつかについて、そのフォーマットとエンコーディングを示す。

表 B-15. P6 ファミリ命令のフォーマットとエンコーディング

| 命令およびフォーマット                                                         | エンコーディング                                    |
|---------------------------------------------------------------------|---------------------------------------------|
| <b>CMOVcc – Conditional Move</b>                                    |                                             |
| register2 to register1                                              | 0000 1111: 0100 tttn : 11 reg1 reg2         |
| memory to register                                                  | 0000 1111 : 0100 tttn : mod reg r/m         |
| <b>FCMOVcc – Conditional Move on EFLAG Register Condition Codes</b> |                                             |
| move if below (B)                                                   | 11011 010 : 11 000 ST(i)                    |
| move if equal (E)                                                   | 11011 010 : 11 001 ST(i)                    |
| move if below or equal (BE)                                         | 11011 010 : 11 010 ST(i)                    |
| move if unordered (U)                                               | 11011 010 : 11 011 ST(i)                    |
| move if not below (NB)                                              | 11011 011 : 11 000 ST(i)                    |
| move if not equal (NE)                                              | 11011 011 : 11 001 ST(i)                    |
| move if not below or equal (NBE)                                    | 11011 011 : 11 010 ST(i)                    |
| move if not unordered (NU)                                          | 11011 011 : 11 011 ST(i)                    |
| <b>FCOMI – Compare Real and Set EFLAGS</b>                          | 11011 011 : 11 110 ST(i)                    |
| <b>FXRSTOR – Restore x87 FPU, MMX, SSE, and SSE2 State</b>          | 00001111:10101110: mod <sup>A</sup> 001 r/m |
| <b>FXSAVE – Save x87 FPU, MMX, SSE, and SSE2 State</b>              | 00001111:10101110: mod <sup>A</sup> 000 r/m |
| <b>SYSENTER – Fast System Call</b>                                  | 00001111:00110100                           |
| <b>SYSEXIT – Fast Return from Fast System Call</b>                  | 00001111:00110101                           |

注：

1. FXSAVE 命令および FXRSTOR 命令では、"mod = 11" は予約されている。

## B.6. SSE 命令のフォーマットとエンコーディング

SSE 命令は ModR/M フォーマットを使用し、先頭に 0FH プリフィックス・バイトが付く。一般に、一度の処理で二方向の動作（すなわち、ロード処理とストア処理）を実行することができる。

以下の3つの表（表 B-16.、B-17.、B-18.）は、それぞれ、SSE SIMD 浮動小数点命令、SSE SIMD 整数命令、SSE キャッシュ可能/メモリ順序付け命令のフォーマットとエンコーディングを示している。SSE の中には、2 バイト・オペコードの一部として必須のプリフィックスである 66H、F2H、F3H を必要とするものがある。これらの必須プリフィックスは表の中に含まれている。

表 B-16. SSE 浮動小数点命令のフォーマットとエンコーディング

| 命令およびフォーマット                                                                              | エンコーディング                                            |
|------------------------------------------------------------------------------------------|-----------------------------------------------------|
| <b>ADDPS – Add Packed Single-Precision Floating-Point Values</b>                         |                                                     |
| xmmreg to xmmreg                                                                         | 00001111:01011000:11 xmmreg1 xmmreg2                |
| mem to xmmreg                                                                            | 00001111:01011000: mod xmmreg r/m                   |
| <b>ADDS – Add Scalar Single-Precision Floating-Point Values</b>                          |                                                     |
| xmmreg to xmmreg                                                                         | 11110011:00001111:01011000:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                                            | 11110011:00001111:01011000: mod xmmreg r/m          |
| <b>ANDNPS – Bitwise Logical AND NOT of Packed Single-Precision Floating-Point Values</b> |                                                     |
| xmmreg to xmmreg                                                                         | 00001111:01010101:11 xmmreg1 xmmreg2                |
| mem to xmmreg                                                                            | 00001111:01010101: mod xmmreg r/m                   |
| <b>ANDPS – Bitwise Logical AND of Packed Single-Precision Floating-Point Values</b>      |                                                     |
| xmmreg to xmmreg                                                                         | 00001111:01010100:11 xmmreg1 xmmreg2                |
| mem to xmmreg                                                                            | 00001111:01010100: mod xmmreg r/m                   |
| <b>CMPPS – Compare Packed Single-Precision Floating-Point Values</b>                     |                                                     |
| xmmreg to xmmreg, imm8                                                                   | 00001111:11000010:11 xmmreg1 xmmreg2: imm8          |
| mem to xmmreg, imm8                                                                      | 00001111:11000010: mod xmmreg r/m: imm8             |
| <b>CMPSS – Compare Scalar Single-Precision Floating-Point Values</b>                     |                                                     |
| xmmreg to xmmreg, imm8                                                                   | 11110011:00001111:11000010:11 xmmreg1 xmmreg2: imm8 |
| mem to xmmreg, imm8                                                                      | 11110011:00001111:11000010: mod xmmreg r/m: imm8    |

表 B-16. SSE 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                                                            | エンコーディング                                      |
|------------------------------------------------------------------------------------------------------------------------|-----------------------------------------------|
| <b>COMISS – Compare Scalar Ordered Single-Precision Floating-Point Values and Set EFLAGS</b>                           |                                               |
| xmmreg to xmmreg                                                                                                       | 00001111:00101111:11 xmmreg1 xmmreg2          |
| mem to xmmreg                                                                                                          | 00001111:00101111: mod xmmreg r/m             |
| <b>CVTPI2PS – Convert Packed Doubleword Integers to Packed Single-Precision Floating-Point Values</b>                  |                                               |
| mmreg to xmmreg                                                                                                        | 00001111:00101010:11 xmmreg1 mmreg1           |
| mem to xmmreg                                                                                                          | 00001111:00101010: mod xmmreg r/m             |
| <b>CVTPS2PI – Convert Packed Single-Precision Floating-Point Values to Packed Doubleword Integers</b>                  |                                               |
| xmmreg to mmreg                                                                                                        | 00001111:00101101:11 mmreg1 xmmreg1           |
| mem to mmreg                                                                                                           | 00001111:00101101: mod mmreg r/m              |
| <b>CVTSI2SS – Convert Doubleword Integer to Scalar Single-Precision Floating-Point Value</b>                           |                                               |
| r32 to xmmreg                                                                                                          | 11110011:00001111:00101010:11 xmmreg r32      |
| mem to xmmreg                                                                                                          | 11110011:00001111:00101010: mod xmmreg r/m    |
| <b>CVTSS2SI – Convert Scalar Single-Precision Floating-Point Value to Doubleword Integer</b>                           |                                               |
| xmmreg to r32                                                                                                          | 11110011:00001111:00101101:11 r32 xmmreg      |
| mem to r32                                                                                                             | 11110011:00001111:00101101: mod r32 r/m       |
| <b>CVTPPS2PI – Convert with Truncation Packed Single-Precision Floating-Point Values to Packed Doubleword Integers</b> |                                               |
| xmmreg to mmreg                                                                                                        | 00001111:00101100:11 mmreg1 xmmreg1           |
| mem to mmreg                                                                                                           | 00001111:00101100: mod mmreg r/m              |
| <b>CVTTSS2SI – Convert with Truncation Scalar Single-Precision Floating-Point Value to Doubleword Integer</b>          |                                               |
| xmmreg to r32                                                                                                          | 11110011:00001111:00101100:11 r32 xmmreg1     |
| mem to r32                                                                                                             | 11110011:00001111:00101100: mod r32 r/m       |
| <b>DIVPS – Divide Packed Single-Precision Floating-Point Values</b>                                                    |                                               |
| xmmreg to xmmreg                                                                                                       | 00001111:01011110:11 xmmreg1 xmmreg2          |
| mem to xmmreg                                                                                                          | 00001111:01011110: mod xmmreg r/m             |
| <b>DIVSS – Divide Scalar Single-Precision Floating-Point Values</b>                                                    |                                               |
| xmmreg to xmmreg                                                                                                       | 11110011:00001111:01011110:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                          | 11110011:00001111:01011110: mod xmmreg r/m    |

表 B-16. SSE 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                                                                                                | エンコーディング                                                                                                                                               |
|------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------|
| <b>LDMXCSR – Load MXCSR Register State</b><br>m32 to MXCSR                                                                                                 | 00001111:10101110:mod <sup>A</sup> 010 mem                                                                                                             |
| <b>MAXPS – Return Maximum Packed Single-Precision Floating-Point Values</b><br>xmmreg to xmmreg<br>mem to xmmreg                                           | 00001111:01011111:11 xmmreg1 xmmreg2<br>00001111:01011111: mod xmmreg r/m                                                                              |
| <b>MAXSS – Return Maximum Scalar Double-Precision Floating-Point Value</b><br>xmmreg to xmmreg<br>mem to xmmreg                                            | 11110011:00001111:01011111:11 xmmreg1 xmmreg2<br>11110011:00001111:01011111: mod xmmreg r/m                                                            |
| <b>MINPS – Return Minimum Packed Double-Precision Floating-Point Values</b><br>xmmreg to xmmreg<br>mem to xmmreg                                           | 00001111:01011101:11 xmmreg1 xmmreg2<br>00001111:01011101: mod xmmreg r/m                                                                              |
| <b>MINSS – Return Minimum Scalar Double-Precision Floating-Point Value</b><br>xmmreg to xmmreg<br>mem to xmmreg                                            | 11110011:00001111:01011101:11 xmmreg1 xmmreg2<br>11110011:00001111:01011101: mod xmmreg r/m                                                            |
| <b>MOVAPS – Move Aligned Packed Single-Precision Floating-Point Values</b><br>xmmreg2 to xmmreg1<br>mem to xmmreg1<br>xmmreg1 to xmmreg2<br>xmmreg1 to mem | 00001111:00101000:11 xmmreg2 xmmreg1<br>00001111:00101000: mod xmmreg r/m<br>00001111:00101001:11 xmmreg1 xmmreg2<br>00001111:00101001: mod xmmreg r/m |
| <b>MOVLHPS – Move Packed Single-Precision Floating-Point Values High to Low</b><br>xmmreg to xmmreg                                                        | 00001111:00010010:11 xmmreg1 xmmreg2                                                                                                                   |
| <b>MOVHPS – Move High Packed Single-Precision Floating-Point Values</b><br>mem to xmmreg<br>xmmreg to mem                                                  | 00001111:00010110: mod xmmreg r/m<br>00001111:00010111: mod xmmreg r/m                                                                                 |
| <b>MOVLHPS – Move Packed Single-Precision Floating-Point Values Low to High</b><br>xmmreg to xmmreg                                                        | 00001111:00010110:11 xmmreg1 xmmreg2                                                                                                                   |
| <b>MOVLPS – Move Low Packed Single-Precision Floating-Point Values</b><br>mem to xmmreg<br>xmmreg to mem                                                   | 00001111:00010010: mod xmmreg r/m<br>00001111:00010011: mod xmmreg r/m                                                                                 |

表 B-16. SSE 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                         | エンコーディング                                      |
|-------------------------------------------------------------------------------------|-----------------------------------------------|
| <b>MOVMSKPS – Extract Packed Single-Precision Floating-Point Sign Mask</b>          |                                               |
| xmmreg to r32                                                                       | 00001111:01010000:11 r32 xmmreg               |
| <b>MOVSS – Move Scalar Single-Precision Floating-Point Values</b>                   |                                               |
| xmmreg2 to xmmreg1                                                                  | 11110011:00001111:00010000:11 xmmreg2 xmmreg1 |
| mem to xmmreg1                                                                      | 11110011:00001111:00010000: mod xmmreg r/m    |
| xmmreg1 to xmmreg2                                                                  | 11110011:00001111:00010001:11 xmmreg1 xmmreg2 |
| xmmreg1 to mem                                                                      | 11110011:00001111:00010001: mod xmmreg r/m    |
| <b>MOVUPS – Move Unaligned Packed Single-Precision Floating-Point Values</b>        |                                               |
| xmmreg2 to xmmreg1                                                                  | 00001111:00010000:11 xmmreg2 xmmreg1          |
| mem to xmmreg1                                                                      | 00001111:00010000: mod xmmreg r/m             |
| xmmreg1 to xmmreg2                                                                  | 00001111:00010001:11 xmmreg1 xmmreg2          |
| xmmreg1 to mem                                                                      | 00001111:00010001: mod xmmreg r/m             |
| <b>MULPS – Multiply Packed Single-Precision Floating-Point Values</b>               |                                               |
| xmmreg to xmmreg                                                                    | 00001111:01011001:11 xmmreg1 xmmreg2          |
| mem to xmmreg                                                                       | 00001111:01011001: mod xmmreg rm              |
| <b>MULSS – Multiply Scalar Single-Precision Floating-Point Values</b>               |                                               |
| xmmreg to xmmreg                                                                    | 11110011:00001111:01011001:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                       | 11110011:00001111:01011001: mod xmmreg r/m    |
| <b>ORPS – Bitwise Logical OR of Single-Precision Floating-Point Values</b>          |                                               |
| xmmreg to xmmreg                                                                    | 00001111:01010110:11 xmmreg1 xmmreg2          |
| mem to xmmreg                                                                       | 00001111:01010110 mod xmmreg r/m              |
| <b>RCPPS – Compute Reciprocals of Packed Single-Precision Floating-Point Values</b> |                                               |
| xmmreg to xmmreg                                                                    | 00001111:01010011:11 xmmreg1 xmmreg2          |
| mem to xmmreg                                                                       | 00001111:01010011: mod xmmreg r/m             |
| <b>RCPSS – Compute Reciprocals of Scalar Single-Precision Floating-Point Value</b>  |                                               |
| xmmreg to xmmreg                                                                    | 11110011:00001111:01010011:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                       | 11110011:00001111:01010011: mod xmmreg r/m    |

表 B-16. SSE 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                                             | エンコーディング                                       |
|---------------------------------------------------------------------------------------------------------|------------------------------------------------|
| <b>RSQRTPS – Compute Reciprocals of Square Roots of Packed Single-Precision Floating-Point Values</b>   |                                                |
| xmmreg to xmmreg                                                                                        | 00001111:01010010:11 xmmreg1 xmmreg2           |
| mem to xmmreg                                                                                           | 00001111:01010010 mode xmmreg r/m              |
| <b>RSQRTSS – Compute Reciprocals of Square Roots of Scalar Single-Precision Floating-Point Value</b>    |                                                |
| xmmreg to xmmreg                                                                                        | 11110011:00001111:01010010:11 xmmreg1 xmmreg2  |
| mem to xmmreg                                                                                           | 11110011:00001111:01010010 mod xmmreg r/m      |
| <b>SHUFPS – Shuffle Packed Single-Precision Floating-Point Values</b>                                   |                                                |
| xmmreg to xmmreg, imm8                                                                                  | 00001111:11000110:11 xmmreg1 xmmreg2: imm8     |
| mem to xmmreg, imm8                                                                                     | 00001111:11000110: mod xmmreg r/m: imm8        |
| <b>SQRTPS – Compute Square Roots of Packed Single-Precision Floating-Point Values</b>                   |                                                |
| xmmreg to xmmreg                                                                                        | 00001111:01010001:11 xmmreg1 xmmreg 2          |
| mem to xmmreg                                                                                           | 00001111:01010001 mod xmmreg r/m               |
| <b>SQRTSS – Compute Square Root of Scalar Single-Precision Floating-Point Value</b>                     |                                                |
| xmmreg to xmmreg                                                                                        | 01010011:00001111:01010001:11 xmmreg1 xmmreg 2 |
| mem to xmmreg                                                                                           | 01010011:00001111:01010001 mod xmmreg r/m      |
| <b>STMXCSR – Store MXCSR Register State</b>                                                             |                                                |
| MXCSR to mem                                                                                            | 00001111:10101110:mod <sup>A</sup> 011 mem     |
| <b>SUBPS – Subtract Packed Single-Precision Floating-Point Values</b>                                   |                                                |
| xmmreg to xmmreg                                                                                        | 00001111:01011100:11 xmmreg1 xmmreg2           |
| mem to xmmreg                                                                                           | 00001111:01011100 mod xmmreg r/m               |
| <b>SUBSS – Subtract Scalar Single-Precision Floating-Point Values</b>                                   |                                                |
| xmmreg to xmmreg                                                                                        | 11110011:00001111:01011100:11 xmmreg1 xmmreg2  |
| mem to xmmreg                                                                                           | 11110011:00001111:01011100 mod xmmreg r/m      |
| <b>UCOMISS – Unordered Compare Scalar Ordered Single-Precision Floating-Point Values and Set EFLAGS</b> |                                                |
| xmmreg to xmmreg                                                                                        | 00001111:00101110:11 xmmreg1 xmmreg2           |
| mem to xmmreg                                                                                           | 00001111:00101110 mod xmmreg r/m               |
| <b>UNPCKHPS – Unpack and Interleave High Packed Single-Precision Floating-Point Values</b>              |                                                |
| xmmreg to xmmreg                                                                                        | 00001111:00010101:11 xmmreg1 xmmreg2           |
| mem to xmmreg                                                                                           | 00001111:00010101 mod xmmreg r/m               |

表 B-16. SSE 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                                                                    | エンコーディング                                                                 |
|--------------------------------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------|
| <b>UNPCKLPS – Unpack and Interleave Low Packed Single-Precision Floating-Point Values</b><br>xmmreg to xmmreg<br>mem to xmmreg | 00001111:00010100:11 xmmreg1 xmmreg2<br>00001111:00010100 mod xmmreg r/m |
| <b>XORPS – Bitwise Logical XOR of Single-Precision Floating-Point Values</b><br>xmmreg to xmmreg<br>mem to xmmreg              | 00001111:01010111:11 xmmreg1 xmmreg2<br>00001111:01010111 mod xmmreg r/m |

表 B-17. SSE SIMD 整数命令のフォーマットとエンコーディング

| 命令およびフォーマット                                                                                | エンコーディング                                                                                                                                       |
|--------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------|
| <b>PAVGB/PAVGW – Average Packed Integers</b><br>mmreg to mmreg<br>mem to mmreg             | 00001111:11100000:11 mmreg1 mmreg2<br>00001111:11100011:11 mmreg1 mmreg2<br>00001111:11100000 mod mmreg r/m<br>00001111:11100011 mod mmreg r/m |
| <b>PEXTRW – Extract Word</b><br>mmreg to reg32, imm8                                       | 00001111:11000101:11 r32 mmreg; imm8                                                                                                           |
| <b>PINSRW – Insert Word</b><br>reg32 to mmreg, imm8<br>m16 to mmreg, imm8                  | 00001111:11000100:11 mmreg r32: imm8<br>00001111:11000100 mod mmreg r/m: imm8                                                                  |
| <b>PMAXSW – Maximum of Packed Signed Word Integers</b><br>mmreg to mmreg<br>mem to mmreg   | 00001111:11101110:11 mmreg1 mmreg2<br>00001111:11101110 mod mmreg r/m                                                                          |
| <b>PMAXUB – Maximum of Packed Unsigned Byte Integers</b><br>mmreg to mmreg<br>mem to mmreg | 00001111:11011110:11 mmreg1 mmreg2<br>00001111:11011110 mod mmreg r/m                                                                          |
| <b>PMINSW – Minimum of Packed Signed Word Integers</b><br>mmreg to mmreg<br>mem to mmreg   | 00001111:11101010:11 mmreg1 mmreg2<br>00001111:11101010 mod mmreg r/m                                                                          |
| <b>PMINUB – Minimum of Packed Unsigned Byte Integers</b><br>mmreg to mmreg<br>mem to mmreg | 00001111:11011010:11 mmreg1 mmreg2<br>00001111:11011010 mod mmreg r/m                                                                          |

表 B-17. SSE SIMD 整数命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                              | エンコーディング                                 |
|--------------------------------------------------------------------------|------------------------------------------|
| <b>PMOVMSKB – Move Byte Mask To Integer</b>                              |                                          |
| mmreg to reg32                                                           | 00001111:11010111:11 r32 mmreg           |
| <b>PMULHUW – Multiply Packed Unsigned Integers and Store High Result</b> |                                          |
| mmreg to mmreg                                                           | 00001111:11100100:11 mmreg1 mmreg2       |
| mem to mmreg                                                             | 00001111:11100100 mod mmreg r/m          |
| <b>PSADBW – Compute Sum of Absolute Differences</b>                      |                                          |
| mmreg to mmreg                                                           | 00001111:11110110:11 mmreg1 mmreg2       |
| mem to mmreg                                                             | 00001111:11110110 mod mmreg r/m          |
| <b>PSHUFW – Shuffle Packed Words</b>                                     |                                          |
| mmreg to mmreg, imm8                                                     | 00001111:01110000:11 mmreg1 mmreg2: imm8 |
| mem to mmreg, imm8                                                       | 00001111:01110000:11 mod mmreg r/m: imm8 |

表 B-18. SSE キャッシュ可能 / メモリ順序付け命令のフォーマットとエンコーディング

| 命令およびフォーマット                                                                                  | エンコーディング                                   |
|----------------------------------------------------------------------------------------------|--------------------------------------------|
| <b>MASKMOVQ – Store Selected Bytes of Quadword</b>                                           |                                            |
| mmreg to mmreg                                                                               | 00001111:11110111:11 mmreg1 mmreg2         |
| <b>MOVNTPS – Store Packed Single-Precision Floating-Point Values Using Non-Temporal Hint</b> |                                            |
| xmmreg to mem                                                                                | 00001111:00101011 mod xmmreg r/m           |
| <b>MOVNTQ – Store Quadword Using Non-Temporal Hint</b>                                       |                                            |
| mmreg to mem                                                                                 | 00001111:11100111: mod mmreg r/m           |
| <b>PREFETCHT0 – Prefetch Temporal to All Cache Levels</b>                                    |                                            |
|                                                                                              | 00001111:00011000:mod <sup>A</sup> 001 mem |
| <b>PREFETCHT1 – Prefetch Temporal to First Level Cache</b>                                   |                                            |
|                                                                                              | 00001111:00011000:mod <sup>A</sup> 010 mem |
| <b>PREFETCHT2 – Prefetch Temporal to Second Level Cache</b>                                  |                                            |
|                                                                                              | 00001111:00011000:mod <sup>A</sup> 011 mem |
| <b>PREFETCHNTA – Prefetch Non-Temporal to All Cache Levels</b>                               |                                            |
|                                                                                              | 00001111:00011000:mod <sup>A</sup> 000 mem |
| <b>SFENCE – Store Fence</b>                                                                  |                                            |
|                                                                                              | 00001111:10101110:11 111 000               |

## B.7. SSE2 命令のフォーマットとエンコーディング

SSE2 命令は ModR/M フォーマットを使用し、先頭に 0FH プリフィックス・バイトが付く。一般に、一度の処理で二方向の動作（すなわち、ロード処理とストア処理）を実行することができる。

以下の 3 つの表は、それぞれ、SSE2 SIMD 浮動小数点命令、SSE2 SIMD 整数命令、SSE2 キャッシュ可能命令のフォーマットとエンコーディングを示している。SSE2 の中には、2 バイト・オペコードの一部として必須のプリフィックスである 66H、F2H、F3H を必要とするものがある。これらの必須プリフィックスは表の中に含まれている。

### B.7.1. グラニュラリティ・フィールド (gg)

グラニュラリティ・フィールド (gg) では、命令の操作対象となるパックド・オペランドのサイズを指定する。このフィールドは、第 2 オペコード・バイトのビット 1 と 0 である。表 B-21. に、この gg フィールドのエンコーディングを示す。

表 B-19. データ・フィールドのグラニュラリティ (gg) のエンコーディング

| gg | データのグラニュラリティ |
|----|--------------|
| 00 | パックドバイト      |
| 01 | パックドワード      |
| 10 | パックド・ダブルワード  |
| 11 | クワッドワード      |

表 B-20. SSE2 浮動小数点命令のフォーマットとエンコーディング

| 命令およびフォーマット                                                                              | エンコーディング                                      |
|------------------------------------------------------------------------------------------|-----------------------------------------------|
| <b>ADDPD – Add Packed Double-Precision Floating-Point Values</b>                         |                                               |
| xmmreg to xmmreg                                                                         | 01100110:00001111:01011000:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                            | 01100110:00001111:01011000: mod xmmreg r/m    |
| <b>ADDSRD – Add Scalar Double-Precision Floating-Point Values</b>                        |                                               |
| xmmreg to xmmreg                                                                         | 11110010:00001111:01011000:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                            | 11110010:00001111:01011000: mod xmmreg r/m    |
| <b>ANDNPD – Bitwise Logical AND NOT of Packed Double-Precision Floating-Point Values</b> |                                               |
| xmmreg to xmmreg                                                                         | 01100110:00001111:01010101:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                            | 01100110:00001111:01010101: mod xmmreg r/m    |

表 B-20. SSE2 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                                           | エンコーディング                                            |
|-------------------------------------------------------------------------------------------------------|-----------------------------------------------------|
| <b>ANDPD – Bitwise Logical AND of Packed Double-Precision Floating-Point Values</b>                   |                                                     |
| xmmreg to xmmreg                                                                                      | 01100110:00001111:01010100:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                                                         | 01100110:00001111:01010100: mod xmmreg r/m          |
| <b>CMPPD – Compare Packed Double-Precision Floating-Point Values</b>                                  |                                                     |
| xmmreg to xmmreg, imm8                                                                                | 01100110:00001111:11000010:11 xmmreg1 xmmreg2: imm8 |
| mem to xmmreg, imm8                                                                                   | 01100110:00001111:11000010: mod xmmreg r/m: imm8    |
| <b>CMPSD – Compare Scalar Double-Precision Floating-Point Values</b>                                  |                                                     |
| xmmreg to xmmreg, imm8                                                                                | 11110010:00001111:11000010:11 xmmreg1 xmmreg2: imm8 |
| mem to xmmreg, imm8                                                                                   | 11110010:00001111:11000010: mod xmmreg r/m: imm8    |
| <b>COMISD – Compare Scalar Ordered Double-Precision Floating-Point Values and Set EFLAGS</b>          |                                                     |
| xmmreg to xmmreg                                                                                      | 01100110:00001111:00101111:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                                                         | 01100110:00001111:00101111: mod xmmreg r/m          |
| <b>CVTPI2PD – Convert Packed Doubleword Integers to Packed Double-Precision Floating-Point Values</b> |                                                     |
| mmreg to xmmreg                                                                                       | 01100110:00001111:00101010:11 xmmreg1 mmreg1        |
| mem to xmmreg                                                                                         | 01100110:00001111:00101010: mod xmmreg r/m          |
| <b>CVTPD2PI – Convert Packed Double-Precision Floating-Point Values to Packed Doubleword Integers</b> |                                                     |
| xmmreg to mmreg                                                                                       | 01100110:00001111:00101101:11 mmreg1 xmmreg1        |
| mem to mmreg                                                                                          | 01100110:00001111:00101101: mod mmreg r/m           |
| <b>CVTSI2SD – Convert Doubleword Integer to Scalar Double-Precision Floating-Point Value</b>          |                                                     |
| r32 to xmmreg1                                                                                        | 11110010:00001111:00101010:11 xmmreg r32            |
| mem to xmmreg                                                                                         | 11110010:00001111:00101010: mod xmmreg r/m          |
| <b>CVTSD2SI – Convert Scalar Double-Precision Floating-Point Value to Doubleword Integer</b>          |                                                     |
| xmmreg to r32                                                                                         | 11110010:00001111:00101101:11 r32 xmmreg            |
| mem to r32                                                                                            | 11110010:00001111:00101101: mod r32 r/m             |

表 B-20. SSE2 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                                                             | エンコーディング                                      |
|-------------------------------------------------------------------------------------------------------------------------|-----------------------------------------------|
| <b>CVTPD2PI – Convert with Truncation Packed Double-Precision Floating-Point Values to Packed Doubleword Integers</b>   |                                               |
| xmmreg to mmreg                                                                                                         | 01100110:00001111:00101100:11 mmreg xmmreg    |
| mem to mmreg                                                                                                            | 01100110:00001111:00101100: mod mmreg r/m     |
| <b>CVTSD2SI – Convert with Truncation Scalar Double-Precision Floating-Point Value to Doubleword Integer</b>            |                                               |
| xmmreg to r32                                                                                                           | 11110010:00001111:00101100:11 r32 xmmreg      |
| mem to r32                                                                                                              | 11110010:00001111:00101100: mod r32 r/m       |
| <b>CVTPD2PS – Covert Packed Double-Precision Floating-Point Values to Packed Single-Precision Floating-Point Values</b> |                                               |
| xmmreg to xmmreg                                                                                                        | 01100110:00001111:01011010:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                           | 01100110:00001111:01011010: mod xmmreg r/m    |
| <b>CVTPS2PD – Covert Packed Single-Precision Floating-Point Values to Packed Double-Precision Floating-Point Values</b> |                                               |
| xmmreg to xmmreg                                                                                                        | 00001111:01011010:11 xmmreg1 xmmreg2          |
| mem to xmmreg                                                                                                           | 00001111:01011010: mod xmmreg r/m             |
| <b>CVTSD2SS – Covert Scalar Double-Precision Floating-Point Value to Scalar Single-Precision Floating-Point Value</b>   |                                               |
| xmmreg to xmmreg                                                                                                        | 11110010:00001111:01011010:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                           | 11110010:00001111:01011010: mod xmmreg r/m    |
| <b>CVTSS2SD – Covert Scalar Single-Precision Floating-Point Value to Scalar Double-Precision Floating-Point Value</b>   |                                               |
| xmmreg to xmmreg                                                                                                        | 11110011:00001111:01011010:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                           | 11110011:00001111:01011010: mod xmmreg r/m    |
| <b>CVTPD2DQ – Convert Packed Double-Precision Floating-Point Values to Packed Doubleword Integers</b>                   |                                               |
| xmmreg to xmmreg                                                                                                        | 11110010:00001111:11100110:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                           | 11110010:00001111:11100110: mod xmmreg r/m    |
| <b>CVTPD2DQ – Convert With Truncation Packed Double-Precision Floating-Point Values to Packed Doubleword Integers</b>   |                                               |
| xmmreg to xmmreg                                                                                                        | 01100110:00001111:11100110:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                           | 01100110:00001111:11100110: mod xmmreg r/m    |

表 B-20. SSE2 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                                                            | エンコーディング                                      |
|------------------------------------------------------------------------------------------------------------------------|-----------------------------------------------|
| <b>CVTDQ2PD – Convert Packed Doubleword Integers to Packed Single-Precision Floating-Point Values</b>                  |                                               |
| xmmreg to xmmreg                                                                                                       | 11110011:00001111:11100110:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                          | 11110011:00001111:11100110: mod xmmreg r/m    |
| <b>CVTPS2DQ – Convert Packed Single-Precision Floating-Point Values to Packed Doubleword Integers</b>                  |                                               |
| xmmreg to xmmreg                                                                                                       | 01100110:00001111:01011011:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                          | 01100110:00001111:01011011: mod xmmreg r/m    |
| <b>CVTPPS2DQ – Convert With Truncation Packed Single-Precision Floating-Point Values to Packed Doubleword Integers</b> |                                               |
| xmmreg to xmmreg                                                                                                       | 11110011:00001111:01011011:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                          | 11110011:00001111:01011011: mod xmmreg r/m    |
| <b>CVTDQ2PS – Convert Packed Doubleword Integers to Packed Double-Precision Floating-Point Values</b>                  |                                               |
| xmmreg to xmmreg                                                                                                       | 00001111:01011011:11 xmmreg1 xmmreg2          |
| mem to xmmreg                                                                                                          | 00001111:01011011: mod xmmreg r/m             |
| <b>DIVPD – Divide Packed Double-Precision Floating-Point Values</b>                                                    |                                               |
| xmmreg to xmmreg                                                                                                       | 01100110:00001111:01011110:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                          | 01100110:00001111:01011110: mod xmmreg r/m    |
| <b>DIVSD – Divide Scalar Double-Precision Floating-Point Values</b>                                                    |                                               |
| xmmreg to xmmreg                                                                                                       | 11110010:00001111:01011110:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                          | 11110010:00001111:01011110: mod xmmreg r/m    |
| <b>MAXPD – Return Maximum Packed Double-Precision Floating-Point Values</b>                                            |                                               |
| xmmreg to xmmreg                                                                                                       | 01100110:00001111:01011111:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                          | 01100110:00001111:01011111: mod xmmreg r/m    |
| <b>MAXSD – Return Maximum Scalar Double-Precision Floating-Point Value</b>                                             |                                               |
| xmmreg to xmmreg                                                                                                       | 11110010:00001111:01011111:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                          | 11110010:00001111:01011111: mod xmmreg r/m    |
| <b>MINPD – Return Minimum Packed Double-Precision Floating-Point Values</b>                                            |                                               |
| xmmreg to xmmreg                                                                                                       | 01100110:00001111:01011101:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                                                          | 01100110:00001111:01011101: mod xmmreg r/m    |

表 B-20. SSE2 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                  | エンコーディング                                      |
|------------------------------------------------------------------------------|-----------------------------------------------|
| <b>MINSD – Return Minimum Scalar Double-Precision Floating-Point Value</b>   |                                               |
| xmmreg to xmmreg                                                             | 11110010:00001111:01011101:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                | 11110010:00001111:01011101: mod xmmreg r/m    |
| <b>MOVAPD – Move Aligned Packed Double-Precision Floating-Point Values</b>   |                                               |
| xmmreg2 to xmmreg1                                                           | 01100110:00001111:00101001:11 xmmreg2 xmmreg1 |
| mem to xmmreg1                                                               | 01100110:00001111:00101001: mod xmmreg r/m    |
| xmmreg1 to xmmreg2                                                           | 01100110:00001111:00101000:11 xmmreg1 xmmreg2 |
| xmmreg1 to mem                                                               | 01100110:00001111:00101000: mod xmmreg r/m    |
| <b>MOVHPD – Move High Packed Double-Precision Floating-Point Values</b>      |                                               |
| mem to xmmreg                                                                | 01100110:00001111:00010111: mod xmmreg r/m    |
| xmmreg to mem                                                                | 01100110:00001111:00010110: mod xmmreg r/m    |
| <b>MOVLPD – Move Low Packed Double-Precision Floating-Point Values</b>       |                                               |
| mem to xmmreg                                                                | 01100110:00001111:00010011: mod xmmreg r/m    |
| xmmreg to mem                                                                | 01100110:00001111:00010010: mod xmmreg r/m    |
| <b>MOVMSKPD – Extract Packed Double-Precision Floating-Point Sign Mask</b>   |                                               |
| xmmreg to r32                                                                | 01100110:00001111:01010000:11 r32 xmmreg      |
| <b>MOVSD – Move Scalar Double-Precision Floating-Point Values</b>            |                                               |
| xmmreg2 to xmmreg1                                                           | 11110010:00001111:00010001:11 xmmreg2 xmmreg1 |
| mem to xmmreg1                                                               | 11110010:00001111:00010001: mod xmmreg r/m    |
| xmmreg1 to xmmreg2                                                           | 11110010:00001111:00010000:11 xmmreg1 xmmreg2 |
| xmmreg1 to mem                                                               | 11110010:00001111:00010000: mod xmmreg r/m    |
| <b>MOVUPD – Move Unaligned Packed Double-Precision Floating-Point Values</b> |                                               |
| xmmreg2 to xmmreg1                                                           | 01100110:00001111:00010001:11 xmmreg2 xmmreg1 |
| mem to xmmreg1                                                               | 01100110:00001111:00010001: mod xmmreg r/m    |
| xmmreg1 to xmmreg2                                                           | 01100110:00001111:00010000:11 xmmreg1 xmmreg2 |
| xmmreg1 to mem                                                               | 01100110:00001111:00010000: mod xmmreg r/m    |
| <b>MULPD – Multiply Packed Double-Precision Floating-Point Values</b>        |                                               |
| xmmreg to xmmreg                                                             | 01100110:00001111:01011001:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                | 01100110:00001111:01011001: mod xmmreg rm     |

表 B-20. SSE2 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                                             | エンコーディング                                            |
|---------------------------------------------------------------------------------------------------------|-----------------------------------------------------|
| <b>MULSD – Multiply Scalar Double-Precision Floating-Point Values</b>                                   |                                                     |
| xmmreg to xmmreg                                                                                        | 11110010:00001111:01011001:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                                                           | 11110010:00001111:01011001: mod xmmreg r/m          |
| <b>ORPD – Bitwise Logical OR of Double-Precision Floating-Point Values</b>                              |                                                     |
| xmmreg to xmmreg                                                                                        | 01100110:00001111:01010110:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                                                           | 01100110:00001111:01010110: mod xmmreg r/m          |
| <b>SHUFPD – Shuffle Packed Double-Precision Floating-Point Values</b>                                   |                                                     |
| xmmreg to xmmreg, imm8                                                                                  | 01100110:00001111:11000110:11 xmmreg1 xmmreg2: imm8 |
| mem to xmmreg, imm8                                                                                     | 01100110:00001111:11000110: mod xmmreg r/m: imm8    |
| <b>SQRTPD – Compute Square Roots of Packed Double-Precision Floating-Point Values</b>                   |                                                     |
| xmmreg to xmmreg                                                                                        | 01100110:00001111:01010001:11 xmmreg1 xmmreg 2      |
| mem to xmmreg                                                                                           | 01100110:00001111:01010001: mod xmmreg r/m          |
| <b>SQRTSD – Compute Square Root of Scalar Double-Precision Floating-Point Value</b>                     |                                                     |
| xmmreg to xmmreg                                                                                        | 11110010:00001111:01010001:11 xmmreg1 xmmreg 2      |
| mem to xmmreg                                                                                           | 11110010:00001111:01010001: mod xmmreg r/m          |
| <b>SUBPD – Subtract Packed Double-Precision Floating-Point Values</b>                                   |                                                     |
| xmmreg to xmmreg                                                                                        | 01100110:00001111:01011100:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                                                           | 01100110:00001111:01011100: mod xmmreg r/m          |
| <b>SUBSD – Subtract Scalar Double-Precision Floating-Point Values</b>                                   |                                                     |
| xmmreg to xmmreg                                                                                        | 11110010:00001111:01011100:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                                                           | 11110010:00001111:01011100: mod xmmreg r/m          |
| <b>UCOMISD – Unordered Compare Scalar Ordered Double-Precision Floating-Point Values and Set EFLAGS</b> |                                                     |
| xmmreg to xmmreg                                                                                        | 01100110:00001111:00101110:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                                                           | 01100110:00001111:00101110: mod xmmreg r/m          |
| <b>UNPCKHPD – Unpack and Interleave High Packed Double-Precision Floating-Point Values</b>              |                                                     |
| xmmreg to xmmreg                                                                                        | 01100110:00001111:00010101:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                                                           | 01100110:00001111:00010101: mod xmmreg r/m          |

表 B-20. SSE2 浮動小数点命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                               | エンコーディング                                      |
|-------------------------------------------------------------------------------------------|-----------------------------------------------|
| <b>UNPCKLPD – Unpack and Interleave Low Packed Double-Precision Floating-Point Values</b> |                                               |
| xmmreg to xmmreg                                                                          | 01100110:00001111:00010100:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                             | 01100110:00001111:00010100: mod xmmreg r/m    |
| <b>XORPD – Bitwise Logical OR of Double-Precision Floating-Point Values</b>               |                                               |
| xmmreg to xmmreg                                                                          | 01100110:00001111:01010111:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                                             | 01100110:00001111:01010111: mod xmmreg r/m    |

表 B-21. SSE2 整数命令のフォーマットとエンコーディング

| 命令およびフォーマット                                             | エンコーディング                                                                                       |
|---------------------------------------------------------|------------------------------------------------------------------------------------------------|
| <b>MOVD – Move Doubleword</b>                           |                                                                                                |
| reg to xmmeg                                            | 01100110:0000 1111:01101110: 11 xmmreg reg                                                     |
| reg from xmmreg                                         | 01100110:0000 1111:01111110: 11 xmmreg reg                                                     |
| mem to xmmreg                                           | 01100110:0000 1111:01101110: mod xmmreg r/m                                                    |
| mem from xmmreg                                         | 01100110:0000 1111:01111110: mod xmmreg r/m                                                    |
| <b>MOVDQA – Move Aligned Double Quadword</b>            |                                                                                                |
| xmmreg to xmmreg                                        | 01100110:00001111:01101111:11 xmmreg1 xmmreg2<br>01100110:00001111:01111111:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                           | 01100110:00001111:01101111: mod xmmreg r/m                                                     |
| mem from xmmreg                                         | 01100110:00001111:01111111: mod xmmreg r/m                                                     |
| <b>MOVDQU – Move Unaligned Double Quadword</b>          |                                                                                                |
| xmmreg to xmmreg                                        | 11110011:00001111:01101111:11 xmmreg1 xmmreg2<br>11110011:00001111:01111111:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                           | 11110011:00001111:01101111: mod xmmreg r/m                                                     |
| mem from xmmreg                                         | 11110011:00001111:01111111: mod xmmreg r/m                                                     |
| <b>MOVQ2DQ – Move Quadword from MMX to XMM Register</b> |                                                                                                |
| mmreg to xmmreg                                         | 11110011:00001111:11010110:11 mmreg1 mmreg2                                                    |
| <b>MOVDQ2Q – Move Quadword from XMM to MMX Register</b> |                                                                                                |
| xmmreg to mmreg                                         | 11110010:00001111:11010110:11 mmreg1 mmreg2                                                    |

表 B-21. SSE2 整数命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                                        | エンコーディング                                         |
|------------------------------------------------------------------------------------|--------------------------------------------------|
| <b>MOVQ – Move Quadword</b>                                                        |                                                  |
| mmxreg2 to mmxreg1                                                                 | 11110011:00001111:01111110: 11 xmmreg1 xmmreg2   |
| mmxreg2 from mmxreg1                                                               | 01100110:00001111:11010110: 11 xmmreg1 xmmreg2   |
| mem to xmmreg                                                                      | 11110011:00001111:01111110: mod xmmreg r/m       |
| mem from xmmreg                                                                    | 01100110:00001111:11010110: mod xmmreg r/m       |
| <b>PACKSSDW<sup>1</sup> – Pack Dword To Word Data<br/>(signed with saturation)</b> |                                                  |
| xmmreg2 to xmmreg1                                                                 | 01100110:0000 1111:01101011: 11 xmmreg1 xmmreg2  |
| memory to xmmreg                                                                   | 01100110:0000 1111:01101011: mod xmmreg r/m      |
| <b>PACKSSWB – Pack Word To Byte Data (signed with saturation)</b>                  |                                                  |
| xmmreg2 to xmmreg1                                                                 | 01100110:0000 1111:01100011: 11 xmmreg1 xmmreg2  |
| memory to xmmreg                                                                   | 01100110:0000 1111:01100011: mod xmmreg r/m      |
| <b>PACKUSWB – Pack Word To Byte Data<br/>(unsigned with saturation)</b>            |                                                  |
| xmmreg2 to xmmreg1                                                                 | 01100110:0000 1111:01100111: 11 xmmreg1 xmmreg2  |
| memory to xmmreg                                                                   | 01100110:0000 1111:01100111: mod xmmreg r/m      |
| <b>PADDQ – Add Packed Quadword Integers</b>                                        |                                                  |
| mmreg to mmreg                                                                     | 00001111:11010100:11 mmreg1 mmreg2               |
| mem to mmreg                                                                       | 00001111:11010100: mod mmreg r/m                 |
| xmmreg to xmmreg                                                                   | 01100110:00001111:11010100:11 xmmreg1 xmmreg2    |
| mem to xmmreg                                                                      | 01100110:00001111:11010100: mod xmmreg r/m       |
| <b>PADD – Add With Wrap-around</b>                                                 |                                                  |
| xmmreg2 to xmmreg1                                                                 | 01100110:0000 1111: 111111gg: 11 xmmreg1 xmmreg2 |
| memory to xmmreg                                                                   | 01100110:0000 1111: 111111gg: mod xmmreg r/m     |
| <b>PADDS – Add Signed With Saturation</b>                                          |                                                  |
| xmmreg2 to xmmreg1                                                                 | 01100110:0000 1111: 111011gg: 11 xmmreg1 xmmreg2 |
| memory to xmmreg                                                                   | 01100110:0000 1111: 111011gg: mod xmmreg r/m     |
| <b>PADDUS – Add Unsigned With Saturation</b>                                       |                                                  |
| xmmreg2 to xmmreg1                                                                 | 01100110:0000 1111: 110111gg: 11 xmmreg1 xmmreg2 |
| memory to xmmreg                                                                   | 01100110:0000 1111: 110111gg: mod xmmreg r/m     |
| <b>PAND – Bitwise And</b>                                                          |                                                  |
| xmmreg2 to xmmreg1                                                                 | 01100110:0000 1111:11011011: 11 xmmreg1 xmmreg2  |
| memory to xmmreg                                                                   | 01100110:0000 1111:11011011: mod xmmreg r/m      |

表 B-21. SSE2 整数命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                              | エンコーディング                                        |
|----------------------------------------------------------|-------------------------------------------------|
| <b>PANDN – Bitwise AndNot</b>                            |                                                 |
| xmmreg2 to xmmreg1                                       | 01100110:0000 1111:11011111: 11 xmmreg1 xmmreg2 |
| memory to xmmreg                                         | 01100110:0000 1111:11011111: mod xmmreg r/m     |
| <b>PAVGB – Average Packed Integers</b>                   |                                                 |
| xmmreg to xmmreg                                         | 01100110:00001111:11100000:11 xmmreg1 xmmreg2   |
| mem to xmmreg                                            | 01100110:00001111:11100000 mod xmmreg r/m       |
| <b>PAVGW – Average Packed Integers</b>                   |                                                 |
| xmmreg to xmmreg                                         | 01100110:00001111:11100011:11 xmmreg1 xmmreg2   |
| mem to xmmreg                                            | 01100110:00001111:11100011 mod xmmreg r/m       |
| <b>PCMPEQ – Packed Compare For Equality</b>              |                                                 |
| xmmreg1 with xmmreg2                                     | 01100110:0000 1111:011101gg: 11 xmmreg1 xmmreg2 |
| xmmreg with memory                                       | 01100110:0000 1111:011101gg: mod xmmreg r/m     |
| <b>PCMPGT – Packed Compare Greater (signed)</b>          |                                                 |
| xmmreg1 with xmmreg2                                     | 01100110:0000 1111:011001gg: 11 xmmreg1 xmmreg2 |
| xmmreg with memory                                       | 01100110:0000 1111:011001gg: mod xmmreg r/m     |
| <b>PEXTRW – Extract Word</b>                             |                                                 |
| xmmreg to reg32, imm8                                    | 01100110:00001111:11000101:11 r32 xmmreg: imm8  |
| <b>PINSRW – Insert Word</b>                              |                                                 |
| reg32 to xmmreg, imm8                                    | 01100110:00001111:11000100:11 xmmreg r32: imm8  |
| m16 to xmmreg, imm8                                      | 01100110:00001111:11000100 mod xmmreg r/m: imm8 |
| <b>PMADD – Packed Multiply Add</b>                       |                                                 |
| xmmreg2 to xmmreg1                                       | 01100110:0000 1111:1110101: 11 xmmreg1 xmmreg2  |
| memory to xmmreg                                         | 01100110:0000 1111:1110101: mod xmmreg r/m      |
| <b>PMAXSW – Maximum of Packed Signed Word Integers</b>   |                                                 |
| xmmreg to xmmreg                                         | 01100110:00001111:11101110:11 xmmreg1 xmmreg2   |
| mem to xmmreg                                            | 01100110:00001111:11101110 mod xmmreg r/m       |
| <b>PMAXUB – Maximum of Packed Unsigned Byte Integers</b> |                                                 |
| xmmreg to xmmreg                                         | 01100110:00001111:11011110:11 xmmreg1 xmmreg2   |
| mem to xmmreg                                            | 01100110:00001111:11011110 mod xmmreg r/m       |
| <b>PMINSW – Minimum of Packed Signed Word Integers</b>   |                                                 |
| xmmreg to xmmreg                                         | 01100110:00001111:11101010:11 xmmreg1 xmmreg2   |
| mem to xmmreg                                            | 01100110:00001111:11101010 mod xmmreg r/m       |

表 B-21. SSE2 整数命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                                        | エンコーディング                                            |
|--------------------------------------------------------------------|-----------------------------------------------------|
| <b>PMINUB – Minimum of Packed Unsigned Byte Integers</b>           |                                                     |
| xmmreg to xmmreg                                                   | 01100110:00001111:11011010:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                      | 01100110:00001111:11011010 mod xmmreg r/m           |
| <b>PMOVMSKB – Move Byte Mask To Integer</b>                        |                                                     |
| xmmreg to reg32                                                    | 01100110:00001111:11010111:11 r32 xmmreg            |
| <b>PMULHUW – Packed multiplication, store high word (unsigned)</b> |                                                     |
| xmmreg2 to xmmreg1                                                 | 0110 0110:0000 1111:1110 0100: 11 xmmreg1 xmmreg2   |
| memory to xmmreg                                                   | 0110 0110:0000 1111:1110 0100: mod xmmreg r/m       |
| <b>PMULHW – Packed Multiplication, store high word</b>             |                                                     |
| xmmreg2 to xmmreg1                                                 | 01100110:0000 1111:11100101: 11 xmmreg1 xmmreg2     |
| memory to xmmreg                                                   | 01100110:0000 1111:11100101: mod xmmreg r/m         |
| <b>PMULLW – Packed Multiplication, store high word</b>             |                                                     |
| xmmreg2 to xmmreg1                                                 | 01100110:0000 1111:11010101: 11 xmmreg1 xmmreg2     |
| memory to xmmreg                                                   | 01100110:0000 1111:11010101: mod xmmreg r/m         |
| <b>PMULUDQ – Multiply Packed Unsigned Doubleword Integers</b>      |                                                     |
| mmreg to mmreg                                                     | 00001111:11110100:11 mmreg1 mmreg2                  |
| mem to mmreg                                                       | 00001111:11110100: mod mmreg r/m                    |
| xmmreg to xmmreg                                                   | 01100110:00001111:11110100:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                      | 01100110:00001111:11110100: mod xmmreg r/m          |
| <b>POR – Bitwise Or</b>                                            |                                                     |
| xmmreg2 to xmmreg1                                                 | 01100110:0000 1111:11101011: 11 xmmreg1 xmmreg2     |
| xmemory to xmmreg                                                  | 01100110:0000 1111:11101011: mod xmmreg r/m         |
| <b>PSADBW – Compute Sum of Absolute Differences</b>                |                                                     |
| xmmreg to xmmreg                                                   | 01100110:00001111:11110110:11 xmmreg1 xmmreg2       |
| mem to xmmreg                                                      | 01100110:00001111:11110110: mod xmmreg r/m          |
| <b>PSHUFLW – Shuffle Packed Low Words</b>                          |                                                     |
| xmmreg to xmmreg, imm8                                             | 11110010:00001111:01110000:11 xmmreg1 xmmreg2: imm8 |
| mem to xmmreg, imm8                                                | 11110010:00001111:01110000:11 mod xmmreg r/m: imm8  |
| <b>PSHUFHW – Shuffle Packed High Words</b>                         |                                                     |
| xmmreg to xmmreg, imm8                                             | 11110011:00001111:01110000:11 xmmreg1 xmmreg2: imm8 |
| mem to xmmreg, imm8                                                | 11110011:00001111:01110000:11 mod xmmreg r/m: imm8  |

表 B-21. SSE2 整数命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                         | エンコーディング                                              |
|-----------------------------------------------------|-------------------------------------------------------|
| <b>PSHUFD – Shuffle Packed Doublewords</b>          |                                                       |
| xmmreg to xmmreg, imm8                              | 01100110:00001111:01110000:11 xmmreg1 xmmreg2: imm8   |
| mem to xmmreg, imm8                                 | 01100110:00001111:01110000:11 mod xmmreg r/m: imm8    |
| <b>PSLLDQ – Shift Double Quadword Left Logical</b>  |                                                       |
| xmmreg, imm8                                        | 01100110:00001111:01110011:11 111 xmmreg: imm8        |
| <b>PSLL – Packed Shift Left Logical</b>             |                                                       |
| xmmreg1 by xmmreg2                                  | 01100110:0000 1111:111100gg: 11 xmmreg1 xmmreg2       |
| xmmreg by memory                                    | 01100110:0000 1111:111100gg: mod xmmreg r/m           |
| xmmreg by immediate                                 | 01100110:0000 1111:011100gg: 11 110 xmmreg: imm8 data |
| <b>PSRA – Packed Shift Right Arithmetic</b>         |                                                       |
| xmmreg1 by xmmreg2                                  | 01100110:0000 1111:111000gg: 11 xmmreg1 xmmreg2       |
| xmmreg by memory                                    | 01100110:0000 1111:111000gg: mod xmmreg r/m           |
| xmmreg by immediate                                 | 01100110:0000 1111:011100gg: 11 100 xmmreg: imm8 data |
| <b>PSRLDQ – Shift Double Quadword Right Logical</b> |                                                       |
| xmmreg, imm8                                        | 01100110:00001111:01110011:11 011 xmmreg: imm8        |
| <b>PSRL – Packed Shift Right Logical</b>            |                                                       |
| xmmxreg1 by xmmxreg2                                | 01100110:0000 1111:110100gg: 11 xmmreg1 xmmreg2       |
| xmmxreg by memory                                   | 01100110:0000 1111:110100gg: mod xmmreg r/m           |
| xmmxreg by immediate                                | 01100110:0000 1111:011100gg: 11 010 xmmreg: imm8 data |
| <b>PSUBQ – Subtract Packed Quadword Integers</b>    |                                                       |
| mmreg to mmreg                                      | 00001111:11111011:11 mmreg1 mmreg2                    |
| mem to mmreg                                        | 00001111:11111011: mod mmreg r/m                      |
| xmmreg to xmmreg                                    | 01100110:00001111:11111011:11 xmmreg1 xmmreg2         |
| mem to xmmreg                                       | 01100110:00001111:11111011: mod xmmreg r/m            |
| <b>PSUB – Subtract With Wrap-around</b>             |                                                       |
| xmmreg2 from xmmreg1                                | 01100110:0000 1111:111110gg: 11 xmmreg1 xmmreg2       |
| memory from xmmreg                                  | 01100110:0000 1111:111110gg: mod xmmreg r/m           |
| <b>PSUBS – Subtract Signed With Saturation</b>      |                                                       |
| xmmreg2 from xmmreg1                                | 01100110:0000 1111:111010gg: 11 xmmreg1 xmmreg2       |
| memory from xmmreg                                  | 01100110:0000 1111:111010gg: mod xmmreg r/m           |
| <b>PSUBUS – Subtract Unsigned With Saturation</b>   |                                                       |
| xmmreg2 from xmmreg1                                | 0000 1111:110110gg: 11 xmmreg1 xmmreg2                |
| memory from xmmreg                                  | 0000 1111:110110gg: mod xmmreg r/m                    |

表 B-21. SSE2 整数命令のフォーマットとエンコーディング（続き）

| 命令およびフォーマット                                           | エンコーディング                                        |
|-------------------------------------------------------|-------------------------------------------------|
| <b>PUNPCKH – Unpack High Data To Next Larger Type</b> |                                                 |
| xmmreg to xmmreg                                      | 01100110:00001111:011010gg:11 xmmreg1 Xmmreg2   |
| mem to xmmreg                                         | 01100110:00001111:011010gg: mod xmmreg r/m      |
| <b>PUNPCKHQDQ – Unpack High Data</b>                  |                                                 |
| xmmreg to xmmreg                                      | 01100110:00001111:01101101:11 xmmreg1 xmmreg2   |
| mem to xmmreg                                         | 01100110:00001111:01101101: mod xmmreg r/m      |
| <b>PUNPCKL – Unpack Low Data To Next Larger Type</b>  |                                                 |
| xmmreg to xmmreg                                      | 01100110:00001111:011000gg:11 xmmreg1 xmmreg2   |
| mem to xmmreg                                         | 01100110:00001111:011000gg: mod xmmreg r/m      |
| <b>PUNPCKLQDQ – Unpack Low Data</b>                   |                                                 |
| xmmreg to xmmreg                                      | 01100110:00001111:01101100:11 xmmreg1 xmmreg2   |
| mem to xmmreg                                         | 01100110:00001111:01101100: mod xmmreg r/m      |
| <b>PXOR – Bitwise Xor</b>                             |                                                 |
| xmmreg2 to xmmreg1                                    | 01100110:0000 1111:11101111: 11 xmmreg1 xmmreg2 |
| memory to xmmreg                                      | 01100110:0000 1111:11101111: mod xmmreg r/m     |

表 B-22. SSE2 キャッシュ可能命令のフォーマットとエンコーディング

| 命令およびフォーマット                                                                                  | エンコーディング                                      |
|----------------------------------------------------------------------------------------------|-----------------------------------------------|
| <b>MASKMOVDQU – Store Selected Bytes of Double Quadword</b>                                  |                                               |
| xmmreg to xmmreg                                                                             | 01100110:00001111:11110111:11 xmmreg1 xmmreg2 |
| <b>CLFLUSH – Flush Cache Line</b>                                                            |                                               |
| mem                                                                                          | 00001111:10101110:mod r/m                     |
| <b>MOVNTPD – Store Packed Double-Precision Floating-Point Values Using Non-Temporal Hint</b> |                                               |
| xmmreg to mem                                                                                | 01100110:00001111:00101011: mod xmmreg r/m    |
| <b>MOVNTDQ – Store Double Quadword Using Non-Temporal Hint</b>                               |                                               |
| xmmreg to mem                                                                                | 01100110:00001111:11100111: mod xmmreg r/m    |
| <b>MOVNTI – Store Doubleword Using Non-Temporal Hint</b>                                     |                                               |
| reg to mem                                                                                   | 00001111:11000011: mod reg r/m                |
| <b>PAUSE – Spin Loop Hint</b>                                                                | 11110011:10010000                             |
| <b>LFENCE – Load Fence</b>                                                                   | 00001111:10101110: 11 101 000                 |
| <b>MFENCE – Memory Fence</b>                                                                 | 00001111:10101110: 11 110 000                 |

## B.7.2. SSE3 のフォーマットとエンコーディングの表

本項の表は、開発コード名 Prescott 用の命令のフォーマットとエンコーディングを示している。SSE3 の一部の命令は、2 バイト・オペコードの一部として必須のプリフィックス 66H、F2H、F3H を必要とする。これらの必須のプリフィックスは表に記載されている。

表 B-23. SSE3 浮動小数点命令のフォーマットとエンコーディング

| 命令およびフォーマット                                                            | エンコーディング                                      |
|------------------------------------------------------------------------|-----------------------------------------------|
| <b>ADDSUBPD – Add /Sub packed DP FP numbers from XMM2/Mem to XMM1</b>  |                                               |
| xmmreg2 to xmmreg1                                                     | 01100110:00001111:11010000:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                          | 01100110:00001111:11010000: mod xmmreg r/m    |
| <b>ADDSUBPS – Add /Sub packed SP FP numbers from XMM2/Mem to XMM1</b>  |                                               |
| xmmreg2 to xmmreg1                                                     | 11110010:00001111:11010000:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                          | 11110010:00001111:11010000: mod xmmreg r/m    |
| <b>HADDPD – Add horizontally packed DP FP numbers XMM2/Mem to XMM1</b> |                                               |
| xmmreg2 to xmmreg1                                                     | 01100110:00001111:01111100:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                          | 01100110:00001111:01111100: mod xmmreg r/m    |
| <b>HADDPD – Add horizontally packed SP FP numbers XMM2/Mem to XMM1</b> |                                               |
| xmmreg2 to xmmreg1                                                     | 11110010:00001111:01111100:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                          | 11110010:00001111:01111100: mod xmmreg r/m    |
| <b>HSUBPD – Sub horizontally packed DP FP numbers XMM2/Mem to XMM1</b> |                                               |
| xmmreg2 to xmmreg1                                                     | 01100110:00001111:01111101:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                          | 01100110:00001111:01111101: mod xmmreg r/m    |
| <b>HSUBPS – Sub horizontally packed SP FP numbers XMM2/Mem to XMM1</b> |                                               |
| xmmreg2 to xmmreg1                                                     | 11110010:00001111:01111101:11 xmmreg1 xmmreg2 |
| mem to xmmreg                                                          | 11110010:00001111:01111101: mod xmmreg r/m    |

表 B-24. SSE3 イベント管理命令のフォーマットとエンコーディング

| 命令およびフォーマット                                                                                                            | エンコーディング                         |
|------------------------------------------------------------------------------------------------------------------------|----------------------------------|
| <b>MONITOR – Set up a linear address range to be monitored by hardware</b><br>eax, ecx, edx                            | 0000 1111 : 0000 0001:11 001 000 |
| <b>MWAIT – Wait until write-back store performed within the range specified by the instruction MONITOR</b><br>eax, ecx | 0000 1111 : 0000 0001:11 001 001 |

表 B-25. SSE3 整数命令および移動命令のフォーマットとエンコーディング

| 命令およびフォーマット                                                                                                                            | エンコーディング                                                                                    |
|----------------------------------------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------|
| <b>FISTTP – Store ST in int16 (chop) and pop</b><br>m16int                                                                             | 11011 111 : mod <sup>A</sup> 001 r/m                                                        |
| <b>FISTTP – Store ST in int32 (chop) and pop</b><br>m32int                                                                             | 11011 011 : mod <sup>A</sup> 001 r/m                                                        |
| <b>FISTTP – Store ST in int64 (chop) and pop</b><br>m64int                                                                             | 11011 101 : mod <sup>A</sup> 001 r/m                                                        |
| <b>LDDQU – Load unaligned integer 128-bit</b><br>xmm, m128                                                                             | 11110010:00001111;11110000: mod <sup>A</sup> xmmreg r/m                                     |
| <b>MOVDDUP – Move 64 bits representing one DP data from XMM2/Mem to XMM1 and duplicate high</b><br>xmmreg2 to xmmreg1<br>mem to xmmreg | 11110010:00001111:00010010:11 xmmreg1 xmmreg2<br>11110010:00001111:00010010: mod xmmreg r/m |
| <b>MOVSHDUP – Move 128 bits representing 4 SP data from XMM2/Mem to XMM1 and duplicate high</b><br>xmmreg2 to xmmreg1<br>mem to xmmreg | 11110011:00001111:00010110:11 xmmreg1 xmmreg2<br>11110011:00001111:00010110: mod xmmreg r/m |
| <b>MOVSLDUP – Move 128 bits representing 4 SP data from XMM2/Mem to XMM1 and duplicate low</b><br>xmmreg2 to xmmreg1<br>mem to xmmreg  | 11110011:00001111:00010010:11 xmmreg1 xmmreg2<br>11110011:00001111:00010010: mod xmmreg r/m |

## B.8. 浮動小数点命令のフォーマットおよびエンコーディング

表 B-26. に、浮動小数点命令に使用される 5 個の異なるフォーマットを示す。すべての場合に、命令は少なくとも 2 バイトの長さであり、ビットパターン 11011 で始まる。

表 B-26. 汎用浮動小数点命令フォーマット

| 命令      |       |     |     |     |         |     |     |       |       | オプションの<br>フィールド |     |
|---------|-------|-----|-----|-----|---------|-----|-----|-------|-------|-----------------|-----|
| 第 1 バイト |       |     |     |     | 第 2 バイト |     |     |       |       |                 |     |
| 1       | 11011 | OPA | 1   | mod | 1       | OPB | r/m | s-i-b | disp  |                 |     |
| 2       | 11011 | MF  | OPA | mod | OPB     |     | r/m | s-i-b | disp  |                 |     |
| 3       | 11011 | d   | P   | OPA | 1       | 1   | OPB | R     | ST(i) |                 |     |
| 4       | 11011 | 0   | 0   | 1   | 1       | 1   | OP  |       |       |                 |     |
| 5       | 11011 | 0   | 1   | 1   | 1       | 1   | OP  |       |       |                 |     |
|         | 15-11 | 10  | 9   | 8   | 7       | 6   | 5   | 4     | 3     | 2               | 1 0 |

MF = メモリ・フォーマット

00 – 32 ビット実数

01 – 32 ビット整数

10 – 64 ビット実数

11 – 16 ビット整数

P = ポップ

0 – スタックをポップしない

1 – 操作後にスタックをポップ

d = デスティネーション

0 – デスティネーションは ST(0)

1 – デスティネーションは ST(i)

R XOR d = 0 – デスティネーション OP ソース

R XOR d = 1 – ソース OP デスティネーション

ST(i) = レジスタスタック要素 i

000 = スタックのトップ

001 = 2 番目のスタック要素

.

.

.

111 = 8 番目のスタック要素

ModR/M バイトの Mod フィールドと R/M フィールドは、整数命令の対応するフィールドと同じように解釈される。SIB バイトと disp (ディスペースメント) は、Mod フィールドと R/M フィールドをもつ命令にオプションで存在する。それらの存在は、整数命令に対するのと同様に、Mod と R/M の値に依存する。

表 B-27. に、浮動小数点命令のフォーマットおよびエンコーディングを示す。

表 B-27. 浮動小数点命令のフォーマットおよびエンコーディング

| 命令およびフォーマット                                       | エンコーディング                 |
|---------------------------------------------------|--------------------------|
| <b>F2XM1 – Compute 2<sup>ST(0)</sup> – 1</b>      | 11011 001 : 1111 0000    |
| <b>FABS – Absolute Value</b>                      | 11011 001 : 1110 0001    |
| <b>FADD – Add</b>                                 |                          |
| ST(0) ← ST(0) + 32-bit memory                     | 11011 000 : mod 000 r/m  |
| ST(0) ← ST(0) + 64-bit memory                     | 11011 100 : mod 000 r/m  |
| ST(d) ← ST(0) + ST(i)                             | 11011 d00 : 11 000 ST(i) |
| <b>FADDP – Add and Pop</b>                        |                          |
| ST(0) ← ST(0) + ST(i)                             | 11011 110 : 11 000 ST(i) |
| <b>FBLD – Load Binary Coded Decimal</b>           | 11011 111 : mod 100 r/m  |
| <b>FBSTP – Store Binary Coded Decimal and Pop</b> | 11011 111 : mod 110 r/m  |
| <b>FCHS – Change Sign</b>                         | 11011 001 : 1110 0000    |
| <b>FCLEX – Clear Exceptions</b>                   | 11011 011 : 1110 0010    |
| <b>FCOM – Compare Real</b>                        |                          |
| 32-bit memory                                     | 11011 000 : mod 010 r/m  |
| 64-bit memory                                     | 11011 100 : mod 010 r/m  |
| ST(i)                                             | 11011 000 : 11 010 ST(i) |
| <b>FCOMP – Compare Real and Pop</b>               |                          |
| 32-bit memory                                     | 11011 000 : mod 011 r/m  |
| 64-bit memory                                     | 11011 100 : mod 011 r/m  |
| ST(i)                                             | 11011 000 : 11 011 ST(i) |
| <b>FCOMPP – Compare Real and Pop Twice</b>        | 11011 110 : 11 011 001   |
| <b>FCOMIP – Compare Real, Set EFLAGS, and Pop</b> | 11011 111 : 11 110 ST(i) |
| <b>FCOS – Cosine of ST(0)</b>                     | 11011 001 : 1111 1111    |
| <b>FDECSTP – Decrement Stack-Top Pointer</b>      | 11011 001 : 1111 0110    |
| <b>FDIV – Divide</b>                              |                          |
| ST(0) ← ST(0) ÷ 32-bit memory                     | 11011 000 : mod 110 r/m  |
| ST(0) ← ST(0) ÷ 64-bit memory                     | 11011 100 : mod 110 r/m  |
| ST(d) ← ST(0) ÷ ST(i)                             | 11011 d00 : 1111 R ST(i) |

表 B-27. 浮動小数点命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                                                                                                                                              | エンコーディング                                                                       |
|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------|
| <b>FDIVP – Divide and Pop</b><br>ST(0) $\leftarrow$ ST(0) $\div$ ST(i)                                                                                                   | 11011 110 : 1111 1 ST(i)                                                       |
| <b>FDIVR – Reverse Divide</b><br>ST(0) $\leftarrow$ 32-bit memory $\div$ ST(0)<br>ST(0) $\leftarrow$ 64-bit memory $\div$ ST(0)<br>ST(d) $\leftarrow$ ST(i) $\div$ ST(0) | 11011 000 : mod 111 r/m<br>11011 100 : mod 111 r/m<br>11011 d00 : 1111 R ST(i) |
| <b>FDIVRP – Reverse Divide and Pop</b><br>ST(0) $\leftarrow$ ST(i) $\div$ ST(0)                                                                                          | 11011 110 : 1111 0 ST(i)                                                       |
| <b>FFREE – Free ST(i) Register</b>                                                                                                                                       | 11011 101 : 1100 0 ST(i)                                                       |
| <b>FIADD – Add Integer</b><br>ST(0) $\leftarrow$ ST(0) + 16-bit memory<br>ST(0) $\leftarrow$ ST(0) + 32-bit memory                                                       | 11011 110 : mod 000 r/m<br>11011 010 : mod 000 r/m                             |
| <b>FICOM – Compare Integer</b><br>16-bit memory<br>32-bit memory                                                                                                         | 11011 110 : mod 010 r/m<br>11011 010 : mod 010 r/m                             |
| <b>FICOMP – Compare Integer and Pop</b><br>16-bit memory<br>32-bit memory                                                                                                | 11011 110 : mod 011 r/m<br>11011 010 : mod 011 r/m                             |
| <b>FIDIV</b><br>ST(0) $\leftarrow$ ST(0) $\div$ 16-bit memory<br>ST(0) $\leftarrow$ ST(0) $\div$ 32-bit memory                                                           | 11011 110 : mod 110 r/m<br>11011 010 : mod 110 r/m                             |
| <b>FIDIVR</b><br>ST(0) $\leftarrow$ 16-bit memory $\div$ ST(0)<br>ST(0) $\leftarrow$ 32-bit memory $\div$ ST(0)                                                          | 11011 110 : mod 111 r/m<br>11011 010 : mod 111 r/m                             |
| <b>FILD – Load Integer</b><br>16-bit memory<br>32-bit memory<br>64-bit memory                                                                                            | 11011 111 : mod 000 r/m<br>11011 011 : mod 000 r/m<br>11011 111 : mod 101 r/m  |
| <b>FIMUL</b><br>ST(0) $\leftarrow$ ST(0) $\times$ 16-bit memory<br>ST(0) $\leftarrow$ ST(0) $\times$ 32-bit memory                                                       | 11011 110 : mod 001 r/m<br>11011 010 : mod 001 r/m                             |
| <b>FINCSTP – Increment Stack Pointer</b>                                                                                                                                 | 11011 001 : 1111 0111                                                          |
| <b>FINIT – Initialize Floating-Point Unit</b>                                                                                                                            |                                                                                |

表 B-27. 浮動小数点命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                                      | エンコーディング                 |
|------------------------------------------------------------------|--------------------------|
| <b>FIST – Store Integer</b>                                      |                          |
| 16-bit memory                                                    | 11011 111 : mod 010 r/m  |
| 32-bit memory                                                    | 11011 011 : mod 010 r/m  |
| <b>FISTP – Store Integer and Pop</b>                             |                          |
| 16-bit memory                                                    | 11011 111 : mod 011 r/m  |
| 32-bit memory                                                    | 11011 011 : mod 011 r/m  |
| 64-bit memory                                                    | 11011 111 : mod 111 r/m  |
| <b>FISUB</b>                                                     |                          |
| ST(0) ← ST(0) – 16-bit memory                                    | 11011 110 : mod 100 r/m  |
| ST(0) ← ST(0) – 32-bit memory                                    | 11011 010 : mod 100 r/m  |
| <b>FISUBR</b>                                                    |                          |
| ST(0) ← 16-bit memory – ST(0)                                    | 11011 110 : mod 101 r/m  |
| ST(0) ← 32-bit memory – ST(0)                                    | 11011 010 : mod 101 r/m  |
| <b>FLD – Load Real</b>                                           |                          |
| 32-bit memory                                                    | 11011 001 : mod 000 r/m  |
| 64-bit memory                                                    | 11011 101 : mod 000 r/m  |
| 80-bit memory                                                    | 11011 011 : mod 101 r/m  |
| ST(i)                                                            | 11011 001 : 11 000 ST(i) |
| <b>FLD1 – Load +1.0 into ST(0)</b>                               | 11011 001 : 1110 1000    |
| <b>FLDCW – Load Control Word</b>                                 | 11011 001 : mod 101 r/m  |
| <b>FLDENV – Load FPU Environment</b>                             | 11011 001 : mod 100 r/m  |
| <b>FLDL2E – Load <math>\log_2(\varepsilon)</math> into ST(0)</b> | 11011 001 : 1110 1010    |
| <b>FLDL2T – Load <math>\log_2(10)</math> into ST(0)</b>          | 11011 001 : 1110 1001    |
| <b>FLDLG2 – Load <math>\log_{10}(2)</math> into ST(0)</b>        | 11011 001 : 1110 1100    |
| <b>FLDLN2 – Load <math>\log_e(2)</math> into ST(0)</b>           | 11011 001 : 1110 1101    |
| <b>FLDPI – Load <math>\pi</math> into ST(0)</b>                  | 11011 001 : 1110 1011    |
| <b>FLDZ – Load +0.0 into ST(0)</b>                               | 11011 001 : 1110 1110    |
| <b>FMUL – Multiply</b>                                           |                          |
| ST(0) ← ST(0) × 32-bit memory                                    | 11011 000 : mod 001 r/m  |
| ST(0) ← ST(0) × 64-bit memory                                    | 11011 100 : mod 001 r/m  |
| ST(d) ← ST(0) × ST(i)                                            | 11011 d00 : 1100 1 ST(i) |
| <b>FMULP – Multiply</b>                                          |                          |
| ST(i) ← ST(0) × ST(i)                                            | 11011 110 : 1100 1 ST(i) |
| <b>FNOP – No Operation</b>                                       | 11011 001 : 1101 0000    |
| <b>FPATAN – Partial Arctangent</b>                               | 11011 001 : 1111 0011    |

表 B-27. 浮動小数点命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                     | エンコーディング                 |
|-------------------------------------------------|--------------------------|
| <b>FPREM – Partial Remainder</b>                | 11011 001 : 1111 1000    |
| <b>FPREM1 – Partial Remainder (IEEE)</b>        | 11011 001 : 1111 0101    |
| <b>FPTAN – Partial Tangent</b>                  | 11011 001 : 1111 0010    |
| <b>FRNDINT – Round to Integer</b>               | 11011 001 : 1111 1100    |
| <b>FRSTOR – Restore FPU State</b>               | 11011 101 : mod 100 r/m  |
| <b>FSAVE – Store FPU State</b>                  | 11011 101 : mod 110 r/m  |
| <b>FSCALE – Scale</b>                           | 11011 001 : 1111 1101    |
| <b>FSIN – Sine</b>                              | 11011 001 : 1111 1110    |
| <b>FSINCOS – Sine and Cosine</b>                | 11011 001 : 1111 1011    |
| <b>FSQRT – Square Root</b>                      | 11011 001 : 1111 1010    |
| <b>FST – Store Real</b>                         |                          |
| 32-bit memory                                   | 11011 001 : mod 010 r/m  |
| 64-bit memory                                   | 11011 101 : mod 010 r/m  |
| ST(i)                                           | 11011 101 : 11 010 ST(i) |
| <b>FSTCW – Store Control Word</b>               | 11011 001 : mod 111 r/m  |
| <b>FSTENV – Store FPU Environment</b>           | 11011 001 : mod 110 r/m  |
| <b>FSTP – Store Real and Pop</b>                |                          |
| 32-bit memory                                   | 11011 001 : mod 011 r/m  |
| 64-bit memory                                   | 11011 101 : mod 011 r/m  |
| 80-bit memory                                   | 11011 011 : mod 111 r/m  |
| ST(i)                                           | 11011 101 : 11 011 ST(i) |
| <b>FSTSW – Store Status Word into AX</b>        | 11011 111 : 1110 0000    |
| <b>FSTSW – Store Status Word into Memory</b>    | 11011 101 : mod 111 r/m  |
| <b>FSUB – Subtract</b>                          |                          |
| $ST(0) \leftarrow ST(0) - 32\text{-bit memory}$ | 11011 000 : mod 100 r/m  |
| $ST(0) \leftarrow ST(0) - 64\text{-bit memory}$ | 11011 100 : mod 100 r/m  |
| $ST(d) \leftarrow ST(0) - ST(i)$                | 11011 d00 : 1110 R ST(i) |
| <b>FSUBP – Subtract and Pop</b>                 |                          |
| $ST(0) \leftarrow ST(0) - ST(i)$                | 11011 110 : 1110 1 ST(i) |
| <b>FSUBR – Reverse Subtract</b>                 |                          |
| $ST(0) \leftarrow 32\text{-bit memory} - ST(0)$ | 11011 000 : mod 101 r/m  |
| $ST(0) \leftarrow 64\text{-bit memory} - ST(0)$ | 11011 100 : mod 101 r/m  |
| $ST(d) \leftarrow ST(i) - ST(0)$                | 11011 d00 : 1110 R ST(i) |
| <b>FSUBRP – Reverse Subtract and Pop</b>        |                          |
| $ST(i) \leftarrow ST(i) - ST(0)$                | 11011 110 : 1110 0 ST(i) |

表 B-27. 浮動小数点命令のフォーマットおよびエンコーディング（続き）

| 命令およびフォーマット                                                 | エンコーディング                 |
|-------------------------------------------------------------|--------------------------|
| <b>FTST – Test</b>                                          | 11011 001 : 1110 0100    |
| <b>FUCOM – Unordered Compare Real</b>                       | 11011 101 : 1110 0 ST(i) |
| <b>FUCOMP – Unordered Compare Real and Pop</b>              | 11011 101 : 1110 1 ST(i) |
| <b>FUCOMPP – Unordered Compare Real and Pop Twice</b>       | 11011 010 : 1110 1001    |
| <b>FUCOMI – Unorderd Compare Real and Set EFLAGS</b>        | 11011 011 : 11 101 ST(i) |
| <b>FUCOMIP – Unorderd Compare Real, Set EFLAGS, and Pop</b> | 11011 111 : 11 101 ST(i) |
| <b>FXAM – Examine</b>                                       | 11011 001 : 1110 0101    |
| <b>FXCH – Exchange ST(0) and ST(i)</b>                      | 11011 001 : 1100 1 ST(i) |
| <b>FXTRACT – Extract Exponent and Significand</b>           | 11011 001 : 1111 0100    |
| <b>FYL2X – ST(1) × log<sub>2</sub>(ST(0))</b>               | 11011 001 : 1111 0001    |
| <b>FYL2XP1 – ST(1) × log<sub>2</sub>(ST(0) + 1.0)</b>       | 11011 001 : 1111 1001    |
| <b>FWAIT – Wait until FPU Ready</b>                         | 1001 1011                |

# C

---

機能的に同等の  
インテル® C/C++  
コンパイラ組み込み関数



# 付録 C 機能的に同等のインテル® C/C++ コンパイラ組み込み関数



本章の2つの表は、インテル® MMX® テクノロジ命令、SSE、SSE2、SSE3 と機能的に同等のインテル® C/C++ コンパイラ組み込み関数をまとめたものである。

対応する命令を持たない組み込み関数が存在する可能性があるため、コンパイラのマニュアルを参照して、サポートしているすべての組み込み関数のリストを確認することを強くお勧めする。『Intel C/C++ Compiler User's Guide With Support for the Streaming SIMD Extensions 2』(資料番号 718195-2001) を参照のこと。本章は、これらの組み込み関数の使用法を示している。

表 C-1. は簡単な組み込み関数、表 C-2. は複合組み込み関数を示す。「複合組み込み関数」とは、2つ以上の命令で構成される組み込み関数のことである。

インテル C/C++ コンパイラの組み込み関数名には、次の命名規則が適用される。

\_mm\_<intrin\_op>\_<suffix>

各要素の意味は以下のとおりである。

<intrin\_op> 組み込み関数の基本動作を示す（例えば、加算の場合は add、減算の場合は sub）。

<suffix> 命令の操作対象となるデータ型を示す。各サフィックスの最初の 1 文字または 2 文字は、パックドデータ (p)、パックド拡張データ (ep) またはスカラデータ (s) を表す。その他の文字は、以下のデータ型を示す。

|      |                |
|------|----------------|
| s    | 単精度浮動小数点       |
| d    | 倍精度浮動小数点       |
| i128 | 符号付き 128 ビット整数 |
| i64  | 符号付き 64 ビット整数  |
| u64  | 符号なし 64 ビット整数  |
| i32  | 符号付き 32 ビット整数  |
| u32  | 符号なし 32 ビット整数  |

|     |               |
|-----|---------------|
| i16 | 符号付き 16 ビット整数 |
| u16 | 符号なし 16 ビット整数 |
| i8  | 符号付き 8 ビット整数  |
| u8  | 符号なし 8 ビット整数  |

変数 *r* は、通常は組み込み関数の戻り値を示す。変数名に付加された数字は、パックド・オブジェクトの要素を示す。例えば、*r0* は *r* の最下位ワードである。一部の組み込み関数は、2つ以上の命令を必要とするため、「複合」組み込み関数と呼ばれる。

パックド値は右から左の順に表現され、スカラ操作には最下位の値が使用される。例えば、次の操作の例を考える。

```
double a[2] = {1.0, 2.0};
__m128d t = _mm_load_pd(a);
```

この操作の結果は、次の各操作の結果と同じになる。

```
__m128d t = _mm_set_pd(2.0, 1.0);
__m128d t = _mm_setr_pd(1.0, 2.0);
```

つまり、値 *t* を保持する XMM レジスタは、次の図のようになる。



「スカラ」要素は 1.0 である。命令の性質上、一部の組み込み関数は、引き数として即値（定数整数リテラル）を必要とする。

コード内で組み込み関数を使用するには、次の構文の行を挿入する。

**data\_type intrinsic\_name (parameters)**

各要素の意味は次のとおりである。

|                |                                                                                        |
|----------------|----------------------------------------------------------------------------------------|
| data_type      | 戻りデータ型。void、int、__m64、__m128、__m128d、または __m128i である。void を返すのは、_mm_empty 組み込み関数だけである。 |
| intrinsic_name | 組み込み関数の名前。C/C++ コード内で、実際の命令の代わりに使用できる関数として機能する。                                        |
| parameters     | 各組み込み関数が必要とするパラメータ。                                                                    |

## C.1. 簡単な組み込み関数

表 C-1. 簡単な組み込み関数

| 一一モニック   | 組み込み関数                                               | 説明                                                                  |
|----------|------------------------------------------------------|---------------------------------------------------------------------|
| ADDPD    | <code>_m128d_mm_add_pd(_m128d a, _m128d b)</code>    | a と b の 2 つの倍精度浮動小数点 (DP FP) 値を加算する。                                |
| ADDPS    | <code>_m128_mm_add_ps(_m128 a, _m128 b)</code>       | a と b の 4 つの单精度浮動小数点 (SP FP) 値を加算する。                                |
| ADDSD    | <code>_m128d_mm_add_sd(_m128d a, _m128d b)</code>    | a と b の最下位の倍精度浮動小数点値 (DP FP) を加算する。上位の 3 つの倍精度浮動小数点値は、a からそのまま渡される。 |
| ADDSS    | <code>_m128_mm_add_ss(_m128 a, _m128 b)</code>       | a と b の最下位の单精度浮動小数点 (SP FP) 値を加算する。上位の 3 つの单精度浮動小数点値は、a からそのまま渡される。 |
| ADDSUBPD | <code>_m128d_mm_addsub_pd(_m128d a, _m128d b)</code> | XMM2/Mem と XMM1 のパックド倍精度浮動小数点値を加算 / 減算する。                           |
| ADDSUBPS | <code>_m128_mm_addsub_ps(_m128 a, _m128 b)</code>    | XMM2/Mem と XMM1 のパックド单精度浮動小数点値を加算 / 減算する。                           |
| ANDNPD   | <code>_m128d_mm_andnot_pd(_m128d a, _m128d b)</code> | a と b の 2 つの倍精度浮動小数点値の間でビット単位の AND-NOT 演算を実行する。                     |
| ANDNPS   | <code>_m128_mm_andnot_ps(_m128 a, _m128 b)</code>    | a と b の 4 つの单精度浮動小数点値の間でビット単位の AND-NOT 演算を実行する。                     |
| ANDPD    | <code>_m128d_mm_and_pd(_m128d a, _m128d b)</code>    | a と b の 2 つの倍精度浮動小数点値の間でビット単位の AND 演算を実行する。                         |
| ANDPS    | <code>_m128_mm_and_ps(_m128 a, _m128 b)</code>       | a と b の 4 つの单精度浮動小数点値の間でビット単位の AND 演算を実行する。                         |
| CLFLUSH  | <code>void _mm_clflush(void const *p)</code>         | コヒーレンシ・ドメイン内のすべてのキャッシュから、p が入っているキャッシュ・ラインをフラッシュし、無効化する。            |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック | 組み込み関数                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | 説明                                                                                                                                                                                                                                               |
|--------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| CMPPD  | $\_m128d\_mm\_cmpeq\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmplt\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmple\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpgt\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpge\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpneq\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpnlt\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpngt\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpnge\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpord\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpunord\_pd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpnle\_pd(\_m128d\ a, \_m128d\ b)$ | 「等しい」の条件で比較する。<br>「より小さい」の条件で比較する。<br>「より小さいか等しい」の条件で比較する。<br>「より大きい」の条件で比較する。<br>「より大きいか等しい」の条件で比較する。<br>「等しくない」の条件で比較する。<br>「より小さくない」の条件で比較する。<br>「より大きくなく等しくない」の条件で比較する。<br>「順序付けあり」の条件で比較する。<br>「順序付けなし」の条件で比較する。<br>「より小さくなく等しくない」の条件で比較する。 |
| CMPPS  | $\_m128\_mm\_cmpeq\_ps(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmplt\_ps(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmple\_ps(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpgt\_ps(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpge\_ps(\_m128\ a, \_m128\ b)$                                                                                                                                                                                                                                                                                                                                                                                                     | 「等しい」の条件で比較する。<br>「より小さい」の条件で比較する。<br>「より小さいか等しい」の条件で比較する。<br>「より大きい」の条件で比較する。<br>「より大きいか等しい」の条件で比較する。                                                                                                                                           |
| CMPPS  | $\_m128\_mm\_cmpneq\_ps(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpnlt\_ps(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpngt\_ps(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpnge\_ps(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpord\_ps(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpunord\_ps(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpnle\_ps(\_m128\ a, \_m128\ b)$                                                                                                                                                                                                                                                                                          | 「等しくない」の条件で比較する。<br>「より小さくない」の条件で比較する。<br>「より大きくなく等しくない」の条件で比較する。<br>「順序付けあり」の条件で比較する。<br>「順序付けなし」の条件で比較する。<br>「より小さくなく等しくない」の条件で比較する。                                                                                                           |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック | 組み込み関数                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              | 説明                                                                                                                                                                                                                                                                        |
|--------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| CMPSD  | $\_m128d\_mm\_cmpeq\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmplt\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmple\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpgt\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpge\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128\_mm\_cmpneq\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128\_mm\_cmpnlt\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpnle\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpngt\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpnge\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpord\_sd(\_m128d\ a, \_m128d\ b)$<br>$\_m128d\_mm\_cmpunord\_sd(\_m128d\ a, \_m128d\ b)$ | 「等しい」の条件で比較する。<br>「より小さい」の条件で比較する。<br>「より小さいか等しい」の条件で比較する。<br>「より大きい」の条件で比較する。<br>「より大きいか等しい」の条件で比較する。<br>「等しくない」の条件で比較する。<br>「より小さくない」の条件で比較する。<br>「より大きくなない」の条件で比較する。<br>「より大きくななく等しくない」の条件で比較する。<br>「順序付けあり」の条件で比較する。<br>「順序付けなし」の条件で比較する。<br>「より小さくななく等しくない」の条件で比較する。 |
| CMPSS  | $\_m128\_mm\_cmpeq\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmplt\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmple\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpgt\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpge\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpneq\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpnlt\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpnle\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpngt\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpnge\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpord\_ss(\_m128\ a, \_m128\ b)$<br>$\_m128\_mm\_cmpunord\_ss(\_m128\ a, \_m128\ b)$                                   | 「等しい」の条件で比較する。<br>「より小さい」の条件で比較する。<br>「より小さいか等しい」の条件で比較する。<br>「より大きい」の条件で比較する。<br>「より大きいか等しい」の条件で比較する。<br>「等しくない」の条件で比較する。<br>「より小さくない」の条件で比較する。<br>「より大きくなない」の条件で比較する。<br>「より大きくななく等しくない」の条件で比較する。<br>「順序付けあり」の条件で比較する。<br>「順序付けなし」の条件で比較する。<br>「より小さくななく等しくない」の条件で比較する。 |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック | 組み込み関数                                   | 説明                                                                                             |
|--------|------------------------------------------|------------------------------------------------------------------------------------------------|
| COMISD | int _mm_comieq_sd(__m128d a, __m128d b)  | 「a と b が等しい」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a と b が等しい場合は、1 が返される。それ以外の場合は、0 が返される。           |
|        | int _mm_comilt_sd(__m128d a, __m128d b)  | 「a が b より小さい」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a が b より小さい場合は、1 が返される。それ以外の場合は、0 が返される。         |
|        | int _mm_comile_sd(__m128d a, __m128d b)  | 「a が b より小さいか等しい」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a が b より小さいか等しい場合は、1 が返される。それ以外の場合は、0 が返される。 |
|        | int _mm_comigt_sd(__m128d a, __m128d b)  | 「a が b より大きい」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a が b より大きい場合は、1 が返される。それ以外の場合は、0 が返される。         |
|        | int _mm_comige_sd(__m128d a, __m128d b)  | 「a が b より大きいか等しい」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a が b より大きいか等しい場合は、1 が返される。それ以外の場合は、0 が返される。 |
|        | int _mm_comineq_sd(__m128d a, __m128d b) | 「a と b が等しくない」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a と b が等しくない場合は、1 が返される。それ以外の場合は、0 が返される。       |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック   | 組み込み関数                                                                                                                                                                                                                                                                                                                            | 説明                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
|----------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| COMISS   | <code>int _mm_comieq_ss(__m128 a, __m128 b)</code><br><code>int _mm_comilt_ss(__m128 a, __m128 b)</code><br><code>int _mm_comile_ss(__m128 a, __m128 b)</code><br><code>int _mm_comigt_ss(__m128 a, __m128 b)</code><br><code>int _mm_comige_ss(__m128 a, __m128 b)</code><br><code>int _mm_comineq_ss(__m128 a, __m128 b)</code> | <p>「a と b が等しい」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a と b が等しい場合は、1 が返される。それ以外の場合は、0 が返される。</p> <p>「a が b より小さい」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a が b より小さい場合は、1 が返される。それ以外の場合は、0 が返される。</p> <p>「a が b より小さいか等しい」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a が b より小さいか等しい場合は、1 が返される。それ以外の場合は、0 が返される。</p> <p>「a が b より大きい」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a が b より大きい場合は、1 が返される。それ以外の場合は、0 が返される。</p> <p>「a が b より大きいか等しい」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a が b より大きいか等しい場合は、1 が返される。それ以外の場合は、0 が返される。</p> <p>「a と b が等しくない」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a と b が等しくない場合は、1 が返される。それ以外の場合は、0 が返される。</p> |
| CVTDQ2PD | <code>_m128d _mm_cvtepi32_pd(__m128i a)</code>                                                                                                                                                                                                                                                                                    | a のパックド形式の最下位の 2 つの 32 ビット符号付き整数値を、2 つの倍精度浮動小数点値に変換する。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |
| CVTDQ2PS | <code>_m128 _mm_cvtepi32_ps(__m128i a)</code>                                                                                                                                                                                                                                                                                     | a のパックド形式の 4 つの 32 ビット符号付き整数値を、4 つの単精度浮動小数点値に変換する。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
| CVTPD2DQ | <code>_m128i _mm_cvtpd_epi32(__m128d a)</code>                                                                                                                                                                                                                                                                                    | a の 2 つの倍精度浮動小数点値を、2 つの 32 ビット符号付き整数値に変換する。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         |
| CVTPD2PI | <code>_m64 _mm_cvtpd_pi32(__m128d a)</code>                                                                                                                                                                                                                                                                                       | a の 2 つの倍精度浮動小数点値を、2 つの 32 ビット符号付き整数値に変換する。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         |
| CVTPD2PS | <code>_m128 _mm_cvtpd_ps(__m128d a)</code>                                                                                                                                                                                                                                                                                        | a の 2 つの倍精度浮動小数点値を、2 つの倍精度浮動小数点値に変換する。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック   | 組み込み関数                                                                                                | 説明                                                                             |
|----------|-------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------|
| CVTPI2PD | <code>_m128d_mm_cvtqi32_pd(_m64 a)</code>                                                             | a の 2 つの 32 ビット整数値を、2 つの単精度浮動小数点値に変換する。                                        |
| CVTPI2PS | <code>_m128_mm_cvt_pi2ps(_m128 a, _m64 b)</code><br><code>_m128_mm_cvtqi32_ps(_m128 a, _m64 b)</code> | b のパックド形式の 2 つの 32 ビット整数値を、2 つの単精度浮動小数点値に変換する。上位の 2 つの単精度浮動小数点値は、a からそのまま渡される。 |
| CVTPS2DQ | <code>_m128i_mm_cvtps_epi32(_m128 a)</code>                                                           | 現在の丸めモードにしたがって、a の 4 つの単精度浮動小数点値を 4 つの 32 ビット符号付き整数に変換する。                      |
| CVTPS2PD | <code>_m128d_mm_cvtps_pd(_m128 a)</code>                                                              | a の最下位の 2 つの単精度浮動小数点値を、倍精度浮動小数点値に変換する。                                         |
| CVTPS2PI | <code>_m64_mm_cvt_ps2pi(_m128 a)</code><br><code>_m64_mm_cvtps_pi32(_m128 a)</code>                   | 現在の丸めモードにしたがって、a の下位の 2 つの単精度浮動小数点値を 32 ビット整数に変換し、パックド形式の整数を返す。                |
| CVTSD2SI | <code>int_mm_cvtsd_si32(_m128d a)</code>                                                              | a の最下位の倍精度浮動小数点値を、32 ビット整数値に変換する。                                              |
| CVTSD2SS | <code>_m128_mm_cvtsd_ss(_m128 a, _m128d b)</code>                                                     | b の最下位の倍精度浮動小数点値を、単精度浮動小数点値に変換する。上位の 3 つの単精度浮動小数点値は、a からそのまま渡される。              |
| CVTSI2SD | <code>_m128d_mm_cvtsi32_sd(_m128d a, int b)</code>                                                    | 32 ビット整数値 b を倍精度浮動小数点値に変換する。上位の倍精度浮動小数点値は、a からそのまま渡される。                        |
| CVTSI2SS | <code>_m128_mm_cvt_si2ss(_m128 a, int b)</code><br><code>_m128_mm_cvtsi32_ss(_m128a, int b)</code>    | 32 ビット整数値 b を単精度浮動小数点値に変換する。上位の 3 つの単精度浮動小数点値は、a からそのまま渡される。                   |
| CVTSS2SD | <code>_m128d_mm_cvtss_sd(_m128d a, _m128 b)</code>                                                    | b の最下位の単精度浮動小数点値を、倍精度浮動小数点値に変換する。上位の倍精度浮動小数点値は、a からそのまま渡される。                   |
| CVTSS2SI | <code>int_mm_cvt_ss2si(_m128 a)</code><br><code>int_mm_cvtss_si32(_m128 a)</code>                     | a の最下位の単精度浮動小数点値を 32 ビット整数に変換する。                                               |
| CVTPD2DQ | <code>_m128i_mm_cvtpd_epi32(_m128d a)</code>                                                          | 切り捨てを使用して、a の 2 つの倍精度浮動小数点値を、2 つの 32 ビット符号付き整数値に変換する。上位の 2 つの整数値は、0 である。       |
| CVTPD2PI | <code>_m64_mm_cvtpd_pi32(_m128d a)</code>                                                             | 切り捨てを使用して、a の 2 つの倍精度浮動小数点値を、32 ビット符号付き整数値に変換する。                               |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック    | 組み込み関数                                                                                                                                                                             | 説明                                                                                                                                                                            |
|-----------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| CVTPPS2DQ | <code>_m128i_mm_cvtps_epi32(_m128 a)</code>                                                                                                                                        | 切り捨てを使用して、a の 4 つの 単精度浮動小数点値を、4 つの 32 ビット整数に変換する。                                                                                                                             |
| CVTPPS2PI | <code>_m64_mm_cvtt_ps2pi(_m128 a)</code><br><code>_m64_mm_cvtps_pi32(_m128 a)</code>                                                                                               | 切り捨てを使用して、a の下位の 2 つの単精度浮動小数点値を 2 つの 32 ビット整数に変換し、パックド形式の整数を返す。                                                                                                               |
| CVTTS2SI  | <code>int_mm_cvttsd_si32(_m128d a)</code>                                                                                                                                          | 切り捨てを使用して、a の最下位の倍精度浮動小数点値を、32 ビット符号付き整数に変換する。                                                                                                                                |
| CVTTSS2SI | <code>int_mm_cvtt_ss2si(_m128 a)</code><br><code>int_mm_cvtss_si32(_m128 a)</code><br><br><code>_m64_mm_cvtsi32_si64(int i)</code><br><br><code>int_mm_cvtsi64_si32(_m64 m)</code> | 現在の丸めモードにしたがって、a の最下位の単精度浮動小数点値を 32 ビット整数に変換する。<br>整数オブジェクト i を 64 ビットの <code>_m64</code> オブジェクトに変換する。整数值は 64 ビットにゼロ拡張される。<br><code>_m64</code> オブジェクト m の下位の 32 ビットを整数に変換する。 |
| DIVPD     | <code>_m128d_mm_div_pd(_m128d a, _m128d b)</code>                                                                                                                                  | a の 2 つの倍精度浮動小数点値を b の 2 つの倍精度浮動小数点値で割る。                                                                                                                                      |
| DIVPS     | <code>_m128_mm_div_ps(_m128 a, _m128 b)</code>                                                                                                                                     | a の 4 つの単精度浮動小数点値を b の 4 つの単精度浮動小数点値で割る。                                                                                                                                      |
| DIVSD     | <code>_m128d_mm_div_sd(_m128d a, _m128d b)</code>                                                                                                                                  | a の最下位の倍精度浮動小数点値を b の最下位の倍精度浮動小数点値で割る。上位の 3 つの倍精度浮動小数点値は、a からそのまま渡される。                                                                                                        |
| DIVSS     | <code>_m128_mm_div_ss(_m128 a, _m128 b)</code>                                                                                                                                     | a の最下位の単精度浮動小数点値を b の最下位の単精度浮動小数点値で割る。上位の 3 つの単精度浮動小数点値は、a からそのまま渡される。                                                                                                        |
| EMMS      | <code>void_mm_empty()</code>                                                                                                                                                       | MMX テクノロジの状態をクリアする。                                                                                                                                                           |
| HADDPD    | <code>_m128d_mm_hadd_pd(_m128d a, _m128d b)</code>                                                                                                                                 | XMM2/Mem と XMM1 のパックド倍精度浮動小数点値を水平方向に加算する。                                                                                                                                     |
| HADDPS    | <code>_m128_mm_hadd_ps(_m128 a, _m128 b)</code>                                                                                                                                    | XMM2/Mem と XMM1 のパックド単精度浮動小数点値を水平方向に加算する。                                                                                                                                     |
| HSUBPD    | <code>_m128d_mm_hsub_pd(_m128d a, _m128d b)</code>                                                                                                                                 | XMM2/Mem と XMM1 のパックド倍精度浮動小数点値を水平方向に減算する。                                                                                                                                     |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック         | 組み込み関数                                                                 | 説明                                                                                          |
|----------------|------------------------------------------------------------------------|---------------------------------------------------------------------------------------------|
| HSUBPS         | <code>_m128_mm_hsub_ps(_m128 a, _m128 b)</code>                        | XMM2/Mem と XMM1 のパックド単精度浮動小数点値を水平方向に減算する。                                                   |
| LDDQU          | <code>_m128i_mm_lddqu_si128(_m128i const *p)</code>                    | Mem から XMM レジスタに 128 ビットをロードする。                                                             |
| LDMXCSR        | <code>_mm_setcsr(unsigned int i)</code>                                | 制御レジスタを指定された値に設定する。                                                                         |
| LFENCE         | <code>void _mm_lfence(void)</code>                                     | プログラム順序で LFENCE 命令に先行するすべてのロード命令が、その LFENCE の後（後続）に実行されるどのロード命令よりも前にグローバルにアクセス可能になることを保証する。 |
| MASKMOVDQ<br>U | <code>void _mm_maskmoveu_si128(_m128i d, _m128i n,<br/>char *p)</code> | d のバイト要素をアドレス p に条件付きでストアする。セレクタ n の各バイトの最上位ビットによって、それに対応する d のバイトがストアされるかどうかが決まる。          |
| MASKMOVQ       | <code>void _mm_maskmove_si64(_m64 d, _m64 n,<br/>char *p)</code>       | d のバイト要素をアドレス p に条件付きでストアする。セレクタ n の各バイトの最上位ビットによって、それに対応する d のバイトがストアされるかどうかが決まる。          |
| MAXPD          | <code>_m128d_mm_max_pd(_m128d a, _m128d b)</code>                      | a と b の 2 つの倍精度浮動小数点値の最大値を計算する。                                                             |
| MAXPS          | <code>_m128_mm_max_ps(_m128 a, _m128 b)</code>                         | a と b の 4 つの单精度浮動小数点値の最大値を計算する。                                                             |
| MAXSD          | <code>_m128d_mm_max_sd(_m128d a, _m128d b)</code>                      | a と b の最下位の倍精度浮動小数点値の最大値を計算する。上位の倍精度浮動小数点値は、a からそのまま渡される。                                   |
| MAXSS          | <code>_m128_mm_max_ss(_m128 a, _m128 b)</code>                         | a と b の最下位の单精度浮動小数点値の最大値を計算する。上位の 3 つの单精度浮動小数点値は、a からそのまま渡される。                              |
| MFENCE         | <code>void _mm_mfence(void)</code>                                     | プログラムの順序でメモリフェンス命令に先行するすべてのメモリアクセスが、フェンスに後続するメモリアクセス命令よりも前に、グローバルにアクセス可能になることを保証する。         |
| MINPD          | <code>_m128d_mm_min_pd(_m128d a, _m128d b)</code>                      | a と b の 2 つの倍精度浮動小数点値の最小値を計算する。                                                             |
| MINPS          | <code>_m128_mm_min_ps(_m128 a, _m128 b)</code>                         | a と b の 4 つの单精度浮動小数点値の最小値を計算する。                                                             |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック  | 組み込み関数                                                                                                                                                                                               | 説明                                                                                                                                                                                                                                                                      |
|---------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| MINSD   | <code>__m128d_mm_min_sd(__m128d a, __m128d b)</code>                                                                                                                                                 | <code>a</code> と <code>b</code> の最下位の倍精度浮動小数点値の最小値を計算する。上位の倍精度浮動小数点値は、 <code>a</code> からそのまま渡される。                                                                                                                                                                       |
| MINSS   | <code>__m128_mm_min_ss(__m128 a, __m128 b)</code>                                                                                                                                                    | <code>a</code> と <code>b</code> の最下位の单精度浮動小数点値の最小値を計算する。上位の 3 つの单精度浮動小数点値は、 <code>a</code> からそのまま渡される。                                                                                                                                                                  |
| MONITOR | <code>void_mm_monitor(void const *p, unsigned extensions, unsigned hints)</code>                                                                                                                     | ハードウェアによってモニタされるリニアアドレス範囲を設定し、モニタをアクティブにする。このアドレス範囲は、ライトバック・メモリ・キャッシュ・タイプでなければならない。                                                                                                                                                                                     |
| MOVAPD  | <code>__m128d_mm_load_pd(double * p)</code><br><br><code>void_mm_store_pd(double *p, __m128d a)</code>                                                                                               | 2 つの倍精度浮動小数点値をロードする。アドレス <code>p</code> は 16 バイト・アライメントでなければならない。<br><br>2 つの倍精度浮動小数点値をアドレス <code>p</code> にストアする。アドレス <code>p</code> は 16 バイト・アライメントでなければならない。                                                                                                         |
| MOVAPS  | <code>__m128_mm_load_ps(float * p)</code><br><br><code>void_mm_store_ps(float *p, __m128 a)</code>                                                                                                   | 4 つの单精度浮動小数点値をロードする。アドレス <code>p</code> は 16 バイト・アライメントでなければならない。<br><br>4 つの单精度浮動小数点値をストアする。アドレス <code>p</code> は 16 バイト・アライメントでなければならない。                                                                                                                              |
| MOVD    | <code>__m128i_mm_cvtsi32_si128(int a)</code><br><br><code>int_mm_cvtsi128_si32( __m128i a)</code><br><br><code>__m64_mm_cvtsi32_si64(int a)</code><br><br><code>int_mm_cvtsi64_si32( __m64 a)</code> | 32 ビット整数 <code>a</code> を 128 ビット・デスティネーションの最下位 32 ビットに移動し、上位ビットをゼロ拡張する。<br><br><code>a</code> の最下位の 32 ビット整数を 32 ビット符号付き整数に移動する。<br><br>32 ビット整数 <code>a</code> を 64 ビット・デスティネーションの下位 32 ビットに移動し、上位ビットをゼロ拡張する。<br><br><code>a</code> の下位の 32 ビット整数を 32 ビット符号付き整数に移動する。 |
| MOVDDUP | <code>__m128d_mm_movedup_pd(__m128d a)</code><br><code>__m128d_mm_loaddup_pd(double const * dp)</code>                                                                                               | 下位の倍精度データ要素を表す 64 ビットを XMM2/Mem から XMM1 レジスタに移動し、複製する。                                                                                                                                                                                                                  |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック  | 組み込み関数                                                 | 説明                                                                                 |
|---------|--------------------------------------------------------|------------------------------------------------------------------------------------|
| MOVDQA  | <code>_m128i_mm_load_si128(_m128i * p)</code>          | p から 128 ビット値をロードする。アドレス p は 16 バイト・アライメントでなければならない。                               |
|         | <code>void_mm_store_si128(_m128i *p, _m128i a)</code>  | a の 128 ビット値をアドレス p にストアする。アドレス p は 16 バイト・アライメントでなければならない。                        |
| MOVDQU  | <code>_m128i_mm_loadu_si128(_m128i * p)</code>         | p から 128 ビット値をロードする。アドレス p は 16 バイト・アライメントである必要はない。                                |
|         | <code>void_mm_storeu_si128(_m128i *p, _m128i a)</code> | a の 128 ビット値をアドレス p にストアする。アドレス p は 16 バイト・アライメントである必要はない。                         |
| MOVDQ2Q | <code>_m64_mm_movepi64_pi64(_m128i a)</code>           | a の最下位の 64 ビットを <code>_m64</code> タイプに返す。                                          |
| MOVHLPS | <code>_m128_mm_movehl_ps(_m128 a, _m128 b)</code>      | b の上位の 2 つの单精度浮動小数点値を、結果の下位の 2 つの单精度浮動小数点値に移動する。a の上位の 2 つの单精度浮動小数点値は、そのまま結果に渡される。 |
| MOVHPD  | <code>_m128d_mm_loadh_pd(_m128d a, double * p)</code>  | 倍精度浮動小数点値を、アドレス p からデスティネーションの上位の 64 ビットにロードする。下位の 64 ビットは、a からそのまま渡される。           |
|         | <code>void_mm_storeh_pd(double * p, _m128d a)</code>   | a の上位の倍精度浮動小数点値をアドレス p にストアする。                                                     |
| MOVHPS  | <code>_m128_mm_loadh_pi(_m128 a, _m64 * p)</code>      | 上位の 2 つの单精度浮動小数点値として、アドレス p から 64 ビットのデータをロードする。下位の 2 つの値は、a からそのまま渡される。           |
|         | <code>void_mm_storeh_pi(_m64 * p, _m128 a)</code>      | a の上位の 2 つの单精度浮動小数点値をアドレス p にストアする。                                                |
| MOVLPD  | <code>_m128d_mm_loadl_pd(_m128d a, double * p)</code>  | 倍精度浮動小数点値を、アドレス p からデスティネーションの下位の 64 ビットにロードする。上位の 64 ビットは、a からそのまま渡される。           |
|         | <code>void_mm_storl_pd(double * p, _m128d a)</code>    | a の下位の倍精度浮動小数点値をアドレス p にストアする。                                                     |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック   | 組み込み関数                                                    | 説明                                                                                                           |
|----------|-----------------------------------------------------------|--------------------------------------------------------------------------------------------------------------|
| MOVLP S  | <code>_m128_mm_loadl_pi(__m128 a, __m64 *p)</code>        | 下位の 2 つの单精度浮動小数点値として、アドレス p から 64 ビットのデータをロードする。上位の 2 つの値は、a からそのまま渡される。                                     |
|          | <code>void_mm_storel_pi(__m64 * p, __m128 a)</code>       | a の下位の 2 つの单精度浮動小数点値をアドレス p にストアする。                                                                          |
| MOVLHPS  | <code>_m128_mm_movelh_ps(__m128 a, __m128 b)</code>       | b の下位の 2 つの单精度浮動小数点値を、結果の上位の 2 つの单精度浮動小数点値に移動する。a の下位の 2 つの单精度浮動小数点値は、そのまま結果に渡される。                           |
| MOVMSKPD | <code>int_mm_movemask_pd(__m128d a)</code>                | a の 2 つの倍精度浮動小数点値の符号付きビットから 2 ビット・マスクを作成する。                                                                  |
| MOVMSKPS | <code>int_mm_movemask_ps(__m128 a)</code>                 | 4 つの单精度浮動小数点値の最上位ビットから 4 ビット・マスクを作成する。                                                                       |
| MOVNTDQ  | <code>void_mm_stream_si128(__m128i * p, __m128i a)</code> | キャッシュを汚染せずに、a のデータをアドレス p にストアする。p が入っているキャッシュ・ラインがすでにキャッシュ内にある場合は、キャッシュは更新される。アドレスは 16 バイト・アライメントでなければならない。 |
| MOVNTPD  | <code>void_mm_stream_pd(double * p, __m128d a)</code>     | キャッシュを汚染せずに、a のデータをアドレス p にストアする。アドレスは 16 バイト・アライメントでなければならない。                                               |
| MOVNTPS  | <code>void_mm_stream_ps(float * p, __m128 a)</code>       | キャッシュを汚染せずに、a のデータをアドレス p にストアする。アドレスは 16 バイト・アライメントでなければならない。                                               |
| MOVNTI   | <code>void_mm_stream_si32(int * p, int a)</code>          | キャッシュを汚染せずに、a のデータをアドレス p にストアする。                                                                            |
| MOVNTQ   | <code>void_mm_stream_pi(__m64 * p, __m64 a)</code>        | キャッシュを汚染せずに、a のデータをアドレス p にストアする。                                                                            |
| MOVQ     | <code>_m128i_mm_loadl_epi64(__m128i * p)</code>           | p から下位 64 ビットをデステイネーションの下位 64 ビットにロードし、上位 64 ビットをゼロ拡張する。                                                     |
|          | <code>void_mm_storel_epi64(__m128i * p, __m128i a)</code> | a の下位 64 ビットを p の下位 64 ビットにストアする。                                                                            |
|          | <code>_m128i_mm_move_epi64(__m128i a)</code>              | a の下位 64 ビットをデステイネーションの下位 64 ビットに移動する。上位 64 ビットはクリアされる。                                                      |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック   | 組み込み関数                                                                                                                                                               | 説明                                                                                                                                                                                                                         |
|----------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| MOVQ2DQ  | <code>__m128i_mm_movi64_epi64(__m64 a)</code>                                                                                                                        | a の 64 ビットをデスティネーションの下位 64 ビットに移動し、上位ビットをゼロ拡張する。                                                                                                                                                                           |
| MOVSD    | <code>__m128d_mm_load_sd(double * p)</code><br><br><code>void_mm_store_sd(double * p, __m128d a)</code><br><br><code>__m128d_mm_move_sd(__m128d a, __m128d b)</code> | 倍精度浮動小数点値を p から最下位の倍精度浮動小数点値にロードし、上位の倍精度浮動小数点値をクリアする。アドレス p は 16 バイト・アライメントである必要はない。<br><br>最下位の倍精度浮動小数点値をアドレス p にストアする。アドレス p は 16 バイト・アライメントである必要はない。<br><br>b の最下位の倍精度浮動小数点値をデスティネーションに設定する。上位の倍精度浮動小数点値は、a からそのまま渡される。 |
| MOVSHDUP | <code>__m128_mm_movehdup_ps(__m128 a)</code>                                                                                                                         | パックド単精度データ要素を表す 128 ビットを XMM2/Mem から XMM1 レジスタに移動し、上位の要素を複製する。                                                                                                                                                             |
| MOVSLDUP | <code>__m128_mm_moveldup_ps(__m128 a)</code>                                                                                                                         | パックド単精度データ要素を表す 128 ビットを XMM2/Mem から XMM1 レジスタに移動し、下位の要素を複製する。                                                                                                                                                             |
| MOVSS    | <code>__m128_mm_load_ss(float * p)</code><br><br><code>void_mm_store_ss(float * p, __m128 a)</code><br><br><code>__m128_mm_move_ss(__m128 a, __m128 b)</code>        | 単精度浮動小数点値を最下位ワードにロードし、上位の 3 ワードをクリアする。<br><br>最下位の単精度浮動小数点値をストアする。<br><br>最下位ワードを b の単精度浮動小数点値に設定する。上位の 3 つの単精度浮動小数点値は、a からそのまま渡される。                                                                                       |
| MOVUPD   | <code>__m128d_mm_loadu_pd(double * p)</code><br><br><code>void_mm_storeu_pd(double *p, __m128d a)</code>                                                             | p から 2 つの倍精度浮動小数点値をロードする。アドレス p が 16 バイト・アライメントである必要はない。<br><br>a の 2 つの倍精度浮動小数点値を p にストアする。アドレス p が 16 バイト・アライメントである必要はない。                                                                                                |
| MOVUPS   | <code>__m128_mm_loadu_ps(float * p)</code><br><br><code>void_mm_storeu_ps(float *p, __m128 a)</code>                                                                 | 4 つの単精度浮動小数点値をロードする。アドレスが 16 バイト・アライメントである必要はない。<br><br>4 つの単精度浮動小数点値をストアする。アドレスが 16 バイト・アライメントである必要はない。                                                                                                                   |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック   | 組み込み関数                                                          | 説明                                                                                                   |
|----------|-----------------------------------------------------------------|------------------------------------------------------------------------------------------------------|
| MULPD    | <code>_m128d_mm_mul_pd(_m128d a, _m128d b)</code>               | a の 2 つの倍精度浮動小数点値に b の 2 つの倍精度浮動小数点値を掛ける。                                                            |
| MULPS    | <code>_m128_mm_mul_ss(_m128 a, _m128 b)</code>                  | a の 4 つの单精度浮動小数点値に b の 4 つの单精度浮動小数点値を掛ける。                                                            |
| MULSD    | <code>_m128d_mm_mul_sd(_m128d a, _m128d b)</code>               | a の最下位の倍精度浮動小数点値に b の最下位の倍精度浮動小数点値を掛ける。上位の倍精度浮動小数点値は、a からそのまま渡される。                                   |
| MULSS    | <code>_m128_mm_mul_ss(_m128 a, _m128 b)</code>                  | a の最下位の单精度浮動小数点値に b の最下位の单精度浮動小数点値を掛ける。上位の 3 つの单精度浮動小数点値は、a からそのまま渡される。                              |
| MWAIT    | <code>void_mm_mwait(unsigned extensions, unsigned hints)</code> | 特定のクラスのイベントが発生するまで、プロセッサが命令の実行を中止し、インプリメンテーション・デpendend・オプティマイズド・ステータスに移行するように指示するヒント。               |
| ORPD     | <code>_m128d_mm_or_pd(_m128d a, _m128d b)</code>                | a と b の 2 つの倍精度浮動小数点値の間でビット単位の OR 演算を実行する。                                                           |
| ORPS     | <code>_m128_mm_or_ps(_m128 a, _m128 b)</code>                   | a と b の 4 つの单精度浮動小数点値の間でビット単位の OR 演算を実行する。                                                           |
| PACKSSWB | <code>_m128i_mm_packs_epi16(_m128i m1, _m128i m2)</code>        | 符号付きの飽和を使用して、m1 の 8 つの 16 ビット値を結果の下位の 8 つの 8 ビット値にパックし、m2 の 8 つの 16 ビット値を結果の上位の 8 つの 8 ビット値にパックする。   |
| PACKSSWB | <code>_m64_mm_packs_pi16(_m64 m1, _m64 m2)</code>               | 符号付きの飽和を使用して、m1 の 4 つの 16 ビット値を結果の下位の 4 つの 8 ビット値にパックし、m2 の 4 つの 16 ビット値を結果の上位の 4 つの 8 ビット値にパックする。   |
| PACKSSDW | <code>_m128i_mm_packs_epi32 (_m128i m1, _m128i m2)</code>       | 符号付きの飽和を使用して、m1 の 4 つの 32 ビット値を結果の下位の 4 つの 16 ビット値にパックし、m2 の 4 つの 32 ビット値を結果の上位の 4 つの 16 ビット値にパックする。 |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック   | 組み込み関数                                                    | 説明                                                                                                   |
|----------|-----------------------------------------------------------|------------------------------------------------------------------------------------------------------|
| PACKSSDW | <code>_m64_mm_packs_pi32(_m64 m1, _m64 m2)</code>         | 符号付きの飽和を使用して、m1 の 2 つの 32 ビット値を結果の下位の 2 つの 16 ビット値にパックし、m2 の 2 つの 32 ビット値を結果の上位の 2 つの 16 ビット値にパックする。 |
| PACKUSWB | <code>_m128i_mm_packus_epi16(_m128i m1, _m128i m2)</code> | 符号なしの飽和を使用して、m1 の 8 つの 16 ビット値を結果の下位の 8 つの 8 ビット値にパックし、m2 の 8 つの 16 ビット値を結果の上位の 8 つの 8 ビット値にパックする。   |
| PACKUSWB | <code>_m64_mm_packs_pu16(_m64 m1, _m64 m2)</code>         | 符号なしの飽和を使用して、m1 の 4 つの 16 ビット値を結果の下位の 4 つの 8 ビット値にパックし、m2 の 4 つの 16 ビット値を結果の上位の 4 つの 8 ビット値にパックする。   |
| PADDB    | <code>_m128i_mm_add_ep18(_m128i m1, _m128i m2)</code>     | m1 の 16 個の 8 ビット値を、m2 の 16 個の 8 ビット値に加算する。                                                           |
| PADDB    | <code>_m64_mm_add_pi8(_m64 m1, _m64 m2)</code>            | m1 の 8 つの 8 ビット値を、m2 の 8 つの 8 ビット値に加算する。                                                             |
| PADDW    | <code>_m128i_mm_addw_epi16(_m128i m1, _m128i m2)</code>   | m1 の 8 つの 16 ビット値を、m2 の 8 つの 16 ビット値に加算する。                                                           |
| PADDW    | <code>_m64_mm_addw_pi16(_m64 m1, _m64 m2)</code>          | m1 の 4 つの 16 ビット値を、m2 の 4 つの 16 ビット値に加算する。                                                           |
| PADDD    | <code>_m128i_mm_add_ep132(_m128i m1, _m128i m2)</code>    | m1 の 4 つの 32 ビット値を、m2 の 4 つの 32 ビット値に加算する。                                                           |
| PADDD    | <code>_m64_mm_add_pi32(_m64 m1, _m64 m2)</code>           | m1 の 2 つの 32 ビット値を、m2 の 2 つの 32 ビット値に加算する。                                                           |
| PADDQ    | <code>_m128i_mm_add_epi64(_m128i m1, _m128i m2)</code>    | m1 の 2 つの 64 ビット値を、m2 の 2 つの 64 ビット値に加算する。                                                           |
| PADDQ    | <code>_m64_mm_add_si64(_m64 m1, _m64 m2)</code>           | m1 の 64 ビット値を、m2 の 64 ビット値に加算する。                                                                     |
| PADDSB   | <code>_m128i_mm_adds_epi8(_m128i m1, _m128i m2)</code>    | m1 の 16 個の符号付き 8 ビット値を、m2 の 16 個の符号付き 8 ビット値に加算し、飽和させる。                                              |
| PADDSB   | <code>_m64_mm_adds_pi8(_m64 m1, _m64 m2)</code>           | m1 の 8 つの符号付き 8 ビット値を、m2 の 8 つの符号付き 8 ビット値に加算し、飽和させる。                                                |
| PADDSW   | <code>_m128i_mm_adds_epi16(_m128i m1, _m128i m2)</code>   | m1 の 8 つの符号付き 16 ビット値を、m2 の 8 つの符号付き 16 ビット値に加算し、飽和させる。                                              |
| PADDSW   | <code>_m64_mm_adds_pi16(_m64 m1, _m64 m2)</code>          | m1 の 4 つの符号付き 16 ビット値を、m2 の 4 つの符号付き 16 ビット値に加算し、飽和させる。                                              |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック  | 組み込み関数                                                    | 説明                                                                                |
|---------|-----------------------------------------------------------|-----------------------------------------------------------------------------------|
| PADDUSB | <code>_m128i_mm_adds_epu8(_m128i m1, _m128i m2)</code>    | m1 の 16 個の符号なし 8 ビット値を、m2 の 16 個の符号なし 8 ビット値に加算し、飽和させる。                           |
| PADDUSB | <code>_m64_mm_adds_pu8(_m64 m1, _m64 m2)</code>           | m1 の 8 つの符号なし 8 ビット値を、m2 の 8 つの符号なし 8 ビット値に加算し、飽和させる。                             |
| PADDUSW | <code>_m128i_mm_adds_epu16(_m128i m1, _m128i m2)</code>   | m1 の 8 つの符号なし 16 ビット値を、m2 の 8 つの符号なし 16 ビット値に加算し、飽和させる。                           |
| PADDUSW | <code>_m64_mm_adds_pu16(_m64 m1, _m64 m2)</code>          | m1 の 4 つの符号なし 16 ビット値を、m2 の 4 つの符号なし 16 ビット値に加算し、飽和させる。                           |
| PAND    | <code>_m128i_mm_and_si128(_m128i m1, _m128i m2)</code>    | m1 の 128 ビット値と m2 の 128 ビット値の間でビット単位の AND 演算を実行する。                                |
| PAND    | <code>_m64_mm_and_si64(_m64 m1, _m64 m2)</code>           | m1 の 64 ビット値と m2 の 64 ビット値の間でビット単位の AND 演算を実行する。                                  |
| PANDN   | <code>_m128i_mm_andnot_si128(_m128i m1, _m128i m2)</code> | m1 の 128 ビット値に対して NOT 演算を実行し、その結果と m2 の 128 ビット値の間でビット単位の AND 演算を実行する。            |
| PANDN   | <code>_m64_mm_andnot_si64(_m64 m1, _m64 m2)</code>        | m1 の 64 ビット値に対して NOT 演算を実行し、その結果と m2 の 64 ビット値の間でビット単位の AND 演算を実行する。              |
| PAUSE   | <code>void_mm_pause(void)</code>                          | 次の命令の実行をプロセッサ固有の時間だけ遅らせる。アーキテクチャ上の状態は変更されない。                                      |
| PAVGB   | <code>_m128i_mm_avg_epu8(_m128i a, _m128i b)</code>       | 2 つのオペランドの 16 個の 8 ビット値のパックド平均を計算する。                                              |
| PAVGB   | <code>_m64_mm_avg_pu8(_m64 a, _m64 b)</code>              | 2 つのオペランドの 8 つの 8 ビット値のパックド平均を計算する。                                               |
| PAVGW   | <code>_m128i_mm_avg_epu16(_m128i a, _m128i b)</code>      | 2 つのオペランドの 8 つの 16 ビット値のパックド平均を計算する。                                              |
| PAVGW   | <code>_m64_mm_avg_pu16(_m64 a, _m64 b)</code>             | 2 つのオペランドの 4 つの 16 ビット値のパックド平均を計算する。                                              |
| PCMPEQB | <code>_m128i_mm_cmpeq_epi8(_m128i m1, _m128i m2)</code>   | m1 の 8 ビット値と m2 の 8 ビット値がすべて等しい場合は、結果の 8 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。 |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック  | 組み込み関数                                                   | 説明                                                                                    |
|---------|----------------------------------------------------------|---------------------------------------------------------------------------------------|
| PCMPEQB | <code>_m64_mm_cmpeq_pi8(_m64 m1, _m64 m2)</code>         | m1 の 8 ビット値と m2 の 8 ビット値がすべて等しい場合は、結果の 8 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。     |
| PCMPEQW | <code>_m128i_mm_cmpeq_epi16(_m128i m1, _m128i m2)</code> | m1 の 16 ビット値と m2 の 16 ビット値がすべて等しい場合は、結果の 62 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。  |
| PCMPEQW | <code>_m64_mm_cmpeq_pi16(_m64 m1, _m64 m2)</code>        | m1 の 16 ビット値と m2 の 16 ビット値がすべて等しい場合は、結果の 16 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。  |
| PCMPEQD | <code>_m128i_mm_cmpeq_epi32(_m128i m1, _m128i m2)</code> | m1 の 32 ビット値と m2 の 32 ビット値がすべて等しい場合は、結果の 32 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。  |
| PCMPEQD | <code>_m64_mm_cmpeq_pi32(_m64 m1, _m64 m2)</code>        | m1 の 32 ビット値と m2 の 32 ビット値がすべて等しい場合は、結果の 32 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。  |
| PCMPGTB | <code>_m128i_mm_cmpgt_epi8(_m128i m1, _m128i m2)</code>  | m1 の 8 ビット値がすべて m2 の 8 ビット値より大きい場合は、結果の 8 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。    |
| PCMPGTB | <code>_m64_mm_cmpgt_pi8(_m64 m1, _m64 m2)</code>         | m1 の 8 ビット値がすべて m2 の 8 ビット値より大きい場合は、結果の 8 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。    |
| PCMPGTW | <code>_m128i_mm_cmpgt_epi16(_m128i m1, _m128i m2)</code> | m1 の 16 ビット値がすべて m2 の 16 ビット値より大きい場合は、結果の 16 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。 |
| PCMPGTW | <code>_m64_mm_cmpgt_pi16(_m64 m1, _m64 m2)</code>        | m1 の 16 ビット値がすべて m2 の 16 ビット値より大きい場合は、結果の 16 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。 |
| PCMPGTD | <code>_m128i_mm_cmpgt_epi32(_m128i m1, _m128i m2)</code> | m1 の 32 ビット値がすべて m2 の 32 ビット値より大きい場合は、結果の 32 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。 |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック   | 組み込み関数                                                      | 説明                                                                                                   |
|----------|-------------------------------------------------------------|------------------------------------------------------------------------------------------------------|
| PCMPGTD  | <code>_m64_mm_cmpgt_pi32(_m64 m1, _m64 m2)</code>           | m1 の 32 ビット値がすべて m2 の 32 ビット値より大きい場合は、結果の 32 ビット値をすべて 1 にセットする。それ以外の場合は、すべて 0 にセットする。                |
| PEXTRW   | <code>int_mm_extract_epi16(_m128i a, int n)</code>          | a の 8 ワードのうち 1 つを抽出する。セレクタ n は即値でなければならない。                                                           |
| PEXTRW   | <code>int_mm_extract_pi16(_m64 a, int n)</code>             | a の 4 ワードのうち 1 つを抽出する。セレクタ n は即値でなければならない。                                                           |
| PINSRW   | <code>_m128i_mm_insert_epi16(_m128i a, int d, int n)</code> | a の 8 ワードのうち 1 つにワード d を挿入する。セレクタ n は即値でなければならない。                                                    |
| PINSRW   | <code>_m64_mm_insert_pi16(_m64 a, int d, int n)</code>      | a の 4 ワードのうち 1 つにワード d を挿入する。セレクタ n は即値でなければならない。                                                    |
| PMADDWD  | <code>_m128i_mm_madd_epi16(_m128i m1, _m128i m2)</code>     | m1 の 8 つの 16 ビット値に m2 の 8 つの 16 ビット値を掛け、8 つの 32 ビットの中間結果を求める。次に、これらの値を 2 つずつ合計して、4 つの 32 ビットの結果を求める。 |
| PMADDWD  | <code>_m64_mm_madd_pi16(_m64 m1, _m64 m2)</code>            | m1 の 4 つの 16 ビット値に m2 の 4 つの 16 ビット値を掛け、4 つの 32 ビットの中間結果を求める。次に、これらの値を 2 つずつ合計して、2 つの 32 ビットの結果を求める。 |
| PMAXSW   | <code>_m128i_mm_max_epi16(_m128i a, _m128i b)</code>        | a と b の 16 ビット整数を比較して、要素ごとに最大値を求める。                                                                  |
| PMAXSW   | <code>_m64_mm_max_pi16(_m64 a, _m64 b)</code>               | a と b のワードを比較して、要素ごとに最大値を求める。                                                                        |
| PMAXUB   | <code>_m128i_mm_max_epu8(_m128i a, _m128i b)</code>         | a と b の符号なしバイトを比較して、要素ごとに最大値を求める。                                                                    |
| PMAXUB   | <code>_m64_mm_max_pu8(_m64 a, _m64 b)</code>                | a と b の符号なしバイトを比較して、要素ごとに最大値を求める。                                                                    |
| PMINSW   | <code>_m128i_mm_min_epi16(_m128i a, _m128i b)</code>        | a と b の 16 ビット整数を比較して、要素ごとに最小値を求める。                                                                  |
| PMINSW   | <code>_m64_mm_min_pi16(_m64 a, _m64 b)</code>               | a と b のワードを比較して、要素ごとに最小値を求める。                                                                        |
| PMINUB   | <code>_m128i_mm_min_epu8(_m128i a, _m128i b)</code>         | a と b の符号なしバイトを比較して、要素ごとに最小値を求める。                                                                    |
| PMINUB   | <code>_m64_mm_min_pu8(_m64 a, _m64 b)</code>                | a と b の符号なしバイトを比較して、要素ごとに最小値を求める。                                                                    |
| PMOVMSKB | <code>int_mm_movemask_epi8(_m128i a)</code>                 | a の各バイトの最上位ビットから 16 ビット・マスクを作成する。                                                                    |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック    | 組み込み関数                                                                                  | 説明                                                                                                                                              |
|-----------|-----------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------|
| PMOVMSKB  | int _mm_movemask_pi8(__m64 a)                                                           | a の各バイトの最上位ビットから 8 ビット・マスクを作成する。                                                                                                                |
| PMULHUW   | _m128i_mm_mulhi_epu16(__m128i a, __m128i b)                                             | a の 8 つの符号なしワードに b の 8 つの符号なしワードを掛け、パックド形式の 8 つの 32 ビットの中間結果の上位 16 ビットを返す。                                                                      |
| PMULHUW   | _m64_mm_mulhi_pu16(__m64 a, __m64 b)                                                    | a の 4 つの符号なしワードに b の 4 つの符号なしワードを掛け、パックド形式の 4 つの 32 ビットの中間結果の上位 16 ビットを返す。                                                                      |
| PMULHW    | _m128i_mm_mulhi_edi16(__m128i m1, __m128i m2)                                           | m1 の 8 つの符号付き 16 ビット値に m2 の 8 つの符号付き 16 ビット値を掛け、8 つの結果の上位 16 ビットを返す。                                                                            |
| PMULHW    | _m64_mm_mulhi_pi16(__m64 m1, __m64 m2)                                                  | m1 の 4 つの符号付き 16 ビット値に m2 の 4 つの符号付き 16 ビット値を掛け、4 つの結果の上位 16 ビットを返す。                                                                            |
| PMULLW    | _m128i_mm_mullo_edi16(__m128i m1, __m128i m2)                                           | m1 の 8 つの符号付き 16 ビット値に m2 の 8 つの符号付き 16 ビット値を掛け、8 つの結果の下位 16 ビットを返す。                                                                            |
| PMULLW    | _m64_mm_mullo_pi16(__m64 m1, __m64 m2)                                                  | m1 の 4 つの符号付き 16 ビット値に m2 の 4 つの符号付き 16 ビット値を掛け、4 つの結果の下位 16 ビットを返す。                                                                            |
| PMULUDQ   | _m64_mm_mul_su32(__m64 m1, __m64 m2)<br><br>_m128i_mm_mul_epu32(__m128i m1, __m128i m2) | m1 の下位の符号なし 32 ビット値に m2 の下位の符号なし 32 ビット値を掛け、64 ビットの結果をストアする。<br><br>m1 の下位の 2 つの符号なし 32 ビット値に m2 の下位の 2 つの符号なし 32 ビット値を掛け、2 つの 64 ビットの結果をストアする。 |
| POR       | _m64_mm_or_si64(__m64 m1, __m64 m2)                                                     | m1 の 64 ビット値と m2 の 64 ビット値の間でビット単位の OR 演算を実行する。                                                                                                 |
| POR       | _m128i_mm_or_si128(__m128i m1, __m128i m2)                                              | m1 の 128 ビット値と m2 の 128 ビット値の間でビット単位の OR 演算を実行する。                                                                                               |
| PREFETCHh | void _mm_prefetch(char *a, int sel)                                                     | 1 キャッシュ・ラインのデータを、アドレス p からプロセッサに「より近い」位置にロードする。値 sel は、プリフェッチ操作のタイプを指定する。                                                                       |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック  | 組み込み関数                                                   | 説明                                                                                                       |
|---------|----------------------------------------------------------|----------------------------------------------------------------------------------------------------------|
| PSADBW  | <code>_m128i_mm_sad_epu8(_m128i a, _m128i b)</code>      | a と b の 16 個の符号なし 8 ビット値の差の絶対値を計算して、上位の 8 つの差と下位の 8 つの差をそれぞれ合計し、2 つの 16 ビットの結果を上位 64 ビットと下位 64 ビットに格納する。 |
| PSADBW  | <code>_m64_mm_sad_pu8(_m64 a, _m64 b)</code>             | a と b の 8 つの符号なし 8 ビット値の差の絶対値を計算して、8 つの差を合計し、16 ビットの結果を格納する。上位 3 ワードはクリアされる。                             |
| PSHUFD  | <code>_m128i_mm_shuffle_epi32(_m128i a, int n)</code>    | a の 4 つの dword の組み合わせを返す。セレクタ n は即値でなければならない。                                                            |
| PSHUFHW | <code>_m128i_mm_shufflehi_epi16(_m128i a, int n)</code>  | n で指定された、a の上位 4 つの 16 ビット・ワードをシャッフルする。セレクタ n は即値でなければならない。                                              |
| PSHUFLW | <code>_m128i_mm_shufflelo_epi16(_m128i a, int n)</code>  | n で指定された、a の下位 4 つの 16 ビット・ワードをシャッフルする。セレクタ n は即値でなければならない。                                              |
| PSHUFW  | <code>_m64_mm_shuffle_pi16(_m64 a, int n)</code>         | a の 4 ワードの組み合わせを返す。セレクタ n は即値でなければならない。                                                                  |
| PSLLW   | <code>_m128i_mm_sll_epi16(_m128i m, _m128i count)</code> | m の 8 つの各 16 ビット値を、count で指定された量だけ左にシフトし、下位はゼロで埋める。                                                      |
| PSLLW   | <code>_m128i_mm_slli_epi16(_m128i m, int count)</code>   | m の 8 つの各 16 ビット値を、count で指定された量だけ左にシフトし、下位はゼロで埋める。                                                      |
| PSLLW   | <code>_m64_mm_sll_pi16(_m64 m, _m64 count)</code>        | m の 4 つの 16 ビット値を、count で指定された量だけ左にシフトし、下位はゼロで埋める。最高のパフォーマンスを得るために、count は定数でなければならない。                   |
|         | <code>_m64_mm_slli_pi16(_m64 m, int count)</code>        | m の 4 つの 16 ビット値を、count で指定された量だけ左にシフトし、下位はゼロで埋める。最高のパフォーマンスを得るために、count は定数でなければならない。                   |
| PSLDD   | <code>_m128i_mm_slli_epi32(_m128i m, int count)</code>   | m の 4 つの各 32 ビット値を、count で指定された量だけ左にシフトし、下位はゼロで埋める。                                                      |
|         | <code>_m128i_mm_sll_epi32(_m128i m, _m128i count)</code> | m の 4 つの各 32 ビット値を、count で指定された量だけ左にシフトし、下位はゼロで埋める。最高のパフォーマンスを得るために、count は定数でなければならない。                  |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック | 組み込み関数                                                                                                              | 説明                                                                                                                                                                                                                                 |
|--------|---------------------------------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| PSLLD  | <code>_m64_mm_slli_pi32(_m64 m, int count)</code><br><code>_m64_mm_sll_pi32(_m64 m, __m64 count)</code>             | <p><code>m</code> の 2 つの 32 ビット値を、<code>count</code> で指定された量だけ左にシフトし、下位はゼロで埋める。</p> <p><code>m</code> の 2 つの 32 ビット値を、<code>count</code> で指定された量だけ左にシフトし、下位はゼロで埋める。最高のパフォーマンスを得るためにには、<code>count</code> は定数でなければならない。</p>         |
| PSLLQ  | <code>_m64_mm_sll_si64(_m64 m, __m64 count)</code><br><code>_m64_mm_slli_si64(_m64 m, int count)</code>             | <p><code>m</code> の 64 ビット値を、<code>count</code> で指定された量だけ左にシフトし、下位はゼロで埋める。</p> <p><code>m</code> の 64 ビット値を、<code>count</code> で指定された量だけ左にシフトし、下位はゼロで埋める。最高のパフォーマンスを得るためにには、<code>count</code> は定数でなければならない。</p>                   |
| PSLLQ  | <code>_m128i_mm_sll_epi64(_m128i m, __m128i count)</code><br><code>_m128i_mm_slli_epi64(_m128i m, int count)</code> | <p><code>m</code> の 2 つの各 64 ビット値を、<code>count</code> で指定された量だけ左にシフトし、下位はゼロで埋める。</p> <p><code>m</code> の 2 つの各 64 ビット値を、<code>count</code> で指定された量だけ左にシフトし、下位はゼロで埋める。最高のパフォーマンスを得るためにには、<code>count</code> は定数でなければならない。</p>       |
| PSLLDQ | <code>_m128i_mm_slli_si128(_m128i m, int imm)</code>                                                                | <code>m</code> の 128 ビット値を、 <code>imm</code> バイットで左にシフトし、下位はゼロで埋める。                                                                                                                                                                |
| PSRAW  | <code>_m128i_mm_sra_epi16(_m128i m, __m128i count)</code><br><code>_m128i_mm_srai_epi16(_m128i m, int count)</code> | <p><code>m</code> の 8 つの各 16 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位は符号ビットで埋める。</p> <p><code>m</code> の 8 つの各 16 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位は符号ビットで埋める。最高のパフォーマンスを得るためにには、<code>count</code> は定数でなければならない。</p> |
| PSRAW  | <code>_m64_mm_sra_pi16(_m64 m, __m64 count)</code><br><code>_m64_mm_srai_pi16(_m64 m, int count)</code>             | <p><code>m</code> の 4 つの 16 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位は符号ビットで埋める。</p> <p><code>m</code> の 4 つの 16 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位は符号ビットで埋める。最高のパフォーマンスを得るためにには、<code>count</code> は定数でなければならない。</p>   |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック | 組み込み関数                                                                                                                | 説明                                                                                                                                                                                                                               |
|--------|-----------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| PSRAD  | <code>_m128i_mm_sra_epi32 (_m128i m, __m128i count)</code><br><code>_m128i_mm_srai_epi32 (_m128i m, int count)</code> | <p><code>m</code> の 4 つの各 32 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位は符号ビットで埋める。</p> <p><code>m</code> の 4 つの各 32 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位は符号ビットで埋める。最高のパフォーマンスを得るために、<code>count</code> は定数でなければならない。</p> |
| PSRAD  | <code>_m64_mm_sra_pi32 (_m64 m, __m64 count)</code><br><code>_m64_mm_srai_pi32 (_m64 m, int count)</code>             | <p><code>m</code> の 2 つの 32 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位は符号ビットで埋める。</p> <p><code>m</code> の 2 つの 32 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位は符号ビットで埋める。最高のパフォーマンスを得るために、<code>count</code> は定数でなければならない。</p>   |
| PSRLW  | <code>_m128i_mm_srl_epi16 (_m128i m, __m128i count)</code><br><code>_m128i_mm_srli_epi16 (_m128i m, int count)</code> | <p><code>m</code> の 8 つの各 16 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位はゼロで埋める。</p> <p><code>m</code> の 8 つの各 16 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位はゼロで埋める。</p>                                                        |
| PSRLW  | <code>_m64_mm_srl_pi16 (_m64 m, __m64 count)</code><br><code>_m64_mm_srli_pi16 (_m64 m, int count)</code>             | <p><code>m</code> の 4 つの 16 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位はゼロで埋める。</p> <p><code>m</code> の 4 つの 16 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位はゼロで埋める。最高のパフォーマンスを得るために、<code>count</code> は定数でなければならない。</p>         |
| PSRLD  | <code>_m128i_mm_srl_epi32 (_m128i m, __m128i count)</code><br><code>_m128i_mm_srli_epi32 (_m128i m, int count)</code> | <p><code>m</code> の 4 つの各 32 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位はゼロで埋める。</p> <p><code>m</code> の 4 つの各 32 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位はゼロで埋める。最高のパフォーマンスを得るために、<code>count</code> は定数でなければならない。</p>       |
| PSRLD  | <code>_m64_mm_srl_pi32 (_m64 m, __m64 count)</code><br><code>_m64_mm_srli_pi32 (_m64 m, int count)</code>             | <p><code>m</code> の 2 つの 32 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位はゼロで埋める。</p> <p><code>m</code> の 2 つの 32 ビット値を、<code>count</code> で指定された量だけ右にシフトし、上位はゼロで埋める。最高のパフォーマンスを得るために、<code>count</code> は定数でなければならない。</p>         |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック | 組み込み関数                                                                                                              | 説明                                                                                                                                               |
|--------|---------------------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------|
| PSRLQ  | <code>_m128i_mm_srl_epi64(_m128i m, __m128i count)</code><br><code>_m128i_mm_srli_epi64(_m128i m, int count)</code> | m の 2 つの各 64 ビット値を、count で指定された量だけ右にシフトし、上位はゼロで埋める。<br>m の 2 つの各 64 ビット値を、count で指定された量だけ右にシフトし、上位はゼロで埋める。最高のパフォーマンスを得るためにには、count は定数でなければならない。 |
| PSRLQ  | <code>_m64_mm_srl_si64(_m64 m, __m64 count)</code><br><code>_m64_mm_srli_si64(_m64 m, int count)</code>             | m の 64 ビット値を、count で指定された量だけ右にシフトし、上位はゼロで埋める。<br>m の 64 ビット値を、count で指定された量だけ右にシフトし、上位はゼロで埋める。最高のパフォーマンスを得るためにには、count は定数でなければならない。             |
| PSRLDQ | <code>_m128i_mm_srli_si128(_m128i m, int imm)</code>                                                                | m の 128 ビット値を、imm バイットで右にシフトし、下位はゼロで埋める。                                                                                                         |
| PSUBB  | <code>_m128i_mm_sub_epi8(_m128i m1, __m128i m2)</code>                                                              | m1 の 16 個の 8 ビット値から m2 の 16 個の 8 ビット値を引く。                                                                                                        |
| PSUBB  | <code>_m64_mm_sub_pi8(_m64 m1, __m64 m2)</code>                                                                     | m1 の 8 つの 8 ビット値から m2 の 8 つの 8 ビット値を引く。                                                                                                          |
| PSUBW  | <code>_m128i_mm_sub_epi16(_m128i m1, __m128i m2)</code>                                                             | m1 の 8 つの 16 ビット値から m2 の 8 つの 16 ビット値を引く。                                                                                                        |
| PSUBW  | <code>_m64_mm_sub_pi16(_m64 m1, __m64 m2)</code>                                                                    | m1 の 4 つの 16 ビット値から m2 の 4 つの 16 ビット値を引く。                                                                                                        |
| PSUBD  | <code>_m128i_mm_sub_epi32(_m128i m1, __m128i m2)</code>                                                             | m1 の 4 つの 32 ビット値から m2 の 4 つの 32 ビット値を引く。                                                                                                        |
| PSUBD  | <code>_m64_mm_sub_pi32(_m64 m1, __m64 m2)</code>                                                                    | m1 の 2 つの 32 ビット値から m2 の 2 つの 32 ビット値を引く。                                                                                                        |
| PSUBQ  | <code>_m128i_mm_sub_epi64(_m128i m1, __m128i m2)</code>                                                             | m1 の 2 つの 64 ビット値から m2 の 2 つの 64 ビット値を引く。                                                                                                        |
| PSUBQ  | <code>_m64_mm_sub_si64(_m64 m1, __m64 m2)</code>                                                                    | m1 の 64 ビット値から m2 の 64 ビット値を引く。                                                                                                                  |
| PSUBSB | <code>_m128i_mm_subs_epi8(_m128i m1, __m128i m2)</code>                                                             | m1 の 16 個の符号付き 8 ビット値から m2 の 16 個の符号付き 8 ビット値を引き、飽和させる。                                                                                          |
| PSUBSB | <code>_m64_mm_subs_pi8(_m64 m1, __m64 m2)</code>                                                                    | m1 の 8 つの符号付き 8 ビット値から m2 の 8 つの符号付き 8 ビット値を引き、飽和させる。                                                                                            |
| PSUBSW | <code>_m128i_mm_subs_epi16(_m128i m1, __m128i m2)</code>                                                            | m1 の 8 つの符号付き 16 ビット値から m2 の 8 つの符号付き 16 ビット値を引き、飽和させる。                                                                                          |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック     | 組み込み関数                                                        | 説明                                                                    |
|------------|---------------------------------------------------------------|-----------------------------------------------------------------------|
| PSUBSW     | <code>_m64_mm_sub_pi16(__m64 m1, __m64 m2)</code>             | m1 の 4 つの符号付き 16 ビット値から m2 の 4 つの符号付き 16 ビット値を引き、飽和させる。               |
| PSUBUSB    | <code>_m128i_mm_sub_epu8(__m128i m1, __m128i m2)</code>       | m1 の 16 個の符号なし 8 ビット値から m2 の 16 個の符号なし 8 ビット値を引き、飽和させる。               |
| PSUBUSB    | <code>_m64_mm_sub_pu8(__m64 m1, __m64 m2)</code>              | m1 の 8 つの符号なし 8 ビット値から m2 の 8 つの符号なし 8 ビット値を引き、飽和させる。                 |
| PSUBUSW    | <code>_m128i_mm_sub_epu16(__m128i m1, __m128i m2)</code>      | m1 の 8 つの符号なし 16 ビット値から m2 の 8 つの符号なし 16 ビット値を引き、飽和させる。               |
| PSUBUSW    | <code>_m64_mm_sub_pu16(__m64 m1, __m64 m2)</code>             | m1 の 4 つの符号なし 16 ビット値から m2 の 4 つの符号なし 16 ビット値を引き、飽和させる。               |
| PUNPCKHBW  | <code>_m64_mm_unpackhi_pi8(__m64 m1, __m64 m2)</code>         | m1 の上位半分の 4 つの 8 ビット値と m2 の上位半分の 4 つの 8 ビット値をインタリープし、m1 の最下位の要素をとる。   |
| PUNPCKHBW  | <code>_m128i_mm_unpackhi_epi8(__m128i m1, __m128i m2)</code>  | m1 の上位半分の 8 つの 8 ビット値と m2 の上位半分の 8 つの 8 ビット値をインタリープする。                |
| PUNPCKHWD  | <code>_m64_mm_unpackhi_pi16(__m64 m1, __m64 m2)</code>        | m1 の上位半分の 2 つの 16 ビット値と m2 の上位半分の 2 つの 16 ビット値をインタリープし、m1 の最下位の要素をとる。 |
| PUNPCKHWD  | <code>_m128i_mm_unpackhi_epi16(__m128i m1, __m128i m2)</code> | m1 の上位半分の 4 つの 16 ビット値と m2 の上位半分の 4 つの 16 ビット値をインタリープする。              |
| PUNPCKHDQ  | <code>_m64_mm_unpackhi_pi32(__m64 m1, __m64 m2)</code>        | m1 の上位半分の 32 ビット値と m2 の上位半分の 32 ビット値をインタリープし、m1 の最下位の要素をとる。           |
| PUNPCKHDQ  | <code>_m128i_mm_unpackhi_epi32(__m128i m1, __m128i m2)</code> | m1 の上位半分の 2 つの 32 ビット値と m2 の上位半分の 2 つの 32 ビット値をインタリープする。              |
| PUNPCKHQDQ | <code>_m128i_mm_unpackhi_epi64(__m128i m1, __m128i m2)</code> | m1 の上位半分の 64 ビット値と m2 の上位半分の 64 ビット値をインタリープする。                        |
| PUNPCKLBW  | <code>_m64_mm_unpacklo_pi8(__m64 m1, __m64 m2)</code>         | m1 の下位半分の 4 つの 8 ビット値と m2 の下位半分の 4 つの 8 ビット値をインタリープし、m1 の最下位の要素をとる。   |
| PUNPCKLBW  | <code>_m128i_mm_unpacklo_epi8(__m128i m1, __m128i m2)</code>  | m1 の下位半分の 8 つの 8 ビット値と m2 の下位半分の 8 つの 8 ビット値をインタリープする。                |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック     | 組み込み関数                                                                   | 説明                                                                    |
|------------|--------------------------------------------------------------------------|-----------------------------------------------------------------------|
| PUNPCKLWD  | <code>_m64_mm_unpacklo_pi16(_m64 m1, _m64 m2)</code>                     | m1 の下位半分の 2 つの 16 ビット値と m2 の下位半分の 2 つの 16 ビット値をインタリープし、m1 の最下位の要素をとる。 |
| PUNPCKLWD  | <code>_m128i_mm_unpacklo_epi16(_m128i m1, _m128i m2)</code>              | m1 の下位半分の 4 つの 16 ビット値と m2 の下位半分の 4 つの 16 ビット値をインタリープする。              |
| PUNPCKLDQ  | <code>_m64_mm_unpacklo_pi32(_m64 m1, _m64 m2)</code>                     | m1 の下位半分の 32 ビット値と m2 の下位半分の 32 ビット値をインタリープし、m1 の最下位の要素をとる。           |
| PUNPCKLDQ  | <code>_m128i_mm_unpacklo_epi32(_m128i m1, _m128i m2)</code>              | m1 の下位半分の 2 つの 32 ビット値と m2 の下位半分の 2 つの 32 ビット値をインタリープする。              |
| PUNPCKLQDQ | <code>_m128i_mm_unpacklo_epi64(_m128i m1, _m128i m2)</code>              | m1 の下位半分の 64 ビット値と m2 の下位半分の 64 ビット値をインタリープする。                        |
| PXOR       | <code>_m64_mm_xor_si64(_m64 m1, _m64 m2)</code>                          | m1 の 64 ビット値と m2 の 64 ビット値の間でビット単位の XOR 演算を実行する。                      |
| PXOR       | <code>_m128i_mm_xor_si128(_m128i m1, _m128i m2)</code>                   | m1 の 128 ビット値と m2 の 128 ビット値の間でビット単位の XOR 演算を実行する。                    |
| RCPPS      | <code>_m128_mm_rcp_ps(_m128 a)</code>                                    | a の 4 つの単精度浮動小数点値の逆数の近似値を計算する。                                        |
| RCPSS      | <code>_m128_mm_rcp_ss(_m128 a)</code>                                    | a の最下位の単精度浮動小数点値の逆数の近似値を計算する。上位の 3 つの単精度浮動小数点値はそのまま渡される。              |
| RSQRTPS    | <code>_m128_mm_rsqrt_ps(_m128 a)</code>                                  | a の 4 つの単精度浮動小数点値の平方根の逆数の近似値を計算する。                                    |
| RSQRTSS    | <code>_m128_mm_rsqrt_ss(_m128 a)</code>                                  | a の最下位の単精度浮動小数点値の平方根の逆数の近似値を計算する。上位の 3 つの単精度浮動小数点値はそのまま渡される。          |
| SFENCE     | <code>void_mm_sfence(void)</code>                                        | フェンスより前にあるすべてのストア命令が、フェンスより後にあらストア命令より前に、グローバルにアクセス可能になることを保証する。      |
| SHUFPD     | <code>_m128d_mm_shuffle_pd(_m128d a, _m128d b, unsigned int imm8)</code> | マスク imm8 に基づいて、a と b から 2 つの倍精度浮動小数点値を選択する。マスクは即値でなければならない。           |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック  | 組み込み関数                                                                | 説明                                                                      |
|---------|-----------------------------------------------------------------------|-------------------------------------------------------------------------|
| SHUFFPS | <code>_m128_mm_shuffle_ps(_m128 a, _m128 b, unsigned int imm8)</code> | マスク imm8 に基づいて、a と b から 4 つの单精度浮動小数点値を選択する。マスクは即値でなければならない。             |
| SQRTPD  | <code>_m128d_mm_sqrt_pd(_m128d a)</code>                              | a の 2 つの倍精度浮動小数点値の平方根を計算する。                                             |
| SQRTPS  | <code>_m128_mm_sqrt_ps(_m128 a)</code>                                | a の 4 つの单精度浮動小数点値の平方根を計算する。                                             |
| SQRTSD  | <code>_m128d_mm_sqrt_sd(_m128d a)</code>                              | a の最下位の倍精度浮動小数点値の平方根を計算する。上位の倍精度浮動小数点値はそのまま渡される。                        |
| SQRTSS  | <code>_m128_mm_sqrt_ss(_m128 a)</code>                                | a の最下位の单精度浮動小数点値の平方根を計算する。上位の 3 つの单精度浮動小数点値はそのまま渡される。                   |
| STMXCSR | <code>_mm_getcsr(void)</code>                                         | 制御レジスタの内容を返す。                                                           |
| SUBPD   | <code>_m128d_mm_sub_pd(_m128d a, _m128d b)</code>                     | a の 2 つの倍精度浮動小数点値から b の 2 つの倍精度浮動小数点値を引く。                               |
| SUBPS   | <code>_m128_mm_sub_ps(_m128 a, _m128 b)</code>                        | a の 4 つの单精度浮動小数点値から b の 4 つの单精度浮動小数点値を引く。                               |
| SUBSD   | <code>_m128d_mm_sub_sd(_m128d a, _m128d b)</code>                     | a の最下位の倍精度浮動小数点値から b の最下位の倍精度浮動小数点値を引く。上位の倍精度浮動小数点値は、a からそのまま渡される。      |
| SUBSS   | <code>_m128_mm_sub_ss(_m128 a, _m128 b)</code>                        | a の最下位の单精度浮動小数点値から b の最下位の单精度浮動小数点値を引く。上位の 3 つの单精度浮動小数点値は、a からそのまま渡される。 |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック  | 組み込み関数                                                                                                                                                                                                                                                                                    | 説明                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   |
|---------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| UCOMISD | int _mm_ucomieq_sd(__m128d a, __m128d b)<br><br>int _mm_ucomilt_sd(__m128d a, __m128d b)<br><br>int _mm_ucomile_sd(__m128d a, __m128d b)<br><br>int _mm_ucomigt_sd(__m128d a, __m128d b)<br><br>int _mm_ucomige_sd(__m128d a, __m128d b)<br><br>int _mm_ucomineq_sd(__m128d a, __m128d b) | 「a と b が等しい」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a と b が等しい場合は、1 が返される。それ以外の場合は、0 が返される。<br><br>「a が b より小さい」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a が b より小さい場合は、1 が返される。それ以外の場合は、0 が返される。<br><br>「a が b より小さいか等しい」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a が b より小さい場合は、1 が返される。それ以外の場合は、0 が返される。<br><br>「a が b より大きい」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a が b より大きい場合は、1 が返される。それ以外の場合は、0 が返される。<br><br>「a が b より大きいか等しい」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a が b より大きい場合は、1 が返される。それ以外の場合は、0 が返される。<br><br>「a と b が等しくない」という条件で、a と b の最下位の倍精度浮動小数点値を比較する。a と b が等しくない場合は、1 が返される。それ以外の場合は、0 が返される。 |

表 C-1. 簡単な組み込み関数（続き）

| ニーモニック   | 組み込み関数                                                                                                                                                                                                                                                                                                                                  | 説明                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |
|----------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| UCOMISS  | <code>int _mm_ucomieq_ss(__m128 a, __m128 b)</code><br><code>int _mm_ucomilt_ss(__m128 a, __m128 b)</code><br><code>int _mm_ucomile_ss(__m128 a, __m128 b)</code><br><code>int _mm_ucomigt_ss(__m128 a, __m128 b)</code><br><code>int _mm_ucomige_ss(__m128 a, __m128 b)</code><br><code>int _mm_ucomineq_ss(__m128 a, __m128 b)</code> | <p>「a と b が等しい」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a と b が等しい場合は、1 が返される。それ以外の場合は、0 が返される。</p> <p>「a が b より小さい」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a が b より小さい場合は、1 が返される。それ以外の場合は、0 が返される。</p> <p>「a が b より小さいか等しい」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a が b より小さい場合は、1 が返される。それ以外の場合は、0 が返される。</p> <p>「a が b より大きい」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a が b より大きい場合は、1 が返される。それ以外の場合は、0 が返される。</p> <p>「a が b より大きいか等しい」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a が b より大きい場合は、1 が返される。それ以外の場合は、0 が返される。</p> <p>「a と b が等しくない」という条件で、a と b の最下位の単精度浮動小数点値を比較する。a と b が等しくない場合は、1 が返される。それ以外の場合は、0 が返される。</p> |
| UNPCKHPD | <code>_m128d _mm_unpackhi_pd(__m128d a, __m128d b)</code>                                                                                                                                                                                                                                                                               | a と b の上位の倍精度浮動小数点値を選択し、インタリープする。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           |
| UNPCKHPS | <code>_m128 _mm_unpackhi_ps(__m128 a, __m128 b)</code>                                                                                                                                                                                                                                                                                  | a と b の上位の 2 つの単精度浮動小数点値を選択し、インタリープする。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      |
| UNPCKLPD | <code>_m128d _mm_unpacklo_pd(__m128d a, __m128d b)</code>                                                                                                                                                                                                                                                                               | a と b の下位の倍精度浮動小数点値を選択し、インタリープする。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           |
| UNPCKLPS | <code>_m128 _mm_unpacklo_ps(__m128 a, __m128 b)</code>                                                                                                                                                                                                                                                                                  | a と b の下位の 2 つの単精度浮動小数点値を選択し、インタリープする。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      |
| XORPD    | <code>_m128d _mm_xor_pd(__m128d a, __m128d b)</code>                                                                                                                                                                                                                                                                                    | a と b の 2 つの倍精度浮動小数点値の間でビット単位の EXOR（排他的論理和）演算を実行する。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         |
| XORPS    | <code>_m128 _mm_xor_ps(__m128 a, __m128 b)</code>                                                                                                                                                                                                                                                                                       | a と b の 4 つの単精度浮動小数点値の間でビット単位の EXOR（排他的論理和）演算を実行する。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         |

## C.2. 複合組み込み関数

表 C-2. 複合組み込み関数

| 一一モニック      | 組み込み関数                                                                                                                                                                                 | 説明                                 |
|-------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------------|
| (composite) | <code>_m128i_mm_set_epi64(__m64 q1, __m64 q0)</code>                                                                                                                                   | 2つの 64 ビット値を 2 つの入力値に設定する。         |
| (composite) | <code>_m128i_mm_set_epi32(int i3, int i2, int i1, int i0)</code>                                                                                                                       | 4つの 32 ビット値を 4 つの入力値に設定する。         |
| (composite) | <code>_m128i_mm_set_epi16(short w7, short w6, short w5, short w4, short w3, short w2, short w1, short w0)</code>                                                                       | 8つの 16 ビット値を 8 つの入力値に設定する。         |
| (composite) | <code>_m128i_mm_set_epi8(char w15, char w14, char w13, char w12, char w11, char w10, char w9, char w8, char w7, char w6, char w5, char w4, char w3, char w2, char w1, char w0)</code>  | 16 個の 8 ビット値を 16 個の入力値に設定する。       |
| (composite) | <code>_m128i_mm_set1_epi64(__m64 q)</code>                                                                                                                                             | 2つの 64 ビット値を入力値に設定する。              |
| (composite) | <code>_m128i_mm_set1_epi32(int a)</code>                                                                                                                                               | 4つの 32 ビット値を入力値に設定する。              |
| (composite) | <code>_m128i_mm_set1_epi16(short a)</code>                                                                                                                                             | 8つの 16 ビット値を入力値に設定する。              |
| (composite) | <code>_m128i_mm_set1_epi8(char a)</code>                                                                                                                                               | 16 個の 8 ビット値を入力値に設定する。             |
| (composite) | <code>_m128i_mm_setr_epi64(__m64 q1, __m64 q0)</code>                                                                                                                                  | 2つの 64 ビット値を、逆の順番で 2 つの入力値に設定する。   |
| (composite) | <code>_m128i_mm_setr_epi32(int i3, int i2, int i1, int i0)</code>                                                                                                                      | 4つの 32 ビット値を、逆の順番で 4 つの入力値に設定する。   |
| (composite) | <code>_m128i_mm_setr_epi16(short w7, short w6, short w5, short w4, short w3, short w2, short w1, short w0)</code>                                                                      | 8つの 16 ビット値を、逆の順番で 8 つの入力値に設定する。   |
| (composite) | <code>_m128i_mm_setr_epi8(char w15, char w14, char w13, char w12, char w11, char w10, char w9, char w8, char w7, char w6, char w5, char w4, char w3, char w2, char w1, char w0)</code> | 16 個の 8 ビット値を、逆の順番で 16 個の入力値に設定する。 |
| (composite) | <code>_m128i_mm_setzero_si128()</code>                                                                                                                                                 | すべてのビットを 0 に設定する。                  |
| (composite) | <code>_m128_mm_set_ps1(float w)<br/>_m128_mm_set1_ps(float w)</code>                                                                                                                   | 4つの単精度浮動小数点値を w に設定する。             |
| (composite) | <code>_m128d_mm_set1_pd(double w)</code>                                                                                                                                               | 2つの倍精度浮動小数点値を w に設定する。             |
| (composite) | <code>_m128d_mm_set_sd(double w)</code>                                                                                                                                                | 下位の倍精度浮動小数点値を w に設定する。             |
| (composite) | <code>_m128d_mm_set_pd(double z, double y)</code>                                                                                                                                      | 2つの倍精度浮動小数点値を 2 つの入力値に設定する。        |
| (composite) | <code>_m128_mm_set_ps(float z, float y, float x, float w)</code>                                                                                                                       | 4つの単精度浮動小数点値を 4 つの入力値に設定する。        |
| (composite) | <code>_m128d_mm_setr_pd(double z, double y)</code>                                                                                                                                     | 2つの倍精度浮動小数点値を、逆の順番で 2 つの入力値に設定する。  |

表 C-2. 複合組み込み関数（続き）

| ニーモニック           | 組み込み関数                                                                                                      | 説明                                                  |
|------------------|-------------------------------------------------------------------------------------------------------------|-----------------------------------------------------|
| (composite)      | <code>_m128_mm_setr_ps(float z, float y, float x, float w)</code>                                           | 4つの単精度浮動小数点値を、逆の順番で4つの入力値に設定する。                     |
| (composite)      | <code>_m128d_mm_setzero_pd(void)</code>                                                                     | 2つの倍精度浮動小数点値をクリアする。                                 |
| (composite)      | <code>_m128_mm_setzero_ps(void)</code>                                                                      | 4つの単精度浮動小数点値をクリアする。                                 |
| MOVSD + shuffle  | <code>_m128d_mm_load_pd(double * p)</code><br><code>_m128d_mm_load1_pd(double *p)</code>                    | 1つの倍精度浮動小数点値をロードし、両方の倍精度浮動小数点値にコピーする。               |
| MOVSS + shuffle  | <code>_m128_mm_load_ps1(float * p)</code><br><code>_m128_mm_load1_ps(float *p)</code>                       | 1つの単精度浮動小数点値をロードし、4ワードすべてにコピーする。                    |
| MOVAPD + shuffle | <code>_m128d_mm_loadr_pd(double * p)</code>                                                                 | 2つの倍精度浮動小数点値を逆の順番でロードする。アドレスは16バイト・アライメントでなければならない。 |
| MOVAPS + shuffle | <code>_m128_mm_loadr_ps(float * p)</code>                                                                   | 4つの単精度浮動小数点値を逆の順番でロードする。アドレスは16バイト・アライメントでなければならない。 |
| MOVSD + shuffle  | <code>void _mm_store1_pd(double *p, __m128d a)</code>                                                       | 最下位の倍精度浮動小数点値を両方の倍精度浮動小数点値にストアする。                   |
| MOVSS + shuffle  | <code>void _mm_store_ps1(float * p, __m128 a)</code><br><code>void _mm_store1_ps(float *p, __m128 a)</code> | 最下位の単精度浮動小数点値を4ワードにストアする。                           |
| MOVAPD + shuffle | <code>_mm_storer_pd(double * p, __m128d a)</code>                                                           | 2つの倍精度浮動小数点値を逆の順番でストアする。アドレスは16バイト・アライメントでなければならない。 |
| MOVAPS + shuffle | <code>_mm_storer_ps(float * p, __m128 a)</code>                                                             | 4つの単精度浮動小数点値を逆の順番でストアする。アドレスは16バイト・アライメントでなければならない。 |





# 索引



# 索引

---

## 記号・数字

$\pi$   
ロー ド , 3-272  
16 進数 , 1-5  
2 進数 , 1-5

## A

AAA 命令 , 3-17  
AAD 命令 , 3-18  
AAM 命令 , 3-19  
AAS 命令 , 3-20  
ADC 命令 , 3-21, 3-445  
ADDPD 命令 , 3-25  
ADDPS 命令 , 3-27  
ADDSD 命令 , 3-29  
ADDSS 命令 , 3-31  
ADDSUBPD 命令 , 3-33  
ADDSUBPS 命令 , 3-36  
ADD 命令 , 3-17, 3-21, 3-23, 3-198, 3-445  
ANDNPD 命令 , 3-45  
ANDNPS 命令 , 3-47  
ANDPD 命令 , 3-41  
ANDPS 命令 , 3-43  
AND 命令 , 3-39, 3-445  
ARPL 命令 , 3-49

## B

BCD 整数  
  アンパック , 3-17, 3-18, 3-19, 3-20  
  パック ド , 3-198, 3-200, 3-228, 3-230  
BOUND 範囲外例外 (#BR) , 3-51  
BOUND 命令 , 3-51  
BSF 命令 , 3-53  
BSR 命令 , 3-55  
BSWAP 命令 , 3-57  
BTC 命令 , 3-61, 3-445  
BTR 命令 , 3-63, 3-445  
BTS 命令 , 3-65, 3-445  
BT 命令 , 3-58  
B (デフォルト・スタック・サイズ) フラグ、セグメント記述子 , 4-86, 4-150

## C

C/C++ コンパイラ組み込み関数  
  一覧 , C-1  
  簡単な , C-3  
  機能的に同等なコンパイラ , C-1  
    説明 , 3-10  
    複合 , C-30  
CALL 命令 , 3-67  
CBW 命令 , 3-80  
CDQ 命令 , 3-196  
CF (キャリー) フラグ、EFLAGS レジスタ , 3-21,  
  3-23, 3-58, 3-61, 3-63, 3-65, 3-82, 3-90, 3-202,  
  3-372, 3-377, 3-561, 4-160, 4-198, 4-210, 4-213,  
  4-236, 4-249  
CLC 命令 , 3-82  
CLD 命令 , 3-83

CLFLUSH 命令 , 3-84  
CLI 命令 , 3-86  
CLTS 命令 , 3-89  
CMC 命令 , 3-90  
CMOVcc 命令 , 3-91  
CMPPD 命令 , 3-97  
CMPPS 命令 , 3-102  
CMPSB 命令 , 3-106  
CMPSD 命令 , 3-106, 3-109  
CMPSS 命令 , 3-113  
CMPSW 命令 , 3-106  
CMPS 命令 , 3-106, 4-176  
CMPXCHG8B 命令 , 3-119  
CMPXCHG 命令 , 3-117, 3-445  
CMP 命令 , 3-95  
COMISD 命令 , 3-121  
COMISS 命令 , 3-124  
CPL, 3-86, 4-283  
CPUID 命令 , 3-127  
  CLFLUSH 命令キヤッショ・ライン・サイズ ,  
  3-134  
CPUID 拡張機能情報 , 3-129  
  機能情報 , 3-136  
  キヤッショおよび TLB の特性 , 3-128, 3-140  
  初期 APIC ID , 3-134  
  バージョン情報 , 3-128  
  ブランド・インデックス , 3-134  
  プロセッサ・タイプ・フィールド , 3-133  
  プロセッサ・ブランド・ストリング , 3-129  
  ローカル APIC 物理 ID , 3-134  
CR0 制御レジスタ , 4-226  
CS レジスタ , 3-68, 3-383, 3-399, 3-411, 3-489, 4-87  
CVTDQ2PD 命令 , 3-152  
CVTDQ2PS 命令 , 3-154  
CVTPD2DQ 命令 , 3-156  
CVTPD2PI 命令 , 3-158  
CVTPD2PS 命令 , 3-160  
CVTPI2PD 命令 , 3-162  
CVTPI2PS 命令 , 3-164  
CVTPS2DQ 命令 , 3-166  
CVTPS2PD 命令 , 3-168  
CVTPS2PI 命令 , 3-170  
CVTSD2SI 命令 , 3-172  
CVTSD2SS 命令 , 3-174  
CVTSI2SD 命令 , 3-176  
CVTSI2SS 命令 , 3-178  
CVTSS2SD 命令 , 3-180  
CVTSS2SI 命令 , 3-182  
CVTPD2DQ 命令 , 3-186  
CVTPD2PI 命令 , 3-184  
CVTPS2DQ 命令 , 3-188  
CVTPS2PI 命令 , 3-190  
CVTSD2SI 命令 , 3-192  
CVTTSS2SI 命令 , 3-194  
CWDE 命令 , 3-80  
CWD 命令 , 3-196

**D**

DAA 命令 , 3-198  
 DAS 命令 , 3-200  
 DEC 命令 , 3-202, 3-445  
 DF (方向) フラグ、EFLAGS レジスタ , 3-83, 3-107, 3-380, 3-448, 3-547, 4-15, 4-201, 4-237  
 DIVPD 命令 , 3-207  
 DIVPS 命令 , 3-209  
 DIVSD 命令 , 3-211  
 DIVSS 命令 , 3-213  
 DIV 命令 , 3-204  
 DS レジスタ , 3-106, 3-427, 3-447, 3-546, 4-14  
 D (デフォルト演算サイズ) フラグ、セグメント記述子 , 4-86, 4-91, 4-150

**E**

EDI レジスタ , 4-200, 4-237, 4-244  
 EFLAGS レジスタ  
   条件コード , 3-93, 3-237, 3-242  
   ステータス・フラグ , 3-95, 3-408, 4-204, 4-266  
   セーブ , 4-192  
   プッシュ , 4-155  
   ポップ , 4-93  
   命令によって影響を受けるフラグ , 3-13  
   コード , 3-419  
   割り込みからのリターン時のポップ , 3-399  
   割り込み時のプッシュ , 3-383  
 EIP レジスタ , 3-68, 3-383, 3-399, 3-412  
 EMMS 命令 , 3-215  
 ENTER 命令 , 3-217  
 ESI レジスタ , 3-106, 3-447, 3-546, 4-14, 4-237  
 ESP レジスタ , 3-68, 4-87  
 ES レジスタ , 3-427, 4-14, 4-200, 4-244

**F**

F2XM1 命令 , 3-220, 3-347  
 FADDP 命令 , 3-224  
 FADD 命令 , 3-224  
 far コール、CALL 命令 , 3-67  
 far ポインタ、コード , 3-427  
 far リターン、RET 命令 , 4-179  
 FBLD 命令 , 3-228  
 FBSTP 命令 , 3-230  
 FCFS 命令 , 3-233  
 FCLEX/FNCLEX 命令 , 3-235  
 FCMOVcc 命令 , 3-237  
 FCOMIP 命令 , 3-242  
 FCOMI 命令 , 3-242  
 FCOMPP 命令 , 3-239  
 FCOMP 命令 , 3-239  
 FCOM 命令 , 3-239  
 FCOS 命令 , 3-245  
 FDECSTP 命令 , 3-247  
 FDIVP 命令 , 3-248  
 FDIVRP 命令 , 3-252  
 FDIVR 命令 , 3-252  
 FDIV 命令 , 3-248  
 FFREE 命令 , 3-256  
 FIADD 命令 , 3-224  
 FICOMP 命令 , 3-257  
 FICOM 命令 , 3-257  
 FIDIVR 命令 , 3-252

FIDIV 命令 , 3-248  
 FILD 命令 , 3-260  
 FIMUL 命令 , 3-279  
 FINCSTP 命令 , 3-262  
 FINIT/FNINIT 命令 , 3-263, 3-297  
 FISTP 命令 , 3-265  
 FISTTP 命令 , 3-268  
 FIST 命令 , 3-265  
 FISUBR 命令 , 3-323  
 FISUB 命令 , 3-319  
 FLD1 命令 , 3-272  
 FLDCW 命令 , 3-274  
 FLDENV 命令 , 3-276  
 FLDL2E 命令 , 3-272  
 FLDL2T 命令 , 3-272  
 FLDLG2 命令 , 3-272  
 FLDLN2 命令 , 3-272  
 FLDPI 命令 , 3-272  
 FLDZ 命令 , 3-272  
 FLD 命令 , 3-270  
 FMULP 命令 , 3-279  
 FMUL 命令 , 3-279  
 FNOP 命令 , 3-283  
 FNSTENV 命令 , 3-276  
 FPATAN 命令 , 3-284  
 FPREM1 命令 , 3-289  
 FPTAN 命令 , 3-292  
 FRNDINT 命令 , 3-294  
 FRSTOR 命令 , 3-295  
 FSAVE/FNSAVE 命令 , 3-295, 3-297  
 FSACLE 命令 , 3-300  
 FSINCOS 命令 , 3-304  
 FSIN 命令 , 3-302  
 FSQRT 命令 , 3-306  
 FSTCW/FNSTCW 命令 , 3-311  
 FSTENV/FNSTENV 命令 , 3-313  
 FSTP 命令 , 3-308  
 FSTSW/FNSTSW 命令 , 3-316  
 FST 命令 , 3-308  
 FSUBP 命令 , 3-319  
 FSUBRP 命令 , 3-323  
 FSUBR 命令 , 3-323  
 FSUB 命令 , 3-319  
 FS レジスタ , 3-427  
 FTST 命令 , 3-327  
 FUCOMIP 命令 , 3-242  
 FUCOMI 命令 , 3-242  
 FUCOMPP 命令 , 3-329  
 FUCOMP 命令 , 3-329  
 FUCOM 命令 , 3-329  
 FXAM 命令 , 3-333  
 FXCH 命令 , 3-335  
 FXRSTOR 命令 , 3-337  
 FXSAVE 命令 , 3-340  
 FXTRACT 命令 , 3-300, 3-347  
 FYL2XP1 命令 , 3-351  
 FYL2X 命令 , 3-349

**G**

GDTR (グローバル記述子テーブルレジスタ) , 3-438, 4-207  
 GDT (グローバル記述子テーブル) , 3-438, 3-440  
 GS レジスタ , 3-427

**H**

HADDPD 命令 , 3-354, 3-355  
 HADDPS 命令 , 3-357  
 HLT 命令 , 3-360  
 HSUBPS 命令 , 3-364

**I**

IDIV 命令 , 3-368  
 IDTR (割り込み記述子テーブルレジスタ) , 3-438, 4-222  
 IDT (割り込み記述子テーブル) , 3-383, 3-438  
 IF (割り込みイネーブル) フラグ、EFLAGS レジスター , 3-86, 4-238  
 IMUL 命令 , 3-371  
 INC 命令 , 3-377, 3-445  
 INSB 命令 , 3-379  
 INSD 命令 , 3-379  
 INSW 命令 , 3-379  
 INS 命令 , 3-379, 4-176  
 INT 3 命令 , 3-382  
 Intel NetBurst®マイクロアーキテクチャ , 1-1  
 INTn 命令 , 3-382  
 INTO 命令 , 3-382  
 INVD 命令 , 3-396  
 INVLPG 命令 , 3-398  
 IN 命令 , 3-375  
 IOPL (I/O 特権レベル) フィールド、EFLAGS レジスター , 3-86, 4-155, 4-238  
 IRETD 命令 , 3-399  
 IRET 命令 , 3-399

**J**

Jcc 命令 , 3-407  
 JMP 命令 , 3-411

**L**

LAHF 命令 , 3-419  
 LAR 命令 , 3-420  
 LDDQU 命令 , 3-423  
 LDMXCSR 命令 , 3-425  
 LDS 命令 , 3-427  
 LDTR (ローカル記述子テーブルレジスタ) , 3-440, 4-224  
 LDT (ローカル記述子テーブル) , 3-440  
 LEAVE 命令 , 3-433  
 LEA 命令 , 3-431  
 LES 命令 , 3-427  
 LFENCE 命令 , 3-436  
 LFS 命令 , 3-427  
 LGDT 命令 , 3-438  
 LGS 命令 , 3-427  
 LIDT 命令 , 3-438  
 LLDT 命令 , 3-440  
 LMSW 命令 , 3-443  
 LOCK プリフィックス , 3-21, 3-23, 3-39, 3-61, 3-63, 3-65, 3-117, 3-119, 3-202, 3-377, 3-445, 4-1, 4-4, 4-6, 4-198, 4-249, 4-290, 4-292, 4-296  
 LODSB 命令 , 3-447  
 LODSD 命令 , 3-447  
 LODSW 命令 , 3-447  
 LODS 命令 , 3-447, 4-176  
 LOOPcc 命令 , 3-450

LOOP 命令 , 3-450  
 LSL 命令 , 3-453  
 LSS 命令 , 3-427  
 LTR 命令 , 3-457

**M**

MASKMOVDQU 命令 , 3-459  
 MASKMOVQ 命令 , 3-462  
 MAXPD 命令 , 3-465  
 MAXPS 命令 , 3-468  
 MAXSD 命令 , 3-471  
 MAXSS 命令 , 3-473  
 MFENCE 命令 , 3-475  
 MINPD 命令 , 3-476  
 MINPS 命令 , 3-479  
 MINSD 命令 , 3-482  
 MINSS 命令 , 3-484  
 ModR/M パイト , 2-4  
 16 ビット・アドレス指定形式 , 2-7  
 32 ビット・アドレス指定形式 , 2-8  
 説明 , 2-4  
 フォーマット , 2-1  
 Mod フィールド、命令フォーマット , 2-5  
 MONITOR 命令 , 3-486  
 CPUID フラグ , 3-135  
 MOVAPD 命令 , 3-499  
 MOVAPS 命令 , 3-501  
 MOVDDUP 命令 , 3-506  
 MOVDQ2Q 命令 , 3-513  
 MOVDQA 命令 , 3-509  
 MOVDQU 命令 , 3-511  
 MOVD 命令 , 3-503  
 MOVHLPs 命令 , 3-514  
 MOVHPD 命令 , 3-515  
 MOVHPS 命令 , 3-517  
 MOVLHPS 命令 , 3-519  
 MOVLPD 命令 , 3-520  
 MOVLPS 命令 , 3-522  
 MOVMSKPD 命令 , 3-524  
 MOVMSKPS 命令 , 3-525  
 MOVNTDQ 命令 , 3-526  
 MOVNTI 命令 , 3-528  
 MOVNTPD 命令 , 3-530  
 MOVNTPS 命令 , 3-532  
 MOVNTQ 命令 , 3-534  
 MOVQ2DQ 命令 , 3-544  
 MOVSB 命令 , 3-546  
 MOVSD 命令 , 3-546, 3-549  
 MOVSHDUP 命令 , 3-536  
 MOVSLDUP 命令 , 3-539  
 MOVSS 命令 , 3-551  
 MOVSW 命令 , 3-546  
 MOVSX 命令 , 3-553  
 MOVS 命令 , 3-546, 4-176  
 MOVUPD 命令 , 3-555  
 MOVUPS 命令 , 3-557  
 MOVZX 命令 , 3-559  
 MOV 命令 , 3-489  
 MOV 命令 (制御レジスタ) , 3-494  
 MOV 命令 (デバッグレジスタ) , 3-497  
 MSR (モデル固有レジスタ)  
 書き込み , 4-288

読み取り , 4-168  
 MULPD 命令 , 3-563  
 MULPS 命令 , 3-565  
 MULSD 命令 , 3-567  
 MULSS 命令 , 3-569  
 MUL 命令 , 3-19, 3-561  
 MWAIT 命令  
     CPUID フラグ , 3-135

**N**

NaN テスト , 3-327  
 near  
     コール、CALL 命令 , 3-67  
     リターン、RET 命令 , 4-179  
 NEG 命令 , 3-445, 4-1  
 NOP 命令 , 4-3  
 NOT 命令 , 3-445, 4-4  
 NT (ネストされたタスク) フラグ、EFLAGS レジスター , 3-399

**O**

OF (オーバーフロー) フラグ、EFLAGS レジスター ,  
 3-21, 3-23, 3-372, 3-382, 3-561, 4-198, 4-210,  
 4-213, 4-249  
 ORPD 命令 , 4-8  
 ORPS 命令 , 4-10  
 OR 命令 , 3-445, 4-6  
 OUTSB 命令 , 4-14  
 OUTSD 命令 , 4-14  
 OUTSW 命令 , 4-14  
 OUTS 命令 , 4-14, 4-176  
 OUT 命令 , 4-12

**P**

P6 ファミリ・プロセッサ  
 説明 , 1-1  
 PACKSSDW 命令 , 4-18  
 PACKSSWB 命令 , 4-18  
 PACKUSWB 命令 , 4-22  
 PADDQ 命令 , 4-28  
 PADDSB 命令 , 4-30  
 PADDSW 命令 , 4-30  
 PADDUSB 命令 , 4-33  
 PADDUSW 命令 , 4-33  
 PANDN 命令 , 4-38  
 PAND 命令 , 4-36  
 PAUSE 命令 , 4-40  
 PAVGB 命令 , 4-42  
 PAVGW 命令 , 4-42  
 PCE フラグ、CR4 レジスター , 4-170  
 PCMPEQB 命令 , 4-45  
 PCMPEQD 命令 , 4-45  
 PCMPEQW 命令 , 4-45  
 PCMPGTB 命令 , 4-49  
 PCMPGTD 命令 , 4-49  
 PCMPGTW 命令 , 4-49  
 Pentium® 4 プロセッサ , 1-1  
 Pentium® II プロセッサ , 1-1  
 Pentium® III プロセッサ , 1-1  
 Pentium® M プロセッサ , 1-1  
 Pentium® Pro プロセッサ , 1-1  
 Pentium® プロセッサ , 1-1  
 PEXTRW 命令 , 4-53

PE (保護イネーブル) フラグ、CR0 レジスタ , 3-443  
 PINSRW 命令 , 4-55  
 PMADDWD 命令 , 4-58  
 PMAXSW 命令 , 4-61  
 PMAXSUB 命令 , 4-64  
 PMINSW 命令 , 4-67  
 PMINUB 命令 , 4-70  
 PMOVMSKB 命令 , 4-73  
 PMULHUW 命令 , 4-75  
 PMULHW 命令 , 4-78  
 PMULLW 命令 , 4-81  
 PMULUDQ 命令 , 4-84  
 POPAD 命令 , 4-91  
 POPA 命令 , 4-91  
 POPFD 命令 , 4-93  
 POPF 命令 , 4-93  
 POP 命令 , 4-86  
 POR 命令 , 4-96  
 PREFETCHh 命令 , 4-98  
 PSADBW 命令 , 4-101  
 PSHUFD 命令 , 4-104  
 PSHUFW 命令 , 4-107  
 PSHUFW 命令 , 4-111  
 PSLLD 命令 , 4-114  
 PSLLQ 命令 , 4-114  
 PSLLW 命令 , 4-114  
 PSRAD 命令 , 4-118  
 PSRAW 命令 , 4-118  
 PSRLDQ 命令 , 4-122  
 PSRLD 命令 , 4-123  
 PSRLQ 命令 , 4-123  
 PSRLW 命令 , 4-123  
 PSUBB 命令 , 4-128  
 PSUBD 命令 , 4-128  
 PSUBQ 命令 , 4-132  
 PSUBSB 命令 , 4-134  
 PSUBSW 命令 , 4-134  
 PSUBUSB 命令 , 4-137  
 PSUBUSW 命令 , 4-137  
 PSUBW 命令 , 4-128  
 PUNPCKHBW 命令 , 4-140  
 PUNPCKHDQ 命令 , 4-140  
 PUNPCKHWD 命令 , 4-140  
 PUNPCKLBW 命令 , 4-145  
 PUNPCKLDQ 命令 , 4-145  
 PUNPCKLWD 命令 , 4-145  
 PUSHAD 命令 , 4-153  
 PUSHA 命令 , 4-153  
 PUSHFD 命令 , 4-155  
 PUSHF 命令 , 4-155  
 PUSH 命令 , 4-150  
 PXOR 命令 , 4-157

**R**

R/m フィールド、命令フォーマット , 2-5  
 RCL 命令 , 4-159  
 RCPPS 命令 , 4-164  
 RCPSS 命令 , 4-166  
 RCR 命令 , 4-159  
 RC (丸め制御) フィールド、x87 FPU 制御ワード ,  
 3-266, 3-272, 3-308  
 RDMSR 命令 , 4-168, 4-170, 4-173  
 RDPMC 命令 , 4-170

RDTSC 命令, 4-173  
 REP/REPE/REPZ/REPNE/REPNZ ブリフィックス,  
 3-107, 3-380, 4-15, 4-175

RET 命令, 4-179  
 ROL 命令, 4-159  
 ROR 命令, 4-159  
 RPL フィールド, 3-49  
 RSM 命令, 4-187  
 RSQRTPS 命令, 4-188  
 RSQRTSS 命令, 4-190

## S

SAHF 命令, 4-192  
 SAL 命令, 4-193  
 SAR 命令, 4-193  
 SBB 命令, 3-445, 4-198  
 SCASB 命令, 4-200  
 SCASD 命令, 4-200  
 SCASW 命令, 4-200  
 SCAS 命令, 4-176, 4-200  
 SETcc 命令, 4-203  
 SFENCE 命令, 4-206  
 SF (符号) フラグ、EFLAGS レジスタ, 3-21, 3-23  
 SGDT 命令, 4-207  
 SHLD 命令, 4-210  
 SHL 命令, 4-193  
 SHRD 命令, 4-213  
 SHR 命令, 4-193  
 SHUFPD 命令, 4-216  
 SHUFPS 命令, 4-219  
 SIB バイト, 2-4  
 32 ビット・アドレス指定形式, 2-9  
 説明, 2-4  
 フォーマット, 2-1  
 SIDT 命令, 4-222  
 SIMD 浮動小数点数例外、マスクされていない、影響  
 , 3-425  
 SLDT 命令, 4-224  
 SMSW 命令, 4-226  
 SQRTPD 命令, 4-228  
 SQRTPS 命令, 4-230  
 SQRTSD 命令, 4-232  
 SQRTSS 命令, 4-234  
 SSE2 拡張命令  
 SIMD 整数レジスタ・フィールドのエンコーディ  
 ング, B-39  
 キヤッショ可能命令のエンコーディング, B-44  
 SSE3 拡張命令  
 CPUID フラグ, 3-135  
 フォーマットとエンコーディングの表, B-45  
 SSE 拡張命令  
 SIMD 整数レジスタ・フィールドのエンコーディ  
 ング, B-31  
 キヤッショ可能 / メモリ順序付け命令のエンコーディング, B-32  
 SS レジスタ, 3-427, 3-490, 4-87  
 STC 命令, 4-236  
 STD 命令, 4-237  
 STI 命令, 4-238  
 STMCSR 命令, 4-242  
 STOSB 命令, 4-244  
 STOSD 命令, 4-244  
 STOSW 命令, 4-244

STOS 命令, 4-176, 4-244  
 STR 命令, 4-247  
 SUBPD 命令, 4-251  
 SUBSS 命令, 4-257  
 SUB 命令, 3-20, 3-200, 3-445, 4-249  
 SYSENTER 命令, 4-259  
 SYSEXIT 命令, 4-263

## T

TEST 命令, 4-266  
 TLB エントリ、無効化 (フラッシュ), 3-398  
 TSD フラグ、CR4 レジスタ, 4-173  
 TSS、タスクレジスタとの関係, 4-247  
 TS (タスクスイッチ) フラグ、CR0 レジスタ, 3-89

## U

UCOMISD 命令, 4-268  
 UCOMISS 命令, 4-271  
 UD2 命令, 4-274  
 UNPCKHPD 命令, 4-275  
 UNPCKHPS 命令, 4-277  
 UNPCKLPD 命令, 4-279  
 UNPCKLPS 命令, 4-281

## V

VERR 命令, 4-283  
 VERW 命令, 4-283  
 VM (仮想 8086 モード) フラグ、EFLAGS レジスタ,  
 3-399

## W

WAIT/FWAIT 命令, 4-285  
 WBINVD 命令, 4-286  
 WRMSR 命令, 4-288

## X

x87 FPU  
 初期化, 3-263  
 定数, 3-272  
 未処理の x87 FPU 例外の有無をチェック, 4-285

x87 FPU 制御ワード  
 RC フィールド, 3-266, 3-272, 3-308  
 ストア, 3-311  
 セーブ, 3-297, 3-313  
 復元, 3-295  
 ロード, 3-274, 3-276

x87 FPU タグワード, 3-276, 3-295, 3-297, 3-313  
 x87 FPU の最後のオペコード, 3-276, 3-295, 3-297,  
 3-313

x87 FPU のステータス・ワード  
 TOP フィールド, 3-262  
 条件コードフラグ, 3-239, 3-257, 3-327, 3-329, 3-333  
 セーブ, 3-297, 3-313, 3-316  
 復元, 3-295  
 命令によって影響を受ける x87 FPU フラグ, 3-13  
 ロード, 3-276  
 x87 FPU のデータポインタ, 3-276, 3-295, 3-297, 3-313  
 x87 FPU の命令ポインタ, 3-276, 3-295, 3-297, 3-313  
 x87 FPU を初期化, 3-263  
 XADD 命令, 3-445, 4-290  
 XCHG 命令, 3-445, 4-292  
 XLAT/XLATB 命令, 4-294

XORPD 命令 , 4-298  
 XORPS 命令 , 4-300  
 XOR 命令 , 3-445, 4-296

**Z**

ZF (ゼロ) フラグ、EFLAGS レジスタ , 3-117, 3-119, 3-420, 3-450, 3-453, 4-176, 4-283

**あ**

アクセス権、セグメント記述子 , 3-420

## アドレス指定方式

- オペランド・コード , A-3
- コード , A-2
- レジスタコード , A-4

アドレス指定、セグメント , 1-5

**い**

インデックス (オペランドのアドレス指定) , 2-5  
 インテル® Xeon™ プロセッサ , 1-1

**え**

## エンコーディング

SIMD- 整数レジスタ・フィールド , B-31, B-39  
 キャッシュ可能 / メモリ順序付け命令 , B-32  
 キャッシュ可能命令 , B-44

**お**

オーバーフロー例外 (#OF) , 3-382

## オペコード

- エスケープ命令 , A-16
- マップ , A-1

## オペコード拡張

- 説明 , A-14
- 表 , A-14

## オペコード整数命令

- 1 バイト , A-4
- 1 バイト・オペコード・マップ , A-8
- 2 バイト , A-5
- 2 バイト・オペコード・マップ , A-10

オペコードのフォーマット , 2-4

オペコード・キーの略語 , A-2

オペランド、命令 , 1-4

**か**

回転操作 , 4-159

仮数、浮動小数点数からの抽出 , 3-347

**き**

機能情報、プロセッサ , 3-127

逆正接、x87 FPU 操作 , 3-284

キャッシュをライトバックおよび無効化 , 4-286

キャッシュ、無効化 (フラッシュ) , 3-396, 4-286

**く**

## 組み込み関数

- 一覧 , C-1
- 簡単な , C-3
- 機能的に同等なコンパイラ , C-1
- 説明 , 3-10
- 複合 , C-30

**こ**

コールゲート , 3-415

## 互換性

- ソフトウェア , 1-3
- コンフォーミング・コード・セグメント , 3-415, 3-421

**さ**

参考文献 , 1-6

**し**

指數および仮数の抽出、x87 FPU 操作 , 3-347

指数、浮動小数点数からの抽出 , 3-347

実効アドレス , 3-431

実効アドレスのロード操作 , 3-431

ジャンプ操作 , 3-411

順序化不可能な値 , 3-239, 3-327, 3-329

条件コードフラグ、EFLAGS レジスタ , 3-91

条件コードフラグ、x87 FPU ステータス・ワード  
設定 , 3-327, 3-329, 3-333

命令によって影響を受けるフラグ , 3-13

条件付きジャンプ , 3-407

剰余、x87 FPU 操作 , 3-289

除算エラー例外 (#DE) , 3-204

**す**

スケール、x87 FPU 操作 , 3-300

スケール (オペランドのアドレス指定) , 2-5

スタック、値をプッシュ , 4-150

ステータス・フラグ、EFLAGS レジスタ , 3-93, 3-95, 3-237, 3-242, 3-408, 4-204, 4-266

ストリング命令 , 3-106, 3-379, 3-447, 3-546, 4-14, 4-200, 4-244

**せ**

制御レジスタ、値を移動 , 3-494

正弦、x87 FPU 操作 , 3-302, 3-304

整数、ストア、x87 FPU データタイプ , 3-265

正接、x87 FPU 操作 , 3-292

性能モニタリング・カウンタ

読み取り , 4-170

セグメント

記述子、セグメント制限 , 3-453

制限 , 3-453

セレクタ、RPL フィールド , 3-49

レジスタ、値を移動 , 3-489

セグメント化アドレス指定 , 1-5

**そ**

即値オペランド , 2-5

**た**

対数イプシロン、x87 FPU 操作 , 3-349

対数 (底 2)、x87 FPU 操作 , 3-351

タイム・スタンプ・カウンタ、読み取り , 4-173

タスクゲート , 3-416

タスクスイッチ

CALL 命令 , 3-67

ネストされたタスクからのリターン、IRET 命令 , 3-399

タスクレジスタ

ストア , 4-247

ロード , 3-457

**て**

定数 (浮動小数点)、ロード , 3-272  
 ディスプレースメント (オペランドのアドレス指定)  
     , 2-5  
 デノーマル有限数 , 3-333  
 デバッグレジスタ、値を移動 , 3-497

**と**

特権レベル間  
     コール、CALL 命令 , 3-67  
     リターン、RET 命令 , 4-179

**は**

バージョン情報、プロセッサ , 3-127  
 バイトオーダー , 1-3  
 汎用レジスタ  
     値を移動 , 3-489  
     すべてをプッシュ , 4-153  
     すべてをポップ , 4-91

**ひ**

非コンフォーミング・コード・セグメント , 3-415  
 ビットオーダー , 1-3  
 表記  
     16進数および2進数 , 1-5  
     セグメント化アドレス指定 , 1-5  
     ビットオーダーおよびバイトオーダー , 1-3  
     命令オペランド , 1-4  
     予約オペコード , 2-4  
     予約ビット , 1-3  
     例外 , 1-6  
 表記法 , 1-3

**ふ**

浮動小数点値を分類、x87 FPU 操作 , 3-333  
 浮動小数点例外  
     SSE/SSE2 SIMD , 3-16  
     x87 FPU , 3-15  
 フラッシュ  
     TLB エントリ , 3-398  
     キャッシュ , 3-396, 4-286  
 プリフィックス  
     LOCK , 2-2, 3-445  
     REP/REPE/REPZ/REPNE/REPNZ , 4-175  
     REPNE/REPNZ , 2-2  
     REP または REPZ/REPZ , 2-2  
     アドレス・サイズ・オーバーライド・プリフィックス , 2-3  
     オペランド・サイズ・オーバーライド・プリフィックス , 2-3  
     セグメント・オーバーライド・プリフィックス , 2-2  
     分岐のヒント , 2-3  
     命令、説明 , 2-2  
     分岐のヒント , 2-3

**へ**

平方根、x87 FPU 操作 , 3-306  
 ベース (オペランドのアドレス指定) , 2-5

**ま**

マシン・ステータス・ワード、CR0 レジスタ , 3-443,  
     4-226  
 丸め、整数への丸め、x87 FPU 操作 , 3-294

**み**

未定義、フォーマット・オペコード , 3-327

**め**

命令オペランド , 1-4  
 命令セット、リファレンス , 3-1, 4-1  
 命令フォーマット  
     ModR/M バイト , 2-4  
     Mod フィールド , 2-5  
     R/M フィールド , 2-5  
     SIB バイト , 2-4  
     インデックス・フィールド , 2-5  
     オペコード , 2-4  
     参照情報の説明 , 3-1  
     図 , 2-1  
     スケール・フィールド , 2-5  
     即値 , 2-5  
     ディスプレースメント , 2-5  
     プリフィックス , 2-2  
     ベース・フィールド , 2-5  
     レジスタ / オペコード・フィールド , 2-5  
 命令リファレンス・ページに使用される記号 , 3-1  
 命令リファレンス、名称 , 3-1

**よ**

余弦、x87 FPU 操作 , 3-245, 3-304  
 予約  
     予約オペコードの使用 , 2-2  
     予約ビットの使用 , 1-3

**り**

略語、オペコード・キー , A-2

**れ**

例外  
     BOUND 範囲外 (#BR) , 3-51  
     オーバーフロー例外 (#OF) , 3-382  
 表記 , 1-6  
     リターン , 3-399  
 レジスタ / オペコード・フィールド、命令フォーマット , 2-5

**ろ**

ロック操作 , 3-445

**わ**

割り込み  
     ソフトウェア , 3-382  
     リターン , 3-399  
 割り込みベクタ 4 , 3-382



MEMO

---

MEMO

---