

ナノフォトニック・デバイスを用いた  
配列アラインメント用レースロジック回路の提案

浅井里奈

平成 30 年 2 月

修士課程  
情報知能工学専攻  
社会情報システム工学コース

# ナノフォトニック・デバイスを用いた 配列アラインメント用レースロジック回路の提案

浅井里奈

## 内容梗概

高性能化や低消費電力を実現させるために多くのアプリケーションにおいて専用アクセラレータが検討されており、その中で“レースロジック”と呼ばれる新しいコンピューティングのアプローチが提案された。レースロジックとは、伝搬信号が回路に入力されてから出力されるまでの伝搬遅延時間が計算結果を示すというアプローチで、これを用いることで動的計画法によって解くことができる最適化問題の高速化が期待できる。レースロジックの有効性は、CMOSトランジスタを用いて実装されたDNAのグローバル配列アラインメントスコアを求める回路にて明らかにされている。

一方、ナノフォトニック・デバイスが光速度で演算を実現できる素子として注目されており、ニューラルアクセラレータや加算器などのアーキテクチャの検討がされている。

本研究では、光デバイスとレースロジックとの親和性に着目し、ナノフォトニック・デバイスを用いたレースロジック回路の構成を目的とした。本論文では、ナノフォトニック・デバイスを用いたDNAのグローバル配列アラインメントスコアを求める回路を提案し、市販の光学シミュレータを用いた回路の機能検証と、遅延時間・面積・消費電力のモデリング及びそのモデル式を用いてDNA配列長Nに対する評価を行った。機能検証の結果、雑音の影響がない場合において提案回路の動作を確認できた。評価の結果、遅延時間はNに線形に従い、面積はNの2乗に従うことが分かった。消費電力に関しては、ケーススタディとしてN=2の場合の値を示した。

また、雑音が回路規模に及ぼす影響や、光伝搬信号とナノフォトニック・デバイスの光速での計算能力、光デバイス独自の設計選択肢について考察した結果、ナノフォトニック・デバイスを用いた配列アラインメント用レースロジック回路に対する要求が分かった。

# 目次

|       |                               |    |
|-------|-------------------------------|----|
| 1     | はじめに                          | 1  |
| 2     | レースロジックと CMOS による実装           | 3  |
| 2.1   | レースロジック                       | 3  |
| 2.2   | 配列アラインメント                     | 5  |
| 2.3   | CMOS によるレースロジック実装             | 9  |
| 3     | ナノフォトニック・デバイスを用いたレースロジック実装の提案 | 14 |
| 3.1   | 光デバイスについて                     | 14 |
| 3.1.1 | ナノフォトニクスの性質                   | 14 |
| 3.1.2 | 光デバイスの特徴                      | 16 |
| 3.1.3 | 光素子の説明                        | 16 |
| 3.1.4 | レースロジックと光デバイス                 | 27 |
| 3.2   | 提案回路                          | 27 |
| 4     | 検証・評価                         | 36 |
| 4.1   | 検証                            | 36 |
| 4.2   | 評価                            | 40 |
| 4.2.1 | 遅延時間                          | 40 |
| 4.2.2 | 面積                            | 41 |
| 4.2.3 | 消費電力                          | 43 |
| 5     | 考察                            | 54 |
| 5.1   | 遅延時間差の検知                      | 54 |
| 5.2   | 雑音の影響                         | 55 |
| 5.2.1 | 光伝搬信号強度に影響を与える雑音              | 56 |
| 5.2.2 | 光伝搬信号の遅延時間に影響を与える雑音           | 56 |
| 5.3   | 遅延時間以外の設計選択肢                  | 58 |
| 6     | おわりに                          | 60 |
|       | 謝辞                            | 62 |



# 第1章

## はじめに

高性能化や低消費電力を実現させるために多くのアプリケーションにおいて専用アクセラレータが検討されており、その中で“レースロジック”と呼ばれる新しいコンピューティングのアプローチが提案された [1]. レースロジックは、回路を伝搬する信号の遅延時間がとある情報を表現しており、入力から出力までの伝搬時間が計算結果を示すものである。このアプローチは、動的計画法 (Dynamic Programming) によって解くことができる最適化問題の高速化が期待できる。レースロジックの有効性は、CMOS トランジスタを用いて実装された DNA のグローバル配列アラインメントスコアを求める回路にて明らかにされている [1-3].

一方、ナノフォトニクスと呼ばれる新しい光素子技術が注目を集めている。このナノフォトニクスを用いて機能を実現したデバイスをナノフォトニック・デバイスという。ナノフォトニック・デバイスは光速度で演算を実現できる素子として注目されており、ニューラルアクセラレータや加算器などのアーキテクチャの検討がされている [4-6].

本研究では光デバイスとレースロジックとの親和性に着目し、ナノフォトニック・デバイスを用いたレースロジック回路の構成を目的とした。本論文では、ナノフォトニック・デバイスを用いた DNA のグローバル配列アラインメントスコアを求める回路を提案し、シミュレータを用いた回路の機能検証とモデル式を用いた評価を行うことでその有効性を明らかにし、実現に向けての問題点について検討する。

本論文の構成は以下の通りである。第2章でレースロジック及び配列アラインメントの基本原理を説明し、CMOS を用いて実装されたレースロジックに基づく回路例について述べ

る。第3章では、光デバイスとナノフォトニクスの基本事項を説明し、ナノフォトニック・デバイスを用いたレースロジックに基づくDNAのグローバル配列アラインメントスコアを求める回路を提案する。第4章では提案した回路に対してシミュレータを用いた検証とモデル式を用いた評価を行い、第5章で考察を行う。最後に第6章でまとめを行う。

## 第 2 章

# レースロジックと CMOS による実装

本章では、まずレースロジックの基本原理を説明する。具体的な評価の対象アプリケーションである配列アラインメントと CMOS による実装例をまとめ、その後レースロジックの検討において解決すべき課題について述べる。

### 2.1 レースロジック

レースロジックの基本概念は、回路に設定された競争条件を利用して、計算を実行することである。レースロジックの計算は有向非巡回グラフ（Directed Acyclic Graph）の最短・最長経路探索に帰結する。有向非巡回グラフとは、グラフ理論における閉路のない有向グラフの事である。その例を図 2.1 に示す。有向グラフは頂点と有向辺から構成される。その中でも、有向辺は頂点同士をつなぐが、ある頂点  $v$  から出発し有向辺をたどっても頂点  $v$  に戻ってこないというものが有向非巡回グラフである。ある頂点から別の頂点までの経路をパスと呼ぶ。レースロジックでは最短・最長経路を探索するために、始点から終点までの各パスにおいて条件に合わせて重み付けを行い、出力時にその重みの総和を観測する。その総和の最小値を観測するか最大値を観測するかが、最短・最長経路探索にそれぞれ対応している。

重みに遅延時間を選択することによって、各パスを通過する信号毎に入力から出力までの伝搬時間が変わってくる。信号がレースロジックを用いた回路に入力されてから出力されるまでの回路伝搬遅延時間を計測することが、パスの重みの総和を観測することに等しい。最



図 2.1: 有向非巡回グラフの例



図 2.2: レースロジックの例

短経路検索においては最も早く出力された信号の回路伝搬遅延時間を、最長経路検索においては最も遅く出力された信号の回路伝搬遅延時間のみを観測する。つまり、出力のタイミングを競うレースに勝利した信号の回路伝搬遅延時間のみを観測する、ということである、レースロジックの名前の所以でもある。出力信号の遅延時間がとある情報を持つ計算結果となる。例として、図 2.2 の頂点 A に信号を入力し、頂点 H から出力されるものを考える。これは図 2.1 の一辺を通過する際の遅延時間を 1 としたものである。頂点 A に信号を入力してから頂点 H に至る経路は、 $A \rightarrow D \rightarrow E \rightarrow F \rightarrow H$ ,  $A \rightarrow D \rightarrow E \rightarrow G \rightarrow H$ ,  $A \rightarrow D \rightarrow E \rightarrow H$ ,  $A \rightarrow B \rightarrow D \rightarrow E \rightarrow F \rightarrow H$ ,  $A \rightarrow B \rightarrow D \rightarrow E \rightarrow G \rightarrow H$ ,  $A \rightarrow B \rightarrow D \rightarrow E \rightarrow H$ ,  $A \rightarrow B \rightarrow C \rightarrow D \rightarrow E \rightarrow F \rightarrow H$ ,  $A \rightarrow B \rightarrow C \rightarrow D \rightarrow E \rightarrow G \rightarrow H$ ,  $A \rightarrow B \rightarrow C \rightarrow D \rightarrow E \rightarrow H$  の 9 通り考えられ、各経路を通った信号の遅延時間はそれぞれ 4, 4, 3, 5, 5, 4, 6, 6, 5 である。よって最短経路は  $A \rightarrow D \rightarrow E \rightarrow H$  であり、一番最初に出力される信号の遅延時間は 3 である。一辺の通過の際の遅延時間を 1 としたので、一番最初に出力された信号の遅延時間は頂点 A か



図 2.3: グローバル配列アラインメントとローカル配列アラインメント

ら頂点 Hまでの距離を表している。

このように出力信号の遅延時間はとある情報を持っており、どのような情報を持つかは応用するアプリケーションによって異なる。

## 2.2 配列アラインメント

生物学の分野において注目されている生物配列 (DNA の塩基配列とタンパク質アミノ酸配列) の文字列処理 (配列情報解析) [7, 8] の中でも、配列アラインメントに焦点を当てる。

DNA やタンパク質はユニットと名付けられた単位の物質が一列に並んだ高分子である。ここでいうユニットとは、DNAにおいては 4 種の核酸、タンパク質においては 20 種類のアミノ酸である。それぞれのユニットを文字とし DNA やタンパク質の配列を単なる文字列だとみなして処理をしてもある種の本質は失われないという考えに基づき、文字列処理をすることで生物配列の解析を行う。DNA の塩基配列やタンパク質アミノ酸配列の研究は、バイオインフォマティクスの最重要課題の一つとして取り組まれてきた。配列情報解析の重要な対象であるゲノム塩基配列は、すでに 200 種類以上が決定されており、さらに多くの解析が進行中であるといわれている [9]。

生物配列の文字列処理の中で、DNA 配列中に同じ順序で並んでいるユニットのパターンを見つける配列アラインメントがある [10]。アラインメントとは、複数の配列を入力として配列要素の間に最適な対応関係が特定できるように並べたものである。配列アラインメントの中には、グローバル配列アラインメントとローカル配列アラインメントがある。グローバル配列アラインメントは、ある 2 つ以上の配列全体でアラインメントすることであり、ローカル配列アラインメントは、ある 2 つ以上の配列の一部分で最も一致度が高い部分でアラインメントすることである。例として、ある配列 P と配列 Q のグローバル配列アラインメントとローカル配列アラインメントを図 2.3 に示す。



図 2.4: 編集距離と編集グラフ

配列アラインメントには、動的計画法による解法として Needleman-Wunsch アルゴリズム [11] や Smith-Waterman アルゴリズム [12] が存在する。配列アラインメントは生物学において重要な手法であり、計算機を用いた処理の高速化は従来より多くの研究がなされてきた [13–17]。

文字列の類似度を知るための典型的な手法は、情報理論に由来する編集距離 (edit distance) である。編集距離は、一方の文字列をもう一方の文字列に変形するのに必要な手順である一文字の挿入・削除・置換にそれぞれ編集スコアを割り当て、そのスコアの和として定義される。編集距離の理解を助けるために、長さ  $N=5$  の文字列  $X = \text{"TCGAT"}$  と長さ  $M=5$  の文字列  $Y = \text{"GTCAC"}$  を考える。図 2.4(a) と図 2.4(c) は、文字列  $X$  を  $Y$  に変換する 2 つの方法を示している。上の行のスペースは挿入を表し、下の行のスペースは削除を表す。両方の行に

同じ文字がある列は一致と呼ぶ。図2.4(a)の方法は文字GとTを削除し、GとCを挿入する一方で、図2.4(c)の方法は文字列Xを完全に削除して文字列Yを挿入している。

図2.4(b)および図2.4(d)は、2つのアライメント方法の代替表現である。任意の位置の数字は、図2.4(a)および図2.4(c)の方法においてその位置までに存在する記号の数を示している。この表示は各列の数値が図2.4(e)に示す二次元の編集グラフの座標と考えることができる。このグラフを編集グラフという。編集グラフは2つの文字列間において、取りうる限りの配置の二次元表現である有向非巡回グラフ(DAG)である。全てのエッジが編集操作に対応しており、垂直の矢印は挿入を、水平の矢印は削除を、斜めの矢印は一致を表している。任意のアライメントはこのグラフのパスで表現できる。例えば、図2.4(e)の青と赤の矢印は、それぞれ図2.4(a)および図2.4(c)に示す2つのアライメントに対応している。

2つの文字列間の編集距離は、動的計画法を用いて計算できる。動的計画法は小さな部分問題から始めて次第に大きな問題を漸進的に解決し、各ステップはそれ以前の計算の結果に依存している。編集グラフ上の各ノードは、部分問題の最適解に対応するスコア、すなわち最初のノードからの最短経路に対応するスコアを計算している。隣接するノードは、計算が対角線に沿って進むにつれてそれ以前の最適解を利用してスコアを計算する。編集グラフ自身は最初のノードから最後のノードまでの経路として、表現される可能性のあるすべてのアライメントから構成されている。よって、上記の方法は比較対象の文字列間の最適なアライメントについて空間全体の検索が保証されている。

任意の2つの文字列が与えられた場合、多数の異なるパスがあり、それぞれが独自のアライメントを持つ。ある特定のアライメントの相対的なメリットを決定するためにスコアマトリックスが導入される。このスコアマトリックスは効果的に編集グラフの有向辺の重みを定義することができる。スコアマトリックスとはあるユニット間の一致・不一致や置換確率から求められるスコアからなる行列である。一致・不一致スコアと対数オッズスコアの式を式2.1と式2.2にそれぞれ示す。

$$S(A, B) = \begin{cases} \alpha & A = B \\ \beta & A \neq B \end{cases} \quad (2.1)$$

$$S(A, B) = \log \frac{q(A, B)}{p(A)p(B)} \quad (2.2)$$

|   | A | C | T | G | - |
|---|---|---|---|---|---|
| A | 2 | 1 | 1 | 1 | 1 |
| C | 1 | 2 | 1 | 1 | 1 |
| T | 1 | 1 | 2 | 1 | 1 |
| G | 1 | 1 | 1 | 2 | 1 |
| - | 1 | 1 | 1 | 1 | 1 |

  

|   | A | C | T | G | - |
|---|---|---|---|---|---|
| A | 1 | 2 | 2 | 2 | 2 |
| C | 2 | 1 | 2 | 2 | 2 |
| T | 2 | 2 | 1 | 2 | 2 |
| G | 2 | 2 | 2 | 1 | 2 |
| - | 2 | 2 | 2 | 2 | 2 |

(a) 最長経路探索に用いられるスコアマトリックス (b) 最短経路探索に用いられるスコアマトリックス

図 2.5: スコアマトリックスの例

ここで  $q(A, B)$  は進化の過程においてある  $A$  と  $B$  というユニットに継承, 置換などの対応が生じた確率,  $p(A)$  は偶然に  $A$  が生じた確率,  $p(A)p(B)$  は偶然に  $A$  と  $B$  の対応が生じた確率である. また, ユニットの挿入・欠損のことをギャップといい, ギャップに対応したスコアをギャップスコアという.

図 2.5 には式 2.1 に具体的な数値を当てはめた場合のスコアマトリックス例を示す. 最下行と最右列はギャップスコアを表している.

あるノードにおけるスコアの最大値と最小値を求める関数は式 2.3a と式 2.3b のように書ける.

$$s_{i,j} = \max \begin{cases} s_{i-1,j} + S(-, Y_j) \\ s_{i,j-1} + S(X_i, -) \\ s_{i-1,j-1} + S(X_i, Y_j) \end{cases} \quad (2.3a)$$

$$s_{i,j} = \min \begin{cases} s_{i-1,j} + S(-, Y_j) \\ s_{i,j-1} + S(X_i, -) \\ s_{i-1,j-1} + S(X_i, Y_j) \end{cases} \quad (2.3b)$$

$i$  と  $j$  は図 2.4(e) に示す行と列のインデックス,  $s_{i,j}$  は  $i$  行  $j$  列のノードのスコア,  $X_i$  は文字列 X の  $i$  番目の文字,  $Y_j$  は文字列 Y の  $j$  番目の文字,  $S(X_i, Y_j)$  は  $X_i$  と  $Y_j$  のスコア,  $S(-, Y_j)$



図 2.6: 配列アラインメントアクセラレータの基本構造

,  $S(X_i, -)$  はギャップスコアである.

アラインメントのメリットを決定することとはつまり、図 2.5(a) のマトリックスと式 2.3a を用いて最長経路を探索すること、または図 2.5(b) のマトリックスと式 2.3b を用いて最短経路を探索することと等しい。

### 2.3 CMOSによるレースロジック実装

本節では、CMOSを用いたレースロジック実装例 [1-3] として、配列アラインメントアクセラレータを説明する。レースロジックの考え方を用いて実装された配列アラインメントアキテクチャの基本構造を図 2.6 に示す。このレースロジックアレイはセルと呼ばれる単位のユニットが繰り返される構造をとっている。図 2.4(e) に示す編集グラフに対して、レースロジックアレイが編集グラフ全体に、セルがノードに対応する。セルは上・斜上・左のセルから信号の入力を受け付ける。信号が入力された後、設定された条件に合わせて適切な処理をした後に、次のセルへと信号を出力する。実装の選択肢として、セルへの信号伝搬をクロックと同期させる同期型と、セルへの信号伝搬をクロックと同期させない非同期型がある。

最短経路探索を行うことで DNA グローバル配列アラインメントスコアを得る配列アライ

|   | A        | C        | T        | G        | - |
|---|----------|----------|----------|----------|---|
| A | 1        | $\infty$ | $\infty$ | $\infty$ | 1 |
| C | $\infty$ | 1        | $\infty$ | $\infty$ | 1 |
| T | $\infty$ | $\infty$ | 1        | $\infty$ | 1 |
| G | $\infty$ | $\infty$ | $\infty$ | 1        | 1 |
| - | 1        | 1        | 1        | 1        | 1 |

図 2.7: CMOS で実装された同期型レースロジックで用いるスコアマトリクス

メントアクセラレータについて、同期型と非同期型を説明する。

- CMOS による同期型レースロジック実装

この同期型レースロジックのセルに必要な機能は、クロックと同期して次のセルへの伝搬を行うこと、右、下のセルへの伝搬は文字列の一致・不一致に関わらず行いスコアマトリクスに基づく重み付けをすること、斜下のセルへの伝搬は文字列の一致・不一致によってスコアマトリクスに基づく重み付けをして行うことである。

この回路で使用するスコアマトリクスを図 2.7 に、CMOS で実装された同期型レースロジックのセルの構造を図 2.8 に示す。図 2.8 の unit cell と示されてる部分が 1 つのセルである。

ブール値 “1” の信号は左、斜上、上のセルのいずれからも入力される。入力された信号は OR ゲートを通過して、D フリップフロップへと入力される。D フリップフロップをクロックと同期させることで、1 つのセルを通過し、次のセルへと伝搬する際に 1 クロックサイクルを要する。右、下のセルへは無条件で信号が伝搬する。斜下への伝搬経路には AND ゲートがあり、 $M_{i,j}$  との AND を取る。 $M_{i,j}$  は式 2.4 で表されるものである。比較する文字が一致した場合は斜下のセルに伝搬が行われ、比較する文字が不一致の場合は斜下のセルに伝搬が行われない。伝搬が行われる場合は伝搬する際に 1 クロックサイクルを要し、伝搬が行われない場合は無限大の伝搬遅延が付与され



図 2.8: CMOSで実装された同期型レースロジックのセル構造 [1]

たと見なせる。よって、スコアマトリクスに基づく重み付けを行うことができる。

$$M_{i,j} = \begin{cases} 1, & X_i = Y_j \\ 0, & X_i \neq Y_j \end{cases} \quad (2.4)$$

図2.8のセルを繰り返した構造を持つアレイに信号が入力された時から出力信号を得るまでのクロック数をカウントするカウンタがアレイ外部に存在する。このカウンタが計測した値が最短経路をパスした時のクロックサイクル数となる。

- CMOSによる非同期型レースロジック実装

この非同期型レースロジックのセルに必要な機能は、右、下のセルへの伝搬は文字列の一致・不一致に関わらず行いスコアマトリクスに基づく重み付けをすること、斜下のセルへの伝搬は文字列の一致・不一致によってスコアマトリクスに基づく重み付けをして行うことである。

この回路で使用するスコアマトリクスを図2.9に、CMOSで実装された非同期型レースロジックのセルの構造を図2.10に示す。

ブール値“1”的信号は左・斜上・上のセルのいずれからも入力される。入力された信号はORゲート、リセットのためのANDゲートを通過する。アレイのリセットのタイミングは、全ての遅延素子が確実にリセットされるように外部から調整される。AND

|   | A        | C        | T        | G        | -        |
|---|----------|----------|----------|----------|----------|
| A | $\alpha$ | $\beta$  | $\beta$  | $\beta$  | $\gamma$ |
| C | $\beta$  | $\alpha$ | $\beta$  | $\beta$  | $\gamma$ |
| T | $\beta$  | $\beta$  | $\alpha$ | $\beta$  | $\gamma$ |
| G | $\beta$  | $\beta$  | $\beta$  | $\alpha$ | $\gamma$ |
| - | $\gamma$ | $\gamma$ | $\gamma$ | $\gamma$ | $\gamma$ |

図 2.9: CMOSで実装された非同期型レースロジックで用いるスコアマトリクス



図 2.10: CMOSで実装された非同期型レースロジックのセル構造 [3]

ゲートを通過後に次のセルへの伝搬に向けて分岐し、それぞれの経路で遅延素子を通過する。右、下への伝搬経路では遅延素子によってギャップスコア $\gamma$ に基づく遅延が付与されている。斜下への伝搬経路では片方の遅延素子によって一致スコア $\alpha$ に基づく遅延が、もう一方の遅延素子によって不一致スコア $\beta$ に基づく遅延が付与されている。文字列Pと文字列Qとのある一文字の一致・不一致がmatch circuitによって判定され、そこから出力された信号でマルチプレクサから一致スコアに基づく遅延が付与された信号か不一致スコアに基づく遅延が付与された信号を選択することができる。ダミーのパスゲートは、遅延時間の調整を行うために斜下へのパス以外に追加されている。図2.10のセルを繰り返した構造を持つアレイに信号が入力された時から出力信号を得るまでの遅延時間をカウントするカウンタがアレイ外部に存在する。

上記の回路については、シミュレーションをもってその有効性が明らかにされている。

## 第3章

# ナノフォトニック・デバイスを用いたレースロジック実装の提案

本章では、本提案のナノフォトニック・デバイスを用いたレースロジック（以下、光レースロジック）アレイを理解する上で必要な光デバイスに関する基本事項を説明し、光レースロジック実装について述べる。

### 3.1 光デバイスについて

本節では、まずナノフォトニクスについてと、光デバイスの特徴と代表的な光素子について説明する。その後、光デバイスとレースロジックの親和性について述べる。

#### 3.1.1 ナノフォトニクスの性質

ナノフォトニクスとは、ナノ加工技術をベースとして、近接場光の性質を活かした技術である。近接場光とは物質の表面付近に局在する非伝播な電磁場であり、その局在範囲は光の波長と同程度かそれに比べ小さい。近接場光の概要を図3.1に示す。物質から遠ざかるにつれて電磁場は減少するため、その特徴からエバネッセント光とも呼ばれる。屈折率が大きい媒質から屈折率の小さい媒質に光を入射させる。この場合ある角度を超えると、光は境界面を通過せず全て反射する。この現象を全反射と言う。物質表面に全反射が起こるように光を



図 3.1: 近接場光



図 3.2: エバネッセント光

入射した際、反射が起こっている物質界面付近では局在する電磁場が発生する。この電磁場光がエバネッセント光である。エバネッセント光が発生した際、界面から離れる方向に電磁場が弱くなる。図3.2はエバネッセント光が発生する様子である。従来の光通信で広く使われている光素子の素材はガラスである。これを半導体微細加工技術を用いて、半導体へと置き換える。この技術によって半導体内を光が伝送できる。ガラスから半導体へと素材を変えただけでは、光素子のゲート長のスケールはcmからmmのサイズに小さくなるだけである。これを $\mu m$ のスケールにするためには、半導体などのナノ加工技術がベースとしてあ

る。半導体のナノ加工技術が素子の加工技術のベースになり、近接場光の局在性をはじめとする近接場光にしかない特徴を活かして、光信号をナノレベルで制御することが可能になって成り立つ技術がナノフォトニクスである。

### 3.1.2 光デバイスの特徴

以下に光デバイスの特徴をまとめ、詳細を説明する。光デバイスは光が信号を伝搬する素子全般のことを指す。一方、本論文では電気デバイスとは電気が信号を伝搬する CMOS トランジスタを指すものと定義する。

- デバイスサイズ

現状、光デバイスのゲート長は  $cm \sim mm$  オーダーのスケールである。後述するナノフォトニクスを用いたとしても、そのスケールのオーダーは  $\mu m$  である。

- 信号の周波数帯域

光デバイスにおいて、信号の伝搬は光信号が通過するか否かで行われる。電気デバイスのように時定数によって周波数帯域が制限されることがない。よって、その周波数帯域は広帯域であると言える。

- データの蓄積

電気デバイスは、電荷を貯めることでデータを保持できる。光デバイスは光を留めておくことが難しいため、データの蓄積は困難である。電気デバイスの方が、光デバイスよりもデータの蓄積が容易であると言える。

電気デバイスはデバイスの小型化が可能という特徴から集積度を上げることが可能である。それに比べ、現状では光デバイスはその小型化に向いておらず、集積度を上げることが困難であった。よって演算には電気デバイスが用いられてきた。一方、光デバイスは伝搬信号の情報量が大きく、信号の移動速度も速いという特徴から通信に使われてきた。

### 3.1.3 光素子の説明

本項では、代表的な光素子について説明する。その説明にあたり、語句を定義する。

- 光伝搬信号

光デバイスおよび、そのデバイスを用いて構成した回路において、情報を伝搬する光信号を指す。

- 光伝搬入力信号および光伝搬出力信号

光デバイスおよび、そのデバイスを用いて構成した回路において、入力される光伝搬信号を光伝搬入力信号、出力される光伝搬信号を光伝搬出力信号と呼ぶ。光入力信号および光出力信号と略す。

- 光伝搬入力信号強度および光伝搬出力信号強度

光伝搬入力信号および光伝搬出力信号の信号強度を指す。単位は [W] である。光入力信号強度および光出力信号強度と略す。

- 光制御信号

光デバイスを制御するための光信号を指す。

- 光制御信号強度

光制御信号の信号強度を指す。単位は [W] である。

- 電気制御信号

光デバイスを制御するための電気信号を指す。

- 電気制御信号強度

電気制御信号の信号強度を指す。単位は [V] である。

## 光スイッチ

光スイッチとは、オン動作およびオフ動作によって光伝搬信号を通過させるか否かを制御する光デバイスである。光スイッチの性能指標としてよく用いられるのが、漏れ率、透過率及び消光比である。光スイッチへの光入力信号強度を  $P_{in}$ 、光出力信号強度を  $P_{out}$  とした場合の、光入力信号強度と光出力信号強度の関係を図 3.3 に示す。図の縦軸は光出力信号強度、横軸は時間を表している。理想的なスイッチでは、光伝搬信号の漏れが無いため光出力信号強度は図の青線に示す関係を取る。しかしながら、実際にはオン動作とオフ動作どちらの場合



図 3.3: 光スイッチの光入力信号強度と光出力信号強度

合でも光伝搬信号の漏れがあるため、光出力信号強度は図の赤線に示す関係を取る。以下にそれぞれの性能指標の定義を示す。

- 漏れ率、透過率

漏れ率とは、スイッチがオン動作とオフ動作の際、それぞれどの程度の光伝搬信号が漏れるかということを表す指標である。図 3.3 に示す  $\alpha$  は、スイッチがオン動作の際にスイッチから回路外へ光伝搬信号がどの程度漏れ出すかを表す漏れ率である。また、スイッチがオン動作の際にどの程度の光伝搬信号を透過させられるかを表す指標を透過率と呼び、漏れ率  $\alpha$  を用いて表すと  $1 - \alpha$  となる。光スイッチへの光入力信号強度を  $P_{in}$ 、オン動作時の光出力信号強度を  $P_{1out}$  とすると、 $\frac{P_{1out}}{P_{in}} = 1 - \alpha$  である。図 3.3 に示す  $\beta$  は、スイッチがオフ動作の際に光伝搬信号を遮断しきれずに、どの程度出力へ漏れ出すかを表す漏れ率である。光スイッチへの光入力信号強度を  $P_{in}$ 、オフ動作をする際の光出力信号強度を  $P_{0out}$  とすると、 $\frac{P_{0out}}{P_{in}} = \beta$  である。 $\alpha$ ,  $\beta$  の値が小さいほどスイッチの性能が高いと言える。

- 消光比

消光比とは、スイッチの光出力信号が 1 と 0 の場合の光出力信号強度比である。透過

率  $1 - \alpha$  および漏れ率  $\beta$  用いると、式 (3.1) で表される。

$$\text{消光比} = \frac{1 - \alpha}{\beta} \quad (3.1)$$

消光比は、透過率および漏れ率を用いて議論することが可能であるとわかる。よって本論文では透過率、漏れ率に着目し、これらをスイッチ性能として議論する。

光スイッチには共振器型スイッチと導波路型スイッチという2つの種類が存在する。図3.4に共振器型スイッチと導波路型のスイッチの概要を示す。光スイッチのゲート長と図3.4に示すように、光スイッチの光伝搬信号の伝送路長のことを指す。

- 共振器型スイッチ

図3.4(a) および (b) に示す共振器型スイッチは、光伝搬信号を共振、共鳴させることでオンとオフの状態を作り出す。オンとオフの状態を切り換えるスイッチング動作を実現するために、光伝搬信号をリークするタイプと光伝搬信号を反射するタイプが存在する。

- リングタイプ

図3.4(a) に示す光伝搬信号をリークするタイプの共振器型スイッチでは、光伝搬信号が伝送するための伝送路とは別に、リング状の構造を取る伝送路(以下、リング)と光伝搬信号をリークするための伝送路がある。リングに電圧を掛けることで伝送路の屈折率を変えることが可能である。屈折率を変えることで、共鳴周波数が変化する。共鳴とは、物理的な系がある特定の周期で働きかけを受けたときにその系がある特徴的な振る舞いをする現象である。この特定の周期が系ごとに異なる。この周期の逆数が共鳴周波数である。電圧を掛けてリングの共鳴周波数を変化させることで、光伝搬信号と共に鳴するか否かを決めることができる。オン動作とオフ動作をどのように実現するかについては後ほど述べる。

- ミラータイプ

図3.4(b) に示す光伝搬信号を反射させるタイプの共振器型スイッチはスイッチング動作を実現するために、光伝搬信号の伝送路中にミラーを配置し、光伝搬信号をミラー間で共振させる。入力側のミラーで反射される光が光伝搬信号と逆位相の場合、互いに打ち消しあう。この状態がオフ動作を行う状態である。入力側の

表 3.1: 共振器型スイッチと導波路型スイッチの特徴

| タイプ | デバイスサイズ | 周波数             | オフ動作時の雑音     |
|-----|---------|-----------------|--------------|
| 共振器 | リング     | $mm \sim \mu m$ | 固定<br>雑音なし   |
|     | ミラー     | $mm \sim \mu m$ | 固定<br>雑音あり   |
| 導波路 |         | $cm$            | 固定なし<br>雑音なし |

ミラーで反射される光の位相を操作することで、オン動作とオフ動作を実現している。

- 導波路型スイッチ

図 3.4(c) に示す導波路型スイッチでは、光伝搬信号の伝送路を挟むように配置した電極から電圧を掛けることで、伝送路の吸光係数を変化させる。吸光係数とは、光がある媒質に入射したとき、その媒質がどれくらいの光を吸収するのかを表す定数である。吸光係数を変化させることで、光伝搬信号を吸収するか否かを決めることが可能である。この操作によってオン動作とオフ動作を実現している。また、図 3.4(a) および (c) に示すスイッチにおいて、電圧の掛かっていないスイッチに光伝搬信号を入射すると、電極間に電圧が発生する。

共振器型スイッチは、共振周波数があるので使用できる光伝搬信号の周波数が固定される。それに対し、導波路型スイッチは光を吸収するので光伝搬信号の周波数が固定されない。しかしながら、既存のフォトニクスにおいて導波路型スイッチのゲート長は  $cm$  オーダーであるのに対し、共振器型スイッチのゲート長は  $mm$  オーダーである。そのため、共振器型スイッチの方が小型化に向いている。ナノフォトニクスの導入により、共振器型の光スイッチのゲート長を  $\mu m$  オーダーにすることができる。ミラータイプの共振器型スイッチは、反射させた信号が経路へと漏れ出し、雑音のように振る舞う可能性がある。リングタイプの共振器型スイッチでは、それを避けることができる。

例として、リングタイプの共振器型スイッチについて動作を説明する。図??に電気制御信号駆動の光スイッチ概要を示す。このスイッチでは光源からの光を入射し、その光を通過させるか否かでスイッチのオン動作とオフ動作を実現している。光スイッチのオン動作時とオフ動作時のそれぞれの状態を図 3.6 に示す。



図 3.4: 光スイッチの種類



図 3.5: 電気制御信号駆動の光スイッチ

図 3.7 のように、光伝搬信号を信号を伝送するための伝送経路へ全反射するように入射すると、その全反射境界面に光が染み出す。この染み出した光が近接場光(エバネッセント光)



図 3.6: スイッチのオンオフ動作



図 3.7: 全反射の際の染み出し光

である。この近接場光は波長程度のスケールで物質表面に局在する。この染み出した光とリングが共鳴すると、入射光がリングへと移る。リングへと移った光はリング内を全反射して進み、リング表面に染み出した近接場光が下の経路へと移る。下の経路へと移った光は回路の外へと放出され、伝送経路に光伝搬信号は戻らない。この現象を使い、リングを共鳴させることでオフ動作を、リングを共鳴させないことでオン動作を実現している。

リングが共鳴するか否かは、電圧の状態によって制御することが可能である。

- 電圧が掛かるとオン動作

電圧が掛かることでリングが共鳴しない様に設定をすると、電圧を掛けることでオン動作をするスイッチとして振る舞う。



図 3.8: 電気制御信号駆動の光スイッチのオンオフ動作

- 電圧が掛からないとオン動作

電圧が掛からないことでリングが共鳴しない様に設定すると、電圧を掛けないことでオン動作をするスイッチとして振る舞う。

- 常にオン動作

電圧が掛かるか否かに関係なく常にリングが共鳴しない様に設定すると、電圧に関わらず常にオン動作をするスイッチとして振る舞う。

図 3.8 に、この電気制御信号駆動の光スイッチのオン動作およびオフ動作の様子を示す。

### 受光器

光の素粒子は一般に光子(フォトン)と呼ばれる。全ての粒子が波動性を持つことを、粒子と波動の二重性と言う。光子も粒子性と波動性の2つの性質を持つ [18]。光子のエネルギーは光の周波数(波長)で決定する。

$$E = h\nu \quad (3.2)$$

$E$  は光子のエネルギー,  $h$  はプランク定数,  $\nu$  は光の周波数である。光の強度は光子の数によって決定する。

物質中の電子のエネルギーは、取り得るエネルギー準位が限定されている。そのエネルギー準位は帯構造を取り、図 3.9 に示すようにそれぞれ伝導帯、禁制帯、価電子帯と呼ばれる。伝導帯とは、電子が占めているエネルギー帯のうち最も高いエネルギー準位を示すエネルギー帯である。この伝導帯は電子が充填されておらず、このエネルギー帯に存在する電子



図 3.9: 半導体のエネルギー-band図

は自由電子として振る舞う。価電子帯は価電子によって充填されたエネルギー帯である。禁制帯とは電子が存在できないエネルギー帯である。この禁制帯の幅が図 3.9 に示す  $E_g$  であり、エネルギーギャップと呼ばれる。半導体物質において、エネルギーギャップを超えるのに十分なエネルギーを持った光子 1 つが入射した際に、自由電子と正孔のペア 1 つを生成する。この現象を吸収という。光子のエネルギーはその光の周波数で決まるため、エネルギーギャップの大きさに対応した周波数がある。逆の現象が、放出である。これは、自由電子と正孔が再結合した際に、そのエネルギーギャップ  $E_g = h\nu$  に相当するエネルギーを持つ光子を放出する現象である。図 3.10 に吸収と放出の様子を示す。図 3.10(a) におけるエネルギーギャップが、緑の光の光子の持つエネルギーと等しいとする。この際、緑の光を入射すると電子正孔対が生成される。しかしながら、赤の光は緑の光よりも周波数が小さいため、光子のエネルギーが緑の光と比べて小さい。よって赤の光を入射しても電子は伝導帯へと励起することができず、電子正孔対は生成されない。受光器であるフォトダイオードはこの吸収の現象を利用して光を検出する。

フォトダイオードは p 型半導体と真性半導体と n 型半導体を接合した pin 接合という構造を持ち、空乏層で発生した電子や正孔が移動することで電流が流れる。この電流のことを光電流と呼ぶ。流れる光電流の大きさは光の強度に比例する。図 3.11 に受光器のエネルギー-band図を示す。

受光器の性能は受光感度として表される。受光感度は、光入力信号強度を [W]、光電流を [A] で表した場合、両者の比で表される。受光感度は式 (3.3) で表される。式 (3.3) によって



図 3.10: 光の吸収と放出



図 3.11: 受光器のエネルギー-band図

導かれる値が 1 に近い程、感度の良い受光器であることを示す。

$$\text{受光感度} = \frac{A}{W} \quad (3.3)$$

もう一つ重要な性能指標が受光器の最小受光感度である。最小受光感度とは、受光器が検出可能な最小の信号強度のことである。



図 3.12: 光カプラの分類

## 光カプラ

光カプラとは、1つの入力端子に入射した光伝搬信号を複数の出力端子に出射する分岐・分配機能と複数の入力端子に入射した光伝搬信号を1つの出力端子に出射する結合機能を持つデバイスである。光分岐結合器、光分岐挿入器とも呼ばれる。光カプラの分類を図3.12に示す。4端子で2入力2出力または3入力1出力のものが光方向性結合器(図3.12(a))、1入力N出力のものが光分配器もしくは光分岐器(図3.12(b))、N入力1出力のものが光結合器(図3.12(c))、N入力N出力のものが光スタークラップラ(図3.12(d))と呼ばれている。光スタークラップラの中には透過型と反射型という分類が存在する。光結合器の多くが入出力端子を逆にすることで光分配器としても使うことができる[19]。また、光の結合・分配の際には損失が発生する。

## 光遅延素子

光遅延素子は光伝搬信号に伝搬遅延を付加できる素子のことを指す。その実現は様々な方法があり、いずれの方法を用いても遅延を付加する際には損失が発生する。

### 3.1.4 レースロジックと光デバイス

レースロジックは動的計画法で解くことができる最適化問題の答えを遅延時間で表現するアプローチである。伝搬信号を積極的に伝搬させることで、計算結果を求める。

前述した通り、光デバイスとは光伝搬信号を取り扱う素子を指す。光伝搬信号は信号の伝搬速度が速いという光の高速性を持っている。本研究では、光伝搬信号の高速性という特徴とレースロジックとの親和性に着目した。ナノフォトニクック・デバイスをはじめとする光デバイスの光速での信号処理という特徴から、CMOSデバイスを用いたレースロジック回路よりも性能において優位になると想え、ナノフォトニクック・デバイスを用いたレースロジック回路を提案する。

## 3.2 提案回路

ナノフォトニクック・デバイスを用いる際、取り扱える情報媒体は遅延時間だけではなく、位相、信号強度なども存在する。レースロジックは伝搬信号に遅延時間を重みとして付与して動的計画法によって求められる最適化問題を解くという考え方である。光デバイスを用いることで、その考えを発展させ、光伝搬信号に位相変化や強度変化を重みとして付与して動的計画法によって求められる最適化問題を解くものを考えることができる。設計選択肢として考えられる遅延時間、位相、信号強度のうち、本論文では情報媒体として遅延時間を選択した場合のレースロジック回路を考える。

ナノフォトニクック・デバイスを用いたレースロジック回路も、図2.6(a)に示すようにコントロールと光伝搬出力信号のアレイ伝搬遅延時間を計測する部分とアレイからなるものを想定する。本論文では、光レースロジックアレイのセル構造を提案する。図3.13に光レースロジックアレイのセルの概要を示す。



図 3.13: 光 Race logic 回路におけるセルの概要

セルは3つのユニットから構成される。合波ユニットは、左、斜上、上のセルからの光伝搬入信号を合波させるユニットである。最長経路探索や最短経路探索、回路に設定する競争条件に合わせてその処理・構成が変わる。その後、光伝搬信号はアンプユニットで光強度を増幅された後、メインユニットへ到達する。メインユニットでは光伝搬信号の分波と任意の処理を施して、光伝搬信号を次のセルへと出力する。このユニットの構成と処理は回路に設定された競争条件によって決定する。対象とするアプリケーションや設定する競争条件によって、セルの構成は詳細に決定する。

本論文ではDNAのグローバル配列アラインメントスコア計算を対象とした非同期型光レースロジック回路のアレイを提案する。今回の提案回路で非同期型の構成を選択したのは、光伝搬信号は蓄積が困難であるという点を考慮した結果である。最短経路探索を用いてアラインメントスコアを求める回路を想定し、計算に用いるスコアマトリクスは式2.1にて決定した。そのスコアマトリクスを図3.14に示す。

|   | A        | C        | T        | G        | - |
|---|----------|----------|----------|----------|---|
| A | 1        | $\infty$ | $\infty$ | $\infty$ | 1 |
| C | $\infty$ | 1        | $\infty$ | $\infty$ | 1 |
| T | $\infty$ | $\infty$ | 1        | $\infty$ | 1 |
| G | $\infty$ | $\infty$ | $\infty$ | 1        | 1 |
| - | 1        | 1        | 1        | 1        | 1 |

図 3.14: 使用するスコアマトリクス



図 3.15: 提案回路のセル構造

図 3.15 に提案する回路のセル構造を示す。提案回路のセルにおける、3つのユニットの構成・動作を述べる。

- 合波ユニット



図 3.16: 合波ユニットの挙動



図 3.17: アンプユニットの挙動

このユニットでは3入力1出力の光カプラを用いて合波が行われる。図3.16にその動作を示す。この時、3方向それぞれからの光入力信号が光カプラに到達するまでの時間は同じでなければならない。

- アンプユニット

合波ユニットを経た光伝搬信号は、光アンプにて増幅される。図3.17にその動作を示す。この光アンプでは、光伝搬信号が各素子を伝搬した際の強度損失を補う役割をし



図 3.18: メインユニット・1入力3出力光カプラの挙動

ている。回路規模や光源の光強度、受光器の最小受光感度によって強度損失を補う必要がない場合があり、その際にはこのユニットは導波路のみで構成される。

- メインユニット

メインユニットに求められる機能は右、下、斜下の3つの経路への分波と、各伝搬経路ごとにスコアマトリクスに基づく重み付けである。右、下、斜下の3つの経路への分波は、図3.18に挙動を示すように1入力3出力の光カプラを用いて行われる。

次に各伝搬経路ごとのスコアマトリクスに基づいての重み付けについて説明する。図3.19に比較する文字列が一致した場合と不一致の場合それぞれのメインユニットの挙動を示す。

斜下への伝搬経路では、文字列の一致・不一致によってそれぞれ違う重み付けがされなければならない。今回使用するスコアマトリクスにおいて、一致スコアは1、不一致スコアは $\infty$ である。このスコアに基づく重み付けを行うため、光スイッチを使用した。光スイッチのオン/オフを決定する制御信号は、コントロール部分において比較する文字列が一致した場合オン動作となるように、不一致の場合にオフ動作となるように設定する。光スイッチがオフ動作の時、光伝搬信号は斜下のセルに伝搬されない。これは無限大の遅延時間を付加された、と考えることができ、不一致スコアに対応した重み付けがされたとみなすことができる。光スイッチがオン動作の時、光伝搬信号は光



図 3.19: メインユニットの挙動

スイッチを通過し次のセルへと出力される。この時の伝搬遅延時間をスコアマトリクスにおける一致スコアの1の重みを表す量として取り扱う。右、下への伝搬経路はそれぞれ、文字列の欠損と挿入に対応し、セルへの伝搬は文字列の一致・不一致に関わらず無条件に行われる。右、下への伝搬経路ではギャップスコアに基づく遅延が発生するように、光遅延素子を設定する。今回使用するスコアマトリクスにおいては、ギャップスコアは1の重み付けをされており、これは一致スコアと同じ重みである。よって、光遅延素子で設定すべき遅延時間は、光遅延素子を通過して次のセルへ出力されるまでの遅延時間が斜め下への伝搬経路で発生する遅延時間と同じになるような量である。3つの伝搬経路において遅延時間の重み付けをされた光伝搬信号は次のセルへと伝搬される。

このセルを並べることでDNA配列アラインメントスコア計算を対象とした光レースロジックアレイを構築する。配列長 $N=2$ の時の光レースロジックアレイの構成、比較する文字列が完全に一致する場合の光レースロジックアレイの挙動、比較する文字列が完全に不一致の場合の光レースロジックアレイの挙動をそれぞれ図3.20、図3.21、図3.22に示す。図3.21、図3.22の赤く示した経路が光伝搬信号が伝搬している経路と到達する素子である。

図 3.20: 配列長  $N=2$  の光レースロジックアレイの構造



図 3.21: 比較する文字列が完全に一致する場合の光レースロジックアレイの挙動



図 3.22: 比較する文字列が完全に不一致の場合の光レースロジックアレイの挙動

# 第4章

## 検証・評価

本章では提案したDNA配列アラインメントスコア計算用の光レースロジックアレイについて機能検証と評価を行う。

### 4.1 検証

検証に用いたのはOptiwave社が提供するOptisystemというシミュレータである[20]。OptiSystemは光ネットワークのあらゆるタイプの広範囲のシステムの設計、評価、シミュレーションを行なうソフトウェアである。素子レベルからシステムレベルまでの物理レイヤー上の光通信システムの設計と解析を行うことができる。

配列長 $N=2$ のアラインメントスコアを求める提案回路について、光レースロジックアレイの動作を確認した。今回のシミュレーションにおいて、各素子において光伝搬信号に影響を与える雑音や損失は考慮していない。またOptisystemの仕様上、遅延素子で付与された遅延時間のみが考慮され、素子や導波路の伝搬遅延については考慮されていない。配列長 $N=2$ の光レースロジックアレイの光スイッチは、配列の組み合わせによってその状態を変える。回路のスイッチが取りうる全状態を図4.1に示す。図4.1中のスイッチは、白塗りがオンの状態を、黒塗りがオフの状態をそれぞれ表している。図4.1(a)は配列X="AA", 配列Y="AA"のように配列が完全に一致する場合、図4.1(b)は配列X="AG", 配列Y="AG"のように配列が完全に一致する場合、図4.1(c)~図4.1(k)は配列X="AG", 配列Y="AC"のように配

表 4.1: 配列長 N=2 の光レースロジックアレイの動作検証結果

|       | 1   | 2                               | 3   |
|-------|-----|---------------------------------|-----|
| 状態 1  | 2ns | 図 4.2(a), 4.2(b) の 0ns~8ns 区間   | 2ns |
| 状態 2  | 2ns | 図 4.2(a), 4.2(b) の 8ns~14ns 区間  | 2ns |
| 状態 3  | 3ns | 図 4.2(a), 4.2(b) の 14ns~20ns 区間 | 3ns |
| 状態 4  | 3ns | 図 4.2(a), 4.2(b) の 20ns~26ns 区間 | 3ns |
| 状態 5  | 3ns | 図 4.2(c), 4.2(d) の 0ns~8ns 区間   | 3ns |
| 状態 6  | 3ns | 図 4.2(c), 4.2(d) の 8ns~14ns 区間  | 3ns |
| 状態 7  | 3ns | 図 4.2(c), 4.2(d) の 14ns~20ns 区間 | 3ns |
| 状態 8  | 3ns | 図 4.2(c), 4.2(d) の 20ns~26ns 区間 | 3ns |
| 状態 9  | 3ns | 図 4.2(e), 4.2(f) の 0ns~8ns 区間   | 3ns |
| 状態 10 | 3ns | 図 4.2(e), 4.2(f) の 8ns~14ns 区間  | 3ns |
| 状態 11 | 3ns | 図 4.2(e), 4.2(f) の 14ns~20ns 区間 | 3ns |
| 状態 12 | 4ns | 図 4.2(e), 4.2(f) の 20ns~26ns 区間 | 4ns |

列中の 1 文字が一致する場合、図 4.1(l) は配列 X=“AG”，配列 Y=“CT”のように配列が完全に不一致の場合である。

Optisystem でのシミュレーションの結果を図 4.2 に示す。今回のシミュレーションでは光遅延素子で発生する遅延時間が 1ns と設定した。

表 4.1 に、図 4.1 のそれぞれの状態ごとの、

1. 最初の光伝搬出力信号の伝搬遅延時間の想定値
2. シミュレータ上の回路のスイッチがその状態を取る区間
3. 結果から読み取った最初の光伝搬出力信号の伝搬遅延時間

を示す。

この機能検証結果から、光レースロジックアレイが想定した動作をしていることが確認できた。



図 4.1: 取りうる全スイッチの状態



(a) 光レースロジックアレイへの光伝搬入  
力信号 1 (b) 光レースロジックアレイへの光伝搬出  
力信号 1



(c) 光レースロジックアレイへの光伝搬入  
力信号 2 (d) 光レースロジックアレイへの光伝搬出  
力信号 2



(e) 光レースロジックアレイへの光伝搬入  
力信号 3 (f) 光レースロジックアレイへの光伝搬出  
力信号 3

図 4.2: Optisystem での光伝搬入出力信号

## 4.2 評価

本節では、提案した光レースロジックアレイが一組の配列のアラインメントを求める（以後、これを一計算と呼称する）ために必要な遅延時間や面積及び消費電力が配列長  $N$  によってどう変化するかを見積るために各項目を算出するモデル式を構築し、評価を行う。

### 4.2.1 遅延時間

光レースロジックアレイに光伝搬信号が入射されてからアレイ内を伝搬し、最初に出力された信号が受光器で検出されるまでの遅延時間を考える。配列長  $N$  の光レースロジックアレイにおいて、最初に光伝搬信号が出力されるまでの回路遅延時間は配列の組み合わせによって異なる。二つの配列が完全に不一致の場合、最初に光伝搬信号が出力されるまでの回路遅延時間は最長となる。今回はこのワーストケースの遅延時間をモデル化した。

図 3.15 の構造より構築した遅延時間  $T$  のモデル式を式 4.1 に示す。

$$\begin{aligned} T &= 2N \times T_{cell-pass} + T_{pd} \\ T_{cell-pass} &= T_{cell-wire} + T_{coupler} + T_{amp} + T_{splitter} + T_{switch-pass} \end{aligned} \quad (4.1)$$

$T_{cell-pass}$  は一つのセルを通過する遅延時間、 $T_{pd}$  は受光器の応答時間である。 $T_{cell-pass}$  の内訳は  $T_{cell-wire}$  がセル内部の配線遅延、 $T_{coupler}, T_{splitter}$  がそれぞれ光結合器・光分配器の遅延時間、 $T_{amp}$  がアンプの遅延時間、 $T_{switch-pass}$  が光スイッチ遅延時間である。 $T_{wire}$  と  $T_{cell-pass}$  が光伝搬入力信号が光レースロジックアレイを伝搬するために必要な時間、 $T_{pd}$  が受光器が光出力信号を検出するまでに必要な時間である。式 4.1 に示す通り、遅延時間は配列長  $N$  に線形にスケールする。

光伝搬信号は光デバイス内部を光速で通過するため、光デバイス内の遅延時間は素子のゲート長に依存する。今回は、セルを構成する各素子のゲート長が全て同じであると仮定し、ゲート長が 100, 10,  $1\mu m$  の場合の光レースロジックアレイの遅延時間を示す。なお、配線遅延に関しては今回は無視している。図 4.3 の縦軸は遅延時間、横軸は配列長  $N$  である。図 4.3 より、ナノフォトニック・デバイスのゲート長が小さいほど遅延時間が小さくなることが読み取れる。



図 4.3: 光レースロジックアレイの遅延時間

#### 4.2.2 面積

提案したセルの構成（図 3.15）より、セル一つの面積  $A_{cell}$  を表すモデル式は式 4.2 と書ける。

$$A_{cell} = A_{cell-wire} + A_{coupler} + A_{amp} + A_{splitter} + A_{switch} + 2A_{delay} \quad (4.2)$$

$A_{cell-wire}$  はセル内部の配線面積、 $A_{amp}$  がアンプの面積、 $A_{coupler}$ ・ $A_{splitter}$  はそれぞれ光結合器・光分配器の遅延時間、 $A_{switch}$  が光スイッチの面積、 $A_{delay}$  は光遅延素子の面積である。このセルを基準セルとする。

セルを並べてアレイを構成した時に、外周のセルはこの基準セルとは違う構成となる。その様子を図 4.4 に示した。基準セルの構成を取るのは赤く着色した部分で、青く着色されたセルは基準セルとは違う構成となるのがわかる。この差異に留意しながら、配列長 N の光



図 4.4: 配列長 N=2 の光レースロジックアレイのセルの構成

レースロジックアレイの面積  $A$  をモデル化していく。面積  $A$  の式を式 4.3 に示す。

$$\begin{aligned}
 A = & (N - 1)^2 \times A_{cell} + A_{splitter} + A_{switch} + 2A_{delay} \\
 & + N \times (A_{amp} + A_{splitter} + A_{switch} + 2A_{delay}) + 2(A_{delay} + A_{amp}) \\
 & + N \times (A_{coupler} + A_{amp} + A_{delay}) + A_{coupler} + A_{amp} + A_{ls} + A_{pd}
 \end{aligned} \quad (4.3)$$

第1項は全ての基準セルの面積、第2~4項は1行目1列目のセルの面積、第5項は1行目の

両端以外と1列目の両端以外のセルの面積, 第6項は1行目N列目とN行目1列目のセルの面積, 第7項はN行目の両端以外とN列目の両端以外のセルの面積, 第8項はN行目N列目のセルの面積, 第9項は光源の面積, 第10項は受光器の面積をそれぞれ表している. 式4.3を整理した面積Aのモデル式を式4.4に示す.

$$A = N^2 \times A_{cell} + 2N \times (A_{delay} + A_{amp}) + A_{ls} + A_{pd} \quad (4.4)$$

式4.4が示すように, 面積は配列長Nの2乗にスケールする.

遅延時間の場合と同様に, セルを構成する各素子のゲート長が全て同じであると仮定する. この時, 各素子の面積は1000, 50,  $3\mu m^2$ となる. ナノフォトニック・デバイスのゲート長が100, 10,  $1\mu m$ の場合の光レースロジックアレイの面積を示す. なお, 配線面積に関しては今回は無視している. 図4.5の縦軸は光レースロジックアレイの面積, 横軸は配列長Nである.

### 4.2.3 消費電力

ここで本提案の光レースロジックアレイでの消費電力について考える. この回路での消費電力は, 式4.5に示すように光源の消費電力 $P_{ls}$ , アンプ $P_{amp}$ の消費電力の二つのみで考えることができる.

$$P = P_{ls} + P_{amp} \quad (4.5)$$

$P$ の値は, 光レースロジックアレイが機能を担保できる値に設定しなければならない. そこで, 光レースロジックアレイの機能担保について具体的に議論する.

配列長Nの光レースロジックアレイのN行N列目のセルからの光伝搬出力信号強度 $P_{out,N,N}$ は式4.6と表せる.

$$P_{out,N,N} = Loss_{N,N}(P_{out,(N-1),(N-1)} + P_{out,(N-1),N} + P_{out,N,(N-1)}) \quad (4.6)$$

$N \geq 1$ ,  $P_{out,0,0} = P_{ls}$ ,  $P_{out,0,1} = 0$ ,  $P_{out,1,0} = 0$ である.  $Loss_{N,N}$ はN行N列目のセルに光伝搬信号が入力されてから出力される際のロスである. とあるセルは図4.6に示すように前段の3つのセルからの出力を入力とするため, 式4.6となる.

$P_{out,N,N}$ の値は配列の組み合わせ, 即ちスイッチの状態によって大きく変化する. 光レースロジックアレイからの光伝搬出力信号は受光器で検出されなければならない. 受光器の最



図 4.5: 光レースロジックアレイの面積

小受光感度  $P_r$  を用いると、 $P_{out N,N}$  の最小値  $\geq P_r$  となるように  $P$  の値を決定することが必要となる。

#### ケーススタディ：配列長 N=2 の光レースロジックアレイにおける消費電力

ここで、図 4.7 に示すように各素子における損失が一律で  $\alpha$  の場合において、配列長 N=2 の光レースロジックアレイにおける消費電力を考える。この  $\alpha$  は 0~1 の範囲の値を取る。図 3.15 に示すセルにおいて、光信号を伝搬させる際に損失を与える素子は光結合器、光分配器、光スイッチ、光遅延素子とする。この 4 つの素子での損失を  $\alpha$  とし、その他の損失は考えない。また、光分配器において、光伝搬信号は強度を 3 分割される。今回は回路規模が小さいので、各セルのアンプユニットでの光伝搬信号強度の増幅は行わず、光源の光出力信号強度

図 4.6: 光レースロジックアレイの光伝搬出力信号強度  $P_{out\ N,N}$ 

図 4.7: 光素子における損失例

を変えることによって  $P_{out\ N,N}$  の最小値  $\geq P_r$  となるようにする。この光レースロジックアレイの消費電力  $P$  は  $P = P_{ls}$  となる。

配列長  $N=2$  の光レースロジックアレイの光スイッチは、図 4.1 に示す 12 通りのいずれかの状態を取る。例として状態 1, 状態 11, 状態 12 の時の出力を求める過程を示す。

- 状態 1 の場合

一つのセルを通過する時間を 1 区間と呼称する。光レースロジックアレイに光源からの光伝搬信号が入力されてから出力されるまでの各区間の信号伝搬経路を模式図 4.8 に表す。

図 4.8(a) の時、1 行 1 列目のセルにおいて光伝搬信号は 1 つの有向辺に沿って伝搬する際に光分配器、光スイッチまたは光遅延素子の 2 つの損失を与える素子を通過する。1



図 4.8: 状態 1 の時の光信号の伝搬の様子

行 1 列目のセルの出力は次の式で表せられる。

$$P_{out,1,1} = P_{ls} \frac{(1-\alpha)^2}{3}$$

図 4.8(b) の時、2 行 1 列目のセルにおいて光伝搬信号は 1 つの有向辺に沿って伝搬する際に光分配器、光スイッチまたは光遅延素子の 2 つの損失を与える素子を通過する。2 行 1 列目のセルの出力は次の式で表せられる。

$$P_{out,2,1} = \frac{(1-\alpha)^2}{3} P_{ls} \frac{(1-\alpha)^2}{3} = P_{ls} \frac{(1-\alpha)^4}{3^2}$$

1 行 2 列目のセルにおいて光伝搬信号は 1 つの有向辺に沿って伝搬する際に光分配器、光スイッチまたは光遅延素子の 2 つの損失を与える素子を通過する。1 行 2 列目のセル

の出力は次の式で表せられる。

$$P_{out1,2} = \frac{(1-\alpha)^2}{3} P_{ls} \frac{(1-\alpha)^2}{3} = P_{ls} \frac{(1-\alpha)^4}{3^2}$$

2行2列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光結合器、光分配器、光スイッチまたは光遅延素子の3つの損失を与える素子を通過する。2行2列目のセルの出力は次の式で表せられる。

$$P_{out2,2} = \frac{(1-\alpha)^3}{3} P_{ls} \frac{(1-\alpha)^2}{3} = P_{ls} \frac{(1-\alpha)^5}{3^2}$$

図4.8(c)の時、3行1列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光遅延素子を通過する。3行1列目のセルの出力は次の式で表せられる。

$$P_{out3,1} = (1-\alpha) P_{ls} \frac{(1-\alpha)^4}{3^2} = P_{ls} \frac{(1-\alpha)^5}{3^2}$$

1行3列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光遅延素子を通過する。1行3列目のセルの出力は次の式で表せられる。

$$P_{out1,3} = (1-\alpha) P_{ls} \frac{(1-\alpha)^4}{3^2} = P_{ls} \frac{(1-\alpha)^5}{3^2}$$

3行2列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光結合器と光遅延素子を通過する。3行2列目のセルの出力は次の式で表せられる。

$$P_{out3,2} = (1-\alpha)^2 P_{ls} \frac{(1-\alpha)^5}{3^2} = P_{ls} \frac{(1-\alpha)^7}{3^2}$$

2行3列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光結合器と光遅延素子を通過する。2行3列目のセルの出力は次の式で表せられる。

$$P_{out2,3} = (1-\alpha)^2 P_{ls} \frac{(1-\alpha)^5}{3^2} = P_{ls} \frac{(1-\alpha)^7}{3^2}$$

3行3列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光結合器を通過する。3行3列目のセルの出力は次の式で表せられる。

$$P_{out3,3} = (1-\alpha) P_{ls} \frac{(1-\alpha)^5}{3^2} = P_{ls} \frac{(1-\alpha)^6}{3^2}$$

以上の過程より、 $P_{out3,3} = P_{ls} \frac{(1-\alpha)^6}{3^2}$  と求まる。



図 4.9: 状態 11 の時の光信号の伝搬の様子

- 状態 11 の場合

光レースロジックアレイに光源からの光伝搬信号が入力されてから出力されるまでの各区間の信号伝搬経路を模式図 4.9 に表す。

図 4.9(a) の時、1行1列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光分配器、光遅延素子を通過する。1行1列目のセルの出力は次の式で表せられる。

$$P_{out1,1} = P_{ls} \frac{(1-\alpha)^2}{3}$$

図 4.9(b) の時、2行1列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光分配器、光遅延素子を通過する。2行1列目のセルの出力は次の式で表せられる。

$$P_{out2,1} = \frac{(1-\alpha)^2}{3} P_{ls} \frac{(1-\alpha)^2}{3} = P_{ls} \frac{(1-\alpha)^4}{3^2}$$

1行2列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光分配器, 光遅延素子を通過する。1行2列目のセルの出力は次の式で表せられる。

$$P_{out1,2} = \frac{(1-\alpha)^2}{3} P_{ls} \frac{(1-\alpha)^2}{3} = P_{ls} \frac{(1-\alpha)^4}{3^2}$$

図4.9(c)の時, 3行1列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光遅延素子を通過する。3行1列目のセルの出力は次の式で表せられる。

$$P_{out3,1} = (1-\alpha) P_{ls} \frac{(1-\alpha)^4}{3^2} = P_{ls} \frac{(1-\alpha)^5}{3^2}$$

1行3列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光遅延素子を通過する。1行3列目のセルの出力は次の式で表せられる。

$$P_{out1,3} = (1-\alpha) P_{ls} \frac{(1-\alpha)^4}{3^2} = P_{ls} \frac{(1-\alpha)^5}{3^2}$$

2行2列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光結合器, 光分配器, 光スイッチまたは光遅延素子の3つの損失を与える素子を通過する。2行2列目のセルの出力は次の式で表せられる。

$$P_{out2,2} = \frac{(1-\alpha)^3}{3} \left( P_{ls} \frac{(1-\alpha)^4}{3^2} + P_{ls} \frac{(1-\alpha)^4}{3^2} \right) = P_{ls} \frac{2(1-\alpha)^7}{3^3}$$

図4.9(d)の時, 3行2列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光結合器, 光遅延素子を通過する。3行2列目のセルの出力は次の式で表せられる。

$$P_{out3,2} = (1-\alpha)^2 \left( P_{ls} \frac{(1-\alpha)^5}{3^2} + P_{ls} \frac{2(1-\alpha)^7}{3^3} \right) = P_{ls} \frac{(1-\alpha)^7 \left\{ \frac{2}{3}(1-\alpha)^2 + 1 \right\}}{3^2}$$

2行3列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光結合器, 光遅延素子を通過する。2行3列目のセルの出力は次の式で表せられる。

$$P_{out2,3} = (1-\alpha)^2 \left( P_{ls} \frac{(1-\alpha)^5}{3^2} + P_{ls} \frac{2(1-\alpha)^7}{3^3} \right) = P_{ls} \frac{(1-\alpha)^7 \left\{ \frac{2}{3}(1-\alpha)^2 + 1 \right\}}{3^2}$$

3行3列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光結合器を通過する。3行3列目のセルの出力は次の式で表せられる。

$$P_{out3,3} = (1-\alpha) P_{ls} \frac{2(1-\alpha)^7}{3^3} = P_{ls} \frac{2(1-\alpha)^8}{3^3}$$

以上の過程より,  $P_{out3,3} = P_{ls} \frac{2(1-\alpha)^8}{3^3}$  と求まる。

- 状態 12 の場合

光レースロジックアレイに光源からの光伝搬信号が入力されてから出力されるまでの各区間の信号伝搬経路を模式図 4.10 に表す。

図 4.10(a) の時、1 行 1 列目のセルにおいて光伝搬信号は 1 つの有向辺に沿って伝搬する際に光分配器、光スイッチまたは光遅延素子の 2 つの損失を与える素子を通過する。1 行 1 列目のセルの出力は次の式で表せられる。

$$P_{out1,1} = P_{ls} \frac{(1-\alpha)^2}{3}$$

図 4.10(b) の時、2 行 1 列目のセルにおいて光伝搬信号は 1 つの有向辺に沿って伝搬する際に光分配器、光スイッチまたは光遅延素子の 2 つの損失を与える素子を通過する。2 行 1 列目のセルの出力は次の式で表せられる。

$$P_{out2,1} = \frac{(1-\alpha)^2}{3} P_{ls} \frac{(1-\alpha)^2}{3} = P_{ls} \frac{(1-\alpha)^4}{3^2}$$

1 行 2 列目のセルにおいて光伝搬信号は 1 つの有向辺に沿って伝搬する際に光分配器、光遅延素子を通過する。1 行 2 列目のセルの出力は次の式で表せられる。

$$P_{out1,2\text{ to right}} = \frac{(1-\alpha)^2}{3} P_{ls} \frac{(1-\alpha)^2}{3} = P_{ls} \frac{(1-\alpha)^4}{3^2}$$

図 4.10(c) の時、3 行 1 列目のセルにおいて光伝搬信号は 1 つの有向辺に沿って伝搬する際に光遅延素子を通過する。3 行 1 列目のセルの出力は次の式で表せられる。

$$P_{out3,1} = (1-\alpha) P_{ls} \frac{(1-\alpha)^4}{3^2} = P_{ls} \frac{(1-\alpha)^5}{3^2}$$

1 行 3 列目のセルにおいて光伝搬信号は 1 つの有向辺に沿って伝搬する際に光遅延素子を通過する。1 行 3 列目のセルの出力は次の式で表せられる。

$$P_{out1,3} = (1-\alpha) P_{ls} \frac{(1-\alpha)^4}{3^2} = P_{ls} \frac{(1-\alpha)^5}{3^2}$$

2 行 2 列目のセルにおいて光伝搬信号は 1 つの有向辺に沿って伝搬する際に光結合器、光分配器、光スイッチまたは光遅延素子の 3 つの損失を与える素子を通過する。2 行 2 列目のセルの出力は次の式で表せられる。

$$P_{out2,2} = \frac{(1-\alpha)^3}{3} \left( P_{ls} \frac{(1-\alpha)^4}{3^2} + P_{ls} \frac{(1-\alpha)^4}{3^2} \right) = P_{ls} \frac{2(1-\alpha)^7}{3^3}$$



図 4.10: 状態 12 の時の光信号の伝搬の様子

図 4.10(d) の時, 3 行 2 列目のセルにおいて光伝搬信号は 1 つの有向辺に沿って伝搬する際に光結合器, 光遅延素子を通過する. 3 行 2 列目のセルの出力は次の式で表せら

れる。

$$P_{out\,3,3} = (1-\alpha)^2 \left( P_{ls} \frac{(1-\alpha)^5}{3^2} + P_{ls} \frac{2(1-\alpha)^7}{3^3} \right) = P_{ls} \frac{(1-\alpha)^7 \left\{ \frac{2}{3}(1-\alpha)^2 + 1 \right\}}{3^2}$$

2行3列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光結合器、光遅延素子を通過する。2行3列目のセルの出力は次の式で表せられる。

$$P_{out\,2,3} = (1-\alpha)^2 \left( P_{ls} \frac{(1-\alpha)^5}{3^2} + P_{ls} \frac{2(1-\alpha)^7}{3^3} \right) = P_{ls} \frac{(1-\alpha)^7 \left\{ \frac{2}{3}(1-\alpha)^2 + 1 \right\}}{3^2}$$

図4.10(e)の時、3行3列目のセルにおいて光伝搬信号は1つの有向辺に沿って伝搬する際に光結合器を通過する。3行3列目のセルの出力は次の式で表せられる。

$$\begin{aligned} P_{out\,3,3} &= (1-\alpha) \left( P_{ls} \frac{(1-\alpha)^7 \left\{ \frac{2}{3}(1-\alpha)^2 + 1 \right\}}{3^2} + P_{ls} \frac{(1-\alpha)^7 \left\{ \frac{2}{3}(1-\alpha)^2 + 1 \right\}}{3^2} \right) \\ &= P_{ls} \frac{2(1-\alpha)^8 \left\{ \frac{2}{3}(1-\alpha)^2 + 1 \right\}}{3^2} \end{aligned}$$

以上の過程より、 $P_{out\,3,3} = P_{ls} \frac{2(1-\alpha)^8 \left\{ \frac{2}{3}(1-\alpha)^2 + 1 \right\}}{3^2}$  と求まる。

このように、各状態での出力が求められる。各状態での出力を以下に示す。

- 状態1（図4.1(a)）の出力  $P_{out\,3,3} = P_{ls} \frac{(1-\alpha)^6}{3^2}$
- 状態2（図4.1(b)）の出力  $P_{out\,3,3} = P_{ls} \frac{(1-\alpha)^6}{3^2}$
- 状態3（図4.1(c)）の出力  $P_{out\,3,3} = P_{ls} \frac{2(1-\alpha)^7}{3^2}$
- 状態4（図4.1(d)）の出力  $P_{out\,3,3} = P_{ls} \frac{(1-\alpha)^7 \left\{ 2(1-\alpha) + 1 \right\}}{3^2}$
- 状態5（図4.1(e)）の出力  $P_{out\,3,3} = P_{ls} \frac{(1-\alpha)^7 \left\{ \frac{2}{3}(1-\alpha) + 1 \right\}}{3^2}$
- 状態6（図4.1(f)）の出力  $P_{out\,3,3} = P_{ls} \frac{(1-\alpha)^7 \left\{ 2(1-\alpha) + 1 \right\}}{3^2}$

表 4.2: 配列長 N=2 の光レースロジックアレイの消費電力

|              | $\alpha = 0.1$ | $\alpha = 0.01$ |
|--------------|----------------|-----------------|
| $P_{ls}[mW]$ | 0.314          | 0.144           |

- 状態 7 (図 4.1(g)) の出力  $P_{out3,3} = P_{ls} \frac{(1-\alpha)^7 \left\{ \frac{2}{3}(1-\alpha)+1 \right\}}{3^2}$
- 状態 8 (図 4.1(h)) の出力  $P_{out3,3} = P_{ls} \frac{2(1-\alpha)^8}{3^2}$
- 状態 9 (図 4.1(i)) の出力  $P_{out3,3} = P_{ls} \frac{(1-\alpha)^7}{3^2}$
- 状態 10 (図 4.1(j)) の出力  $P_{out3,3} = P_{ls} \frac{(1-\alpha)^7}{3^2}$
- 状態 11 (図 4.1(k)) の出力  $P_{out3,3} = P_{ls} \frac{2(1-\alpha)^8}{3^3}$
- 状態 12 (図 4.1(l)) の出力  $P_{out3,3} = P_{ls} \frac{2(1-\alpha)^8 \left\{ \frac{2}{3}(1-\alpha)^2+1 \right\}}{3^2}$

以上のスイッチ状態の中で、その出力強度が最小となるのは状態 11 (図 4.1(k)) の場合である。よって、各素子における損失が一律で  $\alpha$  の配列長 N=2 の光レースロジックアレイでは、 $P_{ls} \frac{2(1-\alpha)^8}{3^3} \geq P_r$  となるように  $P_{ls}$  の値を決定する必要がある。

$P_{ls} \frac{2(1-\alpha)^8}{3^3} = P_r$  とする時、受光器の最小受光感度を  $P_r = -20[dBm] = 0.01[mW]$ ,  $\alpha = 0.1$ , 0.01 の場合の  $P_{ls}$  を表 4.2 に示す。

# 第 5 章

## 考察

本章では、その性能や回路スケールに影響を及ぼす要因や遅延時間以外の設計選択肢について考察していく。

### 5.1 遅延時間差の検知

光レースロジック回路は図 2.6(a) に示すようにコントロールと光伝搬出力信号のアレイ伝搬遅延時間を計測する部分とアレイからなるものを想定し、本論文にて光レースロジックアレイを提案した。光伝搬出力信号のアレイ伝搬遅延時間を計測する部分を検知部分と呼称し、本節ではこの検知部分について考察する。

本提案の光レースロジックアレイは図 3.14 に示すスコアマトリクスを使用している。この場合には、光伝搬出力信号の時間差は一つのセルの通過時間単位で変化する。よって、検知部分では一つのセルの通過時間の差を検知できれば良い。ゲート長が  $1\mu m$  の場合、一つのセルの通過時間は 12.52ps である。デジタルカウンタを用いて遅延時間差を検知部分を構成すると、カウンタを約 80GHz で動作させなければならない。

また、使用するスコアマトリクスを変化させた場合も考える。図 5.1 にスコアマトリクスの一例を示す。このスコアマトリクスでは、図 3.14 に示すスコアマトリクスとは違い、欠損・挿入に対応するギャップスコアが 2 となっている。本提案の光レースロジックアレイでは、光遅延素子で発生させる遅延時間を光スイッチを通過する際の伝搬遅延時間の倍とする

|   | A        | C        | T        | G        | - |
|---|----------|----------|----------|----------|---|
| A | 1        | $\infty$ | $\infty$ | $\infty$ | 2 |
| C | $\infty$ | 1        | $\infty$ | $\infty$ | 2 |
| T | $\infty$ | $\infty$ | 1        | $\infty$ | 2 |
| G | $\infty$ | $\infty$ | $\infty$ | 1        | 2 |
| - | 2        | 2        | 2        | 2        | 2 |

図 5.1: スコアマトリクスの一例

ことで図 5.1 に示すスコアマトリクスに基づく配列アラインメントスコアを求めることができる。この場合、光伝搬出力信号の時間差は光スイッチの通過時間単位で変化し、光スイッチの通過時間はそのゲート長にて決定される。ゲート長の最小加工寸法が  $1 \mu m$  である時、光スイッチを通過する際の遅延時間は  $10 fs$  であり、光遅延素子にて発生させる遅延時間は  $20 fs$  である。検知部分では  $10 fs$  の遅延時間差を検知できなければならない。もしデジタルカウンタを用いて遅延時間差を検知部分を構成するとすると、カウンタを  $100 THz$  で動作させなければならない。

その様な動作周波数でデジタルカウンタを動作させることは不可能である。よって、検知部分をデジタルカウンタで構成した場合には、検知部分が光レースロジック回路の性能を律速する要因となる。

光レースロジックアレイをもって光伝搬信号の遅延時間に情報を付与できることは本研究の検証によって明らかになった。光レースロジックアレイの光速での計算能力を活かす検知部分の構成を考えることが必要である。

## 5.2 雑音の影響

光伝搬信号の特徴として、伝搬するに従って雑音が蓄積していくというものがある。本節では、光伝搬信号の強度や遅延時間に影響を与える雑音について考察していく。

### 5.2.1 光伝搬信号強度に影響を与える雑音

ここでは光伝搬信号強度に影響を与える雑音を考える。光スイッチの漏れ率 $\beta$ はスイッチがオフ動作の際に光伝搬信号を遮断しきれずに、どの程度出力へ漏れ出すかを表す漏れ率である。遮断しきれずに漏れ出した光伝搬信号は次のセルへと伝搬し光アンプにて増幅され、雑音信号のように振る舞う。具体例として、配列長 $N=2$ の光レースロジックアレイの出力を考える。光レースロジックアレイのスイッチ状態が図4.1(l)の状態を取る時、1つのセルの伝搬遅延時間を $1ns$ とすると、最初に光伝搬出力信号が検出されるのは入力から $4ns$ 後と想定される。図5.2に光レースロジックアレイに光伝搬信号を入力してからの様子を示す。赤く示した部分が光伝搬信号が伝搬している経路と到達する素子である。青く示した部分は光スイッチで漏れ出した信号が伝搬する経路である。光伝搬信号入力から $2ns$ 後と $3ns$ 後に光スイッチで漏れ出した光伝搬信号が受光器まで到達する。この光スイッチで漏れ出した光伝搬信号の強度が受光器の最小受光感度以上になると、本来想定された伝搬遅延時間以外のタイミングで出力信号を検出してしまう。

また、光スイッチにはスイッチがオン動作の際にスイッチから回路外へ光伝搬信号がどの程度漏れ出すかを表す漏れ率 $\alpha$ が存在する。この漏れ率 $\alpha$ は光スイッチの製造ばらつきや光スイッチの制御信号の揺らぎによってその値にばらつきが生じる。光結合器、光分配器、光遅延素子での損失に関しても、製造ばらつきなどによってその値にばらつきが生じる。4.2.3項で述べたように、光レースロジックアレイの機能を担保するためにはアレイからの出力の最小値が受光器によって検出可能な強度でなければならない。漏れや損失のばらつきによってアレイからの出力の最小値が揺らぎ、これを考慮して光レースロジックアレイの機能を担保するための光源・アンプの消費電力を設定しなければならないことが考えられる。

上記2つの光伝搬信号強度に関する雑音によって配列長 $N$ のスケーリングに影響を及ぼす可能性がある。

### 5.2.2 光伝搬信号の遅延時間に影響を与える雑音

ここでは光伝搬信号の遅延時間に影響を与える雑音を考える。光デバイスの伝搬遅延時間は製造ばらつきを主な要因とする誤差が存在する。提案した非同期型の光レースロジックアレイでは、光伝搬信号の遅延時間の誤差も伝搬するに従って蓄積されていく。これにより、



図 5.2: 光スイッチの漏れを考慮した光レースロジックアレイの挙動

とある配列の組み合わせにおいて想定される光伝搬信号の出力のタイミングと実際の出力のタイミングに差が生じることが考えられる。

この遅延時間の誤差は、スコア 1 の重みをどの程度の遅延時間と定めるかによってその影響が変化する。また、製造ばらつきを要因とする誤差はチューニングをすることによってある程度吸収が可能であると推察する。

遅延時間のばらつきが配列長  $N$  のスケーリングにどう影響を及ぼすのかを考えていく必要がある。

### 5.3 遅延時間以外の設計選択肢

第3章で触れた通り、光デバイスが取り扱える情報媒体は遅延時間だけではなく、位相、信号強度などが存在する。レースロジックは伝搬信号に遅延時間を重みとして付与して動的計画法によって求められる最適化問題を解くという考え方である。光デバイスを用いることで、その考えを発展させ、光伝搬信号の位相変化や強度変化を重みとして付与して動的計画法によって求められる最適化問題を解くものを考えることができる。今回はその中でも光伝搬信号の位相に着目して述べる。

設計選択肢として位相を選択する場合、光レースロジックアレイからの光出力信号の位相がとある情報を持つ計算結果となる。位相は $0 \sim 2\pi$ の間の値を取り、各パスでの重み付けは位相シフタなどを用いて位相をずらすことによって行う。光レースロジックアレイを伝搬した光出力信号の位相を位相計測器などを用いて計測する。配列アラインメントスコアの例を用いて述べると、スコアマトリクスに基づく位相変化を光伝搬信号に付与し、光出力信号の位相が配列が完全に一致する場合において推定される光出力信号の位相とどの程度差があるかが配列アラインメントスコアに相当する。

設計選択肢に位相を選択した場合、光出力信号への重み付けに用いるスコアに負の値を用いることができるという特徴がある。配列アラインメントに用いられるスコアマトリクスには負の値を含むものも存在する。しかし、遅延時間を重みに選択した場合にはこの負のスコアを付与することができない。負の値を含むスコアマトリクスを使用する場合には、スコアマトリクスの値全体に対してバイアスをかける事で負の値を正の値へと変換することが必要になる。位相を重み付けに選択した場合、負のスコアを付与することが可能になる。図5.3に位相を用いて負のスコアを付与する例を示す。 $-\frac{\pi}{4}$ の重み付けをする場合、位相を $\frac{7}{4}\pi$ ずらすことによってそれを表現できる。

位相を重み付けに選択した場合、光信号の位相計測器の分解能によって重み付けに用いる位相差の最小単位が決定される。よって、位相計測器の性能が配列長Nのスケーリングに影響を及ぼすことが考えられる。また、光レースロジックアレイからの光出力信号の位相が負の値の場合や $2\pi$ を超える場合にはそれを計測できない。更に、違う位相の光伝搬信号同士は干渉するので、光レースロジックアレイ内を伝搬中に干渉しないようにする、もしくは干渉することを踏まえた設計をしなければならない。実装を検討する際には、これらをどう取



図 5.3: 位相を用いて負のスコアを付与する例

り扱うかが問題となる。

## 第6章

### おわりに

ナノフォトニクスと呼ばれる新しい光素子技術と、このナノフォトニクスを用いて機能を実現したナノフォトニック・デバイスが光速度で演算を実現できる素子として注目されている。本研究ではレースロジックと光デバイスとの親和性に着目し、ナノフォトニック・デバイスを用いたアーキテクチャ検討の一環として光レースロジックアレイを提案した。また、市販されている光学シミュレータを用いて、雑音がない場合の光レースロジックアレイの動作検証を行った。更に、遅延時間・面積・消費電力についてのモデリングを行い、配列長  $N$  によってそれぞれの項目がどう変化するのかを示した。遅延時間は  $N$  に線形に従い、面積は  $N$  の 2 乗に従うことが分かった。消費電力に関しては、ケーススタディとして  $N=2$  の場合の値を示した。

光レースロジック回路の性能を律速する要因として遅延時間差を検知する部分の構造が重要になることを考察した。検知部分は重み付けに用いる遅延時間の最小単位を検知できなければいけない。ゲート長によって遅延時間が決定する光デバイスにおいてゲート長を  $1\mu m$  のサイズで加工するとき、重み付けに用いる遅延時間の最小単位は  $10fs$  になる。この遅延時間の最小単位を計測することができる検知部分の構成を考える必要がある。

また、光伝搬信号の強度や遅延時間に影響を与える雑音が光レースロジックアレイの規模を律速しうると考察した。雑音が光レースロジックアレイの規模を具体的にどう律速するのかを考えていかなければならない。

更に、出力信号の遅延時間に情報を付与するレースロジックの考え方を発展させ、光出力信

号の位相や強度に情報を付与できる可能性も見えてきた。光デバイス独自の設計選択肢が存在するのである。

ナノフォトニック・デバイスを用いた光レースロジック回路の実現に向けて、雑音の影響を具体的に示すことと設計選択肢ごとの検知部分の構成が今後の課題である。

## 謝辞

本研究の進行および本論文執筆にあたりまして、懇切丁寧なご指導を頂きました井上弘士教授に心より感謝申し上げます。本論文執筆にあたり、多大なご指導を頂きました小野貴継助教に心より感謝申し上げます。本研究を行うにあたり、多大なご指導を賜りました日本電信電話株式会社 物性科学基礎研究所 ナノフォトニクスセンタ 主幹研究員 新家昭彦様に感謝の意を表するとともに厚く御礼申し上げます。本論文執筆にあたり多大な指導頂きました、井上研究室大学院博士2年川上哲志氏に深く感謝致します。

最後に、井上研究室の皆様の御意見、御厚意に感謝の意を表します。

## 参考文献

- [1] Advait Madhavan, Timothy Sherwood, and Dmitri Strukov. Race logic: A hardware acceleration for dynamic programming algorithms. *ACM SIGARCH Computer Architecture News*, Vol. 42, No. 3, pp. 517–528, 2014.
- [2] Advait Madhavan, Timothy Sherwood, and Dmitri Strukov. Race logic: Abusing hardware race conditions to perform useful computation. *IEEE Micro*, Vol. 35, No. 3, pp. 48–57, 2015.
- [3] Advait Madhavan, Timothy Sherwood, and Dmitri Strukov. A 4-mm<sup>2</sup> 180-nm-cmos 15-giga-cell-updates-per-second dna sequence alignment engine based on asynchronous race conditions. In *Custom Integrated Circuits Conference (CICC), 2017 IEEE*, pp. 1–4. IEEE, 2017.
- [4] 川上哲志, 磯部聖, 浅井里奈, 小野貴継, 本田宏明, 井上弘士, 納富雅也. ナノフォトニック・ニューラルアクセラレーション構想. 情報処理学会研究報告（デザインガイア）, 第2016-ARC卷, 11 2016.
- [5] 磯部聖, 川上哲志, 小野貴継, 井上弘士, 納富雅也. 可飽和吸収体の利用を前提としたナノフォトニック・ニューラルアクセラレータ向け活性化関数の評価. 情報処理学会研究報告（デザインガイア）, 第2016-ARC卷, 11 2016.
- [6] 石原亨, 新家昭彦, 井上弘士, 野崎謙悟, 納富雅也. 光パスゲート論理に基づく並列加算回路の提案と光電混載回路シミュレータによる動作検証. Vol. 116, No. 94, pp. 109–114, 2016.

- [7] 浅井潔ほか. 配列情報と確立モデル（「分子生物情報学の新展開」）. 人工知能学会誌, Vol. 15, No. 1, pp. 35–42, 2000.
- [8] 後藤修. マルチプルアラインメントは生体高分子情報の交差点. 生物物理, Vol. 38, No. 2, pp. 52–56, 1998.
- [9] 浅井潔ほか. バイオインフォマティクス: 7. ポストゲノム時代の配列情報解析. 情報処理, Vol. 46, No. 3, pp. 271–276, 2005.
- [10] 須戸里織, 吉見真聰, 三木光範. バイオインフォマティクスゲノム配列から機能解析へバイオインフォマティクスゲノム配列から機能解析へ, 2005. 電子情報通信学会技術研究報告. CPSY, コンピュータシステム, Vol. 111, No. 328, pp. 35–40, 2011.
- [11] Saul B Needleman and Christian D Wunsch. A general method applicable to the search for similarities in the amino acid sequence of two proteins. *Journal of molecular biology*, Vol. 48, No. 3, pp. 443–453, 1970.
- [12] Temple F Smith and Michael S Waterman. Identification of common molecular subsequences. *Journal of molecular biology*, Vol. 147, No. 1, pp. 195–197, 1981.
- [13] 須戸里織, 吉見真聰, 三木光範. Gpu を用いた 3 次元 smith-waterman 法の高速化手法の提案. 電子情報通信学会技術研究報告. CPSY, コンピュータシステム, Vol. 111, No. 328, pp. 35–40, 2011.
- [14] 宗川裕馬, 伊野文彦, 萩原兼一ほか. 統合開発環境 cuda を用いた gpu での配列アライメントの高速化手法. 情報処理学会研究報告計算機アーキテクチャ (ARC), Vol. 2008, No. 19 (2008-ARC-177), pp. 13–18, 2008.
- [15] Edans Flavius de O Sandes and Alba Cristina MA de Melo. Smith-waterman alignment of huge sequences with gpu in linear space. In *Parallel & Distributed Processing Symposium (IPDPS), 2011 IEEE International*, pp. 1199–1211. IEEE, 2011.
- [16] Yu Liu, Yang Hong, Chun-Yuan Lin, and Che-Lun Hung. Accelerating smith-waterman alignment for protein database search using frequency distance filtration scheme based on cpu-gpu collaborative system. *International journal of genomics*, Vol. 2015, , 2015.

- [17] 伊野文彦, 小谷裕基, 萩原兼一ほか. Gpu グリッドによる高速な塩基配列アライメント. 情報処理学会研究報告ハイパフォーマンスコンピューティング (HPC), Vol. 2007, No. 80 (2007-HPC-111), pp. 73–78, 2007.
- [18] 大津元一, 小林潔. ナノフォトニクスの基礎. オーム社, 2006.
- [19] 三木哲也, 須藤昭一. 光通信技術ハンドブック. (株)オプトロニクス社, 2002.
- [20] Optisystem overview. <https://optiwave.com/optisystem-overview/>.