performanceTest

Scalaでの実行速度のテスト（sbt-jmhを利用してもよかった）

実行方法

「BenchMark」に計測を行いたい対象のメソッドを追加し、下記コマンドを実行。（内部のコレクションサイズなどのパラメータは自身で試してください）

sbt run

計測結果　

■ コレクション関連

▼ ソート

対象A	対象B	総評
scala.collection.sort	scala.util.sorting	scala.util.sorting の方が早い

ただし、Sortingはプリミティブ型に対してのみ有効で、独自型に対して用いても特に高速ではない。1Kで、約1.3倍。10Kで、約1.9倍。

▼ map処理後でのコレクションへの変換

対象A	対象B	総評
toXXX (XXX は、コレクション名)	breakOutの利用	breakOutを利用した方が早い。

mapでなくてもCanBuildFromを使っている関数であれば、breakOutを利用した方が早い。

implicit取る方を強制的に呼ぶためにbreakout渡してる + 好きな型にmapしつつ変換することで、コレクションを2回生成させる手間を1回に省くことが可能

def map[B, That](f: Int => B)(implicit bf: scala.collection.generic.CanBuildFrom[Seq[Int],B,That]): That

▼ Seq と Set のmap処理

mapの処理では、「%2」、「%1000」を行う

対象A	対象B	総評
seq map	set map	値が大きい場合や、map後の処理が思いほど、seq の方が早い場合が多い

10Kの「%2」は、seq より set の方が早かった。（約1.4倍） 10Kの「%1000」は、 seq より set の方が遅かった。（約2倍）一般的には、seqの方がよいと言われている。

▼ Seq の生成

対象A	対象B	対象C	総評
Seq apply	List apply	::Nil	::Nil での生成がものすごく早い

「:Nil」は、ただNewしているだけなので、ものすごく早い。

1 :: Nil == new ::(1, Nil)

対して、'Seq()', 'List()'は、'ListBuffer'を利用している。

val b = newBuilder[A] // mutable.ListBuffer
b ++ elems
b.result()

▼ コレクションの一部利用

stream : 要素を遅延評価され、呼び出された要素のみが計算される。他の点は、Listと同じ (要素の生成を後回しにして、無限の要素があるかのように振るまわせるイメージ)

対象A	対象B	総評
stream	list	一部のみ利用する場合は、streamの方が早い

▼ for と foldLeft の比較

対象A	対象B	総評
for	foldLeft	'for'の方がはやい

Scala foldLeft performance 4x worse than for loop when working with floats

▼ コレクションの初期値宣言

対象A	対象B	総評
Seq()	Seq.empty	'Seq.empty'の方がはやい

immutableなコレクションクラスは、シングルトンの空実装を提供。すべてのファクトリメソッドが作成されたコレクションの長さをチェックするわけではない。したがって、コンパイル時にコレクションの空白が明白になるようにすることで、ヒープスペース（空のコレクションインスタンスを再利用する）またはCPUサイクル（それ以外の場合は実行時の長さチェックに費やされる）を節約できる。

約70倍程度の差。

▼ Arrayでの要素数の算出

対象A	対象B	総評
length	size	'length'の方がはやい

Array.sizeの呼び出しは、暗黙の変換によって実装されているため、メソッドの呼び出しで中間ラップオブジェクトが作成される。JVMでのエスケープ解析を有効にしない限りは、コードのパフォーマンスを低下させる。

Num 10Kの際には、200倍の性能差。

▼ 空チェックの否定

対象A	対象B	総評
!seq.isEmpty	seq.nonEmpty	'seq.nonEmpty'の方がはやい

Set, Option, Map, Iteratorも同様。約1.2倍。

▼ 要素の長さ比較

lengthCompareメソッドは、コレクションの長さと引数のInt値を比べて大小関係を表すInt値を返却。正: 1, 同じ: 0, 負: -n(nは、差分)

対象A	対象B	総評
seq lengthCompare	seq length	lengthの方が早い
stream lengthCompare	stream length	lengthCompareの方が早い

値が小さい場合は、lengthを利用した方が早い。 seqで、num=10000の場合、約180倍の差。

無限のストリームを扱う場合は、lengthなんかはしないと思うが、lengthCompareで扱うこと。 streamの1000000Lの場合で、約7倍の性能差。

▼ 要素の存在チェック

対象A	対象B	総評
seq exists	seq nonEmpty	nonEmptyの方が早い

約50 ~ 100倍の差。existsのコードは冗長。 Set, Option, Map, Iteratorも同様。

  def exists(p: A => Boolean): Boolean = {
    var res = false
    while (!res && hasNext) res = p(next())
    res
  }

existsは、中でwhileのループを回そうとするので冗長。

▼ 要素の中身チェック

seqなどでの比較

対象A	対象B	総評
==	sameElements	'=='の方が早い

attayやIteratorなどは、'=='では値の比較ができない。

1 ~ 10000の Seq の比較であれば、'=='の方が約200倍早い。

▼ 末尾追加

対象A	対象B	総評
可変なVector	不変なArrayBuffer	不変なArrayBufferの方が早い

'var Vector'は、新しいインスタンスに既存の要素をコピーしてから、新しい要素を追加する。
'val ArrayBuffer'は、インスタンスのリサイズを行ってから末尾の要素を新要素で更新する。

▼ 先頭挿入

対象A	対象B	総評
可変なList	不変なListBuffer	可変なListの方が早い

'var List'は、先頭とその他の要素を別で管理しているため、新しい要素をすぐ作ることが可能。
'val ListBuffer'は、vaList内部変数内部変数の再代入を行う

▼ 要素削除

対象A	対象B	総評
可変なList	不変なListBuffer	不変なListBufferの方が早い

n=10Kの場合、約15倍差がでた。 ListのdropRightは、要素を削除するのに、O(n)かかるが、Buffer系のremoveは、定数時間かかる(Buffer系以外は、遅い。) また、dropRightとtakeは同様の処理ができ、takeの方が少しばかり早い。

▼ ランダム読み込み

対象A	対象B	総評
Vector	ListBuffer	Vectorの方が早い

Arrayのランダム読み込みは、定数
ArrayBuffer,Vectorは、内部でArrayを利用している

▼ フィボナッチ数の作成

対象A	対象B	総評
Stream	Array	Streamの方が早い

Streamが遅延評価のため。数列が具象化される時は、それなりに時間がかかる。

■ 便利機能

▼ Random値の生成

対象A	対象B	総評
scala.util.Random	concurrent.forkjoin.ThreadLocalRandom	ThreadLocalRandomの方が早い。

scala.concurrent.forkjoin.ThreadLocalRandomのエイリアスとして、java.util.concurrent.ThreadLocalRandomが存在する。 1Kで、約2倍、10Kで、約15倍程度。測定が安定しない場合もありその際は、約1.5倍て程度

▼ 正規表現

対象A	対象B	総評
findAllIn & 肯定的後読み（?<=）	findPrefixOf & 量指定子(+)	'findAllIn & 肯定的後読み（?<=）'の方が早い

findAllInは、対象文字列中でマッチした部分を全て返却 findPrefixOfは、対象文字列の先頭が正規表現にマッチした場合のみマッチ部分を返却

■ 言語機能

▼ 条件によって、引数を扱うメソッド

名前渡し(call by name)

名前渡しされた引数は、使用される直前で評価される。ただし、Scalaの名前渡しは遅延評価ではない。

遅延評価の定義は、一旦計算された値はキャッシュをすることが可能であり、遅延プロミスは最大で一度しか計算されないようにすることができる

対象A	対象B	総評
名前渡し	値渡し	名前渡しの方が、引数を使わない場合は処理が早い

一般的に、call by nameは、loggerなどに使うのが便利。

<名前渡しについて>

名前渡しは遅延評価を目的として使うのではなくて、「() =>」の冗長な記述をなくすために用いる
値は再計算されるので、何度も実行したくない場合は一時変数に置くなどする
名前渡しは無名クラス経由で実行されるので値渡しよりは効率が悪い
名前渡しは無名クラスを作るので値渡しよりもスタックヒープを食う
Scalaの名前渡しは、"call by need"ではなく、"cal by name"である

▼ 値クラスのインスタンス化

値クラスは、AnyValを継承し、ただ一つのValを持つもの

対象A	対象B	総評
値クラスのインスタンス化	(AnyValを継承しない)通常クラス	値クラスを継承した方が早い

値クラスは、 DDD や 'implicit class' などで使いどころが多い。

▼ Future と for式

Futureが複数あり、for式で展開していく場合

対象A	対象B	総評
for式の中に、Futureを定義し、for式で使用	for式の外に、Futureを定義し、for式で使用	for式の外にFutureを出している方が早い

for式は上から順に処理されていくため、Futureを複数for式で利用している場合は見直しが必要。（同期処理になるため）

▼ 構造的部分型の性能

対象A	対象B	総評
構造的部分型の使用	引数オブジェクトの利用	構造的部分型を使用しない方が早い

構造的部分型を使うと、インタフェースであるtraitやclassを用意しなくても、メソッドを利用可能になるがリフレクションが発生するため呼び出しにかかるコストが増加する

参考

Scala performance tips - ScalaMatsuri2017
Scalaの名前渡しは遅延評価ではない
コレクションの性能特性
あなたのScalaを爆速にする７つの方法 - ScalaMatsuri2016
Scalaにおける細かい最適化のプラクティス
Scalaの構造的部分型の性能に注意
Scala Collections Tips and Tricks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

performanceTest

実行方法

計測結果

■ コレクション関連

▼ ソート

▼ map処理後でのコレクションへの変換

▼ Seq と Set のmap処理

▼ Seq の生成

▼ コレクションの一部利用

▼ for と foldLeft の比較

▼ コレクションの初期値宣言

▼ Arrayでの要素数の算出

▼ 空チェックの否定

▼ 要素の長さ比較

▼ 要素の存在チェック

▼ 要素の中身チェック

▼ 末尾追加

▼ 先頭挿入

▼ 要素削除

▼ ランダム読み込み

▼ フィボナッチ数の作成

■ 便利機能

▼ Random値の生成

▼ 正規表現

■ 言語機能

▼ 条件によって、引数を扱うメソッド

▼ 値クラスのインスタンス化

▼ Future と for式

▼ 構造的部分型の性能

参考

Files

README.md

Latest commit

History

README.md

File metadata and controls

performanceTest

実行方法

計測結果

■ コレクション関連

▼ ソート

▼ map処理後でのコレクションへの変換

▼ Seq と Set のmap処理

▼ Seq の生成

▼ コレクションの一部利用

▼ for と foldLeft の比較

▼ コレクションの初期値宣言

▼ Arrayでの要素数の算出

▼ 空チェックの否定

▼ 要素の長さ比較

▼ 要素の存在チェック

▼ 要素の中身チェック

▼ 末尾追加

▼ 先頭挿入

▼ 要素削除

▼ ランダム読み込み

▼ フィボナッチ数の作成

■ 便利機能

▼ Random値の生成

▼ 正規表現

■ 言語機能

▼ 条件によって、引数を扱うメソッド

▼ 値クラスのインスタンス化

▼ Future と for式

▼ 構造的部分型の性能

参考

計測結果