Convex-Hull Trick - sataniC++

概要

直線集合 $L=\{f_i(x)=a_ix+b_i\}$ に対して、「 $L$ への直線 $f_k(x)=a_kx+b_k$ の追加」(以下、追加クエリ)と、「ある $x$ に対し、 $L$ の中で最小値(あるいは最大値)を取るような直線の値を求める」(以下、最小値クエリ)という2つのクエリを効率的に行うことが出来ます。

使える状況

DPの漸化式を整理したときなどにおいて、 $\displaystyle min_{1\leq i\leq n}(a_ix+b_i)$ といった式が出てきたときに、Convex-Hull Trickを用いることで効率的に値を求めることが出来ます。

説明

ここでは最小値を求めるときのみを説明します(最大値を求めるときは上⇔下、増加⇔減少など、文章を補って読んでください)。

クエリ

まず、それぞれのクエリを見ていきます。

直線集合 $L$ に直線 $f_k(x)=a_kx+b_k$ を追加する

f:id:satanic0258:20160815045239p:plain
上図は、始め直線集合 $L$ が $L=\{y=2x+2, y=x+3, y=-x+10\}$ であった状態(左)から、そこに新たな直線 $y=-2x+15$ を追加した状態(右)へと遷移している様子を表しています。
(なお、グラフの描画にはGrapesというソフトを用いています。*1 )

ある $x$ に対し、 $L$ の中で最小値(あるいは最大値)を取るような直線の値を求める

上図左において、 $x=0$ のとき、 $3$ 本の直線の中で最も小さい値を取るものは $y=2x+2$ であり、その時の値は $2$ となります。
同様に $x=2$ では $5$ 、 $x=6$ では $4$ ということも分かります。

その後、赤色の直線を追加すると、 $x=0$ や $x=2$ のところでは変わらず $2, 5$ となっていますが、 $x=6$ のところでは $3$ と、直線を追加する前とは値が異なっていることが分かります。

このクエリを愚直に実装しようとすると、直線の本数を $N$ 本、最小値クエリの回数を $Q$ 回としたとき、最小値クエリを求める度に各直線における値を調べる必要があるので、計算量は $O(NQ)$ となります。

しかし、より速くクエリをこなす方法があるため、それについて考えていきます。

性質

もう一度先ほどの図をよく見てみると、2つの性質が隠れていることが分かります。

1.最小値を取る直線は左から順に傾きが減少している

f:id:satanic0258:20160815052207p:plain

ちなみにこのことを簡単に証明すると、上図の状態で傾き $2$ の直線の区間と傾き $1$ の直線の区間の間に傾き $0$ の直線の区間があるようなときに反例となりますが、

直線 $y=3$ を追加したとき、傾きは $2\to 0\to -2$ と遷移する
直線 $y=5$ を追加したとき、傾きは $2\to 1\to 0\to -2$ と遷移する

となります。よって、最小値を取る直線は左から順に傾きが減少している事がわかりました。

2.不必要な直線が無いとき、ある $x$ での直線の取る値は、その値を直線の傾き順に並べると下に凸となる

文章にすると少しわかりにくいですが、図にすると次のような感じです。
f:id:satanic0258:20160815163318p:plain
今、 $x=3$ のときについて考えています。このとき、直線の傾きを横軸、 $x=3$ のときの直線の取る値を縦軸とすると、次のようになります。
f:id:satanic0258:20160815163328p:plain

この性質についても簡単に証明すると、次の図左のような、直線集合 $\{y=-2x+3, y=-x+1, y=x+2, y=2x\}$ を考えたとき、 $x=0$ において直線の取る値をそのまま図にすると、図右のようになります。
f:id:satanic0258:20160815171620p:plain
しかし、図左に緑色で示した直線 $y=x+2$ は、 $x$ をどのようにとっても直線集合の中で最小値を取ることがありません。したがって、この緑色の直線を直線集合から取り除くことによって、図右の青色の折れ線のように下に凸となります。故に、不必要な直線を取り除いてしまえば、直線の取る値は傾き順に並べると下に凸となります。

これらの性質から、直線集合を、傾きをキーとしてソートしておくことにより、最小値クエリに二分探索を用いることが出来るため、 $N$ 本の直線に対する $Q$ 回の最小値クエリの計算量は $O(Q\log N)$ となります。

また、直線の追加クエリは、ソート済みの直線集合に追加する、ということから、先ほどと同様に直線の挿入位置を調べるのに二分探索を用いることが出来るため、全体の直線の数を $N$ 本とすると、全ての追加クエリの計算量は $O(N\log N)$ となります。

不必要な直線を取り除く

他に、先ほどの性質を満たすためには「不必要な直線を取り除く」という動作も適宜行う必要があります。

それでは、どのようなとき、どうなっていれば「不必要」と判断することが出来るのか、それについて考えていきます。

まず、前提として直線集合がすでに不必要な直線を全て取り除いてあると仮定します。
このように仮定してしまえば、次に直線が不必要になるときは、直線を追加する際であると分かります。
よって、「直線の追加クエリ」を行うときに、「追加する事によって不必要になる直線を調べる」ようにすれば良いことが分かりました。

次に、どのような直線が不必要かについてですが、ここで次の図を考えます。
f:id:satanic0258:20160815190352p:plain
これは不必要な直線が無い状況です。なお、直線 $l_i:y = a_ix+b_i$ とすると傾き $a_i$ は $a_1\geq a_2\geq a_3$ となっています。

このとき、直線 $l_1$ と直線 $l_2$ の交点を赤の点、直線 $l_2$ と直線 $l_3$ の交点を青の点、直線 $l_3$ と直線 $l_1$ の交点を緑の点とすると、これらの交点の $x$ 座標は、
赤の点 $\leq$ 緑の点 $\leq$ 青の点
となっていることが分かります。

一方、次の図を考えます。
f:id:satanic0258:20160815191214p:plain
これは不必要な直線がある状況です。直線の設定は先ほどと変わりません。

このとき、交点の $x$ 座標は、
青の点 $\leq$ 緑の点 $\leq$ 赤の点
となっていることが分かります。

このように、不必要な直線があるときとないときで、相異なる $2$ 直線の交点の位置関係が変わっています。

よって、 $3$ 直線のうち相異なる $2$ 点を選んで、それらの $x$ 座標を比較することにより不必要かどうかを判断できることが分かりました。

ここでは、赤の点と青の点を選んで考えます(どの $2$ 点を選んでも判断はできますが、蟻本*2と同じ選び方としておきます)。

まず、赤の点の $x$ 座標を求めます。
赤の点は直線 $y=a_1x+b_1$ と直線 $y=a_2x+b_2$ の交点なので、次の連立方程式を解けば求めることが出来ます。

$\displaystyle \begin{cases}y=a_1x+b_1\\ y=a_2x+b_2 \end{cases}$

これを解くと(簡単のために $x$ についてのみ)、

$\displaystyle \begin{eqnarray} a_1x+b_1 &=& a_2x+b_2 \\ (a_1-a_2)x &=& b_2-b_1 \\ x &=& \cfrac{b_2-b_1}{a_1-a_2} \end{eqnarray}$

よって、赤の点の $x$ 座標は $x = \cfrac{b_2-b_1}{a_1-a_2}$ であることが分かりました。

同様に、青の点の $x$ 座標を求めます。
青の点は直線 $y=a_2x+b_2$ と直線 $y=a_3x+b_3$ の交点なので、次の連立方程式を解けば求めることが出来ます。

$\displaystyle \begin{cases}y=a_2x+b_2\\ y=a_3x+b_3 \end{cases}$

これを解くと(簡単のために $x$ についてのみ)、

$\displaystyle \begin{eqnarray} a_2x+b_2 &=& a_3x+b_3 \\ (a_2-a_3)x &=& b_3-b_2 \\ x &=& \cfrac{b_3-b_2}{a_2-a_3} \end{eqnarray}$

よって、青の点の $x$ 座標は $x = \cfrac{b_3-b_2}{a_2-a_3}$ であることが分かりました。

あとはこれらの大小関係について調べればよいことになります。ここでは、「不必要であるかどうか」という不等式を作ります。
そのためには、先ほどの議論により、
青の点の $x$ 座標 $\leq$ 赤の点の $x$ 座標
とすれば良いです。

今、 $a_1\geq a_2\geq a_3$ であることから、 $a_1-a_2\geq 0$ 及び $a_2-a_3\geq 0$ であるので、

$\displaystyle \begin{eqnarray} \cfrac{b_3-b_2}{a_2-a_3} &\leq & \cfrac{b_2-b_1}{a_1-a_2} \\ (b_3-b_2)(a_1-a_2) &\leq & (b_2-b_1)(a_2-a_3) \\ (b_3-b_2)(a_2-a_1) &\geq & (b_2-b_1)(a_3-a_2) \end{eqnarray}$

よって、この式を満たしているとき、直線 $l_2:y=a_2x+b_2$ が不必要であることが分かりました。

以上をまとめると $2$ つのクエリは、

直線の追加するクエリ $\cdots$ 直線を追加する位置を二分探索で求める。その際、追加によって不必要となる直線は取り除く。
最小値を求めるクエリ $\cdots$ 最小値を取る直線を二分探索で求める。

とすることで、直線 $N$ 本、最小値クエリ $Q$ 回とすると、全体の計算量は $O((N+Q)\log N)$ となることが分かりました。

特殊な状況における更なる高速化

上記では、どのようなクエリ群であっても最小値を求められるものを説明しました。

ここでは、そのクエリ群がある条件を満たしているようなときに、より高速化が可能であるため、それについて解説していきます。

追加クエリにおける直線の傾きが単調であるとき

「追加クエリにおける直線の傾きが単調」とは、始め直線集合が空である状態から、直線 $l_i:y=a_ix+b_i$ を、 $i=1,2,3,\cdots$ と追加していくときに、その傾き $a_i$ が $a_1\geq a_2\geq a_3\geq \cdots$ (あるいは $a_1\leq a_2\leq a_3\leq \cdots$ )であることを指します。

このとき、先ほど述べたように直線の挿入位置を二分探索で調べる必要はなく、常に先頭、あるいは末尾に追加していくことになるため、直線の本数 $N$ 本とすると、追加クエリの計算量は $O(N)$ となります。

最小値クエリにおける $x$ が単調であるとき

「最小値クエリにおける $x$ が単調」とは、最小値クエリにおいて与えられる $x_i$ が $x_1\geq x_2\geq x_3\geq \cdots$ (あるいは $x_1\leq x_2\leq x_3\leq \cdots$ )であることを指します。

このとき、最小値クエリにおける $x$ を進めると、直線集合の先頭の直線が最小値を取らなくなるときがあります。すると、 $x$ は後戻りしないため、もうこの直線は使わないことが分かります。よって、直線集合の先頭からも直線を取り除くようにすることで、最小値クエリを行うときは常に直線集合の先頭の直線が最小値を取ることになるため、最小値クエリ $1$ 回にかかる計算量は $O(1)$ となります。
f:id:satanic0258:20160815211119p:plain
(図における色付きの直線は最小値を取らなくなったもの)

上記 $2$ パターンを両方満たしているとき

つまり、「追加クエリにおける直線の傾きも単調」であり「最小値クエリにおける $x$ も単調」であるようなときを指します。

このときは、直線の本数 $N$ 本、最小値クエリの回数を $Q$ 回とすると、その計算量は $O(N+Q)$ となるため、条件が無い時に比べて $\log N$ 分速くクエリをこなすことが出来ます。

コード(C++)

※注：このコードは追加クエリが単調であると仮定したものです。
~~(力不足で一般的な状況のものが出来ていません…。書きかけのものを一応ここに残しておきます)~~
[2018-02-27 追記] 一般的なクエリに対応したものをココに書きましたが，若干遅そうなのでまだα版です

#include <algorithm>
#include <functional>
#include <utility>
#include <vector>

template<typename T>
class ConvecHullTrick {
private:
	// 直線群(配列)
	std::vector<std::pair<T, T>> lines;
	// 最小値(最大値)を求めるxが単調であるか
	bool isMonotonicX;
	// 最小/最大を判断する関数
	std::function<bool(T l, T r)> comp;

public:
	// コンストラクタ ( クエリが単調であった場合はflag = trueとする )
	ConvecHullTrick(bool flagX = false, std::function<bool(T l, T r)> compFunc = [](T l, T r) {return l >= r; })
		:isMonotonicX(flagX), comp(compFunc)  {
		lines.emplace_back(0, 0);
	};

	// 直線l1, l2, l3のうちl2が不必要であるかどうか
	bool check(std::pair<T, T> l1, std::pair<T, T> l2, std::pair<T, T> l3) {
		if (l1 < l3) std::swap(l1, l3);
		return (l3.second - l2.second) * (l2.first - l1.first) >= (l2.second - l1.second) * (l3.first - l2.first);
	}

	// 直線y=ax+bを追加する
	void add(T a, T b) {
		std::pair<T, T> line(a, b);
		while (lines.size() >= 2 && check(*(lines.end() - 2), lines.back(), line))
			lines.pop_back();
		lines.emplace_back(line);
	}

	// i番目の直線f_i(x)に対するxの時の値を返す
	T f(int i, T x) {
		return lines[i].first * x + lines[i].second;
	}

	// i番目の直線f_i(x)に対するxの時の値を返す
	T f(std::pair<T, T> line, T x) {
		return line.first * x + line.second;
	}

	// 直線群の中でxの時に最小(最大)となる値を返す
	T get(T x) {
		// 最小値(最大値)クエリにおけるxが単調
		if (isMonotonicX) {
			static int head = 0;
			while (lines.size() - head >= 2 && comp(f(head, x), f(head + 1, x)))
				++head;
			return f(head, x);
		}
		else {
			int low = -1, high = lines.size() - 1;
			while (high - low > 1) {
				int mid = (high + low) / 2;
				(comp(f(mid, x), f(mid + 1, x)) ? low : high) = mid;
			}
			return f(high, x);
		}
	}
};

コードの説明

ほぼ先ほどの議論をそのままコードに書いています。
なお、関数はそれぞれ、

${\tt check}$ 関数 $\cdots$ 直線の不必要性を判断する
${\tt add}$ 関数 $\cdots$ 直線集合に直線を追加する
${\tt f}$ 関数 $\cdots$ 直線 $l_i$ に対する $f_i(x)$ を返す
${\tt get}$ 関数 $\cdots$ 直線集合内で $x$ のときの最小値を返す

となっています。

また、使うときには

ConvexHullTrick<int> cht(true);

といった感じで宣言します。
このとき、第一引数を ${\tt true}$ か ${\tt false}$ にすることでそれぞれ最小値(最大値)クエリが単調であるか否かを指定することが出来ます(省略可)。
また、第二引数に、

ConvexHullTrick<int> cht(true, std::less<int>());

としたり、

ConvexHullTrick<int> cht(true, [](T l, T r) {return l <= r; });

とすることで最大値クエリをこなすことが出来ます。

具体例

実際に直線を追加していって、その後の最小値クエリの違いを見ていきます。

ソースコード

※ヘッダ、 ${\tt ConvexHullTrick}$ クラスは省略

int main() {
	ConvecHullTrick<int> cht(false);
	cht.add(2, 0);
	std::cout << "Add y=2x" << std::endl;
	std::cout << "min(f(-2)) = " << cht.get(-2) << std::endl;
	std::cout << "min(f(2)) = " << cht.get(2) << std::endl << std::endl;

	cht.add(0, -1);
	std::cout << "Add y=-1" << std::endl;
	std::cout << "min(f(-2)) = " << cht.get(-2) << std::endl;
	std::cout << "min(f(2)) = " << cht.get(2) << std::endl << std::endl;

	cht.add(1, 1);
	std::cout << "Add y=x+1" << std::endl;
	std::cout << "min(f(-2)) = " << cht.get(-2) << std::endl;
	std::cout << "min(f(2)) = " << cht.get(2) << std::endl << std::endl;

	cht.add(-1, 0);
	std::cout << "Add y=-x" << std::endl;
	std::cout << "min(f(-2)) = " << cht.get(-2) << std::endl;
	std::cout << "min(f(2)) = " << cht.get(2) << std::endl << std::endl;
	return 0;
}

出力

Add y=2x
min(f(-2)) = -4
min(f(2)) = 4

Add y=-1
min(f(-2)) = -4
min(f(2)) = -1

Add y=x+1
min(f(-2)) = -4
min(f(2)) = -1

Add y=-x
min(f(-2)) = -4
min(f(2)) = -2

上記例で行ったクエリを図にしてみると、次のようになっています。
f:id:satanic0258:20160816170731p:plain
これで、確かに正しく出力出来ていることが分かりました。