Convex-Hull Trick
概要
直線集合に対して、「への直線の追加」(以下、追加クエリ)と、「あるに対し、の中で最小値(あるいは最大値)を取るような直線の値を求める」(以下、最小値クエリ)という2つのクエリを効率的に行うことが出来ます。
使える状況
DPの漸化式を整理したときなどにおいて、といった式が出てきたときに、Convex-Hull Trickを用いることで効率的に値を求めることが出来ます。
説明
ここでは最小値を求めるときのみを説明します(最大値を求めるときは上⇔下、増加⇔減少など、文章を補って読んでください)。
クエリ
まず、それぞれのクエリを見ていきます。
直線集合に直線を追加する
上図は、始め直線集合がであった状態(左)から、そこに新たな直線を追加した状態(右)へと遷移している様子を表しています。
(なお、グラフの描画にはGrapesというソフトを用いています。*1 )
あるに対し、の中で最小値(あるいは最大値)を取るような直線の値を求める
上図左において、のとき、本の直線の中で最も小さい値を取るものはであり、その時の値はとなります。
同様にでは、ではということも分かります。
その後、赤色の直線を追加すると、やのところでは変わらずとなっていますが、のところではと、直線を追加する前とは値が異なっていることが分かります。
このクエリを愚直に実装しようとすると、直線の本数を本、最小値クエリの回数を回としたとき、最小値クエリを求める度に各直線における値を調べる必要があるので、計算量はとなります。
しかし、より速くクエリをこなす方法があるため、それについて考えていきます。
性質
もう一度先ほどの図をよく見てみると、2つの性質が隠れていることが分かります。
1.最小値を取る直線は左から順に傾きが減少している
ちなみにこのことを簡単に証明すると、上図の状態で傾きの直線の区間と傾きの直線の区間の間に傾きの直線の区間があるようなときに反例となりますが、
- 直線を追加したとき、傾きはと遷移する
- 直線を追加したとき、傾きはと遷移する
となります。よって、最小値を取る直線は左から順に傾きが減少している事がわかりました。
2.不必要な直線が無いとき、あるでの直線の取る値は、その値を直線の傾き順に並べると下に凸となる
文章にすると少しわかりにくいですが、図にすると次のような感じです。
今、のときについて考えています。このとき、直線の傾きを横軸、のときの直線の取る値を縦軸とすると、次のようになります。
この性質についても簡単に証明すると、次の図左のような、直線集合を考えたとき、において直線の取る値をそのまま図にすると、図右のようになります。
しかし、図左に緑色で示した直線は、をどのようにとっても直線集合の中で最小値を取ることがありません。したがって、この緑色の直線を直線集合から取り除くことによって、図右の青色の折れ線のように下に凸となります。故に、不必要な直線を取り除いてしまえば、直線の取る値は傾き順に並べると下に凸となります。
これらの性質から、直線集合を、傾きをキーとしてソートしておくことにより、最小値クエリに二分探索を用いることが出来るため、本の直線に対する回の最小値クエリの計算量はとなります。
また、直線の追加クエリは、ソート済みの直線集合に追加する、ということから、先ほどと同様に直線の挿入位置を調べるのに二分探索を用いることが出来るため、全体の直線の数を本とすると、全ての追加クエリの計算量はとなります。
不必要な直線を取り除く
他に、先ほどの性質を満たすためには「不必要な直線を取り除く」という動作も適宜行う必要があります。
それでは、どのようなとき、どうなっていれば「不必要」と判断することが出来るのか、それについて考えていきます。
まず、前提として直線集合がすでに不必要な直線を全て取り除いてあると仮定します。
このように仮定してしまえば、次に直線が不必要になるときは、直線を追加する際であると分かります。
よって、「直線の追加クエリ」を行うときに、「追加する事によって不必要になる直線を調べる」ようにすれば良いことが分かりました。
次に、どのような直線が不必要かについてですが、ここで次の図を考えます。
これは不必要な直線が無い状況です。なお、直線とすると傾きはとなっています。
このとき、直線と直線の交点を赤の点、直線と直線の交点を青の点、直線と直線の交点を緑の点とすると、これらの交点の座標は、
赤の点緑の点青の点
となっていることが分かります。
一方、次の図を考えます。
これは不必要な直線がある状況です。直線の設定は先ほどと変わりません。
このとき、交点の座標は、
青の点緑の点赤の点
となっていることが分かります。
このように、不必要な直線があるときとないときで、相異なる直線の交点の位置関係が変わっています。
よって、直線のうち相異なる点を選んで、それらの座標を比較することにより不必要かどうかを判断できることが分かりました。
ここでは、赤の点と青の点を選んで考えます(どの点を選んでも判断はできますが、蟻本*2と同じ選び方としておきます)。
まず、赤の点の座標を求めます。
赤の点は直線と直線の交点なので、次の連立方程式を解けば求めることが出来ます。
これを解くと(簡単のためにについてのみ)、
よって、赤の点の座標はであることが分かりました。
同様に、青の点の座標を求めます。
青の点は直線と直線の交点なので、次の連立方程式を解けば求めることが出来ます。
これを解くと(簡単のためにについてのみ)、
よって、青の点の座標はであることが分かりました。
あとはこれらの大小関係について調べればよいことになります。ここでは、「不必要であるかどうか」という不等式を作ります。
そのためには、先ほどの議論により、
青の点の座標赤の点の座標
とすれば良いです。
今、であることから、及びであるので、
よって、この式を満たしているとき、直線が不必要であることが分かりました。
以上をまとめるとつのクエリは、
- 直線の追加するクエリ直線を追加する位置を二分探索で求める。その際、追加によって不必要となる直線は取り除く。
- 最小値を求めるクエリ最小値を取る直線を二分探索で求める。
とすることで、直線本、最小値クエリ回とすると、全体の計算量はとなることが分かりました。
特殊な状況における更なる高速化
上記では、どのようなクエリ群であっても最小値を求められるものを説明しました。
ここでは、そのクエリ群がある条件を満たしているようなときに、より高速化が可能であるため、それについて解説していきます。
追加クエリにおける直線の傾きが単調であるとき
「追加クエリにおける直線の傾きが単調」とは、始め直線集合が空である状態から、直線を、と追加していくときに、その傾きが(あるいは)であることを指します。
このとき、先ほど述べたように直線の挿入位置を二分探索で調べる必要はなく、常に先頭、あるいは末尾に追加していくことになるため、直線の本数本とすると、追加クエリの計算量はとなります。
最小値クエリにおけるが単調であるとき
「最小値クエリにおけるが単調」とは、最小値クエリにおいて与えられるが(あるいは)であることを指します。
このとき、最小値クエリにおけるを進めると、直線集合の先頭の直線が最小値を取らなくなるときがあります。すると、は後戻りしないため、もうこの直線は使わないことが分かります。よって、直線集合の先頭からも直線を取り除くようにすることで、最小値クエリを行うときは常に直線集合の先頭の直線が最小値を取ることになるため、最小値クエリ回にかかる計算量はとなります。
(図における色付きの直線は最小値を取らなくなったもの)
上記パターンを両方満たしているとき
つまり、「追加クエリにおける直線の傾きも単調」であり「最小値クエリにおけるも単調」であるようなときを指します。
このときは、直線の本数本、最小値クエリの回数を回とすると、その計算量はとなるため、条件が無い時に比べて分速くクエリをこなすことが出来ます。
コード(C++)
※注:このコードは追加クエリが単調であると仮定したものです。
(力不足で一般的な状況のものが出来ていません…。書きかけのものを一応ここに残しておきます)
[2018-02-27 追記] 一般的なクエリに対応したものをココに書きましたが,若干遅そうなのでまだα版です
#include <algorithm> #include <functional> #include <utility> #include <vector> template<typename T> class ConvecHullTrick { private: // 直線群(配列) std::vector<std::pair<T, T>> lines; // 最小値(最大値)を求めるxが単調であるか bool isMonotonicX; // 最小/最大を判断する関数 std::function<bool(T l, T r)> comp; public: // コンストラクタ ( クエリが単調であった場合はflag = trueとする ) ConvecHullTrick(bool flagX = false, std::function<bool(T l, T r)> compFunc = [](T l, T r) {return l >= r; }) :isMonotonicX(flagX), comp(compFunc) { lines.emplace_back(0, 0); }; // 直線l1, l2, l3のうちl2が不必要であるかどうか bool check(std::pair<T, T> l1, std::pair<T, T> l2, std::pair<T, T> l3) { if (l1 < l3) std::swap(l1, l3); return (l3.second - l2.second) * (l2.first - l1.first) >= (l2.second - l1.second) * (l3.first - l2.first); } // 直線y=ax+bを追加する void add(T a, T b) { std::pair<T, T> line(a, b); while (lines.size() >= 2 && check(*(lines.end() - 2), lines.back(), line)) lines.pop_back(); lines.emplace_back(line); } // i番目の直線f_i(x)に対するxの時の値を返す T f(int i, T x) { return lines[i].first * x + lines[i].second; } // i番目の直線f_i(x)に対するxの時の値を返す T f(std::pair<T, T> line, T x) { return line.first * x + line.second; } // 直線群の中でxの時に最小(最大)となる値を返す T get(T x) { // 最小値(最大値)クエリにおけるxが単調 if (isMonotonicX) { static int head = 0; while (lines.size() - head >= 2 && comp(f(head, x), f(head + 1, x))) ++head; return f(head, x); } else { int low = -1, high = lines.size() - 1; while (high - low > 1) { int mid = (high + low) / 2; (comp(f(mid, x), f(mid + 1, x)) ? low : high) = mid; } return f(high, x); } } };
コードの説明
ほぼ先ほどの議論をそのままコードに書いています。
なお、関数はそれぞれ、
- 関数直線の不必要性を判断する
- 関数直線集合に直線を追加する
- 関数直線に対するを返す
- 関数直線集合内でのときの最小値を返す
となっています。
また、使うときには
ConvexHullTrick<int> cht(true);
といった感じで宣言します。
このとき、第一引数をかにすることでそれぞれ最小値(最大値)クエリが単調であるか否かを指定することが出来ます(省略可)。
また、第二引数に、
ConvexHullTrick<int> cht(true, std::less<int>());
としたり、
ConvexHullTrick<int> cht(true, [](T l, T r) {return l <= r; });
とすることで最大値クエリをこなすことが出来ます。
具体例
実際に直線を追加していって、その後の最小値クエリの違いを見ていきます。
ソースコード
※ヘッダ、クラスは省略
int main() { ConvecHullTrick<int> cht(false); cht.add(2, 0); std::cout << "Add y=2x" << std::endl; std::cout << "min(f(-2)) = " << cht.get(-2) << std::endl; std::cout << "min(f(2)) = " << cht.get(2) << std::endl << std::endl; cht.add(0, -1); std::cout << "Add y=-1" << std::endl; std::cout << "min(f(-2)) = " << cht.get(-2) << std::endl; std::cout << "min(f(2)) = " << cht.get(2) << std::endl << std::endl; cht.add(1, 1); std::cout << "Add y=x+1" << std::endl; std::cout << "min(f(-2)) = " << cht.get(-2) << std::endl; std::cout << "min(f(2)) = " << cht.get(2) << std::endl << std::endl; cht.add(-1, 0); std::cout << "Add y=-x" << std::endl; std::cout << "min(f(-2)) = " << cht.get(-2) << std::endl; std::cout << "min(f(2)) = " << cht.get(2) << std::endl << std::endl; return 0; }
出力
Add y=2x min(f(-2)) = -4 min(f(2)) = 4 Add y=-1 min(f(-2)) = -4 min(f(2)) = -1 Add y=x+1 min(f(-2)) = -4 min(f(2)) = -1 Add y=-x min(f(-2)) = -4 min(f(2)) = -2
上記例で行ったクエリを図にしてみると、次のようになっています。
これで、確かに正しく出力出来ていることが分かりました。
備考
前述のように、上記コードは全ての状況に対応出来るものではないので注意してください。
あとがき
使える機会は式を見て割と分かりやすいですが、実装は慣れていないと難しそうです。
そのため、問題を色々調べてみました(まだ全て解いてないです)。
3709 -- K-Anonymous Sequence
No.409 ダイエット - yukicoder
I: Live Programming - Japan Alumni Group Summer Camp 2015 Day 4 | AtCoder
Contest Page | CodeChef
Contest Page | CodeChef
Problem - E - Codeforces
このConvex-Hull Trickを用いることにより、計算量をからへと高速化出来るため、覚えておくとどこかで役に立つと思います。
*1:http://www.osaka-kyoiku.ac.jp/~tomodak/grapes/
*2: プログラミングコンテストチャレンジブック [第2版] ?問題解決のアルゴリズム活用力とコーディングテクニックを鍛える?