事故は、突然起きるように見える。
だが実際には、
ずっと前から起きる準備が整っていた。
その共通点は、ほぼひとつだ。
境界が、どこにも書かれていなかった。
境界とは何か
境界とは、
ここから先はやらない
ここからは人が決める
ここまでは自動でよい
という線引きのことだ。
だが、より正確に言えば、
境界とは、
「どの条件で、判断の責任を人に戻すか」
を定義したものである。
重要なのは、
境界は「制限」ではないという点だ。
境界とは、
責任の配置図
である。
境界は、単一の線ではない。
現実のシステムでは、複数の異なる種類の境界が存在する。
例えば、次のような境界である。
1. 不確実性の境界
モデルが十分に確信できない場合は、自動判断しない。
分からないときに止まるための境界である。
2. 影響度の境界
判断の影響が大きい場合は、自動化しない。
結果の重大さに基づく境界である。
3. 新規性の境界
モデルが想定していない種類の入力では、自動判断しない。
モデルの適用範囲を定義する境界である。
4. 観測可能性の境界
判断に必要な情報が不足している場合は、自動判断しない。
入力の完全性に基づく境界である。
5. 合意の境界
複数のモデルやエージェントが一致しない場合は、結論を出さない。
判断の安定性に基づく境界である。
6. 責任の境界
法的・倫理的責任を伴う判断は、自動化しない。
責任主体を明確にする境界である。
7. 時間の境界
モデルが前提とする世界が変化した場合は、自動判断を停止する。
モデルの有効期間を定義する境界である。
これらに共通する本質は同じである。
境界とは、
モデルが判断してよい条件ではなく、
モデルが判断してはいけない条件を定義するもの
である。
そして、それは同時に、
人間が責任を引き受ける場所を定義するもの
でもある。
境界とは、
能力の限界線ではない。
責任の開始線である。
境界が書かれていないと、何が起きるか
境界が曖昧なシステムでは、
次の現象が必ず起きる。
-
AIはできるところまで進む
-
最適化は止まらない
-
確率は更新され続ける
誰も「ここで止めよう」と言わない。
なぜなら、
止める理由が、どこにも書いていないから
だ。
暗黙の境界は、必ず破られる
多くの現場では、
こうした境界が存在している。
-
「そこは常識で分かるでしょ」
-
「普通はそこまでやらない」
-
「暗黙に人が見る前提」
だが、
暗黙の境界は境界ではない。
-
コードには存在しない
-
ログにも残らない
-
責任の所在も示さない
結果として、
誰も越えたつもりがないのに、
越えてはいけない線を越える
という事故が起きる。
事故は「異常」ではなく「設計通り」に起きる
事故が起きたあと、
よくこう言われる。
-
想定外だった
-
特殊ケースだった
-
運が悪かった
だが冷静に見れば、
境界が書かれていなければ、
そこまで行くのは必然
だった。
事故は、
設計されていなかったのではない。
設計されていない境界の上で、
きちんと計算が進んだ結果
なのだ。
なぜ人は境界を書きたがらないのか
理由ははっきりしている。
境界を書くのは、
コストが高いからだ。
-
合意が必要
-
責任が明確になる
-
後から問われる
-
「なぜそこなのか」を説明しなければならない
境界を書くとは、
判断を引き受ける覚悟を書くこと
に他ならない。
だから人は、
できるだけ書かずに済ませたがる。
だが、言語化しないコストは必ず後払いになる
境界を書かないことで
一時的に得られるものがある。
-
開発が速い
-
議論を避けられる
-
責任が曖昧になる
しかしそのツケは、
必ず後からやってくる。
-
事故
-
炎上
-
想定外の利用
-
説明不能な判断
これは偶然ではない。
言語化をサボった分だけ、
安全性が削られていた
だけだ。
境界を書くとは「止める場所を書く」ことである
境界を書くとは、
詳細なルールを書くことではない。
重要なのは、次のような文だ。
-
この条件では自動判断しない
-
この領域では結果を仮説扱いにする
-
このケースは必ず人に戻す
-
合意しない場合は結論を出さない
これは仕様ではあるが、
ロジックではない。
責任の流れを定義する文章
だ。
境界はAIのためではなく、人間のために書く
よく誤解されるが、
境界はAIに守らせるために書くのではない。
-
人が判断を思い出すため
-
人が立ち戻る場所を作るため
-
人が「ここからは自分だ」と自覚するため
に書く。
境界が書かれていないと、
人は簡単にこう言ってしまう。
「システムがそう判断したので」
良い設計ほど、境界が多い
一見すると、
-
境界が多い
-
止まる場所が多い
-
人に戻す点が多い
システムは、
非効率に見える。
だがそれは、
世界が危ういことを、
ちゃんと前提にしている
ということだ。
境界を書ける人だけが、設計者である
最後に、
はっきり言っておこう。
-
モデルを書ける人が設計者ではない
-
最適化できる人が設計者でもない
境界を書ける人だけが、設計者である。
-
どこで止めるか
-
どこで人に戻すか
-
どこから先は扱わないか
これを書いた人が、
判断の作者だ。
まとめ
-
境界が書かれていない設計は必ず破綻する
-
暗黙の境界は、事故の温床である
-
事故は想定外ではなく設計通りに起きる
-
言語化のコストは、安全性そのもの
-
境界を書くことが、責任を置くこと
AI時代の安全性とは、
性能でも精度でもない。
「ここから先はやらない」と
書いてあるかどうか
それだけで、
システムの運命は決まる。

コメント