データがない世界で、AIはどう意思決定するのか？ — 医療トリアージにおける Decision System の可能性 —

1. 問い

AIはデータがないと何もできないのか？

医療の現場では、常に「不完全な情報」の中で判断が行われています。

初診の患者
症状が曖昧
検査結果がまだ出ていない

それでも、医師は判断しなければならない。

では、この状況でAIは何ができるのでしょうか？

2. 従来の限界

従来のAIは、基本的に以下の前提に依存しています。

学習データがあること
正解ラベルが存在すること
入力が安定していること

しかし医療の現場では、

患者ごとに状態が異なる
正解は後からしか分からない
入力（症状）は常に揺らぐ

つまり、

cold start状態が常態

です。

このとき、従来のAIは止まります。

3. 発想の転換

ここで必要なのは、AIの捉え方の転換です。

AIは「予測装置」ではありません。

AIは意思決定システムである

重要なのは、

正解を当てることではなく
不完全な情報の中で判断を進めること

です。

4. 解法

この問題に対する解法は、単にAIモデルを用意することではありません。

本当に必要なのは、

データがない状態でも判断を開始できること
不完全な情報の中でも安全に進められること
運用しながら判断精度を改善できること

です。

そのために必要なのが、
Simulation / Decision Trace Model / Multi-Agent
の3つを組み合わせた構造です。

それぞれは独立した技術ではなく、
「判断を始める」「判断を制御する」「判断を改善する」ための一連の解法として機能します。

この問題に対するアプローチは、3つの要素から構成されます。

(1) Simulation

データがない問題に対して、判断を始めるための土台を作る

cold startが難しいのは、過去データがないために、最初の判断基準そのものが作れないからです。

医療では特に、

初診患者で履歴がない
症状が曖昧である
正解がその場では分からない

という状況が珍しくありません。

このとき、「データが揃うまで待つ」という発想では、現場では何も動きません。

そこで必要になるのがSimulationです。

現実のデータが十分にないなら、まず仮想的な患者や症状のパターン、病状進行の仮説を設計し、
判断を試せる環境そのものを先に作るのです。

たとえば、

仮想患者を生成する
症状の出方のパターンを定義する
重症化の仮説シナリオを作る
その中でトリアージ判断を試す

といった形です。

ここで重要なのは、これは単なるダミーデータ生成ではないということです。

目的は「学習用データを埋めること」ではなく、
どのような判断ルールなら現場で機能するかを、事前に検証できる状態を作ることにあります。

つまりSimulationは、
データ不足を埋めるための代用品ではなく、判断を開始するための実験環境です。

(2) Decision Trace Model

不完全な情報の中でも、判断を制御可能な形にする

仮想世界を作っても、それだけでは解決しません。

なぜなら、医療判断は単純な入力と出力の対応ではなく、
どの情報を見て、どこで判断し、どこで人間に戻すか
という判断プロセスそのものが重要だからです。

そこで必要なのがDecision Trace Modelです。

Decision Trace Modelでは、医療の判断を次のように分解します。

Event：患者の来院
Signal：症状・バイタルなどの観測情報
Decision：緊急度や優先順位の判定
Boundary：危険領域や不確実性が高い場合の停止条件
Human：医師による最終確認・介入
Log：結果と判断履歴の記録

この構造を導入すると、
AIは単に「答えを返す装置」ではなく、
どの情報をもとに、どのルールで、どの範囲まで判断したかを明示できるシステムになります。

これが重要なのは、医療では「当たったか外れたか」だけでは不十分だからです。

むしろ必要なのは、

なぜその判断に至ったのか
どの時点で不確実だったのか
どこで人間が介入すべきだったのか

を追跡できることです。

つまりDecision Trace Modelは、
判断を見える化するための枠組みであると同時に、
不完全な情報の中でも判断を暴走させず、安全に運用するための制御構造でもあります。

(3) Multi-Agent

複雑な判断を分解し、運用しながら改善可能にする

医療判断が難しいのは、ひとつの視点だけで決められないからです。

たとえばトリアージでは、

症状をどう解釈するか
重症化リスクをどう見るか
今どの患者を優先すべきか

という異なる種類の判断が同時に存在します。

これを一つのAIにまとめて任せると、
判断の根拠が曖昧になりやすく、
どこで誤ったのかも分かりにくくなります。

そこで、判断を役割ごとに分解します。

症状解釈エージェント
リスク評価エージェント
優先順位付けエージェント

それぞれが異なる観点から判断を行い、
必要に応じて相互に矛盾や不一致も出します。

しかし、その不一致は欠陥ではありません。

むしろ医療のような不確実な領域では、
判断の衝突そのものが重要なシグナルになります。

たとえば、

症状解釈では軽症に見える
しかしリスク評価では重症化可能性が高い

というズレがあれば、
それは「追加確認が必要」という重要な兆候になります。

このようにMulti-Agentは、単なる並列化ではなく、
複雑な判断を分解し、どこに不確実性や対立があるかを明示するための仕組みです。

さらに、各エージェント単位で改善できるため、
運用後に実データが蓄積されたときも、

症状解釈だけを改善する
リスク評価ルールだけを調整する
優先順位の重みづけを見直す

といった形で、局所的かつ継続的な改善が可能になります。

(4) なぜこの3つを組み合わせるのか

この3つは、単に役割の異なる技術ではありません。
「データがない状態から意思決定を立ち上げ、改善していくための一つの連続したプロセス」です。

最初の問題は、
データがない状態では、そもそも判断を始められないことです。

従来の発想では、

データがない
→ 学習できない
→ 使えない

となり、ここで止まります。

しかし現実の現場では、データが揃うのを待つことはできません。

そこで最初に必要になるのが Simulation です。

シミュレーションの役割は、精度を上げることではありません。
不完全でもよいので、仮の条件のもとで一度判断を動かすことです。

仮の患者
仮の症状
仮の判断ルール

を使って、

意思決定の「初期の形」を作る

ここでは正しさよりも、
「判断が動く構造があるかどうか」が重要になります。

しかし、この段階ではまだ問題があります。

仮の世界で作った判断は、現実と必ずズレます。
そしてそのズレがどこから生まれているのか分からなければ、改善はできません。

ここで Decision Trace Model が必要になります。

Decision Trace Model によって、実際のデータを当てはめ、ズレが認織された場合に

どの情報（Signal）を見て
どの判断（Decision）を行い
どこで止めるべきだったのか（Boundary）

が分解され、

判断のどこにズレがあったのかを特定できる状態になります。

さらにもう一つの問題があります。

現実の判断は単一ではなく、

症状の解釈
リスク評価
優先順位付け

といった複数の判断が絡み合っています。

これを一つのモデルで扱うと、
ズレが発生したときに、どこを直せばよいか分からなくなります。

ここで Multi-Agent が必要になります。

判断を役割ごとに分解することで、

どの判断がズレの原因だったのかを切り分けられるようになります

(5) この3つがつながると何が起きるのか

この3つを組み合わせることで、初めて次の流れが成立します。

① Simulationで判断の“形”を作る
→ データがなくても意思決定を開始できる

② 実運用でログが蓄積される
→ 現実の結果が記録される

③ Decision Traceでズレを特定する
→ どの判断が問題だったか分かる

④ Multi-Agentで局所的に修正する
→ 判断構造をピンポイントで改善する

そしてこの結果、

シミュレーションで“形”を作り、
実データで“歪み”を知り、
その歪みで判断構造を修正していく

という循環が回り始めます。

(6) なぜこの構造が重要なのか

ここで重要なのは、
最初から十分なデータがあることを前提にしないことです。

必要なのは、

完璧なモデルではなく
大量の学習データでもなく

不完全でも判断を開始し、
その結果を記録し、
ズレをもとに改善できる構造

です。

この構造があるからこそ、

最初は仮説でも動き出せる
実運用を通じてログが蓄積される
差分から改善点が見つかる
その結果として、意味のあるデータが育っていく

のです。

5. 具体ユースケース：医療トリアージ

救急外来では、患者が来院した瞬間から、連続的な意思決定が始まります。

どの患者を先に診るべきか
緊急度はどのレベルか
すぐに医師へ回すべきか
検査を優先すべきか、経過観察でよいか

しかし、ここで難しいのは、
こうした判断の多くが不完全な情報の中で行われることです。

患者は最初から診断名を持って来るわけではありません。

現場で最初に得られるのは、

本人の訴え
見た目の様子
バイタルサイン
限られた問診情報

といった断片的な情報です。

しかも、それらはしばしば曖昧で、揺らぎがあります。

たとえば胸痛ひとつをとっても、

軽い筋肉痛のようなケースもあれば
心筋梗塞の前兆であるケースもある

つまり、同じように見える入力の背後に、全く異なるリスクが潜んでいるのです。

ここで重要なのは、
その場で「絶対に正しい答え」を出すことではありません。

本当に必要なのは、

限られた情報の中で危険を見落とさず
判断を急ぎすぎず
必要なときには人間へ戻し
後から改善できる形で判断を残すこと

です。

このとき、Decision Trace Model と Simulation を組み合わせる意味が出てきます。

■ Decision Traceでの流れ

医療トリアージの判断は、次のような構造として整理できます。

Event: 患者来院
↓
Signal: 症状・バイタル（ノイズあり）
↓
Decision: 緊急度判定
↓
Boundary: 危険度が高い場合は即人間へ
↓
Human: 医師が最終判断
↓
Log: 実際の診断結果・経過

この構造の重要な点は、

AIがいきなり「診断名」や「正解」を断定するのではなく、
どの情報を観測し、どの段階で、どのレベルの判断をしたのかを分けて扱うことです。

たとえば、患者が来院した時点では、AIが見るのはまず Signal です。

呼吸が荒い
血圧が低い
胸痛を訴えている
発熱がある
意識が少し混濁している

こうした情報を受けて、AIは「何の病気か」を断定するのではなく、
まず緊急度をどう扱うべきかという Decision を行います。

たとえば、

低リスクとして待機可能
中リスクとして優先診察
高リスクとして即時対応

というような形です。

そして、ここで Boundary が重要になります。

もし入力が不安定であったり、危険シグナルが一定以上であったり、
エージェント間で判断が大きく割れたりした場合には、
AIはそこで止まり、即座に人間へ戻します。

つまりこの構造は、
AIにすべてを任せる仕組みではなく、
どこまではAIが扱い、どこからは人間が引き取るのかを明示する仕組みです。

■ シミュレーションの役割

では、こうした構造をどうやって最初から作るのか。

ここで必要になるのがシミュレーションです。

医療トリアージでは、十分な実データが最初から揃っているとは限りません。
特に新しい運用設計や判断ロジックを作る段階では、
いきなり本番データだけで安全に最適化することは難しい。

そこでまず、仮想患者を用いたシナリオを作ります。

たとえば、

軽い発熱と咳を訴える患者
胸痛と冷や汗を伴う患者
高齢で意識がぼんやりしている患者
呼吸苦を訴えるが、見た目は比較的落ち着いている患者

といったケースを多数用意します。

それぞれに対して、

症状解釈エージェントが所見を整理し
リスク評価エージェントが重症化可能性を見積もり
優先順位付けエージェントがトリアージ順を判断する

という流れを試します。

すると、単に「正解か不正解か」だけでなく、
どのケースで判断が迷いやすいかが見えてきます。

たとえば、

胸痛なのに低リスクに寄りやすい
高齢者の非典型症状を過小評価しやすい
呼吸苦の表現の違いで判断がぶれやすい

といった傾向です。

これが重要です。

シミュレーションの役割は、単に事前評価をすることではありません。
判断ロジックの弱点を、実運用前に発見することです。

■ 差分がどう「判断改善」につながるのか

そして実運用が始まると、
シミュレーションで作った仮説と、現実の結果の間に差分が生まれます。

たとえばAIが、

「中リスク」と判定した患者が、実際には緊急処置を要した
「待機可能」と見た患者が、その後急変した
逆に「高リスク」と見た患者が、実際には軽症だった

というようなケースです。

このとき重要なのは、
その差分を単に「AIの精度が悪かった」で終わらせないことです。

Decision Trace Model があると、
どこでズレが生じたかを分解して見られます。

たとえば、

Signalの取り方が粗かったのか
リスク評価の閾値が低すぎたのか
高齢者や非典型症状に対する重みづけが足りなかったのか
エージェント間の不一致をBoundaryで拾えていなかったのか

といった形です。

つまり、改善対象が「AI全体」ではなく、
判断構造のどこを直すべきかとして見えるようになります。

ここで差分は、学習データの追加というよりも、
判断ルール・境界条件・役割分担を調整する材料になります。

たとえば、

胸痛＋冷汗＋高齢なら優先度を一段引き上げる
症状解釈とリスク評価が衝突した場合は自動で人間へ戻す
呼吸苦に関する重みづけを見直す
非典型症状のパターンを仮想患者シナリオに追加する

といった改善です。

これによってシステムは、単に「もっと学習する」のではなく、
どのように判断すべきかを、運用を通じて少しずつ賢くしていくことができます。

■ 何が解決されるのか

この構造によって解決されるのは、
「最初から完璧な診断AIを作ること」ではありません。

解決されるのはむしろ、次の問題です。

データが少ない段階では何も始められない
AIの判断がブラックボックスで修正点が分からない
現場導入後にズレが出ても、どこを直すべきか分からない
危険なケースで人間への切り戻しが遅れる

Simulation、Decision Trace Model、Multi-Agent を組み合わせることで、

少ないデータでも先に判断構造を立ち上げられる
判断の根拠と流れを追跡できる
差分をもとに改善点を局所化できる
不確実性の高いケースを人間へ安全に返せる

ようになります。

つまりこのアプローチは、
医療の不確実性を消すものではありません。

そうではなく、
不確実なままでも判断を開始でき、しかも改善できる状態を作ることが本質です。

6. 本質

ここで本当に重要なのは、
「データとは何か」を見直すことです。

AIの議論では、しばしばデータが出発点として扱われます。

つまり、

まず十分なデータを集める
そのデータを使って学習する
学習済みモデルで推論する

という流れです。

これは確かに、多くの機械学習システムでは自然な考え方です。

しかし、医療トリアージのような現場では、この前提がそのまま成り立つとは限りません。

なぜなら、現実の意思決定は、
十分に整理されたデータセットが先に存在する状態から始まるのではなく、
不完全な情報の中で、まず判断しなければならない状態から始まるからです。

現場に最初からあるのは、完成された学習データではありません。

あるのは、

曖昧な症状
限られた観測情報
不確実な状況
それでもすぐに求められる判断

です。

つまり実際の現場では、

データがあるから判断するのではなく、
判断し、その結果を記録することで、あとからデータになっていく
という順序のほうが本質に近いのです。

■ 従来の発想

従来のAIは、しばしば次の順序で語られます。

データ → 学習 → 推論

この見方では、データは最初から存在している前提です。
そのため、十分なデータがなければ、AIはまだ始められない、という発想になりやすい。

しかしこの考え方には限界があります。

特に、初期導入段階やコールドスタートの状況では、
「十分なデータが集まるまで待つ」ということ自体が、
現場ではほとんど許されないからです。

医療では、データが揃うのを待っている間にも患者は来院し、
判断はその場で必要になります。

■ もう一つの見方

これに対して、この記事で扱っているアプローチでは、順序を逆に捉えます。

判断 → 実行 → ログ → データ化

まず必要なのは、
完璧なモデルでも、大量の事前データでもありません。

必要なのは、
不完全な状態でも判断を開始できる構造です。

たとえば医療トリアージであれば、

来院という Event が起こる
症状やバイタルという Signal を受け取る
その時点で可能な範囲の Decision を行う
危険であれば Boundary によって人間へ戻す
実際の経過や診断結果を Log として残す

この流れが繰り返されることで、
はじめて「どの判断が妥当だったか」「どこにズレがあったか」という情報が蓄積されていきます。

つまり、ここで言うデータとは、
最初から完成された資源として存在するものではなく、
判断と運用の履歴から生まれてくるものなのです。

■ データは“入力資源”である前に、“運用の結果”でもある

ここで見落としてはいけないのは、
現場で本当に価値を持つデータの多くは、単なる入力データではないということです。

重要なのはむしろ、

どのような症状をどう解釈したか
どの時点で高リスクと判断したか
なぜ人間へ切り戻したか
実際の結果とどこに差があったか

といった、判断の履歴を含んだデータです。

この種のデータは、最初から外部に完成形で存在しているわけではありません。
実際に運用し、判断し、記録してはじめて得られます。

だからこそ、データは単なる前提条件ではありません。

データは、
意思決定システムが動いた結果として、少しずつ蓄積される資産でもあるのです。

■ 本質は「学習前提」から「運用前提」への転換にある

この違いは、単なる順番の違いではありません。

これは、

学習のためにAIを作るのか
現場で判断するためにAIを作るのか

という設計思想そのものの違いです。

前者では、まずデータが必要になります。
後者では、まず判断構造が必要になります。

そして、判断構造が運用されることで、
その履歴がデータとなり、
そのデータが次の改善に使われる。

この循環ができて初めて、
AIは単なる推論装置ではなく、
継続的に改善される意思決定システムになります。

■ つまり何が言いたいのか

要するに、重要なのは
「データが十分に揃ってからAIを始める」ことではありません。

そうではなく、

判断を始め、記録し、改善できる構造を先に作ること

です。

その構造があるからこそ、

最初は不完全でも動き出せる
実運用を通じてログが蓄積される
差分から改善点が見つかる
その結果として、より意味のあるデータが育っていく

のです。

つまり、

データは前提条件として与えられるだけのものではない。
意思決定の運用を通じて、結果として育っていくものでもある。

7. まとめ

医療のような不確実な領域では、

入力は常に揺らぎ
正解はその場には存在せず
データは最初から十分に揃っているわけではありません

それでも現場では、判断を止めることはできません。

重要なのは、
完璧なデータを待つことではなく、
不完全な状態でも判断を開始し、安全に進め、あとから改善できる構造を持つことです。

そのために必要なのが、

Simulation（判断を試せる環境）
Decision Trace Model（判断を構造化・可視化する枠組み）
Multi-Agent（判断を分解し、改善可能にする仕組み）

による意思決定システムです。

この構造によって初めて、

データが少ない状態でも動き出せる
判断の根拠と限界を把握できる
実行結果をログとして蓄積できる
その差分から判断を改善できる

という循環が成立します。

■ 最後に

AIはデータによって動くのではない
意思決定の構造によって動き出し、
その結果としてデータが蓄積されていく

Deux Ex Machina

AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。

Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.