【日々のマナビ】なぜ評価制度ほど局所最適を生むのか – 行動経済学と Goodhart で設計するインセンティブ

2026-03-212026-05-19

こんにちは。ろっさんです。

0. はじめに｜なぜ評価制度は導入した瞬間から壊れ始めるのか

合格直後、最初に経営者から相談を受けるテーマのひとつが「人事評価」と「インセンティブ」です。

「社員のモチベーションが上がらない。営業に成果報酬を入れたい」「現場の改善活動が定着しない。提案件数で評価したい」「品質クレームが減らない。クレーム発生率をマイナス評価にしたい」——どれも、聞いた瞬間は妥当に思える話です。

ところが、診断士として現場に通うようになると、ある奇妙な現象に何度もぶつかります。

評価制度を導入した瞬間から、組織の挙動が「制度の想定外」の方向へ動き始める。

成果報酬を入れた営業部は、確かに売上が伸びる。でも返品が増え、無理な値引きが横行し、半年後の継続率が落ちる。提案件数を評価指標にした現場では、確かに提案数は増える。でも内容は薄く、実装されない机上の改善案が大量に山積みされる。クレーム発生率を下げるためにマイナス評価を入れたら、現場が「クレームをクレームとして上げない」という選択をしはじめる。

数字は良くなる。でも、現実は悪くなる。

新米診断士の多くは、この壁にぶつかったとき「評価の運用が悪い」「人選が悪い」「教育が足りない」といった対症的な説明に逃げ込みます。もちろんそれも一因ではある。でも構造的に見ると、もっと根の深い問題があります。

そもそも評価制度は、「人間は契約された通りに動く合理的主体」という前提では設計できない。 ところが大半の制度は、その前提で組まれています。エージェンシー理論はそれを乗り越えるための出発点を提供し、行動経済学はそこに「人間は文脈・参照点・損失回避・公平感に縛られる」という現実を上書きします。さらに Goodhart の法則は「測定行為そのものが行動を歪める」ことを警告し、Lazear のソーティング効果は「評価制度は人を動かすだけでなく、誰を残し誰を引き寄せるかも決める」と教えてくれます。

この記事では、中小企業診断士の試験で学んだ「インセンティブ設計」を、合格後の実務に耐える厚さで再構成します。扱うのは次の論点です。

エージェンシー理論の定義・前提・論理構造（ホルムストローム＝ミルグロムのマルチタスク問題まで）
行動経済学の主要バイアス（プロスペクト理論・参照点依存・損失回避・最後通牒ゲーム）
多指標・監査・裁量という「測定できない努力」への3つの対処
Goodhart の法則と「KPIを増やせば解決する」という誤解
ソーティング効果と機能別リスク設計（Lazear 2000の出来高制研究を含む）
評価頻度と双曲割引、終了設計と心理的契約（追加論点として深掘り）
営業評価を「売上」から「粗利・回収・品質・継続」へ広げる具体設計
金属加工業A社（22名・売上2億円・主力顧客47%集中・熟練工2名勤続20年超）における全制度設計

最初に断っておきます。今回はかなり理論寄りに書きます。エージェンシー理論を「情報の非対称性のことね」で済ませると、合格後の実務で何度も同じ罠にハマります。理論の骨格を一度きちんと押さえることが、結局は「現場で何が起きているかを最短で読み解く力」になります。事例は最後まで金属加工業A社で統一しますので、抽象論で迷子になることはありません。

なお、本記事は同シリーズの価値創造システム6要素で扱った「統治・資源・プロセス」の因果と、ビジネス複雑性を因果ループで読むで扱った「強化ループ／バランスループ」の発想を、人事評価という固有領域に当てはめた応用編にあたります。シリーズ全体の構造を踏まえて読んでいただくと、組織論と戦略論の接続が見えやすくなります。

1. エージェンシー理論——「人は契約通りには動かない」を構造化する

1.1 定義と前提

エージェンシー理論（Agency Theory）は、1970年代に Jensen & Meckling（1976）が体系化した、組織と契約の経済学的分析枠組みです。中核にあるのは次の構造です。

プリンシパル（依頼人）が、エージェント（代理人）に対して何らかの業務を委任する。両者の間には情報の非対称性が存在し、エージェントの行動は完全には観察できない。エージェントは自らの効用を最大化するため、プリンシパルの利害と乖離した行動を取りうる。

経営学的文脈に翻訳すると、株主と経営者、経営者と従業員、本社と支店、本部と現場——いずれも構造はプリンシパル＝エージェント関係です。中小企業の文脈なら「経営者と工場長」「工場長と熟練工」「熟練工と若手工員」もすべて多層的なエージェンシー関係に該当します。

この関係に内在する2つの問題が、エージェンシー理論の中核概念です。

①モラルハザード（隠れた行動）：契約締結後、エージェントの行動をプリンシパルが完全に観察できないため、エージェントが努力を怠ったり利己的行動を取ったりするリスク。 ②アドバースセレクション（隠れた情報）：契約締結前、エージェントの能力・性向についての情報を本人だけが知っているため、プリンシパルが望ましくないタイプを選んでしまうリスク。

評価制度は本質的に、この2つの問題への対処として設計されます。「行動が観察できないなら、結果を測って報酬と結びつける」というのがインセンティブ契約の基本発想です。

1.2 ホルムストローム＝ミルグロムの「マルチタスク問題」

エージェンシー理論を実務に使う上で、最も重要な発展は Holmstrom & Milgrom（1991）のマルチタスク・エージェンシーモデルです。これを押さえていないと、評価制度の設計は確実に事故ります。

骨子はこうです。

エージェントが複数のタスク（例：売上を上げる／顧客満足を上げる）を同時に遂行する状況を考える
そのうち一部のタスクは測定が容易（売上＝伝票で集計可能）、他は測定が困難（顧客満足＝アンケートに偏りがある、長期的にしか出ない）
報酬を測定容易な指標だけに連動させると、エージェントは測定困難なタスクから努力を引き上げる
結果として、組織全体の成果は 逆に悪化 することがある

この帰結が直観に反する点に注目してください。「測定できるところだけでも報酬と結びつければ、何もしないよりはマシ」と考えがちですが、マルチタスク状況では「測定可能な部分の強いインセンティブ＝測定困難な部分の努力放棄」が起きます。

金属加工業A社の文脈で言えば、「納期遵守率」を強い評価指標にすると、現場は「納期に間に合わせるための品質の妥協」を選びます。納期は測れるが、出荷後の早期故障や顧客の不満は半年単位でしか可視化されません。納期だけ強化すれば、半年後にクレームが噴き出します。

ホルムストロームの結論は明確です。測定困難なタスクが重要な場合、測定可能な指標への強いインセンティブはむしろ有害。そのときの正解は次の3つの組合せのいずれかです。

(a) 測定可能・困難の両タスクに対し、インセンティブ強度を全体的に弱める（固定給比率を高める）
(b) 測定可能な指標を 複数並べて、それぞれが互いの歪みを牽制する設計にする
(c) 測定困難なタスクには 裁量と監査 で対処し、強い数値連動を諦める

(a) は「成果主義の罠」を回避する基礎、(b) は §3 で扱う多指標化、(c) は §3 で扱う裁量と監査の役割。3つの選択肢が常に視野にあるかどうかが、合格後の制度設計の質を決めます。

1.3 リスク・シェアリングのトレードオフ

もうひとつ、ホルムストロームの古典（1979, 1982）から引き継がれる重要な視点がリスク・シェアリングです。

業績連動報酬は、エージェントに業績変動リスクを負わせる構造になります。経営者から見れば「成果に応じた支払いは公平」に見えますが、エージェント側から見ると、自分のコントロール外の要因（景気・為替・大口顧客の動向）まで報酬変動として降りかかってきます。

理論的には、リスク回避度の高いエージェントには、リスクの少ない固定給を厚くし、業績連動を弱めるのが効率的です。逆にリスク許容度の高いエージェントには、業績連動を強めて期待リターンを高くする方が双方にとって望ましい。

これが §5 で扱う「ソーティング効果」の伏線になります。インセンティブの強度は、誰を引き寄せ誰を遠ざけるかという人材構成の変数としても作用します。

1.4 A社の文脈に当てはめる

ここでこの理論を金属加工業A社（従業員22名、年商2億円、主力顧客47%集中、熟練工2名勤続20年超）の現場に置いてみます。

エージェンシー関係を多層に分解すると次のようになります。

プリンシパル	エージェント	観察できない行動	観察できる結果
経営者	工場長	工程の判断・現場との調整	月次の納期遵守率・歩留り
工場長	熟練工	段取りの工夫・若手指導の質	工程完了時間・若手の独立可能工程数
工場長	若手工員	学習意欲・自主練習	担当可能工程数・歩留り
経営者	営業（兼務役員1名）	顧客との関係構築・受注の質	月次受注額・粗利・回収サイト

ここでマルチタスクの罠は至るところに潜んでいます。

熟練工に「歩留り率」だけで評価すれば、難易度の高い試作案件（歩留りが悪いが将来の顧客拡大に必須）を避けるようになります。営業に「月次受注額」だけで評価すれば、無理な値引き・長期の支払いサイト容認・短納期受注の乱発が起きます。若手に「担当可能工程数」だけで評価すれば、浅い習得で「できる」と申告するインセンティブが生まれます。

すべての評価指標が、「ある努力を強化すると別の努力を犠牲にする」というマルチタスクの構造を抱えている。これがエージェンシー理論を経由して初めて見える事実です。

2. 行動経済学——「合理的に動く人」は現場にはいない

2.1 プロスペクト理論と参照点依存

エージェンシー理論は強力ですが、「エージェントは期待効用を合理的に最大化する」という前提に立っています。これを実証データで揺さぶったのが、Kahneman & Tversky（1979）のプロスペクト理論です。

骨格は3つの命題です。

①参照点依存：人間は絶対水準ではなく、参照点（直近の状態・期待水準・他者との比較）からの差分で利得・損失を評価する。 ②損失回避：同額の利得と損失では、損失の心理的インパクトが利得の約2倍。「得るための努力」よりも「失わないための努力」の方が動機づけが強い。 ③確率の主観的歪み：低確率の事象（宝くじ・大事故）は過大評価され、高確率の事象は過小評価される。

参照点依存と損失回避の組合せは、評価制度に決定的な影響を及ぼします。

A社で営業役員に「目標達成で年間ボーナス200万円」というインセンティブを提示したとします。エージェンシー理論ベースでは「期待値が高いほど努力が増える」と単純化しますが、プロスペクト理論はそうは見ません。

営業役員にとっての参照点は「これまでの平均ボーナス（仮に150万円）」です
目標達成なら +50万円の利得、未達なら -50万円程度の損失と感じます（基準点 150 から見た差分）
損失回避の倍率（約2.0）を加味すると、未達回避への心理的圧力 ≒ 達成意欲の倍

ここから先が問題です。未達回避の圧力が極端に強いと、人は達成のためなら手段を選ばないという方向にも、最初から達成不能と思った瞬間に努力を放棄するという方向にも振れます。前者は不正・データ改ざんの温床、後者は「半期の途中で目標を諦めて翌期に取っておく」現象を生みます。

2.2 損失回避と「サンドバッギング」

期初の目標設定の場面を思い出してください。営業役員と経営者の対話。

経営者：「今期は前期比15%増の目標でいきたい」営業役員：「いやー、今の市場環境では厳しいですよ……。10%ならなんとか」

これは怠惰ではなく、損失回避と参照点操作の合理的な振る舞いです。営業役員にとって、達成可能ラインを上回る目標が設定されれば、未達による損失の心理コストが高い。だから期初の参照点をできるだけ下げに行きます。サンドバッギング（目標を低く見積もる）はインセンティブ設計の必然的副産物です。

これを「営業のモラルが低い」と片付けると、原因究明が止まります。構造的には、評価制度が「期初の目標設定」と「期末の達成・未達」を強くリンクさせる限り、合理的に行動する人ほど目標を低く見積もるインセンティブを持つ、ということです。

2.3 最後通牒ゲームと公平感

行動経済学のもうひとつの古典が、最後通牒ゲーム（Güth, Schmittberger & Schwarze, 1982）です。

ルールは単純です。AさんがBさんに対して「1000円をどう分けるか」を提案する。Bさんは Yes/No だけ言える。Bさんが No と言えば双方ゼロ円。

合理的経済人モデルでは、Aは999円を取って1円だけBに渡し、Bは1円でも0円よりマシだから受け入れるはず。ところが実験では、Bの2〜3割は「不公平な提案」を拒否します。自分が損をしてでも、不公平を拒否することを選ぶ。

この実験が示しているのは、人は「客観的に得かどうか」ではなく「公平かどうか」を評価関数に強く含むという事実です。

評価制度では、これがとくに機能別の差異で問題になります。営業と製造で評価方法が違う、本社と支店で違う、男女で違う、正社員と非正規で違う——その差異に「合理的理由」があっても、当事者が「不公平」と感じれば、絶対水準とは無関係に行動が変わります。

A社の文脈なら、「熟練工の特別手当」が直接的な事例です。月3万円の指導手当を熟練工2名に支給する案を出したとき、若手から「不公平だ」と声が上がりかねません。客観的には妥当な手当（指導は明確な追加業務）でも、公平感の問題として処理されると、組織全体のモラルが下がります。

ここから先は §5 の機能別リスク設計で深掘りしますが、「機能別の差異が受け入れられる3条件」を先取りで提示しておきます。

①「なぜ違うか」の論理が透明かつ全員に理解可能であること
②全員共通の基盤（ベース給・福利厚生・最低限の教育機会）が手厚く保たれていること
③機能間異動が原理的に可能で、固定カーストになっていないこと

不満の本質は「差異がある」ことではなく「差異が恣意的に見える」ことです。最後通牒ゲームの拒否は、相手が「気まぐれで決めた」と認識した瞬間に起きるのであって、「客観的なルールで決まった」と認識されれば受け入れられる。同じことが組織内のインセンティブ差異にも当てはまります。

2.4 内発的動機のクラウディング・アウト

最後にひとつ、Deci & Ryan の自己決定理論から引き継がれる「クラウディング・アウト」を押さえておきます。

ある実験で、子どもがもともと楽しんでいた絵を描く活動に「報酬」を導入すると、報酬を撤去した後、絵を描く頻度が報酬導入前より低下したという結果が出ました（Lepper, Greene & Nisbett, 1973）。

これは、外発的報酬が内発的動機を侵食する現象——クラウディング・アウト——として知られています。「面白いからやっていたこと」が「報酬のためにやっていること」に再定義されると、報酬を撤去したときに行動が崩れます。

実務的含意は深刻です。A社の熟練工2名は、若手に技を伝えること自体に職人としての誇りを感じていた可能性があります。そこに「指導手当」を導入した瞬間、彼らの動機が「誇り」から「手当」に置き換わるリスクがあります。手当を撤去すれば指導は止まり、手当があっても「いくらまでなら指導するか」という計算が始まるかもしれません。

これを避けるには、金銭報酬と内発的動機の両立を意識した設計が必要です。具体的には：

金銭報酬は「業務拡張への対価」として位置づけ、誇りや裁量と切り離さない
「教える役割を任命する」という役割の格上げを金銭より先行させる
報酬の話より先に、「貴方の技を組織の資産として残したい」という意味づけを共有する

A社で実際に提案するなら、まず熟練工2名を「マイスター」として正式に任命し、組織図上に明示する。手当はその役割に付随する形で導入する。逆に「手当を出すから教えてくれ」と切り出すと、構造的にクラウディング・アウトが起きやすくなります。

3. 多指標・監査・裁量——測定できない努力をどう扱うか

3.1 多指標化の論理と限界

マルチタスク・エージェンシーの帰結のひとつ「(b) 測定可能な指標を複数並べる」を、もう少し深掘りします。

複数指標化の論理は、各指標が単独では引き起こす歪みを、別の指標が牽制することにあります。A社の営業評価を例に取ると、5-2-2 の問いそのままに「売上だけ」から広げる場合、こうなります。

指標	単独で使うと起きる歪み	牽制してくれる相方指標
月次売上	値引き乱発・短納期受注の押し付け・押し込み出荷	粗利率・納期遵守率
粗利率	売れる案件を絞り込み・受注規模の縮小	月次売上・新規受注件数
回収サイト	既存顧客への過度な迎合（条件緩和を断れない）	新規受注件数・与信スコア
顧客継続率（LTV）	顧客固定化・新規開拓の停止	新規受注件数
新規受注件数	案件の質を問わない数稼ぎ	粗利率・継続率

「単独では歪みを生む指標」を互いに牽制させるのがマルチタスク設計の基本骨格です。

ただし、多指標化には限界があります。Goodhart の法則が示唆するように、「測定する指標を増やせば組織の問題が解決する」というのは誤解です（§4 で詳述）。指標が増えるほど、人間の認知容量を超え、結局はどれか一つが事実上の支配指標になります。営業現場で「5指標を毎月チェックしましょう」と言っても、月末になれば全員が「結局、社長は売上を見ている」と察して、売上中心の行動に戻ります。

Miller’s Law（人間が同時に処理できるチャンク数は7±2）を引くまでもなく、実務的な評価指標は3〜5に絞るのが標準です。それ以上は形骸化します。

3.2 監査（モニタリング）の役割

多指標化と並ぶ手段が監査（モニタリング）です。これは「測定そのものではなく、測定の質を確認する仕組み」です。

監査の目的は2つあります。

①不正・データ改ざんの抑止：自己申告ベースの指標が改ざんされていないかをサンプルでチェック ②指標が拾いきれない要素の補完：数値には現れない品質・コンプライアンス・顧客対応の実態を、現地ヒアリングや顧客アンケートで把握

A社の文脈で具体化すると、たとえば次のような監査が考えられます。

サンプル監査：営業役員が報告した「受注見込み」のうち、月1件をランダムに選び、顧客に直接「実際に内示が出ているか」を確認
ログ監査：工場の段取り時間・歩留りデータを工場長が集計しているなら、四半期に1回は経営者または外部監査が原データを突合
顧客アンケート：年2回、主要顧客5社に「対応品質」を5段階で評価してもらう（指名は無記名・経営者に直接届く）

中小企業では、外部監査をフル装備するのは現実的でない場合が多いです。その場合は「経営者自らが現地・現物・現実（三現主義）に触れる頻度を設計に組み込む」のが最低限の代替策です。月1回、経営者が顧客訪問に同席する、現場に半日立ち会う——これも立派な監査機能です。

3.3 裁量の意味と限界

多指標と監査でも拾いきれない「測定できない努力」は最後に残ります。職人の手抜き・コンプライアンス意識・部下指導の質——どれも完全な数値化は不可能です。

その領域に対しては裁量で報いるしかありません。裁量とは、評価者が「数値化されない貢献」を独自の判断で評価に織り込む権限です。

裁量には2つの効用と2つの危険があります。

効用①：数値で拾いきれない貢献を報酬に反映できる 効用②：制度の硬直性を緩和し、状況変化への柔軟性を保てる

危険①：恣意性が「公平感の欠如」を生む（最後通牒ゲームの構造を再生する） 危険②：エージェントが「数値より評価者の機嫌取り」に努力を振り向ける

裁量を機能させるには、次の3条件が同時に必要です。

(1) 裁量の範囲が事前に明示されている（例：年間ボーナスのうち基礎部分70%は機械的算定、上乗せ30%は裁量）
(2) 裁量判断の根拠が言語化される仕組みがある（評価面談での具体的フィードバック）
(3) 裁量を行使する評価者自身が、上位プリンシパルから監査されている（裁量の二重性）

(3) は中小企業では見落とされがちです。「社長の裁量は誰も監査しない」状態だと、(1)(2) が崩れた瞬間に裁量は「気まぐれ」に堕します。社外取締役・顧問・税理士など、社長の判断を年1回でも棚卸しする外部の視点を入れるのが現実的な解です。

3.4 A社の制度骨格（中間まとめ）

§1〜§3 をA社に当てはめると、現時点で次のような骨格が見えてきます。

階層	評価指標（多指標）	監査	裁量
営業役員	月次売上・粗利率・回収サイト・継続率・新規受注	顧客アンケート年2回・サンプル監査月1件	年俸の20%（経営者裁量）
工場長	納期遵守率・歩留り・若手独立工程数・原価率	経営者の現場立会月1回・外部診断士の年次レビュー	年俸の15%（経営者裁量）
熟練工	担当工程の歩留り・若手指導件数（教えた工程数）・標準化への寄与	工場長の現場立会週1回	月給の10%（工場長裁量）
若手工員	担当可能工程数・歩留り・自主練習時間	熟練工の確認サイン	月給の5%（工場長裁量）

これはまだ「素材」です。§5 のソーティング効果、§7 のライフサイクル設計を経て、最終的に §6 の事例で全体像をまとめます。

4. Goodhart の法則と「KPIを増やせば解決する」という誤解

4.1 Goodhart の法則の定式化

「KPIを増やせば組織の問題が解決する」という素朴な信念は、なぜ間違いか。これを最も鋭く言い当てたのが、英国の経済学者 Charles Goodhart（1975）の観察です。

A measure becomes a target, it ceases to be a good measure. （指標が目標になった瞬間、それは良い指標ではなくなる）

後に Marilyn Strathern が次のように一般化しました。

When a measure becomes a target, it ceases to be a good measure.

定式化のポイントは、指標が「現象を観察する道具」から「達成すべき目標」へと役割を変えたとき、人々がその指標を直接最適化しに行くため、指標が表す現象との対応関係が崩れる、という構造です。

例を挙げます。

「論文の引用数」は学術的影響力の指標として有用だったが、評価指標化された途端、自己引用・引用カルテル・サラミ投稿が増え、引用数が学術的影響力を表さなくなった
「コールセンターの平均通話時間」は効率の指標だったが、目標化された途端、未解決のまま電話を切る行為が増え、通話時間が効率を表さなくなった
「公立学校のテストスコア」は教育成果の指標だったが、目標化された途端、テスト対策に特化した授業が増え、スコアが本来の教育成果を表さなくなった

Goodhart 現象は指標と現象の乖離として現れます。指標は順調に改善しているのに、それが表すはずだった現象は悪化している、または変化していない。

4.2 Campbell の法則と組み合わせて見る

社会科学では、心理学者 Donald T. Campbell（1976）が同種の観察を残しています。

The more any quantitative social indicator is used for social decision-making, the more subject it will be to corruption pressures and the more apt it will be to distort and corrupt the social processes it is intended to monitor.

訳すと「定量的な社会指標が意思決定に使われるほど、それは腐敗圧力を受け、もともと観察するはずだった社会的プロセスを歪める」。

Campbell の指摘で重要なのは「腐敗圧力」という言葉です。指標化された数値には、関係者を指標を操作する方向に動かす圧力が自動的に発生します。これは個人の倫理の問題ではなく、構造的な圧力です。

A社の文脈で言えば、「歩留り95%以上を達成した工程に月3万円の手当」を導入した瞬間、熟練工に「歩留りの定義をぎりぎり95%に届くように調整する」という腐敗圧力が発生します。本人の意図とは関係なく、定義の解釈に裁量の余地があれば、その裁量は指標達成の方向に流れる。

4.3 KPI を増やすことが解決にならない理由

「単一指標が歪むなら、複数指標にすれば良い」というのが §3.1 の多指標化の論理でしたが、それが万能薬ではない理由を3つ挙げます。

理由①：人間の認知容量の制約

Miller’s Law（7±2）と Sweller の認知負荷理論を引くまでもなく、人間が同時に処理できる目標数には限界があります。10個の KPI を提示されても、現場は事実上「上司が一番見ている1〜2個」だけを最適化します。残りは「形だけ報告する」項目になります。指標数を増やしても、実質的な行動誘導指標は3つ前後を超えません。

理由②：相互牽制の崩壊

複数指標を設計する側は「指標Aと指標Bは互いに歪みを牽制する」と想定しますが、現場の側は「Aだけを優先しても、評価者は最終的に売上を見るから問題ない」と察します。指標間の優先順位が暗黙のうちに固定されると、牽制関係は崩壊します。これが起きるのは、評価者自身（経営者）が「結局、何を最重要だと考えているか」を本人ですら明確化していないケースが大半です。

理由③：目的関数の不在

KPI を増やすことは、目的関数（最大化すべき究極の目標）の代替にならない。むしろ目的関数を曖昧にしたまま KPI を増やすことは、組織全体を「KPI 集合に最適化する官僚的な機関」に変えるだけです。

ここで重要なのが、目的関数と制約を明示的に分離するという発想です。

4.4 目的関数と制約——最小指標セットの設計原則

組織のインセンティブ設計を、最適化問題として書き下すとこうなります。

maximize    f(目的関数)
subject to  g_1(法令) ≦ 上限
            g_2(セキュリティ) ≦ 上限
            g_3(品質) ≧ 下限
            g_4(財務制約) ≦ 上限
            ...

ここで重要なのは、目的関数 f は1つだけにする、ということです。「売上を最大化したい、利益も最大化したい、顧客満足も最大化したい、社員幸福度も最大化したい」というのは、最適化問題として成立しません（多目的最適化は、各目的のウェイトを決める時点で1つの統合目的関数に帰着するため）。

目的関数を1つに絞った上で、それ以外の重要な要素は制約として扱う。制約は「下限・上限を満たせばよく、最大化の対象ではない」項目です。

A社の例で書き下すと、次のようになります。

maximize    営業利益額（年次）
subject to  クレーム発生件数 ≦ 月10件以内
            主要顧客の継続契約 ≧ 5社のうち4社以上
            労働基準法・安全基準を100%遵守
            キャッシュ・コンバージョン・サイクル ≦ 45日
            年間離職者数 ≦ 2名以内

この書き方をすると、最小指標セットの設計原則が見えてきます。

目的関数を測る指標は1つだけ強くインセンティブと結びつける（A社なら営業利益額）
制約条件を測る指標は「達成・未達」の二値で扱い、未達の場合のみ強いペナルティを与える（クレーム月10件超で減点等）
目的関数の代理指標（先行指標）として、目的関数に確実に効くものを2〜3個併設する（A社なら稼働率・粗利率）

これが「最小の指標セットで行動を誘導する」設計原則の核です。指標を増やすのではなく、指標の役割を「目的関数の最大化」と「制約条件の遵守」に明確に分けることが、Goodhart 対策の本質です。

4.5 Goodhart 対策の4原則

総合すると、Goodhart の罠を回避するための運用原則は次の4つに集約できます。

原則①：指標は変動させる 同じ指標を3年以上連続で使わない。組織が「この指標を最適化することに最適化」するのを防ぐため、定期的に指標の組合せを見直す。

原則②：定性的判断を組み込む すべての指標を二値化・スコア化せず、評価面談で「具体的にどう貢献したか」を必ず言語化する。Goodhart 化しにくい「定性的フィードバック」を動機づけ層として独立に設計する（§7 のライフサイクル設計で詳述）。

原則③：指標達成のプロセスを観察する 結果指標だけでなく、「どのように達成したか」を観察する。サンプル監査・現場立会・顧客フィードバックなどの非数値的情報を、評価判断に常時混ぜる。

原則④：腐敗圧力を予想して設計する 新指標を導入する前に「この指標を最大化しようとする人が、悪意なく何をするか」を想像する。導入後の腐敗圧力を事前に予想して防御策を組み込む。たとえば歩留り指標を入れるなら、歩留り定義の解釈余地を事前に潰す、定義を満たさない不良品の処理ルートも合わせて設計する、など。

§3.4 のA社制度骨格に、Goodhart 対策の4原則を上書きすると、骨格は「指標一覧」から「目的関数・制約・先行指標・定性面談」の四層構造へ進化します。これを §6 で完成形として提示します。

5. ソーティング効果と機能別リスク設計

5.1 Lazear（2000）の出来高制研究——人材構成が変わる

ここまでは「評価制度が既存の従業員の行動をどう変えるか」を議論してきました。ところが、評価制度が組織に及ぼす効果はそれだけではありません。誰を引き寄せ、誰を追い出すかという人材構成の変化が、多くの場合より大きな効果を持ちます。これをソーティング効果と呼びます。

この現象を最も鮮やかに示したのが、Edward Lazear（2000）の研究です。

サフォーク・グラス社という米国の自動車用ガラスを製造する企業が、生産現場の報酬制度を時給制から出来高制（取り付け1枚あたりの報酬）に切り替えました。Lazear が前後のデータを分析したところ、生産性が44%向上しました。

ここまでなら「成果報酬が効いた」で終わるのですが、Lazear はこの44%の改善を2つの要因に分解しました。

既存社員の行動変化（incentive effect）：報酬が成果連動になり、既存社員が努力量を増やした効果 → 約22%
人材構成の変化（sorting effect）：高能力者が辞めずに残り・引き寄せられ、低能力者が離脱した効果 → 約22%

つまり、生産性向上の約半分は、既存社員の頑張りではなく「誰が会社に残るか」が変わったことによるものでした。

この発見が組織設計に与える示唆は深いものです。インセンティブ設計は、現職者の行動を変える「動機づけ装置」であると同時に、「どんな人材が集まり、どんな人材が去るか」を決める選別装置でもある。後者の効果は、特に長期で見ると前者を上回ることが少なくありません。

5.2 逆選択のメカニズム

ソーティング効果は良い方向だけに働くわけではありません。インセンティブの強度を上げると、逆選択が起きることもあります。

強いインセンティブ（高い業績連動・コミッション重視・成果主義）は、次のような特性を持つ人材を引き寄せる傾向があります。

リスク許容度が高い人：報酬の変動を許容できる
自己効力感が高い人：「自分は成果を出せる」と信じている
短期志向の人：長期的な関係構築より目先の数字を選ぶ
競争志向の人：他者との比較で自己評価する

逆に、次のような特性を持つ人材は離脱しやすくなります。

リスク回避型の人：安定した報酬を望む
チーム志向の人：個人成績で評価される環境を嫌う
長期志向の人：5年後10年後の評価を重視する

ここで重要なのは、組織のどの機能を担うかによって望ましい人材特性が異なるという事実です。

営業機能：短期で成果が出やすく、競争志向・リスク許容度の高い人材が向く。強いインセンティブが有効。

品質管理機能：失敗が許容されない領域。リスク回避型・慎重・長期志向の人材が向く。強いインセンティブは逆効果（リスクを取る方向に動機づけてしまう）。

R&D（研究開発）機能：成果が出るまで長期。失敗を許容できる文化が必要。探索的な人材（既知の枠を外せる）が向く。短期のインセンティブはむしろ阻害要因。

オペレーション（製造）機能：安定性・正確性が最優先。規律重視の人材が向く。強いインセンティブより、ベース給と地道な熟練手当の組合せが向く。

これを機能別リスクポートフォリオと呼びます。

5.3 機能別リスクポートフォリオの設計

組織全体の人材構成は、機能ごとの最適リスク選好を意図的に混ぜる「ポートフォリオ」として設計するのが理論的に正しいアプローチです。

A社（金属加工業22名）の機能ごとに整理してみます。

機能	望ましいリスク選好	適合する報酬構造	想定される人材像
営業（兼務役員1名）	リスク許容・短期志向	業績連動30%・固定70%	顧客開拓を楽しめる、数字に強い
工場長（1名）	バランス型	固定85%・年次裁量15%	現場と経営の翻訳ができる
熟練工（2名）	リスク回避・長期志向	固定90%・指導手当10%	技能の蓄積・伝承に意義を見出す
若手工員（数名）	学習志向	固定95%・技能習得手当5%	成長機会を重視
品質管理（兼務）	リスク回避	固定100%（業績連動なし）	不良の早期発見に集中

ここで重要な原則を3つ挙げます。

原則①：機能ごとに固定給と業績連動の比率を変える

営業は業績連動を厚く、製造は固定給を厚く。これは「不公平」ではなく、機能の性質に応じた合理的な設計です。製造現場に強い業績連動を入れると、品質を犠牲にしてでも生産量を上げる動機が発生します。これは Goodhart 現象を機能設計レベルで誘発する典型です。

原則②：機能間異動の経路を残す

「営業 → 工場長への昇格」「若手工員 → 熟練工」「製造 → 品質管理」など、機能間異動が可能な構造にしておく。固定化したカーストにすると、§2.3 で扱った「公平感」が崩れ、最後通牒ゲームの拒否反応を組織内で生みます。

原則③：共通基盤（ベース給・福利厚生）を手厚くする

機能別の差異を許容してもらうための前提条件として、全員に共通する基盤を手厚く保つ。A社なら全社員に共通の最低保障額・健康診断・退職金制度を整備する。基盤が薄いのに機能別の差異を設けると、底辺との距離が際立って公平感が破綻します。

5.4 公平感を支える3条件（再掲）

§2.3 で予告した「機能別差異が受け入れられる3条件」を、ソーティング効果の文脈で整理し直しておきます。

条件①：差異の論理が透明かつ全員に理解可能

A社で営業役員に業績連動30%、製造工に5%しか業績連動を付けない場合、その理由が全員に説明可能でなければなりません。「営業は受注の変動が大きく、月によって貢献度が大きく変動するから連動性を高める」「製造は品質を最優先するため、業績連動を弱める」——この説明が経営者から熟練工まで全員に共有されていれば、差異は受け入れられます。

条件②：全員共通の基盤が手厚い

A社の場合、ベース給の最低水準・社会保険完備・年次健康診断・有給取得率・育休制度——これらを全社員に等しく保証する。共通基盤が薄いと、差異が「あの人だけ得している」と認識されます。

条件③：機能間異動が原理的に可能

「自分も望めば営業に挑戦できる」「熟練工になれば指導手当が付く」という移動経路が見えていることが大事です。閉ざされたカーストは公平感を破壊します。

不満の本質は「差異がある」ことではなく「差異が恣意的に見える」ことです。3条件は、差異を非恣意的にするための装置です。

5.5 A社で起きうるソーティングの未来予測

これらを踏まえて、A社が今後3年で起きうるソーティング効果を予測してみます。

シナリオA：何もしない場合

現状の評価制度（実質的に経営者の裁量だけ）を維持すると、若手の定着率は引き続き低水準（過去3年で4名退職）です。退職する若手は「成長機会が見えない・評価軸が不透明」を理由に挙げるでしょう。一方、熟練工2名は変わらず残る（彼らは安定志向・長期志向）。年齢構成はさらに高齢化し、5年後には事業継続そのものが危ぶまれます。

シナリオB：営業に強いインセンティブを入れる場合

営業に成果報酬30%を入れると、現職の営業役員のモチベーションは上がる（incentive effect）。同時に、3年スパンで見れば「短期成果志向の営業」が外部から引き寄せられる可能性がある（sorting effect）。ただし兼務役員1名の現状では、即座の人材流入は限定的。むしろ既存の役員が「サンドバッギング」を始めるリスクを管理する必要があります（§2.2）。

シナリオC：若手の技能習得を評価軸に組み込む場合

担当可能工程数を月次手当に連動させる（§7 で詳述）と、既存若手の習得意欲が上がる（incentive effect）。同時に、「成長環境がある工場」として求人に書けるようになり、学習志向の若手が応募してくる可能性がある（sorting effect）。これがA社の人材問題を中長期で解く鍵になります。

中小企業の評価制度設計は、一見「現職者の動機づけ」だけが目的に見えますが、3〜5年のスパンで見れば人材プールの質を変える長期の経営戦略でもあります。経営者にこの視点を提示できるかどうかが、診断士の付加価値の分水嶺です。インセンティブは戦術ではなく経営戦略の中核に位置づける——この一段の認識転換が、制度設計の質を決めます。

6. 事例の統合——A社における全制度設計

6.1 事例設定（再掲）

ここまでの理論を統合して、A社（金属加工業・従業員22名・年商2億円・主力顧客47%集中・熟練工2名勤続20年超・営業利益率1.8%）の全制度設計を組み立てます。

経営者からの相談は当初「営業に成果報酬を入れたい。営業は兼務役員1名だが、最近受注が減っている。やる気を出させたい」というものでした。

6.2 初回ヒアリングで明らかになった問題

ヒアリングを進めるうちに、評価制度の問題は営業だけでなく組織全体に及んでいることが分かりました。

営業役員：報酬は固定給のみ。年次ボーナスも社長の裁量で曖昧。短期売上を上げる動機がない一方、長期顧客との関係維持には熱心。
工場長：固定給のみ。評価軸が不明。経営者からの「もっと現場を回せ」という指示と、現場からの「無理な受注が来る」という訴えの板挟み。
熟練工2名：固定給と長年の経験への暗黙の手当（基本給が他より高い）。指導は「気が向いたら」やる程度。若手が辞めても「最近の若い者は」で終わる。
若手工員：固定給と勤続による昇給のみ。技能習得への報酬連動はゼロ。「ここで何年いれば一人前になれるか」が見えない。

つまり、A社全体が「評価制度がない」状態に近く、すべての動機づけが経営者の気分に依存している構造でした。

このとき、経営者の最初の要望「営業に成果報酬を入れる」だけに応えると、組織全体のバランスが崩れます。営業だけ強いインセンティブを入れた瞬間、製造との公平感が破綻し（最後通牒ゲーム）、機能別ポートフォリオの観点からも逆選択が起きます。

6.3 設計の3段階

A社に提案した制度設計は、3段階に分けて実装する形にしました。

フェーズ1（〜3ヶ月）：制度の言語化と共通基盤の整備

最初の3ヶ月では、報酬構造を変えるのではなく、現在の暗黙ルールを言語化することに集中します。

全社員の評価基準を明文化（評価面談を年2回・上司と本人の双方が記入する形式）
ベース給・住宅手当・通勤費・健康診断・退職金制度を全社員共通の規程として整備
経営者から全社員へ「来年から評価制度を変える」という予告（参照点の事前操作）

なぜいきなり制度を変えないか。プロスペクト理論の参照点依存（§2.1）が示すように、現状の暗黙の参照点を急激に変えると、人は変化を「損失」として知覚します。先に「変わる予告」を出して参照点を慣らし、共通基盤を強化することで「これから差異を入れても公平」と感じられる土台を作るのが鉄則です。

1-1 の価値創造システムで扱った「統治」の変更が、まさにここに対応します。報酬構造を変える前に、判断ルールの分散と権限移譲を進めることで、新しい評価制度を運用する受け皿が組織内にできます。

フェーズ2（4〜12ヶ月）：機能別の差異化と多指標化

共通基盤が固まったところで、機能別のインセンティブ構造を導入します。§5 の機能別リスクポートフォリオに沿って、次のような設計です。

機能	固定給割合	業績連動割合	連動する指標	評価サイクル
営業役員	70%	30%	粗利額（年）・回収サイト・継続率・新規受注件数	半期
工場長	85%	15%	営業利益率（年）・納期遵守率・若手独立工程数	半期
熟練工	90%	10%	担当工程歩留り・指導工程数・標準化への寄与	年次
若手工員	95%	5%	担当可能工程数・歩留り	月次（手当形式）
品質管理（兼務）	100%	0%（特別手当のみ）	クレーム月10件未満達成で +1万円	月次

このとき、各指標は §4.4 の「目的関数・制約・先行指標」の三層構造に当てはめています。

目的関数（年次）：営業利益額（経営者と工場長・営業役員に共通）
制約条件（月次・二値）：クレーム件数・労働基準法遵守・離職者数
先行指標（月次〜半期）：粗利率・稼働率・納期遵守率・担当可能工程数

目的関数を1つに絞り、それ以外を制約と先行指標に分解する。これが Goodhart 対策の中核設計です。

フェーズ3（13〜24ヶ月）：監査・裁量・終了設計の精緻化

最初の1年を運用したら、§3 の監査・裁量と §7 のライフサイクル設計を本格的に組み込みます。

監査：顧客アンケート年2回・サンプル監査月1件・経営者の現場立会月1回
裁量：年俸の15〜30%を経営者裁量、ただし「裁量理由を年次評価面談で本人に説明する」というルールを必須化
終了設計：すべてのインセンティブ手当に「条件達成または2年経過で見直し」という終了規定を最初から明示（§7 で詳述）

6.4 営業評価の具体設計——5-2-2 の問いに直接答える

5-2-2 が問うたのは「営業が短期売上で評価され、返品・クレームが増加。評価指標を、売上だけでなく粗利・回収・品質・継続（LTV）に広げ、ゲーム化を抑える監査と心理的安全性を守る運用」です。これにA社の文脈で具体的に答えます。

営業役員（兼務）の半期評価シート（案）：

指標カテゴリ	指標	配点	算定方法
目的関数（粗利）	半期粗利額	40点	前年同期比 ±10%で線形配点
制約（品質）	返品・クレーム件数	0/-10点	月3件超で-10点（減点のみ）
制約（回収）	平均回収サイト	0/-10点	60日超で-10点（減点のみ）
先行指標	新規顧客との内示件数	20点	半期4件以上で満点、ゼロで0点
先行指標	主要顧客との関係スコア（年2回アンケート）	20点	5社平均で配点
定性評価（裁量）	経営者面談での評価	20点	裁量配点

合計100点満点で、半期ボーナスの算定式に組み込みます。注目すべき点は次の3つです。

①目的関数を「粗利額」にしている

「売上」ではなく「粗利」を目的関数に置くことで、値引き乱発の Goodhart 化を防ぎます。粗利率ではなく粗利額にしているのは、案件規模を縮小して粗利率だけ上げる方向への歪みを防ぐためです（マルチタスクの相互牽制）。

②品質・回収は「制約」として減点のみ

クレーム件数や回収サイトを加点要素にすると、現場が「クレーム対応に時間を取られて新規開拓が止まる」「回収を厳しくしすぎて顧客と揉める」という方向に動きます。これらは達成すべき下限・上限を超えた場合にペナルティとして扱い、それ以上の最適化対象にはしない設計です。

③主要顧客との関係スコアを「先行指標」に

LTV は短期では測れません。代わりに「主要顧客との関係スコア」を年2回のアンケートで測定し、これを先行指標として組み込みます。アンケートは無記名（顧客側担当者の名前は明かさない）で、経営者に直接届く仕組みにします。これが §3.2 の監査機能を兼ねます。

6.5 心理的安全性を守る運用——フィードバック面談の設計

5-2-2 はもうひとつ「心理的安全性を守る運用」を問うています。これは Edmondson（1999, 2018）の心理的安全性概念をインセンティブ運用に組み込む話です。

具体策として、半期評価面談を次のように設計します。

面談1（中間レビュー）：月3ヶ月目 – 場所：経営者室ではなく、近所のカフェ（環境を変えることで権威勾配を緩める） – 内容：目標達成状況の確認・障害要因のヒアリング・必要な支援の確認 – 重要点：評価が「期末」だけでないことを身体化する。期末の一発勝負ではなく、途中で軌道修正する機会を制度化する

面談2（期末評価）：半期末 – 場所：経営者室 – 内容：定量指標のスコアと裁量配点の説明・本人の自己評価との突合・次期目標の合意 – 重要点：裁量配点の理由を必ず言語化する。「なぜこの点数にしたか」を本人に説明できないなら、その配点は使ってはいけない（§3.3 の裁量の三条件）

面談3（フォローアップ）：期末から1ヶ月後 – 場所：現場 – 内容：評価結果に対する本人の感情の確認・次期へのモチベーション確認 – 重要点：プロスペクト理論の損失回避が示すように、未達評価は強い心理的インパクトを残します。期末から1ヶ月置いて、本人が「数字」を超えて「自分の役割」を語れる状態に戻っているかを確認する

この3段階の面談設計が、心理的安全性の運用上の支柱になります。1回の評価面談だけで済ますと、評価=判決という構造になり、エージェントは防衛的になります。3段階に分散することで、「評価は対話の一部」という位置づけに変わります。

7. ライフサイクル設計——評価頻度と終了設計の理論

7.1 評価頻度と双曲割引——半減期から逆算する

ここまでで「何を測るか」「どう測るか」「誰に差を付けるか」を扱いました。残る大きな論点が「いつ・どのくらいの頻度で・いつ終えるか」です。

ここで決定的に重要なのが、Loewenstein & Prelec（1992）の双曲割引（Hyperbolic Discounting）です。

定義から入ります。

将来の報酬の主観的価値は、時間と共に急激に低下する。指数割引（V(t) = V0 × δ^t）と異なり、近接した時点間では割引率が急峻になる。

伝統的な経済学では、将来の報酬を一定の割引率（指数割引）で割り引くと仮定します。これだと「今日の100円」と「1年後の110円」を比較したときの選好が、「10年後の100円」と「11年後の110円」を比較したときの選好と論理的に整合します（どちらも「1年待てば10%上乗せ」の比較）。

ところが実証実験では、人は次のように振る舞います。

「今すぐ1000円」と「1週間後に1100円」では、前者を選ぶ人が多い
「6週間後に1000円」と「7週間後に1100円」では、後者を選ぶ人が多い

同じ「1週間待てば10%上乗せ」の比較なのに、近い未来か遠い未来かで選好が逆転する。これを説明するのが、β-δモデル（quasi-hyperbolic discounting; Laibson, 1997）です。

数式で書くと、

V(t) = V0                  (t = 0)
V(t) = β × V0 × δ^t        (t ≥ 1)

ここで β（0 < β < 1）が「現在バイアス」を表します。「今すぐ」と「1期間後」の間で大きな割引が発生し、それ以降は緩やかな割引になる。

7.2 動機づけの「半減期」

実務的含意は重大です。年末ボーナスの動機づけ効果は、月次フィードバックの数分の1です。

A社の営業役員に「半期末のボーナスを上げる」と言っても、3ヶ月後・6ヶ月後の動機づけ効果は、現在バイアスにより指数関数的に減衰します。一方、月次の小さなフィードバック（先月の貢献を翌月初に言語化して伝える）は、近接した時点での評価なので強い動機づけ力を持ちます。

ところが——ここで Goodhart の罠との衝突が起きます。高頻度評価は動機づけ力を上げるが、Goodhart 化（指標のゲーミング）を加速する。月次で歩留り率を評価すれば、月次で歩留り定義の操作が起きる。週次で評価すれば、週次でデータ改ざんの誘惑が高まる。

ここから、Goodhart と双曲割引の最適な解決策が見えてきます。

7.3 二層構造——動機づけ層と報酬決定層の分離

理論的に整合する解は、次の二層構造です。

層1：動機づけフィードバック（高頻度・定性的・ゲーム困難）

頻度：日次〜週次
形式：定性的（数値化しない）
内容：具体的な貢献の言語化、改善点の指摘、対話
ゲーム困難性：定性的・対話的なので、特定指標を最適化する形でゲーム化しにくい
報酬連動：なし

層2：報酬決定（低頻度・多指標・ゲーム困難）

頻度：半期〜年次
形式：定量的（数値で算定）
内容：複数指標の組合せ・制約条件・裁量配点
ゲーム困難性：複数指標の相互牽制と裁量の二重監査
報酬連動：あり

この二層構造の優れている点は、双曲割引が要求する「高頻度の動機づけ」を定性的フィードバックで満たし、Goodhart が要求する「低頻度の報酬決定」を定量指標で満たすことで、両者のトレードオフを解消できることです。

トヨタの現場マネジメントが歴史的に強い理由のひとつは、この二層構造を実装していることです。日次の現場歩き・上司から部下への定性的フィードバック（層1）と、年次の昇給・賞与評価（層2）が分離されている。日々の動機づけは現場の対話で満たされ、年次の報酬決定は別の判断機構で行われる。

7.4 A社における二層実装

A社にこの二層構造を当てはめると、次のようになります。

層1（高頻度・定性）

朝礼での前日振り返り（毎日5分）：工場長が前日の良かった点を1つ、改善点を1つ、具体的に言語化
週次の1on1（営業役員・工場長と経営者、各15分）：今週の動きと来週の見通しを対話
月次の感謝メール（経営者から全社員へ）：「先月、○○さんが△△をやってくれたおかげで」という具体的言及

層2（低頻度・定量）

半期評価（営業役員・工場長）：§6.4 の評価シートで算定
年次評価（熟練工・若手工員）：§7.5 で詳述する技能習得スコア・歩留り評価
業績連動賞与：半期・年次の算定式に従って自動算定

特に重要なのは、層1ではお金の話を一切しないことです。日次の振り返り・週次の1on1で「これを達成すれば月給が上がる」という話を混ぜると、層1も Goodhart 化のリスクを背負います。層1は純粋に「あなたの貢献を見ている」という承認の場として保たれるべきです。

7.5 心理的契約と終了設計——Rousseau の理論を実装に落とす

ライフサイクル設計のもうひとつの軸が「いつ終わるか」です。インセンティブ制度は永遠に続くわけではありません。条件達成・状況変化・経営判断によって、いずれ終了します。終了の設計を最初に組み込んでいないと、終了の瞬間に心理的契約違反が発生します。

心理的契約理論（Rousseau, 1989）の定義：

明文化されていない雇用上の暗黙の期待と義務の相互認識。法的契約に対して、暗黙の信念・約束として両者の頭の中にある「契約」。

明示的契約（書面化された雇用契約）と異なり、心理的契約は「頑張れば報われる」「この制度は続く」「会社は私を見捨てない」といった暗黙の期待を含みます。これが行動の前提を形成します。

A社で若手工員に「担当可能工程数に応じて月手当を出す」と告げ、3年運用した後に「今期から制度を見直す」と言って手当を撤去するとどうなるか。

明示的契約上：問題ない。法的拘束力のある契約ではない。 心理的契約上：違反。若手は「6工程まで習得したのに、手当がなくなるなら、なぜ努力したのか」と感じます。

法律的には何の問題もなくても、心理的契約違反として処理されると、信頼の損傷だけが残ります。明示的契約と違って訴求手段がないため、感情の負債だけが組織に蓄積する。

さらに悪いことに、努力の投入が「期待報酬を前提とした意思決定」であったため、期待喪失は埋没費用化し、徒労感に転化します。「3年間の努力は何のためだったのか」という問いが残り、組織との心理的距離が広がります。

7.6 良い終了設計の4原則

これを避けるための終了設計の4原則を提示します。

原則①：起動時に終了条件を明示する

新インセンティブを導入する際、最初に「いつ・どんな条件で終わるか」を明示します。

A社の例：「担当可能工程数手当は、全工程習得（ジェネラリスト認定）達成または導入から3年経過で見直します。見直しの結果、別形態の手当へ転換するか終了するかを、その時点で本人と協議します」

終了条件が起動時に明示されていれば、達成時の終了は「成功完了」として処理されます。徒労感ではなく達成感になる。

原則②：崖（cliff）でなくテーパー（taper）で終わらせる

ある日突然「来月から手当を廃止します」では、心理的契約違反の典型です。代わりに、6〜12ヶ月の段階的縮小（テーパー）を入れる。

A社の例：「担当可能工程数手当を廃止する場合、廃止月から12ヶ月かけて毎月10%ずつ縮小し、13ヶ月目にゼロとする」

喪失感は変化速度に比例します。テーパーで緩めれば、変化を「予測可能なプロセス」として受け入れやすくなります。

原則③：理由を語る

なぜこの制度を終わらせるのか、その理由を観察事実と整合する形で伝える。

A社の例：「担当可能工程数手当は、本制度導入時には『工程の標準化と若手の独立を促す』ことが目的でした。3年経過し、全工程の標準化が完了し、若手の平均独立工程数も目標を超えました。当初の目的は達成されたので、次のフェーズである『工程改善提案』を促す新制度に切り替えます」

説明が観察事実と整合していれば、聴き手は「期待の更新」が可能です。フェードアウト（説明なく消える）は推測コストを生み、「大切にされていない」という解釈を残します。

原則④：非金銭的承認への転換

金銭インセンティブが終わるとき、それを役割の格上げ・組織内地位の認知といった非金銭的承認に転換する。

A社の例：「担当可能工程数手当を廃止する代わりに、全工程習得者を『シニア・テクニシャン』として組織図に明示し、新人OJTのリーダーシップを正式委任します」

ただし注意点があります。文脈整合性が前提です。「お金は出せないけど、肩書きで報いる」と見透かされると逆効果になります。役割の格上げが組織にとっても本人にとっても実質的な意味を持っている場合に限り、この転換は機能します。

7.7 ライフサイクル設計の総まとめ

§7 で扱った内容を整理します。

評価頻度：双曲割引により、動機づけの半減期は短い。高頻度フィードバックが本質
二層構造：動機づけ層（高頻度・定性）と報酬決定層（低頻度・定量）を分離
心理的契約：明示的契約を超えた暗黙の期待が組織を動かしている
終了設計4原則：①起動時に終了条件を明示、②テーパーで終わらせる、③理由を語る、④非金銭的承認への転換

これらは「制度を設計するときに考えるべき時間軸」の理論です。制度の入口（設計時）と出口（終了時）の両方を設計に含めることで、心理的契約違反を予防できます。

シリーズの改善活動の持続化で扱った「過剰管理を避けながら改善を持続させる」設計と本質的に同型の問題です。あちらは改善活動、こちらは評価制度ですが、いずれも「短期の動機づけと長期の歪み回避」のトレードオフ構造に向き合うものです。

8. まとめ——「正しい評価制度」が現場を壊さないために

ここまでの内容を1段下げて、新米診断士が現場で使える形に凝縮します。

8.1 評価制度設計の8原則

①エージェンシー理論の前提を疑う：人は契約された通りには動かない。マルチタスク状況では、測定可能な指標への強いインセンティブはむしろ有害なことがある。

②行動経済学の枠で人を見る：参照点依存・損失回避・公平感・クラウディング・アウト。合理的経済人モデルは現場には存在しない。

③多指標化は万能薬ではない：人間の認知容量は7±2。実務的指標は3〜5に絞る。それ以上は形骸化する。

④目的関数と制約を明確に分離する：最大化する目的関数は1つだけ。それ以外は「下限・上限」を満たすべき制約として扱う。

⑤Goodhart の法則を予想して設計する：指標を導入する前に「この指標を最適化する人が何をするか」を想像し、腐敗圧力への防御策を組み込む。

⑥ソーティング効果を視野に入れる：インセンティブは現職者を変えるだけでなく、誰を引き寄せ誰を追い出すかも決める。機能別リスクポートフォリオで設計する。

⑦動機づけ層と報酬決定層を分離する：高頻度・定性的なフィードバック（層1）と、低頻度・定量的な報酬決定（層2）を独立に設計する。

⑧終了設計を起動時に組み込む：すべてのインセンティブに「いつ・どう終わるか」を最初から明示する。テーパー終了・理由の説明・非金銭的承認への転換。

8.2 試験で学んだ知識との接続

中小企業診断士の試験では「インセンティブ設計」「成果主義」「目標管理（MBO）」「KPI」「人事評価」などをそれぞれ別の概念として学びます。本記事で扱った理論群を、試験知識との対応で整理します。

試験で学ぶ概念	背景理論	落とし穴
成果主義	エージェンシー理論	マルチタスク・サンドバッギング・クラウディング・アウト
MBO（目標管理）	期待理論・参照点依存	期初目標の操作・損失回避による低い目標設定
KPI マネジメント	多指標化・モニタリング	Goodhart 化・認知容量の限界・目的関数の不在
バランスト・スコアカード	多指標の体系化	4視点が逆に「すべての指標を最適化」の指示に堕す危険
人事評価制度	公平感・心理的契約	機能間の差異の恣意性・終了設計の不在

試験ではフレームの暗記で点数になりますが、合格後は「フレームの背後にある理論」「フレームが導入された組織で何が起きるか」を予測する力が問われます。

8.3 制度設計を依頼されたときの最初の問い

経営者から「評価制度を入れたい」と言われたとき、合格直後の診断士が最初にすべき問いは次の3つです。

問い①「目的関数は何ですか？」：最大化したい究極の目標を1つに絞れますか？
問い②「現在の暗黙の参照点は何ですか？」：従業員が「今の制度」をどう認識しているか
問い③「機能ごとに望ましいリスク選好は同じですか？」：営業・製造・品質管理で異なるはず

この3つを最初に聞かないと、いきなり「KPI を作りましょう」という議論に入って、Goodhart の罠と公平感の崩壊を一気に踏み抜きます。

9. 応用としての組織論——A社で起きた「制度以前の3つの問題」

9.1 制度設計を始める前に見えた組織風土の壁

§6 でA社の制度設計を3段階に分けて提案しました。実際の現場では、フェーズ1の「言語化と共通基盤の整備」を始める前に、診断士は3つの組織風土の壁にぶつかりました。これは制度の問題ではなく、制度を入れる前提条件の問題でした。

9.2 壁①：経営者の「裁量を手放したくない」という抵抗

最初の提案で経営者から返ってきた反応はこうでした。

「制度で決めるのは分かるが、最後は私が見ている。社長としての裁量を縛らないでほしい」

これは中小企業の制度設計で最も頻繁に出会う抵抗です。経営者が裁量を手放したくない理由を分解すると、3層に分けられます。

①経営判断としての裁量：状況変化に応じた柔軟な判断は経営の本質
②権力としての裁量：制度化されないルールは経営者の権力源
③愛情としての裁量：「頑張ったから出してあげたい」という個人的判断

①は正当な裁量で、§3.3 で扱った「効用②」（制度の硬直性を緩和する柔軟性）に対応します。②と③は本人が明確に意識していないことが多いですが、組織からは「気まぐれ」として見えています。

A社の経営者にとっての「裁量を手放したくない」気持ちは、③の比重が高いものでした。「長年頑張ってくれた熟練工に、年末に少し多めに出してあげたい」という気持ち。これ自体は美しいのですが、組織から見れば「次もそうしてくれるか分からない」「もらえる人ともらえない人の差が見えない」という不透明性として認識されます。

提案したのは、裁量を完全に消すのではなく、裁量範囲を明示することでした。

「年俸の85%は機械的算定、15%は社長裁量。裁量配点の理由は年次評価面談で本人に伝える」

この形にすると、経営者は裁量を保ちつつ、組織からは「裁量はあるが、説明がある」という認識に変わります。3つの裁量条件（§3.3）のうち、(1)範囲の明示、(2)根拠の言語化、を満たす形です。

提案後、経営者は1ヶ月考えてから「分かった、それでやってみよう」と返答しました。「裁量を手放さなくていい」という形にしたことが受け入れの鍵でした。

9.3 壁②：熟練工2名の「変えてほしくない」という抵抗

次の壁が、熟練工2名（勤続20年超）の抵抗でした。

評価制度の説明会を開いたとき、熟練工リーダーから次の発言が出ました。

「自分たちはずっとこのやり方でやってきた。点数化されるのは……正直、気分が悪い」

これも頻発する反応です。背景にあるのは、ベテラン社員にとって現状の暗黙ルールこそが参照点だという事実です（§2.1 の参照点依存）。新制度がもたらす変化は、客観的に「より公平」「より合理的」だとしても、ベテランからは「これまでの自分への評価が変わる」という損失として知覚されます。

A社で取った対応は次の3つでした。

①現状からの上振れ・下振れの試算を本人に見せる

新制度を仮に1年前の状況に当てはめたら、熟練工2名の年収はそれぞれいくらになっていたかを試算しました。結果、両名とも現状の年収から±2%以内に収まる設計にしてあったため、「制度を変えても、自分にとっての金額は実質変わらない」ことが見えました。

これがプロスペクト理論の損失回避を緩和する一手です。参照点（現状の年収）からの変化が小さければ、変化は受容されやすい。

②熟練工に「マイスター」の役割を正式委任する

§2.4 で触れたクラウディング・アウト対策と重なります。手当の話より先に、組織図上に「マイスター」（熟練技能継承者）の正式肩書きを設けました。これは熟練工2名にとっての役割の格上げであり、内発的動機（職人としての誇り）と整合する位置づけです。

熟練工リーダーは、肩書きを提示されたとき「これは……名刺に書けますか」と聞いてきました。「もちろん」と答えたとき、彼の表情が変わりました。金額ではなく、組織内地位の認知が彼にとって決定的だったことが分かった瞬間でした。

③指導の成果を「定量化」せず「定性化」する

最初の案では「指導した若手の独立可能工程数」を熟練工の評価指標に組み込んでいました。これに対して熟練工リーダーから「数字で測られると、自分のペースで教えられなくなる」という反応がありました。

これは正当な指摘です。Goodhart 化のリスクが指導という活動には特に強い。「教えた数」を最大化する方向に動機づければ、浅く広く教えるバイアスが生じます。

修正案では、指導の成果を「半期面談で工場長と本人が定性的に振り返る」形にしました。具体的には：

半期に1回、工場長が熟練工と面談（30分）
「この半期で誰にどの工程を教えたか」「どの程度独立できたと感じるか」を熟練工が語る
工場長は質問するだけで、点数化しない

層1（動機づけ層）の定性フィードバックの典型例です。これにより、指導という活動を Goodhart 化から守りつつ、組織として「指導が評価されている」というメッセージを伝えられます。

9.4 壁③：若手工員の「制度を信じられない」という疑念

最後の壁が、若手工員の不信感でした。説明会後、若手のひとり（入社2年目）が工場長に小声でこう言いました。

「先生（診断士）が来てる間はやるんでしょうけど、3ヶ月で消えますよね、こういうの」

これは制度疲労に対する先回りの心理的契約違反予防です。若手にとっての参照点は、過去3年で4名退職した経験から「ここでは新制度は定着しない」という認識。新しい制度は最初から「どうせ消える」というフィルターを通して見られます。

これに対処するために、§7.6 の終了設計4原則を逆向きに使いました。継続条件を起動時に明示する形です。

①継続条件の明示：「この担当可能工程数手当は、来年3月までは確実に維持します。それ以降の変更は、半年前に必ず予告します」
②変更経路の透明化：「もし変更する場合、なぜ変更するかを全員に説明します。理由が観察事実と整合しない場合、若手代表と再協議します」
③予告期間の保証：「いかなる変更も6ヶ月以上前に予告」という条文を運用ルールに明文化

これらを書面化し、若手全員に渡しました。「制度の予告ルール」という1枚の紙です。

3ヶ月後、若手の表情に変化がありました。月次の手当が実際に支給され、その算定根拠が伝えられた回が3回続いた時点で、「あ、本当にやるんですね」という発言が出始めました。

心理的契約は、約束を3回連続で守った時点で初めて成立します。1回や2回では「たまたま」と認識される。3回続けることで参照点が更新され、「この制度は信じられる」という新しい暗黙ルールが組織内に生まれます。

9.5 制度の前に風土——順序の重要性

A社の事例で見えた3つの壁は、すべて「制度を入れる前提条件」に関わるものでした。診断士として制度設計を依頼されたとき、最初に着手すべきは制度そのものではなく、制度が機能する組織風土の整備です。

具体的な順序は次のようになります。

[1] 経営者の裁量についての対話 → 裁量範囲の合意
        ↓
[2] ベテラン社員の参照点の確認 → 損失回避の緩和設計
        ↓
[3] 若手の信頼回復の予告 → 継続条件の明示と書面化
        ↓
[4] 共通基盤の整備（ベース給・福利厚生・規程の明文化）
        ↓
[5] 機能別の差異化（インセンティブ構造の差異）
        ↓
[6] 監査・裁量・終了設計の精緻化

[1]〜[3] が組織風土の整備、[4]〜[6] が制度の設計実装です。順序を逆にすると、制度がどれだけ理論的に正しくても定着しません。

シリーズの品質データ統合性で扱った「データを集める前にデータが信じられる組織風土を作る」という発想と、本質的に同型です。あちらはデータ、こちらは評価ですが、いずれも「測定の前に測定を受け入れる風土」が必要であるという原則は共通しています。

9.6 6ヶ月後のA社——制度が動き始めた瞬間

施策開始から6ヶ月が経過したとき、A社で観察された変化を整理しておきます。

観察項目	施策前	6ヶ月後
営業役員の半期粗利額	4,200万円	4,800万円（+14%）
返品・クレーム件数（月平均）	4.2件	1.8件
平均回収サイト	52日	41日
若手の担当可能工程数（平均）	3.0工程	5.5工程
若手の離職件数（半期）	1名	0名
工場長から経営者への自発的提案件数（半期）	2件	11件
熟練工の「マイスター」名刺発注	–	2名分（本人申請）

数字の改善も重要ですが、6ヶ月後に診断士が最も注目したのは「自発的提案件数」でした。工場長が経営者に対して「来期はこうしたい」と先回りで提案するようになった。これは制度が動機づけ層（層1）と報酬決定層（層2）の二層構造で動き始めた証拠です。

数字を超えた変化として、若手のひとりがこう言ったのが印象的でした。

「ここで6工程まで覚えました。あと3工程やったら、自分も技を教える側に回れるんですよね」

3年前に「成長できない・自分の居場所がない」で退職した先輩たちが見ていなかった景色を、彼は見ていました。制度がもたらしたのは金額ではなく、自分の未来が見える地図でした。

10. 合格直後の自分へ——この記事を読み終えたあなたへ

最初の問い——「なぜ評価制度は『正しいはず』のものほど不正と局所最適を生むのか」——に戻ります。

答えは、評価制度が「正しい」か「正しくない」かの問題ではなかった。評価制度を導入する組織が「人間とはどんな存在か」を理解しているかどうかの問題でした。

人間は契約された通りに動かない（エージェンシー理論）。人間は参照点と損失回避に縛られる（プロスペクト理論）。人間は公平感を尺度として持つ（最後通牒ゲーム）。人間は内発的動機を金銭で侵食されうる（クラウディング・アウト）。人間は指標を導入された瞬間、それを最大化しに動く（Goodhart の法則）。人間は誘導される方向に集まり、相容れない方向の人材は去る（ソーティング効果）。人間は近い未来を遠い未来より重く割り引く（双曲割引）。人間は明示的契約の外側に暗黙の期待を持つ（心理的契約）。

これら8つの「人間像」を踏まえずに評価制度を設計すると、制度は「正しい」のに組織は壊れます。

Level 1（合格直後）の診断士と Level 100 の診断士は、何が違うのか。

Level 1 は「成果主義を入れましょう」と提案する。Level 100 は「成果主義を入れたとき、誰が損失と感じ、誰が公平感を失い、誰がゲームを始めるか」を予想して設計に組み込む。

Level 1 は「KPI を作りましょう」と提案する。Level 100 は「KPI が腐敗圧力を受けたときの防御策」を最初から組み込み、目的関数と制約を分離する。

Level 1 は「評価制度を変えましょう」と提案する。Level 100 は「変える前に裁量・参照点・信頼の問題を解き、変える順序を設計する」。

Level 1 は「現職者の動機づけ」を考える。Level 100 は「3年後にどんな人材が集まり、どんな人材が去るか」（ソーティング効果）を考える。

Level 1 は「制度の起動」を考える。Level 100 は「制度の終了」も最初から設計する（テーパー終了・理由の説明・非金銭的承認への転換）。

この差は、経験年数で自然に埋まりません。人間の不合理性に対する敬意を持ち続けることでしか埋まりません。「人は理屈通りに動くはずだ」という前提を捨て、人が現に動いている姿（行動経済学）と、組織が現に変容している姿（ソーティング効果）を素直に観察すること。

合格後の最初の人事評価コンサルで、あなたはきっとこの壁にぶつかります。「制度は正しいのに、組織が壊れる」「数字は良くなったのに、現場の声が険しくなる」という感覚。そのとき、この記事のことを思い出してください。

問題は制度ではなく、制度を導入する人間と組織の理解の浅さにある——そこから考え直すことで、糸口が見えてきます。

理論を学術的に学ぶのは、現場で人を傷つけないためです。評価制度は、設計を誤れば最も多くの人を傷つけうる組織装置です。だからこそ、合格後にもう一度、理論の骨格を腑に落とすまで読み込む価値があります。

それが、合格直後のあなたへの、私からの送り物です。

本記事は、中小企業診断士合格後の実務準備を目的とした「smeca-level100」シリーズの一部です。試験対策ではなく「合格後の知的再武装」として、アカデミックと実務のギャップを埋めることをコンセプトにしています。チェックポイント5-2「インセンティブ設計をエージェンシー理論と行動経済学で捉え、局所最適や不正を抑えつつ成果を出す仕組みを作れる」に対応した記事です。

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

この記事を書いた人

ろっさん

３０代会社員。
理系大学を卒業して以降、新卒からIT業界を渡り歩いてきました。
転職経験は２回。
　・中小SIerにてプログラマー
　・BtoB向けサービス事業会社にて社内開発SE
　・大手総合コンサル会社にてテクノロジーコンサルタント（見習い）
といったキャリアを歩んでいます。

人生１００年時代に向け日々精進！
知らない道を歩いたり走ったりするのが好きで、フルマラソン完走するくらいにはジョギングを続けています。

興味のあるトピック
　・資格勉強
　　（主な取得資格）
　　・中小企業診断士
　　・JDLA認定　G検定・E資格
　　・情報処理技術者試験　応用情報処理技術者、ITストラテジスト他複数
　・競技系プログラミング（Atcoder、kaggle等も含む）
　・データサイエンス、AI関連の話題
　・クイズ、謎解き系
　・読書、映画
　・ボードゲーム全般（将棋アマチュア2段程度。専ら”見る将”）