多次元の情報に基づく指標づくりの議論ってこんなかんじ(Kawada et al.の紹介)。

*この記事は簡単な数学の知識を前提とします。

大学院の同期が開発経済の授業を受けていたので、それについて雑談していたときに、どのような指標によって「その国の発展度合い(途上国支援がうまくいったか)」を測れば良いかの話題になった。

1人あたりGDPをもとにして「その国が発展した」と判断することなどは考えられるが、それだとちょっと問題がありそう。例えば、政策xを取ると経済は発展するけど健康被害が大きくなるが、もう1つの政策yを取ると経済成長は少し落ちるが健康被害は出ない、みたいな状況があるときに、1人あたりGDPを評価指標にすると健康などの側面は見落とされてしまう。経済状況だけで国としての発展度合いを測るのでは、本来望ましくない方向への成長を促進する可能性があり問題がありそうだ。

ではどうするか?

1つの方法として、「経済状況の情報」だけではなく「教育水準の情報」や「健康状態の情報」も合わせて多角的な情報を用いた評価方法を考えるのは自然である。

そこで例えば、その国の経済状況を0~1で評価した値をI、健康の状況を0~1で評価した値をH、教育への状況を0~1で評価した値をEとした上で、それらの情報から、I+H+Eのような指標を用いてその国の「発展度合い」を評価することを考える。こうすれば経済状況以外の要素も考慮しながら「発展度合い」を評価することができる。しかし、この指標では、例えば健康の値がすごく低くても(Hがとても低くても)、Iが高ければ全体としての評価は高くなってしまう。

これでは問題がありそうだ。

この記事では、Kawada et al.(2019)の内容を紹介することで、このような多次元の情報に基づく指標の作り方についてどのような議論が行われているかを紹介する。なお、Kawada et al.(2019)は修正論文であり、Herrero et al.の主張を紹介した上で反例を示し、修正案を提案している。今回はHerrero et al.の元の主張とKawada et al.による反例を紹介するところまで行う(ということで基本的にはHerrero et al.の主張を紹介するのがこの記事がメインで行うことである)。

ーーーーーーーーー

セットアップ

まずは、今回の文脈における"指標”とは何かを定式化するための準備をする。

社会を構成する人々の集合をN=\{1,2,...,n\}をする(n\geq 1で有限集合)。

評価項目の集合をK=\{1,2,...,k\}とする(k\geq 1で有限集合)。例えばK=\{I,H,E\}などであり、この場合はIncome、Health、Educationが評価項目になっている。

次に、個人iさんの評価項目jの達成度合いをy_{ij}\in [0,1]で表す。例えばy_{1,H}=0.8であるとき、1さんのHealthの達成度合い(健康状態が十分な状態であるかの度合い)は0.8ということである。y_{ij}[0,1]の要素であるから、達成度合いは0から1で測られることになる。

注意点として、ここでは具体的にどの教育水準であれば1の教育水準と見なすかなどについては議論していておらず、各項目について達成度合いが与えられた上での議論をしている。

ここで、\mathbf{y_j}=\begin{pmatrix}y_{1j}\\y_{2j}\\ \vdots \\ y_{nj}\\ \end{pmatrix}\in [0,1]^nを項目jについての達成度のベクトルを呼ぶ。

つまり、項目jに関する達成度を各個人についてまとめたのが\mathbf{y_j}である。

例えばN=\{1,2,3\}のとき、\mathbf{y_e}=\begin{pmatrix}0.9\\0.8\\0.95\\ \end{pmatrix}であれば、この社会における教育の達成度は1さんが0.92さんが0.83さんが0.95である。

このとき「社会状態」は、y=(\mathbf{y_1},\cdots,\mathbf{y_k})\in [0,1]^{nk}と定義される。つまり、各項目の各個人についての情報が全部つまった行列として社会状態という概念は定義される。このような「社会状態」全部からなる集合を\Omegaと書くことにする(つまり、\Omega=[0,1]^{nk})。

例えばN=\{1,2,3,4\}K=\{I,E,H\}の場合には、「社会状態」の1つの例は以下のようになる。以下の表以外にも「社会状態」は多く考えることができ(入っている数字が0~1であればなんでも良いので)、それら全部のあり得るパターンからなる行列の集合が\Omega(社会状態すべてからなる集合)である。



指標の定義

ここまでの準備をもとに、「指標」という概念の定義をする。今回の文脈における「指標」とは、関数P:\Omega\rightarrow \mathbb{R}のことである。

つまり、

「社会状態がーーーーのときには、社会の発展度合いは10であり、社会状態がーーーーのときには、社会の発展度合いは-2である」のように、

あり得るすべての「社会状態」に対して、ある実数を割り当てるルールが「指標」である。この定義はとても広く(およそまともな指標と呼べないものも含んでおり)、例えばどんな社会状態に対しても10を割り当てる関数も「指標」と呼ばれる。

公理

Herrero et al.は、「指標」についていくつかの「満たしていて欲しい条件(公理)」を定式化した上で、それらの公理をすべて満たす指標はこういう形式になっていなければいけない、ということを示そうとした。いまから、Herrero et al.が採用した5つの公理(指標に満たしていて欲しい条件)を1つずつ見ていく。

まずは単調性と呼ばれる性質です。

公理1:単調性
指標Pが単調性を満たすとは、任意のX,Y\in \Omegaについて、X\gg Y \Rightarrow P(X)\gt P(Y)が成り立つことである。

これはどのような性質かというと、2つの社会状態XYを考えたときに、Xの各成分がどれもYの各成分よりも厳密に大きいのであれば、指標はXに対してYよりも厳密に大きく評価するべき(厳密に高い数字を割り当てるべき)という性質である。全員の全項目が厳密に大きいならば厳密に高く評価されるという自然な要求である。

このような「この条件は欲しいよね」という条件をリストアップしていく。

公理2:項目に関する対称性
指標Pが項目に関する対称性を満たすとは、任意のX,Y\in \Omegaについて、ある全単射写像\pi: K\rightarrow Kが存在して、XYの各列を\piに従って並び変えたものになっている場合には、P(X)=P(Y)が成り立つ。

何かしらの社会状態を考えたときに、その行列の各列をどんな風に入れ替えても(1列目と3列目を入れ替えるなどしても)、その入れ替えたあとの行列に指標が割り当てる値ともとの行列に割り当てる値は変わらないということである。これはつまり、各項目を平等に扱うことを要求する条件である(もちろん、これが妥当であるかはそのとき考えている問題による)。

公理3:基準化
指標Pが基準化を満たすとは、任意の\alpha \in [0,1]についてP(\alpha \mathbf{1})=\alphaが成り立つことである。

ここで\mathbf{1}\in \Omegaはすべての成分が1の行列である。つまり各人の各項目の成分がすべて\alphaであるような社会状態は\alphaと評価されるべきという条件である。この条件は規範的に重要というよりは指標としての使い勝手の良さに関する条件である。

公理4:最小下限性
任意のX,Y\in \Omega、任意のj\in Kについて、もし行列Yj列目が0ベクトルであるならば、P(X)\geq P(Y)が成り立つ。

この条件は、例えば教育の達成ベクトルが0ベクトルであるならば(各人の教育の達成度が0であるならば)、そのような社会状態は他のどのような社会状態よりも低く評価されるということである。何かの項目が最低水準である場合には、社会状態は最低であるとして処理されることが要求している。この記事の最初に言及した、I+H+Eのような単純な足し合わせをする指標では(この場合はn=1として考えれば良い)、ある項目が0でも他の項目の値が高ければ指標の値は大きくなり得た。これに問題を感じる場合には今回の公理は望ましいものとして捉えられるだろう。

例えばI\times H\times Eのような指標を考えると
何かしらの項目が0であると他の項目がどんなによくても全体として0と評価されることになるためこの条件は満たされることになる。ただし定義から分かるように、すべての社会状態に対して10を割り当てるような定数関数になっている指標についても最小下限性は満たされる。

最後の公理はややこしいのでさらっと紹介する。

公理5:分離性
任意のX,Y\in \Omega with X,Y \gg \mathbf{0}と任意のj\in Kについて、P(X_{-j},\mathbf{x_j})\geq P(Y_{-j},\mathbf{x_j}) \Rightarrow P(X_{-j},\mathbf{y_j}) \geq P(Y_{-j},\mathbf{y_j})が成り立つ。

この公理は各項目がそれぞれに価値を持つことを要求するものである。逆に、この条件が満たされない指標では、例えば項目Aが価値を持つのは項目Bの値が大きいときのみになったりする。個人的に分かりやすい理解の仕方(数式の読み方は)、「項目jについて達成ベクトルを\mathbf{x_j}で固定しても\mathbf{y_j}で固定しても、その固定の仕方にかかわらず、j以外の項目についての情報X_jY_jの比較は変わらない*1(つまり項目jは他とは切り離すことができる
)」である。

ここまでで、まずは「社会状態」を定義をして、そのあとにそれぞれの社会状態についてある実数を割り与えるルールのことを「指標」と定義した。「指標」というだけではなんでもよくて、その関数形などはまるで特定されていないが、今考えた5つの公理を使うとその関数形がかなり特定できるとHerrero et al.は主張した。

何もないところから、どんな指標が望ましいかを決めるのは難しいが(どう考えたらいいか分からず途方に暮れそうなものだが)、「これらの条件を満たす指標はこの関数形になっている指標に限られる」という知見があると議論がかなり分かりやすくなる。このような手法はCharacterizationと呼ばれ、Herraro et al.の主張は具体的には以下の通りである。

Herraro et al.の主張


任意の指標P:\Omega \rightarrow \mathbb{R}について、以下の2つの条件は同値である。つまり、(i)が満たされるのは(ii)が満たされるときであり、またそのときに限る。

(i)Pが5つの公理を満たす。

(ii)ある関数 A:[0,1]^n\rightarrow \mathbb{R}が存在して、任意のY\in \Omegaについて、

 P(Y)=A(\mathbf{y_1})^{\frac{1}{k}}  \times \cdots \times  A(\mathbf{y_n})^{\frac{1}{k}} が成り立つ。

この主張が言っていることは、指標が上に定式化した5つの公理を全部満たすことと、その指標が
「それぞれの項目について項目ごとに集計する関数Aが存在して、その項目ごとの集計値を掛け算のような形で合わせることで全体の評価が定まる」という形式になっていることが同じことであるということである。

この主張が正しければ、5つの公理を満たして欲しいのならば、この形式の指標を使うしかないことが示されることになり、指標の設計に役立つ。

反例

ただしこの主張は実は成り立っておらず(まったく成り立っていないというより修正が必要であるというかんじ)、例えばN=\{1\}K=\{1,2\}としたときに、任意のY=(y_1,y_2)\in [0,1]^2について、P(Y)=\frac{1}{2}y_1^{\frac{2}{3}}y_2^{\frac{1}{3}}+\frac{1}{2}y_1^{\frac{1}{3}}y_2^{\frac{2}{3}}となるような指標を考えると、この指標は5つの公理を満たすが、(ii)の条件は満たさないことが示される(そのような関数Aが存在すると仮定すると矛盾が導かれる)。

Kawada et al.では他にも反例をあげつつ、ではどうしたらこの主張を正しいものに修正できるか(n=1のケースに限ってはいる)について議論している。*2

まとめ

この記事では多次元の情報に基づいた指標の設計に関する議論を紹介した。「こんなかんじのことを議論している分野があるんだ」とイメージが共有できたなら嬉しいです。

また、今回の議論は途上国の発展を測る以外にも、多次元の情報に基づいた評価指標づくりに関して広く役立つ議論だと思います。とても面白い分野なので興味がある方は参考文献の論文か、ちょっと手に入りづらいですが、河田先生の著書である「社会の『よさ』をいかに測るか」が
おすすめです(最高に面白い本なので経済学をやっている方はぜひ読んでみてください!)。

Fin.

参考文献

Herrero, C., Martínez, R., & Villar, A. (2010). Multidimensional social evaluation: an application to the measurement of human development. Review of Income and Wealth, 56(3), 483-497.

Kawada, Y., Nakamura, Y., & Otani, S. (2019). An axiomatic foundation of the multiplicative human development index. Review of Income and Wealth, 65(4), 771-784.

*1:なお、分離性の定義における、\Rightarrow\Leftrightarrowに変えても条件としては同値である。

*2:なお、先ほどのherrerroの主張への反例についてはAの方から特定化すると簡単に単調性をviolateする例を作れる気もする(そっちの方が反例になっていることがclearな気がする)。例えばAを常に1を取る定数関数にしておくなど(というかこの例から分かるように、例えば常にP(Y)=1となるPを考えれば反例になっていると思う)。こういう簡単な反例が作れることを見るとHerrerroの主張は割と壊れている気もする(修正はできる気はするけどなんで間違いに気づかなかったのはそれなりに疑問に感じる)。なおこの反例については「なんでAについてincreaingなどの条件がないんだろう。それで単調性は大丈夫なのかな?」という気づきから思いついた。