SSブログ

生命表の数学的な理解について(あなたは何歳まで生きるのか) [理数系思いつき]

唐突ですが,博士と助手の会話。

助手:博士、ずいぶんブログ更新をサボってましたが、どうされました?

博士:ふむ、1年半も空いてしまったわい。この間、公私ともにいろいろあってのう……(遠くを見る目)。でも、ようやくブログを更新する元気が出てきたわい。これからチビチビ書きためていこうと思う。

助手:それは実に結構なことです。それで今日のお題は「生命表」とのことですが、これは一体?

博士:うん、厚生労働省が毎年、国民の死亡状況に関する統計である「生命表」を発表しておるんじゃが、とある事情で生命保険の利回りを計算してみたくなってのう、この統計に注目したというわけじゃ。

助手:そうでしたか。それで「生命表」ってどういうものですか?

博士:厚生労働省のサイトを叩けばすぐに出てくるんじゃが、毎年7月頃に、前年1年間の年齢別死亡状況の統計を示すとともに、これが不変だと仮定した場合に「…歳のあなたは平均してあと何年生きられるでしょう?」を平均余命という年数で見積もるなどしたものじゃ。

助手:なるほど、それは実にありがたい統計ですね。でも、サイトをちょっとみてみたら「死亡率」「生存数」「死亡数」「定常人口」「平均余命」「平均寿命」「寿命中位数」とか、定義がゴチャゴチャしてよくわからないんですが。

博士:そうなんじゃ。我々のような自然科学の分野に身を置く者が現象を記述する場合には、必要最低限の本質的な用語定義しか行わないものじゃが、社会科学の分野では往々にしてこういうことがある。そこで今回は、厚労省の「生命表」のより本質的な部分を見極めつつ解説したいと思う。

[1] 「生命表」の本質は「死亡率」だけだ!

https://www.mhlw.go.jp/toukei/saikin/hw/life/life17/dl/life17-06.pdf

助手:上のリンクが2018年7月に公表された、2017年の「簡易生命表」の男性版ですね。早速いろんな列があって直感的によくわかりませんが^^;

博士:そうじゃろ、でも実は恐るるに足らず。「生命表」が持つ唯一の情報は左端から二番目の「死亡率」だけじゃ。それ以外の数字はすべて「死亡率」から派生的に作り出されたものじゃ。

助手:そうなんですか。それでかなりホッとしました。それでは、厚生省の「死亡率」の定義をみてみると…。

https://www.mhlw.go.jp/toukei/saikin/hw/life/life17/dl/life17-08.pdf

博士:上のリンクのいちばん上に書いてある。簡単に言うと、表のいちばん左端の「年齢」から、その1行下の「年齢」に達するまでに死亡する確率が「死亡率」というわけじゃ。例えば、表の1行目の「0.00072」という死亡率は、週齢0から週齢1に達するまでに0.072%死亡するという意味で、9行目の
「0.00191」という死亡率は、0歳から1歳に達するまでに0.191%死亡するという意味じゃ。なお、8行目と9行目は不連続になっている点に注意せよ。

助手:ということは、上の8行をつなぎあわせると出生後1年間の死亡率である「0.00191」に一致するはずですね。(1-0.00072)×(1-0.00010)×(1-0.00008)×(1-0.00006)×(1-0.00021)×(1-0.00013)×(1-0.00030)×(1-0.00032)=0.998081=1-0.001919。あれ、少し合わないや。

博士:有効数字の関係があるから、それくらいは許容範囲じゃ。ただ、考え方はわかったようじゃな。

[2] 生存時間解析の分野のハザード関数で考える

博士:以下では、死亡率がすべて年率になっていて使いやすい「生命表」の9行目以下のみ使うことにしよう。これだけみてもなかなか興味深いのう。

助手:出生直後は多少高めの死亡率ですが、その後10歳あたりまで低下し、その後はジワジワ増えていくことがわかります。直感的に違和感ないですね。

博士:95歳を超えると死亡率が0.25を上回る、すなわち1年で4人に1人以上死ぬ計算になるが、このあたりはサンプル数がかなり少なくなっており、統計的な信頼性はそれほど高くないと思われるが、計算上はこういうことになる。

助手:同じ95歳でも、健康な95歳とそうでない95歳がいるでしょうから、そのあたりも統計でわかるといいんですが。。。

博士:うむ、厚生省は死因別の死亡確率も公表しているものの、死んでから死因を分類しているだけなので、生きているときの健康状態別というわけにはいかんのう。そこはとりあえずあきらめることとして、ここではタイトルにある「あなたは何歳まで生きるのか」について深掘りすべく、生存時間解析の分野でよく使われる「ハザード関数」を導入してみよう。

助手:唐突に「生存時間解析」と言われましても。。。それって「生存時間」を「解析」する学問なんですか?

博士:そんなに身構えなくても大丈夫じゃ。何かのイベントがいつ起こるかを考えるのが「生存時間解析」だと思ってもらえばよいが、イベントとしては人の死だけでなく、機械の故障とか地震の発生とか企業の倒産とか、稀にしか起こらないが起こると元に戻れないようなイベントが馴染むかのう。いずれにしても、ここでは「ハザード関数」という時間の関数を導入するのがキモじゃ。

助手:ハザードって危険とかそういう意味ですよね。あんまりピンときませんが。

博士:う〜ん、hazardの適切な和訳を考えるのは勘弁してもらって、とにかく時刻tを引数とするハザード関数h[t]とは、時刻tまでにまだイベントが起こっていない場合に、時刻t〜t+dtの間にイベントが起こる確率がh[t]dtで与えられるような関数のことじゃ。h[t]が与えられると、時刻Tの時点でまだイベントが起こっていない確率(生存率)S[T]が以下のように美しく表されるのじゃ。


助手:ねらいは何となくわかってきました。あとは「生命表」を用いてh[t]を決めればいいわけですね。

博士:そうじゃそうじゃ。生命表における「死亡率」q[T,n]とは、時刻Tまでにまだイベントが起こっていない場合に、時刻T〜T+nの間にイベントが起こる確率なので、

となり、さらに時刻T〜T+nの間のハザード率が一定数hであるとすれば、

とq[T,n]を用いてhをtの小さい方から順に求めることができる。

助手:つまり、ハザード関数h[t]を階段状の関数として求めるわけですね。

博士:そうじゃそうじゃ。こうすれば「生命表」に載っていない中途半端な年齢における計算もできてしまうというわけじゃ。

[3] あなたは何歳まで生きるのか

助手:博士、そろそろお時間が近づいてきたようですが。

博士:そうか、それでは今日は任意の年齢に対して、何歳に死ぬかの確率分布を求めて終わることとしよう。T歳の場合に、T+n歳以上T+n+1歳未満で死亡する確率は、

となるので、例えば50、60、70、80、90歳の男性の場合はそれぞれこのようになる。長生きしてもしなくても死ぬ年齢は87歳前後のようじゃ。それを超えて90歳まで生きた場合、1年以内に死ぬ確率は15%もあるということじゃ。ただし、統計上は病気を抱えて生きながらえている人がかなり含まれていると思われるので、90歳の段階でそこそこ健康であれば15%よりもずっと小さいと思われる。

20181003.png
<続く>
nice!(0)  コメント(0) 

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

※ブログオーナーが承認したコメントのみ表示されます。

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。