さて今回は一般化線型モデル(GLM)と言われる、クラス料率を求める手法を解説していこうと思います。(他にもクラス料率を求める手法はあるのですが、今日はGLMに絞ります。)

そもそもクラス料率ってなんなの?って人はこちらの記事をどうぞ



まず、表の各クレーム単価項目の期待値を次のように書きます。

また、クラス料率には契約者間の公平性が求められるので、μの表は次のように書けるとします。


ここでβ1は業務目的の車である事によるクレーム単価への影響度合い

β2はレジャー目的の車であることによるクレーム単価への影響度合い

β3はゴールド免許である事よりもゴールド以外の免許である事でどれだけクレーム単価が大きくなるかの影響度合い

を表しています。

あと後々便利になるので次の様な書き方をしておきます。


また、関数g(x)はリンク関数と呼ばれる関数で、1番わかりやすいのはg(x)=xの時なのですが、他にもg(x)=logxなんかが使われたりします。

そして各クレーム単価は確率変数になるのでそれを次のようにおきます。

そしてその実現値(実績値)を次のようにおきます。

目標は、実現値の表から上で書いたβを推定し、それを通して期待値の表を推定することです。

ここで、Yiの従う分布も予め決めておかねばならなく、それを指数分布族と言います。

ここで最尤法によって推定したβを使って期待値の表を推定します。

今書いた一連のプロセスで期待値の表を作成する事を一般化線型モデル(GLM)と言います。

注)GLMでは一般化線型モデルとリンク関数だけ指定しておけば、期待値の表を求める事ができます。

よく使われるGLMの代表例は次の4つです。

①指数分布族が正規分布(Yi〜N(μi,σ^2))でリンク関数がg(x)=x

②指数分布族がポワソン分布(Yi〜Po(μi))でリンク関数がg(x)=logx

③指数分布族がポワソン分布(Yi〜Po(μi))でリンク関数がg(x)=x

④指数分布族がガンマ分布(Yi〜Γ(α,α/μi))でリンク関数がg(x)=logx


それでは1つずつ導出と共にμの表がどうなるのか見ていきましょう。

①指数分布族が正規分布(Yi〜N(μi,σ^2))でリンク関数がg(x)=x

リンク関数の形からμは次のように表せます。



まず、実現値からβを最尤法により推定します。

尤度関数はこんな感じ。


なので対数尤度はこう。



これを各βについて微分して、それがゼロになるのでこんな式が出てきます。



今書いたこれがβの方程式です。

ここで計算を早く済ませるコツとして、β3は次のように表せます。

これを使って全てのβを求めてμの表に代入します。

最初に例を出した表に対して具体的に計算していくとこうなります。

これで契約者間の不公平性は解消されて上司に褒められます。(元ネタわからない方はこの記事の冒頭にあるリンクの記事を見てください)

それでは次は②指数分布族がポワソン分布(Yi〜Po(μi))でリンク関数がg(x)=logxを解説していきます、と言いたいところですが、どうやら1つの記事に貼れる写真には上限があるようなので、複数の記事にまたがって続きを解説していこうと思います。

とりあえず今紹介した①のパターンが1番典型的なパターンなのでアクチュアリー試験の損保数理を受ける人は最低でもそこだけは抑えておいたほうがいいと思います。

導出の仕方さえ知っておけば残りのパターンも導出できます。

それにしても筆者にはこのGLMって手法、(実際回帰分析の一般化なので)とても汎用性が高そうな手法に見えますね、、

日常生活でこういう表を分析しようと思った時に使ってみようと思います笑

この記事の続きはこちら