Charakter

Charakter

  • 0

ダークアポカリプス エピローグの調査協力比率からベイズ推定を使って統計的に求めるキャラクター人口

Öffentlich
よくわかる3行解説
ダークアポカリプスのエピローグで出る調査協力比率から、ダークアポカリプスをプレイしたキャラクター数をベイズ推定してみた。
結果はJPは11万キャラクター強、NA&EUは10万キャラクター強。何か微妙。
統計学では仮定次第でいくらでも結論を変えられるので、統計データの解釈は前提条件の確認が最も大切。
------

ころろんなのです。

ダークアポカリプスのエピローグで、調査協力比率としてワールド毎にどちらの選択肢を選んだのかの割合が表示されていたのですね。
まとめると以下のようなデータだったのです。

調査協力比率のデータ
JPリージョン
63:37…5ワールド
64:36…13ワールド
65:35…11ワールド
66:34…3ワールド
 JP平均 64.4:35.6

NA&EUリージョン
65:35…1ワールド
66:34…2ワールド
67:33…6ワールド
68:32…19ワールド
69:31…8ワールド
 NA&EU平均 67.9:32.1

これを最初に見た時の私の感想は「へー、統計的に数値が安定するほど各ワールドに人口がいるのかー」だったのですね。あとはリージョンごとに傾向があって(言語による?)母集団の違いも見ているような気もするのです。
※NAとEUをまとめてるのは別にすると、ワールド数が少なくて統計的に不安なところがあるからなのですね。


これつまり、各ワールドに十分な人口がいて、母集団が同一とみなせるワールド同士なら、各個々人の趣味嗜好は関係なくある一つの割合に結果が収束するということなのです。
言い換えると、無限人の人口がいるなら完全に同じ結果になるのですが、実際にはそうはなっておらず多少はバラついているので、この収束度合いから統計的に人口を逆算することもできちゃうのですね。

ということで、統計学の中でもベイズ推定っていう推定手法を使って「どのくらい人口がいればこのくらいの収束度合いになるか」を統計的に求めてみるのですね。

仮定
・JPリージョン、NA&EUリージョンでそれぞれワールドの人口nを推定する
・それぞれで各ワールドの人口は等しいとする
 (つまり、JPリージョンの人口は推定したnの32倍、NA&EUは36倍になる)
・各キャラクターは平均割合の確率で、独立に選択肢を選ぶとする
・調査協力比率のデータは小数第1位で四捨五入して整数に丸めたものとする

この仮定をおけば統計的にごにょごにょして、以下のような調査協力比率のデータが与えられたときの人口の確率分布が得られてしまうのですね。

この図は、上段がJP,下段がNA&EUで、それぞれ横軸が全ワールド合計したプレイヤーの人口、縦軸が推定した確率、になっているのです。
青線が元の尤度関数で、赤線がこれを移動平均して見やすくしたものなのです。(便宜上連続関数として描いてるのですが、実際には確率質量関数になるのですね)
青線が太い線みたいになってるのは、めっちゃギザギザしてからなのですね。これは四捨五入していることを仮定した影響(のはず)なのですね。

これから最尤推定するなら、ダークアポカリプスをプレイしたキャラクタ―数は
JPは11万キャラクター強、NA&EUは10万キャラクター強
となるのです。
いつまでの期間でとった統計かはわからないのですが、他の人がやっている人口調査とかを見ると倍くらいいてもおかしくなさそうなので、なんか微妙なのですね……

まぁ、統計学なんて仮定次第でいくらで結論を変えられるのでそんなもんなのです。
逆に言うと、仮定次第でいくらでも結論を変えられるので、統計データの解釈は前提条件の確認が最も大切なのですね。
ただの数字遊びのはずが、なんか含蓄あることが言えたので満足なのです。

------
「統計的にごにょごにょして」の解説
各ワールドの比率の左側の値をxiとし、xiの標本平均をp、ワールド数をmとする。(i=1,...,m)
上で書いた仮定の下では、このxiは次のように定義される確率変数Xから得られた標本であるとみなせる。
Pr(X=k) = Σ[ l=a,b ] Pr(Y=l)
ここで、k=0,...,100, Yは二項分布Bi(n,p/100)に従う確率変数で a=ceiling(n(k-0.5)/100), b=floor(n(k+0.5)/100)である。
ceiling(m)は「m以上の最大整数」、floorは「m未満の最大整数(普通の床関数とちょっと違う)」。
このような標本xiが与えられたとき、nについての尤度関数L(n)は次のようになる。
L(n)=Π[ i=1,m ] Pr(X=Xi)
nの事前確率分布として計算を打ち切るnまでの一様分布を仮定すれば、ベイズの定理より、L(n)を正規化した関数はxiが与えられたときのnの事後確率分布である。
Kommentare (0)
Kommentar verfassen

Community-Pinnwand

Neueste Aktivitäten

Die Anzahl der anzuzeigenden Einträge kann verringert werden.
※ Aktivitäten, die Ranglisten betreffen, werden auf allen Welten geteilt.
※ Aktivitäten zur Grüdung von PvP-Teams können nicht nach Sprache gefiltert werden.
※ Aktivitäten deiner Freien Gesellschaft können nicht nach Sprache gefiltert werden.

Nach Art des Eintrags sortiert
Datenzentrum / Stammwelt
Sprache
Anzahl