2007-07-18 ガチムチ診断チャートを開発中です
連休中に「ガチムチ診断チャート」のためのデータ整理をしておりました。ガチムチ診断チャートとはウェブアプリです。年齢・身長・体重を入力すると体型が何系であるか教えてくれる,というサービスなのです。公開日はいつものように未定です。なおガチムチとは何であるかは,1回目の調査結果でお話したとおりです。
診断チャートの開発なんですけれど,まだ標本の「欠け」を探している段階です。だれでも想像が付くと思いますが身長170cm程度,体重60~70kgの人間がいちばん多いのです。それ以外は少ないというわけで,少ない層の標本をもっと抽出して標本の歪みを修正しておかないと,診断結果の精度が悪くなってしまいます。
<画像の説明>現在,抽出している標本です。あちらこちらに欠けが生じています。
さて,「それにしても身長165cm未満の人の標本が足りないな」と思いました。集計したデータを見ると,どうも統計的に変な気がしたのです。一体,何が起きているのでしょうか。身長の度数分布表を作ってみたらすぐに分かりました。
<画像の説明>虹色業界人の身長の分布。170cmが突出しており,169cmが凹んでいることが分かります。180cmと179cmにも似たような傾向が見られます。ちょっと図の都合で分かり難くて申し訳ないのですが,164cmは頻度ゼロのため項目そのものが存在していません。
みなさん身長をサバ読みしているんですよね。まったく,パパや少女は騙せても私は騙せませんよ(ふめい)。数字を盲信すると現実とズレてしまうので,主観で補正値を設けた方が良いのかもしれませんね。