2008-11-11 ガチムチを見ると興奮する数式(きかい)
ガチムチを判定する関数を作ってみました。
Public Function gachimuchi(bmi As Double) As Double Dim h1, h2, o1 As Double bmi = bmi / 50 bmi = bmi - (21.25 / 50) bmi = bmi / 0.2 h1 = 1 / (1 + Exp(-(bmi * -7.26 + 5.61))) h2 = 1 / (1 + Exp(-(bmi * 8.82 - 2.2))) o1 = 1 / (1 + Exp(-(h1 * 5.31 + h2 * 4.96 - 9.26))) gachimuchi = o1 End Function
<画像の説明>作成したガチムチ関数のBMIスペクトルです。この関数は,ある体型のガチムチの度合いを百分率で返します。ガチムチを見ると興奮する数式(きかい)なのです。オカルトかもしれませんね。
さて,どうしてこんなくだらないものを作る気になったのか,少しお話します。近々,投入予定の「ガチムチ診断チャート」のための布石なのです。ガチムチ診断チャートの構想は2006年あたりからあるのですが,作業が難航していました。今まで,ガチムチの分布関数をどうやって作ればよいのか,思い浮かばなかったのです。
私は,「ニューラルネットワークを使えば,ガチムチ関数を作れるはずだ」ということにかなり前から気づいていました。実際に試してみたらできちゃったので,手順を少しお話します。
社会現象を定式化するには
「ガチムチ関数を作る」なんて言うと,バ○っぽく感じた人がいるかもしれません。言い方次第なのです。「社会現象を観測して,その現象を定式化する作業」と言い換えてみたらどうですか。途端に高級な感じがしてきたのではないでしょうか。
どうすれば社会現象を定式化できるのでしょうか。一般的な手順は以下のようになるでしょう。
- 社会現象を観測して記録する
- 記録した情報から特定の情報を抽出する
- 抽出した情報を集計する
- 集計した情報を正規化(加工)する
- 正規化した情報を定式化する
今回のガチムチ関数は,上記のひとつでも欠けていては実現できません。私はこれまで観測から正規化までは自力でできたのですが,その先の定式化ができませんでした。ところが,11月上旬にニューラルネットワークのお勉強をしたことで,定式化の一手法をついに習得しました。
ガチムチの素,教師信号を得る
今回,近似関数を得るためにニューラルネットワークを使いました。ニューラルネットワークを誤差逆伝搬法で学習させるには,教師信号が必要です。教師信号とは入力と出力のお手本です。「学習」というのは名前の通り学習であって,お手本どおりの信号を出すことを指します。
今回は,以下の手順で教師信号を用意しました。
- データベースからガチムチと呼ばれる身長と体重の一覧を抽出する
- 身長と体重をBMIにする
- BMIを階級に分けて,各階級の出現頻度を算出する
- 出現頻度を百分率にする
- 出現頻度が全体の5%未満の階級は切り捨てる(雑音の除去)
- BMIの中間値(Median)を算出する
- BMIの下限と上限を算出する
- BMIの下限と上限を0.0~1.0の範囲に修正する
教師信号は「下限」「中間」「上限」の3点だけにしました。最初は,実在する数値を片っ端から学習させれば良いと思っていたのですが,やってみたら「学習しない」「精度が低い」と悪いこと尽くめでした。
階層型ニューラルネットワークは,中間層ニューロンの数次第でどんな関数でも近似できるそうなのですが,学習が成功するかどうかは別問題のようです。
<画像の説明>学習により得たニューラルネットワーク。
BMIスペクトル
<画像の説明>ガチムチ以外にも,「スジ筋」「筋肉質」「デブ」の解析も済ませたので,ガチムチと合わせたBMIスペクトルをお見せしましょう。感心する人よりも,呆れた人の方が多い気がします。こんなことに労力を費やして,いったい何の役に立つのやら。いちばん心配しているのは私自身です(ふめい)。
今回,新たな発見がありました。BMI 24の近辺が,いちばんややこしい状態になっているのですね。BMI 24は筋肉質でもあり,ガチムチでもあり,デブでもあるのです(びっくりマーク)。
BMI 24は身長を171cmにした場合,体重は70kgになります。この数値は「身長から体重を引いて100くらい」というあの名文句に対応するのですよ。いちばん苦情の多い体型のような気がするのですが,どうなんでしょうね。定式化してもなお,ガチムチの謎は深まるばかりです。
2008-10-04 体型変換チャート―極端な体型ってどんな体型?―
以前,某氏から「身長と体重を変換できるようなものが欲しい」という依頼を受けていました。身長と体重を変換するって意味不明な気がするので,何をやりたいのか少し説明します。
例えば,身長170cmで体重64kgの体型がお好みだとします。もし身長が165cmの人がいたとしたら,体重は何kgになれば好みの体型だと言えるのでしょうか。相手の身長が,自分の身長に近いのならだいたい察しがつくのですよね。でも自分の身長からかけ離れていると,想像すらできないのではないでしょうか。
そこで私は「体型変換チャート」を作ってみることしました。身長ごとに,BMI(Body Mass Index)換算で健康的とされる体重の範囲を描いてみることにしました。体型変換チャートを活用すれば,いわゆる騙しの被害に遭う確率を低くすることができるでしょう(完璧とは言えませんが)。「これは使えそう」と思った人は,すぐにこのページをブックマークしておきましょうね。
<画像の説明>作成した「体型変換チャート」です。いつものように,Microsoft Excelで作ってみました。図には3本の斜め線が引かれています。左から体重の下限,標準,上限の境界線です。使い方ですが,ある身長と体重の位置を斜め線に沿って移動させれば,体重を変換することができます。【追記 5 OCT 2008 15:32】 図を少し修正しました。
極端な体型とは
たまに出会い系サイトで「極端な体型じゃない人」というセリフを見かけることがあります。極端な体型とはどんな体型のことなのでしょうか。体型変換チャートを使えばすぐに分かるのです。下限あるいは上限から外れた体重は病的であり,いわゆる極端な体型だと言えるでしょう。
とくに上限を超えた体重は,およそ肥満1度に相当します。これは俗に「ガチムチ」といいます。たまに自分のことを,好んでガチムチ系だと言う人がいます。ところで下限を下回った体重は「ガリ」なんでしょうけれど,自分で好んで「ガリ」なんて言う人は存在しません。なぜなのでしょうか。おやおや,新たな謎を発見してしまったようですね。
本心では「どうでもいい」と思っているので,ひとまず私は寝ることにします(なぞ)。
2008-01-29 ガチムチとは自己管理のできない愚か者
軽く公開メールを兼ねています。なんでも「ガチムチ」について疑問があるそうで,お任せください。ばっちり解析できています。何しろ私は解析魔なのです。
<画像の説明>体型呼称をBMIに換算してみた。全体の標本数N=173,「ガチムチ」の標本数は31。分析にはYumi Scanties,Microsoft Excelを使用。
説明
ガチムチというのはBMI 25.9を指します。BMIの標準値は22です。BMI 25以上を「肥満1度」と言うそうです。つまり自己管理のできない愚かな人のことを,俗に「ガチムチ」って言うわけですね。立派な蔑視用語なのに,なぜ雑誌メディアで多用されているのか私には理解できません(←かなり意地悪)。
「ガチムチは病的肥満なんかじゃないよ(びっくりマーク)」と言いたい人が,たぶんいらっしゃると思います。私,べつにガチムチの人に嫌がらせするつもりはないのです。でも客観的に調べてみると,ガチムチっていうのは病的肥満のことなのです。ガチムチの状態を放っておくと「高脂血症」「高血圧」「糖尿病」という,いわゆる生活習慣病に罹る可能性が高いのです。
いままで自分のことを「ガチムチです」なんて言っていた人は,考え直してくださいね。ただの肥満患者だって,みんなにバレていますよ(毒)。それと,恥ずかしい思いをする人が増えないように,この話をお友達にも教えてあげてください。
2007-12-31 Access 2007で“おさかん地図”を作る
数日前,Microsoft Access 2007の練習をしているというお話をしました。徐々にコツを掴んできたので,現在の成果物をご紹介しましょう。
小熊の分析
今回は2007年6月から3か月間,6万件の情報を元に,ある小熊の行動を分析し,レポートを作成してみることにしました。「どうして小熊なの?」と思った人がいるかもしれません。個人的な趣味です(なぞ)。今回,作ったものの使い方と動作概要をお話します。
<画像の説明>Accessの起動画面と解析フォームです。解析したい人の識別コードを入力するとレポートを作ることができます。「識別コードって何なの?どうして識別できるの?」と思った人がいるかもしれません。ここでは識別コードの説明はしません。
<画像の説明>ひとつ目のレポートです。識別コードに該当した人物の日単位・時間単位の活動頻度を図にし,さらにひとつひとつの投稿文を表形式で出力します。画像はAccessからレポートをPDFで出力し,Acrobat Readerで表示したPDFから切り出したものです。
<画像の説明>ふたつ目のレポートです。日単位・時間単位の活動頻度を格子状に表します。私はこれを「おさかん地図」と呼んでいます。ひとつ目のレポートよりも粒度が細かく,また平面に表されるので分かりやすいと思います。
何が分かったのか
データ分析って,何か知りたいことがあるから分析するのです。分析結果が得られて,そこからつぎに何をすべきかが分からなければ分析する意味がありません。今回,分かったことを箇条書きにします。
- この小熊は夕方から活動をはじめる。20時の活動係数がもっとも高くなる
- 夜間は寝ているらしい
- 定期的におさかん係数が高まるらしい。とくに8月16日,8月19日は活動が頂点になっている。いわゆるおさかん爆発を起こしたのだろうか
以上のことから20時ごろに網を張ると小熊を捕獲できる可能性が高まり,偶然にもおさかん爆発の日(いわゆる「多い日」)に当たったときには激しく求めてくることが予想されます(ふめい)。
過去にここまでAccessを悪用した人がいたでしょうか。まったくもって碌な使い方をしていません。いつものことです(再三ふめい)。
もっともっとAccess
私は過去にもAccess以外の方法(おもにExcel)で,この小熊を分析したことがあります。Accessを導入した理由は,もっと手軽にデータ分析したかったからなのです。断っておきますが,小熊が云々というのはあくまで例題ですからね。小熊のためだけにOffice 2007を買ったのではないのです。
さて,Accessを使っていて,いろいろと気づいたことがあります。つぎはその「気づいたこと」をお話しようと思います。
2007-07-18 ガチムチ診断チャートを開発中です
連休中に「ガチムチ診断チャート」のためのデータ整理をしておりました。ガチムチ診断チャートとはウェブアプリです。年齢・身長・体重を入力すると体型が何系であるか教えてくれる,というサービスなのです。公開日はいつものように未定です。なおガチムチとは何であるかは,1回目の調査結果でお話したとおりです。
診断チャートの開発なんですけれど,まだ標本の「欠け」を探している段階です。だれでも想像が付くと思いますが身長170cm程度,体重60~70kgの人間がいちばん多いのです。それ以外は少ないというわけで,少ない層の標本をもっと抽出して標本の歪みを修正しておかないと,診断結果の精度が悪くなってしまいます。
<画像の説明>現在,抽出している標本です。あちらこちらに欠けが生じています。
さて,「それにしても身長165cm未満の人の標本が足りないな」と思いました。集計したデータを見ると,どうも統計的に変な気がしたのです。一体,何が起きているのでしょうか。身長の度数分布表を作ってみたらすぐに分かりました。
<画像の説明>虹色業界人の身長の分布。170cmが突出しており,169cmが凹んでいることが分かります。180cmと179cmにも似たような傾向が見られます。ちょっと図の都合で分かり難くて申し訳ないのですが,164cmは頻度ゼロのため項目そのものが存在していません。
みなさん身長をサバ読みしているんですよね。まったく,パパや少女は騙せても私は騙せませんよ(ふめい)。数字を盲信すると現実とズレてしまうので,主観で補正値を設けた方が良いのかもしれませんね。
2007-05-27 ガチムチの謎―ガチムチとは筋肉質な体に脂肪がついた体型―
世に蔓延る体型呼称。時として「詐欺」であるとか「勘違い」「嘘」「おおげさ」などと,忌み嫌われています。今回はガチムチの謎に迫ります。みなさん「ガチムチ」ってどんな体型か分かりますか。また「ガチムチ」はいつから始まって,いつ終わるのでしょうか。
元ネタは「セ○」さんのマイミクさん(ごめんなさい,お名前は忘れてしまいました)の「ガチムチのガイドライン」です。私も日頃から気になっていたので,調べてみることにしました。
ガチムチとは筋肉質な体に脂肪がついた体型
年齢別に各体型呼称の構成比率を調べてみることにしました。
※分析方法。2007年5月における1万3千件の投稿文から体型呼称ならびに身長,体重,年齢を含む投稿文を抽出。分析にはYumi Scanties,Microsoft Excelを使用。
<説明>体型呼称と年齢ごとの傾向を述べます。
- スジ筋 ― 20代から30代に掛けて減少し,40代では皆無となる
- 筋肉質 ― 20代から40代に掛けて減少していく
- ガチムチ ― 20代では少ない。30代から増え始める。ガチムチとは30代,40代の体型を指すらしい
- ガチ ― 意味不明な呼称の「ガチ」であるが,年齢ごとの傾向ははっきりしなかった。意味不明だからなのかもしれない
- デブ ― 40代でいちばん多い。経験的に妥当な結果
<まとめ>20代から30代に掛けて「筋肉質」と「スジ筋」が減り,代わりに「ガチムチ」が増えます。ガチムチというのは,20代にスジ筋あるいは筋肉質だった人が脂肪太りした体型を指すのでしょう。なお「スジ筋」とは,痩せており体脂肪率が低くそれでいて筋肉のついた体のことです(たぶん)。
さて「ガチムチ」という体型呼称は,わりと新しいです。使われ出したのは,2000年代に入ってからだと思います。以前は「SG系」という言われ方をしていました。私は当時,「SG系とは生活習慣病予備軍のこと。本来はSF(SUPER FAT)なんだけれど,『勘違い』という悪習慣がひとつ多いからFを1文字進めてSGになった」と説きました。どうやら世の中,10年前と変わっていないようですね。おそらく10年後も同じことを繰り返しているでしょうね。いい加減にすればいいのにね(ふめい)。
体型呼称早見表,あなたは何系?
ガチムチの正体,だいたいお分かりいただけたかと思います。つぎにあなたはガチムチか,そうではなければ一体何であるのか,判別するための資料をお見せしましょう。
なんと体型呼称の早見表なのです。身長170-174cm,175-180cmの二種類を用意しました。あなたの体重を当てはめてみてくださいね。体型が何であるか分かりますよ。なお残念ながら170cm未満の人の早見表は,用意できませんでした。資料が足りなかったのです。
<説明>身長170-174cmの方のための早見表です。ガチムチと呼べる体重は70kg以上90kg未満のようです。それから「スジ筋」と「筋肉質」は背反します。60kgを超えたらスジ筋と言ってはいけませんし,60kg未満なのに筋肉質と言うのも良くないみたいです。
<説明>身長175-180cmの方のための早見表です。申し訳ありませんが,170-174cmの早見表よりも精度がちょっと悪くなっています。175cmを超えると「普通体型」という言い方がお目見えします(170-174cmの早見表では,出現頻度が低いため省略されています)。「普通体型」もかなりの地雷なのですが(なぞ)。そのお話はまたいつか。