Theoretical Sociology

太郎丸博のブログです。研究ノートや雑感などを掲載しています。(このページは太郎丸が自主的に運営しています。京都大学の公式ページではありません。)
<< March 2020 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 >>
 
RECOMMEND
後期近代と価値意識の変容: 日本人の意識 1973-2008
後期近代と価値意識の変容: 日本人の意識 1973-2008 (JUGEMレビュー »)

NHKの日本人の意識調査のデータをつっこんで分析した本です。
RECOMMEND
Labor Markets, Gender and Social Stratification in East Asia: A Global Perspective (The Intimate and the Public in Asian and Global Perspectives)
Labor Markets, Gender and Social Stratification in East Asia: A Global Perspective (The Intimate and the Public in Asian and Global Perspectives) (JUGEMレビュー »)

直下の和書の英語版です。審査を通過するためにレフェリーのコメントに従って若干修正してあります。
RECOMMEND
東アジアの労働市場と社会階層 (変容する親密圏/公共圏)
東アジアの労働市場と社会階層 (変容する親密圏/公共圏) (JUGEMレビュー »)

GCOEの成果をまとめた本です。日本を中心に韓国、台湾(中国も少し)との比較研究をしてます。
RECOMMEND
若年非正規雇用の社会学‐階層・ジェンダー・グローバル化 (大阪大学新世紀レクチャー)
若年非正規雇用の社会学‐階層・ジェンダー・グローバル化 (大阪大学新世紀レクチャー) (JUGEMレビュー »)
太郎丸 博
拙著です。非正規雇用に関する本はたくさんありますが、「なぜ正規雇用と非正規雇用では賃金格差があるのか」など当たり前と思われがちな問題を突き詰めて考えてみました。
RECOMMEND
フリーターとニートの社会学
フリーターとニートの社会学 (JUGEMレビュー »)

拙編です。オーソドックスな計量社会学の手法で、若年非正規雇用や無職にアプローチした本です。白い装丁なので、輪郭がわからないですね...
RECOMMEND
人文・社会科学のためのカテゴリカル・データ解析入門
人文・社会科学のためのカテゴリカル・データ解析入門 (JUGEMレビュー »)
太郎丸 博
拙著です。軽く読み流すのは難しいですが、まじめに一歩一歩勉強するために作りました。
ARCHIVES
RECENT COMMENT
  • 阪大を去るにあたって: 社会学の危機と希望
    charlestonblue (10/08)
  • Cohen et. al 2011 「フェミニズムの方法論的インパクト: 社会学のやっかいな問題?」
    abe daijyu (10/05)
  • アマチュア社会学の可能性
    読者 (02/20)
  • 社会システム理論の野望、あるいは全体性へのオブセッション
    宮国 (12/19)
  • 片山他 2015「図書館は格差解消に役立っているのか?」
    オカベ (12/09)
  • ランダム効果の意味、マルチレベル・モデル、全数調査データ分析
    YZ (12/07)
  • 学歴社会から「学習資本」社会へ:日本の教育と社会における階級形成の再編
    赤尾勝己 (02/11)
  • グラフィカル・モデリングとは?
    anonymous (11/30)
  • Rスクリプト覚書き:vglm関数で平行性の仮定を置かずに順序ロジット
    ほっくー (08/05)
  • 台湾の経済: 典型NIESの光と影
    おーまきちまき (07/19)
RECENT TRACKBACK
 
収入カテゴリを数値に変換するときに「XXXX万円以上」にどんな値を割り振るべきか
ちょっとした事情で勉強したことをメモします。社会調査で収入などをたずねるときは、「200〜299万円台」といったカテゴリを用意しておいて選んでもらうことが多い。連続変数として分析するためには、カテゴリのままではなく、適当な数値を割りふってやる必要がある。その場合、カテゴリの上限と下限の真ん中の値を割り振ることが多い。例えば「200〜299万円台」なら 250万円という値が割り振られる。しかし、収入の場合、最高のカテゴリは「2300万円以上」といった形になっており、上限の値がないので、上限と下限の間の値を割り振ることができない。そこで、適当な値を割り振ってやる必要がある。やり方はいくつかあるようだが、今回勉強したのが、下記のレポートに記載されている方法である。
Ethan Ligon, 1989, The Development and Use of a Consistent Income Measure for the General Social Survey, GSS Methodological Report No. 64.
収入はいわゆるパレート分布におおむね近似するといわれている。その性質を利用してざっくりとある値以上をとる人の平均値を計算しようというわけである。 Ligon が勧めているのが、quantile method と呼ばれるもので、最高のカテゴリである「x 万円以上」に該当する人の平均収入の推定値 m(x) は、以下のように計算される。
m(x) = x * v / (v - 1)   (1)
v = (c - d) / (b - a)   (2)
ただし、
  • x: 一番上の収入カテゴリの下限値
  • v: パレート分布のカタチを決めるパラメータの一つ。(2) 式で推定できる
  • a: 二番目に高い収入カテゴリの下限値の log10 (10を底とする対数)
  • b: 一番上の収入カテゴリの下限値 (x) の log10
  • c: 一番上と二番目の収入カテゴリに該当する人数の総和の log10
  • d: 一番上の収入カテゴリに該当する人数の log10
である。JGSS 2010 の世帯収入で計算してみよう。JGSS 2010 の世帯収入は、最高が「2300万円以上」、その次が「1850〜2300万円未満」である。「2300万円以上」に該当するのが 29人、「1850〜2300万円未満」が 26人である。それゆえ、
  • x = 2300
  • a = log10 1850 = 3.27
  • b = log10 2300 = 3.36
  • c = log10 (29+26) = log10 55 = 1.74
  • d = log10 29 = 1.46
  • v = (1.74 - 1.46) / (3.36 - 3.27) = 2.94
  • m(x) = 2300 * 2.94 / (2.94 - 1) = 3486
なので、 3486万円を割り振ればよいというわけである。平均値で代表すべきなのか、とか、ほかのカテゴリは上限値と下限値の中点をとっているのに一番上のカテゴリだけ平均値を使うのは一貫性がない、とか批判はできようが、実用性とコストパフォーマンスを考えると、悪くない方法だと感じた。 R で計算した際のスクリプトは下記の通り。
x <- 2300
a <- log10(1850)
b <- log10(x)
c <- log10(29 + 26)
d <- log10(29)

v <- (c - d) /(b - a)

round(c(x, a, b, c, d, v), 2) # 値をまとめて確認

x * v/ (v - 1)
スポンサーサイト
- | 14:59 | - | -
コメント
コメントする









 
トラックバック
この記事のトラックバックURL
トラックバック機能は終了しました。
 

Copyright (C) 2004 paperboy&co. All Rights Reserved.

Powered by "JUGEM"