Theoretical Sociology

太郎丸博のブログです。研究ノートや雑感などを掲載しています。(このページは太郎丸が自主的に運営しています。京都大学の公式ページではありません。)
<< March 2020 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 >>
 
RECOMMEND
後期近代と価値意識の変容: 日本人の意識 1973-2008
後期近代と価値意識の変容: 日本人の意識 1973-2008 (JUGEMレビュー »)

NHKの日本人の意識調査のデータをつっこんで分析した本です。
RECOMMEND
Labor Markets, Gender and Social Stratification in East Asia: A Global Perspective (The Intimate and the Public in Asian and Global Perspectives)
Labor Markets, Gender and Social Stratification in East Asia: A Global Perspective (The Intimate and the Public in Asian and Global Perspectives) (JUGEMレビュー »)

直下の和書の英語版です。審査を通過するためにレフェリーのコメントに従って若干修正してあります。
RECOMMEND
東アジアの労働市場と社会階層 (変容する親密圏/公共圏)
東アジアの労働市場と社会階層 (変容する親密圏/公共圏) (JUGEMレビュー »)

GCOEの成果をまとめた本です。日本を中心に韓国、台湾(中国も少し)との比較研究をしてます。
RECOMMEND
若年非正規雇用の社会学‐階層・ジェンダー・グローバル化 (大阪大学新世紀レクチャー)
若年非正規雇用の社会学‐階層・ジェンダー・グローバル化 (大阪大学新世紀レクチャー) (JUGEMレビュー »)
太郎丸 博
拙著です。非正規雇用に関する本はたくさんありますが、「なぜ正規雇用と非正規雇用では賃金格差があるのか」など当たり前と思われがちな問題を突き詰めて考えてみました。
RECOMMEND
フリーターとニートの社会学
フリーターとニートの社会学 (JUGEMレビュー »)

拙編です。オーソドックスな計量社会学の手法で、若年非正規雇用や無職にアプローチした本です。白い装丁なので、輪郭がわからないですね...
RECOMMEND
人文・社会科学のためのカテゴリカル・データ解析入門
人文・社会科学のためのカテゴリカル・データ解析入門 (JUGEMレビュー »)
太郎丸 博
拙著です。軽く読み流すのは難しいですが、まじめに一歩一歩勉強するために作りました。
ARCHIVES
RECENT COMMENT
  • 阪大を去るにあたって: 社会学の危機と希望
    charlestonblue (10/08)
  • Cohen et. al 2011 「フェミニズムの方法論的インパクト: 社会学のやっかいな問題?」
    abe daijyu (10/05)
  • アマチュア社会学の可能性
    読者 (02/20)
  • 社会システム理論の野望、あるいは全体性へのオブセッション
    宮国 (12/19)
  • 片山他 2015「図書館は格差解消に役立っているのか?」
    オカベ (12/09)
  • ランダム効果の意味、マルチレベル・モデル、全数調査データ分析
    YZ (12/07)
  • 学歴社会から「学習資本」社会へ:日本の教育と社会における階級形成の再編
    赤尾勝己 (02/11)
  • グラフィカル・モデリングとは?
    anonymous (11/30)
  • Rスクリプト覚書き:vglm関数で平行性の仮定を置かずに順序ロジット
    ほっくー (08/05)
  • 台湾の経済: 典型NIESの光と影
    おーまきちまき (07/19)
RECENT TRACKBACK
 
Allison 2002 『欠損データ』

欠損値処理法の入門書。重回帰分析や因子分析のような多変量解析では、すべての変数の値がデータとして得られているということが前提になっていることが多い。しかし、実際には無回答など幾つかの理由から、幾つかの変数に関して、データが得られないケースが生じることがしばしばある。このような欠損値が生じた場合、リストワイズ法とペアワイズ法が伝統的な処理法として知られている。しかし、近年では最尤法や多重代入法といった方法が発展しており、これらの解説が本書の中心になっている。

興味深いのは、Allison がリストワイズ法の利点をかなり強調している点である。リストワイズ法は、かなり広範な条件下で、一致推定量を得られるそうで、欠損値がそれほど多くなければしばしば正しいデータ処理法であるとされている。ただし、リストワイズ法では半分以上のサンプルが分析から除外されてしまうような場合、最尤法や多重代入法が有効かもしれない。リストワイズ法では、一つでも欠損値のあるケースは分析から除外されてしまうので、大半の変数の値がわかっていても、それらの情報をすべて捨ててしまうことになるのであるが、最尤法や多重代入法は、それらの情報を活用することで標準誤差を小さくすることが期待できる。

ただし、最尤法や多重代入法は Missing at Random (MAR) を仮定した分析法であり、それが成り立たなければやはり幾つかの条件下でバイアスを完全に補正することはできない。 MAR とは、ある変数 Y が欠損値になる確率は Y の値には依存していない、という意味である。ただし、別の変数 X の値によって Y の欠損値になる確率が影響を受けてもよい(それでも MAR になりうる)。例えば、性役割意識を尋ねる質問項目が欠損値になる確率が、その人の性役割意識の強さに依存していないならば、別の変数(例えば、性格の真面目さや忙しさ)に依存していても MAR は成り立つ。それゆえ、難しい価値判断を迫る質問項目では欠損値が多く生じるが、それはその人の価値判断に依存しているというよりも、性格や忙しさなど別の要因に依存していると考えられるので、こういう場合は、MAR が成り立っており、最尤法や多重代入法が有効であると期待できる。いっぽう収入や資産は、収入や資産の多い人ほど欠損値になりやすいと考えられるので、MAR は成り立っておらず、最尤法や多重代入法でもバイアスを除去できるとは限らない。

以下、思ったことをメモ。

  1. 回帰分析では説明変数に関して MAR が成り立っていなくても、被説明変数が MAR ならばやはり一致推定量が得られる。ただし、被説明変数が欠損値になるかどうかに影響する変数が説明変数として投入されているか、説明変数とは独立というのが大前提である。またロジスティック回帰分析の場合、被説明変数が MAR でなくても一致推定量が得られるそうで、それは当然そうだろうと思うが、カテゴリカル変数の場合、連続変数よりも欠損値によるバイアスに対してロバストという印象を受けた。しかし、どの程度一般的なのかは不明。
  2. またある変数が欠損値になるかどうかを決定するメカニズムが交互作用項等を含む複雑なものである場合、一般的にどのようなバイアスが生じるか、など考えだすと夜も眠れなくなりそう。
  3. 正規分布を仮定できる場合、最尤法が簡単で、ややこしい価値判断を迫る質問はだいたい連続変数で正規分布を仮定できることもけっこうあるので、そういう場合は最尤法が有効だろう。Allison もだいたいそんな感じの意見を述べている。
  4. MAR が成り立たない場合の欠損値処理法も2,3触れられているが、どれも仮定が強すぎて、本当にバイアスを補正できているのかまったく確信が持てない。Heckman の二段階推定も触れられていたが、バイアスが大きくなりやすいことが強調されていた。

スポンサーサイト
- | 07:41 | - | -
コメント
コメントする









 
トラックバック
この記事のトラックバックURL
トラックバック機能は終了しました。
 

Copyright (C) 2004 paperboy&co. All Rights Reserved.

Powered by "JUGEM"