ここでは、研究における「信頼性」についてまとめます。
用語: 信頼性とは / 再現性(再検査法, Cohenのκ係数) / 等価性(平行検査法)
/ 内的整合性(折半法, Cronbachのα係数・Kuder-Richardson)
信頼性とは、対象に対する測定の精度のことであり、主に「再現性(安定性)」、「等価性」、「内的整合性」の3つの側面があります。
信頼性の程度を示す数値は、「信頼性係数(ρ:ロー)」と呼ばれ、0〜1の範囲であり1に近いほど信頼性が高くなります。信頼性係数は「全体の得点の分散に占める真値の分散の割合」を意味します(真値の分散の割合が高いほど,信頼性が高い)。
信頼性に関連して、「妥当性」という言葉がありますが、その違いは、射的(まとあて)で例えられることが多いです。
注意すべき点は、「信頼性が高くても妥当性が高い」とは言えないことです。また、その逆も同様です。
つまり、射的で何度も同じ場所に当てることができても(信頼性高くとも)、その場所はまとの外側である(妥当性は低い)という場合があるからです。
信頼性の1側面である「再現性」とは、「繰り返し測定しても同じ測定値が得られること」です。
再現性が高いければ、信頼性が高いと考えます。
「再検査法」とは、一定の期間をおいて2回検査を行い、測定値間の相関係数から安定性を確認する方法です。
相関係数を信頼性係数の推定値とし、その値から信頼性を評価します。
質的分析において、2名の評定者間の一致率を算出するために用いられる指標に「Cohenのκ係数」(コーエンのカッパ係数)があります。
一致度が高いほど、質的分析の信頼性が高いとされます。
信頼性の1側面である「等価性」とは、「その検査と類似した構成概念の検査と一定の関係が認められること」です。等価性が高ければ、信頼性が高いと考えます。
「平行検査法」とは、内容や構成概念、難易度がほぼ等しい2種類の検査を作成し、両者の測定値間の相関係数から等価性を確認する方法です。
相関係数を信頼性係数の推定値とし、その値から信頼性を評価します。
信頼性の1側面である「内的整合性」とは、「尺度内の各項目が同じ構成概念を測ることができていること」です。
内的整合性が高ければ、信頼性が高い考えます。
「折半法」とは、尺度の項目群を2つに分け、両群の相関係数から内的整合性を確認する方法です。
折半法での信頼性係数は、相関係数の値をスピアマン-ブラウン(Spearman-Brown)の公式に当てはめて算出します。
「クロンバックのα係数(Cronbach's α)」を用いる方法も内的整合性を確認する方法として挙げられます。
クロンバックのα係数とは、項目群の可能な組合せ全てについて信頼性係数を算出し平均した結果であり、α係数の値で信頼性を評価します。信頼性が高いと見るには少なくとも0.7以上は必要とされています。
クロンバックのα係数は、「尺度項目数を多くすると高くなる」、「項目間の相関係数が高いほど高くなる」という特徴を持ちます。
尺度が、「2件法」(例:はい・いいえ)の場合には、α係数の代わりに、「Kuder-Richardson(キューダーリチャードソン)」の公式が用いられます。