불확실성 하에서의 판단 : 통계와 편향

J. Krueger
출처 : J. Krueger

아직도 몇몇 빈번한 사람들이 남아 있습니다. ~ 조 Austerweil, "털이 많은"베이지안 문제를 mulling 동안

중요성 테스트는 객관성의 안식처, 과학적 방법의 핵심, 직업 정의를위한 성배로 이어지는 실무자들 중 상당수가 볼 수 있습니다. 데이터가 수집되고, 테스트 통계가 계산되며, 적어도이 통계치의 확률이 발견됩니다. 이 확률이 .05보다 작 으면 귀무 가설은 기각됩니다. 아무 것도 아닌 다른 일이 진행되고 있다고 가정합니다. 일반적으로 '아무것도 아님'은 실험 대상을 대조군과 분리 한 모든 치료법으로 생각됩니다. 이 방법은 드릴을 아는 모든 사람들이 같은 결과를 얻는다는 의미에서 객관적입니다.

'목표'는 '유효'를 의미하지 않습니다. 유의미한 테스트 방법의 타당성은 한 세기 동안 의문을 제기 해왔다. (초기의 비판 은 욥기서 에서 찾을 수 있으며, 작업 노트 참조). 그러나 이러한 방법이 우선합니다 (적어도 당분간은 파티가 끝날 수 있습니다). 왜? Gerd Gigerenzer (어딘가의 언젠가)는 p 값의 사용, 즉 귀무 가설 하에서 데이터의 확률, p (D | H)를 사용하여 역 (inverse), 즉 가설의 확률 데이터, p (H | D)는 대표성 발견 적 방법에 의한 판단의 한 예이다. 그는 내가 회상 한만큼 정교하지 않았기 때문에 여기에 올거야.

p (H | D) = p (D | H) * p (H) / pD)를 기억하십시오. 데이터는 가설을 말합니다. 이들의 효과 (우도)는 기본 속도의 비율, 즉 가설의 사전 확률을 (어떤 가설 하에서) 그 종류의 데이터를 찾는 전체 확률로 나눈 값과 곱해야합니다. 베 베이 목사는 네가 번식하고 나눌 것이라고 말합니다. 그러나 중대한 seductress 테스트는 연구자가 p (D | H)에서 p (H | D)로 직접 도약하도록 유혹하며 기본 속도 비율은 저주됩니다. 배경 정보를 사용하거나 무시하는 것의 차이점은 Tversky와 Kahneman의 작품에서 생각한 것과 사고에서 영감을 얻은 것의 상당 부분에서 생각을 구별하는 것입니다.

대표성 발견 적 방법론은 기본 요율의 정의를 무시한 채, 기각하지 않고, 해고하는 것으로 유명 해졌다. Tversky & Kahneman (TK, 1974)의 말을 들어 봅시다. "사람들이 우려하는 확률 론적 질문의 대부분은 물체 A가 클래스 B에 속할 확률은 얼마입니까? "A는 연구 결과를 가리키며, B는 가설에 의해 설명 된 것처럼 잠재적 인 기본 현실이다. "그런 질문에 대답 할 때, 사람들은 전형적으로 A가 B를 대표하는 정도, 즉 A가 B와 유사한 정도에 따라 확률이 평가되는 대표성 발견 적 방법에 의존한다.

TK는 대표성에 의한 판단의 6 가지 특징을 검토한다. 의미 테스트와 그 실습에 적용되는지 확인해 봅시다.

[1] 결과의 사전 확률에 대한 무감각 . 이것이 적용됩니까? 예. 잘못으로. 유의성 검정은 귀무 가설의 사전 확률 또는 다른 가설을 명시 적으로 괄호로 묶는다. 연구자들은 조용히 프로젝트의 위험성 (즉, 무언가와 무관 한 것을 발견 할 수있는 기회)을 고려할 수 있지만, 이러한 묵상을 공식화하고 증거를 수집 한 후에 가설에 대한 추론에 영향을 미칠 수는 없습니다. 이런 의미에서 유의미 테스트는 우리 딸의 남자 친구가 '멍청이 (jerks)'범주에 속하는지 궁금해 할 때 당신과 내가 정착 한 정원 다양성 대표 생각 ( er , perceiving)보다 훨씬 견고합니다. 그는 멍청이처럼 굴지도 않고, 멍청이처럼 보이지도 않습니다. . . 우리는 저크의 범주의 크기를 무시합니다. 즉, 젊은이가 얼간이 일 가능성이 얼마나 높은지를 무시합니다. 덧붙여 말하자면, TK가 정의 특징과 결과에 관해서 대표성 휴리스틱을 소개하는 것이 다소 이상합니다. 베이 즈 방치 (더 정확하게는 '기준 금리 소홀')는 두 모자를 착용 한 것처럼 보입니다.

[2] 표본 크기에 둔감합니다 . 중요성 테스트는 표본 크기에 민감하므로이 방법은 경험적 방법과 유사하지 않습니다. 샘플이 클수록 샘플이있을 경우 효과를 발견 할 확률이 높습니다. 그러나 TK가 지적한 바와 같이, 유의미 테스트를 수행하는 많은 실무자들은 이러한 종류의 무감각 함을 보여줍니다. 마치 다른 유형을 사용하여 특정 유형의 대표성을 경험적으로 생각하는 것처럼 보입니다.

[3] 기회에 대한 오해 . 다시 말하지만, 이것은 절차보다는 사람의 문제입니다. 사람들은 기회에 대한 직관력이 약하며 카지노, 복권 관계자 및 보험 영업 사원이 악용 할 수있는 취약성이있는 이유 중 하나입니다. 유의미한 테스트는 기회가 있음을 가정합니다.이 테스트는 p 값을 산출하는 데 도움이됩니다.

[4] 예측 가능성에 무감각 함. 여기서 TK는 사람들의 판단이 좋은 이야기에 의해 좌우된다는 것을 의미합니다. 그들은 이야기의 신뢰성을 무시하면서 예를 들어 전문가의 의견이나 소문에 근거하여 이야기의 가치에서 가치 (긍정적이거나 부정적)를 예측합니다. 유의미한 테스트 – 여기에서 사지에 나가기 – 비슷한 (대표적인 모습 그대로) 기능이있는 것으로 나타납니다. 귀무 가설의 진실성이나 허위성에 대한 추론 (예 : 예측)은 데이터에만 근거하고 다른 가설은 적용되지 않습니다. 널 값 아래의 p 값은 낮지 만 대체 가설 하에서의 p 값은 훨씬 낮다. 베이지안은 귀무 가설에 찬성하여 상대적인 증거가 있다고 주장 할 것이다.

[5] 타당한 환상 . TK는 대표성에 대한 의존이 잘못된 타당도를 높여 준다고 주장한다. 사람들이 완벽하게 유효하지 않은 경험적 방법에 의지하는 경우에는 이렇게해야합니다. 그들에게 타당성에 대한 착각이 없다면 그들은 휴리스틱에 의지하지 않을 것이다. 여하튼,이 에세이의 첫 번째 문장에서 지적한 중요성 테스트 (significance testing)는 연구 인물이 같은 방식으로 illuded되도록 유혹한다. 중요성 테스트가 과학적 발견을위한 마스터 툴이라고 생각하면, 그들은 과신이 될 수 밖에 없습니다.

[6] 회귀의 오해 . 그거 좋네. 마지막이지만 길을 잃지 않았습니다. 천재를 찾고 거의 찾지 못한 Galton (Francis 경)은 회귀를 발견했다. 걸출한 사람들의 아들들은 그다지 현저하지 않았습니다. 오늘날 우리는 회귀가 확률 적 세계의 필수적인 특징으로 알고 있습니다. 그러나 대표적으로 생각할 때, 우리는 B에서 A를 마치 두 가지 경우 사이의 상관 관계가 완벽하지 않은 경우에도 완벽하다고 예측합니다. 유의성 테스트의 맥락에서 회귀 분석은 중요한 발견이 반복 될 것이라고 연구원이 가정 할 때 머리를 되 돌린다. 이것은 점 [2]와 [5]와 관련이 있으며, 주로 테스트 사용자의 문제이고 부분적으로 p 값의 문제입니다. p는 자신의 복제 가능성을 말하지만 매우 낮은 목소리로 말합니다.

나머지 이야기는 이것입니다. TK는 유명한 논문의 오랫동안 잊혀진 토론 섹션에 속합니다. "대표성과 같은 유용한 경험적 방법 [ . .] 때때로 예측과 추정에서 오류가 발생하더라도. "TK는 이러한 경험적 방법이 유용하며 사람들이 사용하는 것에 놀라지 말아야한다고 주장했습니다. 중요성 테스트가 실제로 – 대표성을 가진 휴리스틱의 형식화 된 버전을 보여주기 위해 시도한 것처럼, 아직 일부 삶이 남아있을 수 있습니다.

그리고 "유용하다"는 의미는 무엇입니까? 저비용으로 충분히 정확한 판단과 선택을 내놓는다면 경험적으로 유용합니다. 의미면에서 유의미한 테스트와 그 가치가 얼마나 중요한지는 아직 논란의 여지가 있습니다. 몇 가지 시뮬레이션 작업을 마친 후에는 유의미 테스트가 잘못 계산 된 것만 큼 나쁘지 않다고 생각하기 시작했습니다.

직업 노트. Job, 굳건한 전설의 사람은 압도적 인 증거에도 불구하고 신이 좋았다는 가설을 기각했다.

eigener Sache에서 : 나는 모든 게시물을 루 브릭 '사회 생활'아래 그리고 다른 어떤 곳에서도 기록합니다. '통계'에 대한 루 브릭이 없으므로이 게시물은 '영성'아래에 있습니다. 좋은 직장.

Tversky, A., & Kahneman, D. (1974). 불확실성 하에서의 판단 : 발견 적 및 편견, Science, 185 , 1124-1131.

느슨한 연관성 : 당신이 다른 사람에게 '원격'연상을 말할 수 있다고 위장 할 수 있다면, 이것에 대해 어떻게 할 것인가 : 유의성 테스트의 비평가는 귀무 가설에 대해 편향된 방식, 즉 '아무것도 아님'에 대한 생각은 너무 쉽게 받아 들여진다 . 이것은 Null 가설이 ' 거부 감도 '에 시달리는 것을 의미합니까?

이 게시물은 Ovum Capu t, Ph.D.