P의 삶과 시대

Wikipedia; public domain
출처 : 위키 백과; 공개 도메인

Totgesagte leben lannger. [ '죽은 자들은 더 오래 살았다.', 또는 라틴어 : 'Declaravit iam mortuum vivere'] ~ 기원 미확인

나는 p 값이 합법적 인 조치라고 희망한다. 그렇지 않으면 통계에서 아무것도 배웠습니다 . ~ Lauren Krueger, 마스 트리 히트 대학교 경영 및 재무 학생

통계는 확률에 관한 것이며 단일 확률 지수는 소위 p- 값 (이전 에세이는 여기 참조)만큼 많이 사용하고 남용하는 것으로 보지 않았습니다. 작은 p 는 특정 가설 (즉, 현실의 이론적 모델)이 맞다고 가정하고 데이터의 확률을 표현한다. 종종이 이론적 모델은 거기에 아무것도 없다는 가정하에 이론적 인 것이다. 당신은 우유에 차와 차를 첨가 한 우유 사이에 차이점을 말할 수 있다고 생각하지 않습니다. 차이를 말할 수 없다고 말하면, 시도 할 때마다 .5 확률이 옳다고 말할 수 있습니다. 10 회 중 8 회 성공하면 p = .055 (단측 검정). 규칙에 따라 우리는 당신의 성공에 흥미를 느끼지 만, 우리는 당신이 붓는 순서에 대해 입증 할 수있는 능력이 있다고 추측하지는 않습니다.

P 는 어디 에나 있습니다. 경험적 변수 들간의 연관성 평가, 평균, 중앙값, 순위 또는 비율의 차이를 평가할 때, p 는 공통 척도를 제공합니다. 테스트 통계는 다양 할 수 있지만 (r, b, t, F, 카이 제곱, U 또는 W) p를 사용하면 비교할 수 있습니다. 그러나 많은 통계 학자들은 우리가 모두 보았던 오해와 오용 때문에, 또는 p 가 아닌지, 또는 척하지 않기 때문에 p를 싫어합니다. 즉, 데이터가 주어진 가설의 확률입니다. 이전의 심술 궂은 이유는 그것이 p 의 본질이 아닌 피의 수용의 문제이기 때문에 혼란 스럽습니다. 후자는 p 가 말할 수 있다면 역 조건부 확률과 동일하다고 주장하지 않기 때문에 논박의 여지가있다. 분명히, 가설 p (D | H)가 주어진 데이터의 확률은 데이터 p (H | D) 가설의 확률을 가장 할 수 없다. 역 조건이 어떻게 관련되어 있는지 이해하지 못하는 사람들 만이 그렇게 할 수 있습니다. 그러면 우리는 무지와 오용의 문제로 돌아갑니다.

종종 p 에 대한 경멸은 귀무 가설 검사에 경멸로 뒤섞이거나 정당화된다. 효과가 없다는 null (또는 nil) 가설은 종종 짚맨으로 묘사됩니다. 우리는 그것이 거짓이라는 것을 이미 알고 있습니다. 따라서 낮은 p 값을보고하는 방식으로 거짓이라는 것을 보여주는 것은 과학으로 가장하는 흉내입니다. 정말? 우리는 차에 우유 나 우유에 차가 첨가되었는지 (또는 거꾸로 잡는 "능력") 감지 할 수있는 능력이 있다는 것을 이미 알고 있습니까? 합리적인 사람이 거기에있을 것으로 기대하지 않을 때, Null 가설은 시험 가능한 예측으로 설정됩니다. 그렇다면 잘 설계되고 복제 된 일련의 연구에서 p 가 낮게 유지되면 우리는 (확률 론적) 존재 증명을 갖게됩니다.

한 세기 동안 p 의 공포에 대해 아우성 치며, 최근에 다시 열병에 휩싸였습니다. p의 스캔들 오용이 우리의주의를 끌었 기 때문에, 그리고 그 방법의 고유 한 공포가 드러났기 때문에가 아니라, 똑똑한 수학 또는 auto-da-fé 중 하나. p 와 그 사용에 관한 권위있는 판단을 누구에게 돌릴 수 있습니까? 물론 미국 통계 협회 !

그리고 보라! ASA는 그 일에 착수하여 p . 이사회는 소집 된 여러 사상 학교의 전문가들을 소집하고 평가를 제공하기 위해 결국 사려 깊고 신중한 보고서가 발표되었습니다 (Wasserstein & Lazar, 2016). 테너는 p 값이 약간의 증거 가치가 있지만 오해를 불러 일으키고 오용되기 쉽다는 것을 의미합니다. 주의를 기울여야하며 다른 통계 도구도 사용해야합니다. 이것은 악마의 일로 p 가치를 정죄하는 것이 아닙니다. 유의미한 테스트와 p 의보고가 포기 될 수 있고 버려 져야하는 것보다 훨씬 더 우월한 대체 방법을 사용할 수 있다는 선언도 아닙니다. 다시 말해서 ASA 보고서는 말하지 않은 점에서 주목할 만하다. 연구원과 학생들은 윤리적이고 염두에 두려는 노력을하면서 계속 수행 할 수 있습니다. 그 이상도 이하도 아닌.

ASA 보고서는 여러 의견을 평균하여 의견 차이를 최소화하도록 고안된 하나의 서술로 반영된위원회의 작업입니다. 흥미롭게도 (그리고 ASA의 신용에), 보충 자료로서 보고서와 함께 21 개의 해설이 출판됩니다. 보고서 작성자 중 5 월이 ASA 보고서 준비에 참여한 것처럼 보였으므로 개별 평가는 보고서에 집계 된 의견의 다양성에 대한 흥미로운 창을 제공합니다. 개별 논평을 통해 등장하는 몇 가지 주제는 다음과 같습니다.

제 독서에서 네 개의 해설 (Benjamin & Berger, Carlin, Johnson, Rothman)은 p 값의 포기를 분명히 옹호합니다 (즉, 포기하지 않는 그룹이 다수, p = .007, 양측). 다른 사람들은 p 가 어떤 용도를 가지고 있음을 마지 못해 인정한다. 다른 방법들 (특히 베이지안 계산)은 동일하거나 다른 문제를 가지고 있거나 "진짜"문제는 특정한 통계 지표가 아니라보다 넓은 인식 론적 맥락이다. 주석가 중 일부는 제대로 이해되면 p 값의 사용을 강조합니다. 다음은 21 개의 해설 중 7 개에서 유래 한 몇 가지 기억에 남는 따옴표입니다.

"성명서에 잘 설명 된 오해에도 불구하고 20 세기 내내 과학에 유용하고 성공적이었던 p 가치는 무엇 이었습니까? 어떤 의미에서는 신호가 노이즈와 분리되어 무작위성에 속지 않도록하는 첫 번째 방어선을 제공합니다. 필요한 모델은 다른 통계 도구보다 필요하기 때문입니다. " ~ Benjamini

"신흥 과학 기술을 신흥 기술로 사용하는 경우 특히 p 값이 불확실성을 계량하는 유일한 방법입니다." – Benjamini

"P- 값은 말단의 편리한 측정이며 Z- 점수 및 신뢰 구간과 비슷한 방식으로 숫자 집합을 나타냅니다." ~ Berry

P 값 은 숫자의 데이터 세트를 설명하는 데 유용하며 그런 의미에서 유용한 도구입니다. " ~ Berry

"P 값을 포기하는 것이 아니라 가난한 연구를 포기하는 문제입니다." ~ Ionannidis

"P 값은 유용한 통찰력을 계속 제공 할 것입니다." ~ Ioannidis

P 값은 "통계 모델 내에서 데이터의 증거적인 의미에 대한 지표"입니다. ~ Lew

"P 값은 데이터가 말하는 것의 질문에 유용하고 방어 가능한 대답입니다." ~ 루

"하나 또는 다른 사전 분포를 기반으로 사후 확률에 부합하지 않는 p 값이"유효하지 않음 "이라고 주장하는 것은 부정확합니다." ~ Little

"P- 값은 오류 통계적 접근 방법의 일부로서 제한된 역할을 위해 유지되어야합니다." ~ Senn

"과학은 데이터의 잠재적 인 설명을 배제함으로써 부분적으로 진행됩니다. p 값은 주어진 설명이 적절한 지 평가하는 데 도움이됩니다. " ~ Stark

하지만. . .

오용과 남용은 여전히 ​​문제입니다. "p value"를 검색 할 때, Deborah Rumsey의 에세이가 먼저옵니다. Dummies.com을 위해 작성한 Deb은 " 작은 p 값 (일반적으로 0.05 이하)은 귀무 가설에 대한 강력한 증거를 나타 내기 때문에 귀무 가설을 거부합니다 "라고 선언합니다. "그녀는 우리에게 유머러스 한 예를 들고 그녀의 주장을 삼켜달라고 요청합니다. " 피자 가게는 배달 시간이 평균 30 분 이하라고 주장하지만 그 이상이라고 생각합니다. 평균 가설 시간이 30 분 이하라는 귀무 가설 (Ho)이 틀렸다고 생각하기 때문에 가설 검정을 실시합니다. 귀하의 대안 가설 (Ha)은 평균 시간이 30 분 이상이라는 것입니다. 가설 테스트를 통해 무작위로 일부 배달 시간을 샘플링하고 데이터를 실행하면 P 값은 0.051보다 훨씬 작은 0.001로 나타납니다. "

그리고 당신이 이해할 수 있도록, De는 " 실제로, 0.001의 확률로 피자 장소의 배달 시간이 30 분 이하라고 잘못 주장 할 확률이 있습니다 ."

그것만이었다. ASA는해야 할 일이 많습니다.

Wasserstein, RL, & Lazar, NA (2016). ASA의 p- 값에 대한 진술 : 문맥, 과정 및 목적. 미국 통계 학자, 70 , 129-133. doi : 10.1080 / 00031305.2016.1154108

해설은 여기에 있습니다.