베이 즈 정리의 두 가지 함의

목사는 불확실성을 가르칩니다.

과학, 진보가 가능합니다. 사실, 베이 즈의 정리를 믿는다면, 예측이 이루어지고 신념이 테스트되고 정제됨에 따라 과학적 진보가 불가피 합니다. ~ 네이트 실버

베이 즈의 정리가 참인 확률이 .9라면, p = .05에서 거짓이라는 가설을 거부하면 참된 확률은 어느 정도인가? ~ JIK

Thomas Bayes는 영국 성직자이자 수학자로 다른 것들 중에서도 신의 증거를 찾는 데 관심이있었습니다. 그는 그렇게 할 수는 없었지만, 사후에 출판 된 후에 (Bayes, 1764) 논문과 정리를 남겨 두었고, 지금 베이지안 통계학의 기초가되었다. 베이 즈의 정리는 개념적으로 모순이없는 방식으로 기존의 신념 (추측, 가설 또는 직감)을 새로운 증거 (관찰, 데이터)에 비추어 어떻게 업데이트해야 하는지를 설명한다. 다시 말하면 Bayes의 정리는 일관성을 보장하며 점차적으로 증가하는 신념 정확도를 약속합니다. 많은 사람들 (통계 학자, 심리학자, 기계 학자)이 정리를 합리성의 정의로 보았는지는 놀랄 일이 아닙니다. 이 온화한 기술 에세이에서 저는 베이 즈의 정리가 수학에 깊이 숨겨져 있지는 않지만 연구와 종교와의 관련성에있어서 두 가지 의미가 있음을 지적합니다. 그러나 먼저 우리는 정리의 조건과 그것들이 어떻게 서로 관련되어 있는지 (즉, 밝혀야 할 정리의 작업)를 소개 할 필요가있다.

J. Krueger

그림 1. 베이 즈 정리.

출처 : J. Krueger

그림 1은 정리를 보여줍니다. 증거 (데이터에 대한 D) 또는 p (H | D)가 주어진 가설 (H (hypothesis)의 가설에 대한 가설)이 사실 일 확률은 가설의 사전 확률 p (H) , 즉 새로운 데이터가 도입되기 전에 “진단 비율”이된다.이 비율은 가설이 참이라고 가정하는 데이터의 확률이고, p (D | H)는 데이터의 전체 확률에 대해 p (D ), 즉 모든 가설 하에서 데이터의 합계 확률. 문제를 간단하게하기 위해 ( 예! ), ~ H (확률이 1 – p (H))라는 단 하나의 대체 가설 만 있다고 가정 해 봅시다. 이제 p (D) = p (H) * p (D | H) + p (H) * p (D | ~ H)라고 말할 수 있습니다. 정리가 완료되었습니다. 이 사실을 이해하려면 그림 1을 다시보십시오.

베이 즈 정리의 첫 번째 의미는 목사가 이론적으로 증명 된 신을 가질 수 있지만 필요한 조건이 극단적이라는 것입니다. p (D | H) = 1이고 p (D | ~ H) = 0 인 경우에만 p (H | D)가 1이 될 수 있습니다. 확실한 신념에는 데이터의 확실성이 필요합니다. 데이터는 관심의 가설을 가지고 확실해야하며 대체 가설 하에서는 불가능하다. 이 후자의 한 쌍의 조건이 충족 될 때, (신에서 또는 무엇이든) 신념의 이전 강도는 부적합합니다. 증명 (즉, p (D | H) = 1과 p (D | ~ H) = 0의 조합)은 옹호론자와 회의론 자의 차이를 근절한다.

종교에 많은 도움이됩니다. 대부분의 경험 과학에서 명백한 증거는 드물다. 데이터에는 소음과 불확실성이 있으며 가설과 그들이 지원하는 신념과 가정은 확률 적으로 유지되는 경향이 있습니다. 기껏해야, 연구자들은 X가 사실이라는 ‘도덕적 확실성’이 있다고 말할 수 있습니다. 도덕성은 불완전한 것으로 유명하며, 새로운 데이터가 주어진다면 마음의 변화를위한 문이 열려 있습니다.

베이 즈 정리의 두 번째 의미는 가설 하에서 데이터의 확률 p (D | H)가 가설의 사후 확률과 얼마나 잘 정렬되어 있는가에 대한 질문과 관련있다. 즉, 데이터, p (H | D). 이 질문은 가설을 검증하고자하는 모든 연구자들에게 흥미가 있으며 데이터가 신뢰할 만한지 아닌지에 관심이있는 경우에만 해당됩니다. 이 연구자들은 데이터에서 가설에 대한 추론을 이끌어 내고자합니다. 그들은 p (D | H)를 사용하여 p (H | D)를 추론하려고합니다. 그렇게하기 위해서는 완전한 정리가 필요합니다. 그들은 p (H), p (~ H) 및 p (D | ~ H)를 알아야 (또는 가정) 할 필요가 있습니다. p (D | H)에서 p (H | D) 로의 추론은 두 항이 서로 상관되기 때문에 강하다. 시뮬레이션 실험을 사용하여 이러한 상관 관계는 양의 값을 가지지 만 그 크기는 예측 가능한 방식으로 크게 다를 수 있음을 발견했습니다 (Krueger & Heck, 2017). 여기서 p (D | H)와 p (H | D)가 동일한 조건을 찾고 싶습니다.

베이 즈 정리 (Bayes ‘s theorem)는 p (H | P (D))가있는 경우에만 p (D | H) = p 이제 p (D | H) = .05의 경우를 생각해 봅시다. 연구원은 협약에 따라 결과가 중요하다고 선언합니다. 모든 경우 p (H | D)는 p (D | H)만큼 낮지는 않지만 그렇다고 할 수 있습니다. 오늘의 질문은 이렇습니다. 그렇게하려면 무엇이 필요합니까? 작은 대수학은 p (D | H) = (p (H) – p (D | H)) / p (~ H)이면 p (D | H) = p (H | 몇 가지 예를 들어 봅시다. p (D | H) = .05를 선택했다면, 우리는 처음에는 가능성이 낮지도 보이지도 않는 가설을 가질 수 있습니다. 즉, p (H) = .5. 이제, p (D | ~ H) = .9라면 우리는 p (H | D) = p (D | H) = .05의 우리의 동등성을 얻게됩니다. 이것은 좋은 배열입니다. 이전의 믿음은 극도로 불확실하다 (p (H) = .5); (p (D | H) = .05), 대립 가설 (p (D | ~ H) = .9) 하에서 확률이 높다. 귀무 가설은 참으로 거부 될 수있다 (p (H | D) = .05). 이것은 p (~ H | D) = .95를 의미한다.

지금 우리가이 최상의 시나리오에서 출발 할 때 발생하는 더 심각한 결과를 고려하십시오. 연구자가 위험한 대체 가설, 즉 p (H)가 높은 경우를 선택하면 어떻게 될까요? 예를 들어 p (D | H) = .8이면 p (D | H) = 3.0이므로 p (D | H)는 3.75가되어야합니다. 불가능한 결과! 베이 즈 정리 (Bayes ‘s theorem)는 그것을 금지하고있다. 위험한 연구 (p (H)가 높음)를 추구하고 통계적 유의미성을 확보 할 수 있다면 그 가설을 거부하는 데이터만큼이나 가설이 없다는 것을 보장 할 수 있습니다. p (H | D)> p (D | H) = 1. p (H)의 모든 더 높은 값에 대해, p (H | D)> p 이것은 딜레마의 하나의 뿔입니다.

연구가 안전 할 때 다른 경적이 나온다. p (H)가 낮을 때, 즉 대안 또는 실질 가설 확률 p (H)가 선험적 일 때, p (H | D)와 p (D | H)의 동등성은 쉽게 그러나 p (D | ~ H)가 낮다는 가격에 대해서. 예를 들어 p (H) = .1, p (D | H)와 p (H | D) = .05 모두 p (D | ~ H) =. 그로테스크 한 결과처럼 보일 수 있습니다. 한편으로는 대립 가설은 선험적으로 간주 될 수 있지만 (p (~ H) = .9), 반면에이 가설은 가설과의 적합성만큼이나 가난한 자료에 적합하다 (H)는 거절 당하고있다.

이야기의 도덕은 베이 즈의 정리가 우리에게 일관성을 가르 칠뿐 아니라 테스트 할 수있는 중간 가능성에 대한 가설을 선택하기 위해 최선을 다할 것을 촉구합니다. 경험적 연구가 가장 큰 보상을 산출하는 것은 여기에 있습니다.

증명? 무슨 증거 요? 첫 번째 암시 ( ‘증거는 옹호자와 회의론자 사이의 불일치를 제거합니다’)를 적어봤을 때 나는 호만의 잠에서 몹시 괴롭혔다. David Hume (1764)는 연역적 방법으로 유도의 타당성을 증명할 수 없다고 유명하게 주장했습니다 (Stanford Encyclopedia에서 볼 수 있습니다). 이 매우 깊은 통찰력에 대한 진부한 예는 얼마나 많은 백조를 보았더라도 검은 백조가 없다는 것을 증명할 수는 없다는 것입니다. 가능한 백조의 수에 제한이 없을 때 그렇습니다. 인수는 한정된 인구 집단에서 유지되지 않는다. 이제 우리는 p (D | H)가 1 일 수 있는지 물어봐야합니다. 우리가 이론의 땅에서 일하고 있다면, 가우스 (또는 무제한) 분포의 존재를 가정하면, 그것이 어떻게 데이터의 기초. 데이터는 측정 값에 포함되어 있으므로 숫자 값이 유한합니다. 따라서 더 극단적 인 값이 항상 가능합니다. 따라서 이러한 데이터 나 데이터의 확률은 1보다 작아야합니다. 따라서 베이 즈의 정리가 관측 된 데이터로부터 특정 신념을 추출 할 수있게한다는 논거는 이론적으로 만 유효하지만 실제로는 유효하지 않습니다. 흄 (Hume)이 이긴다 (베이 즈의 노력이 흄을 반박하려는 욕망에 의해 동기 부여되었다는 흥미로운 역사적 기록이있다).

우리는 위대한 회의론자가 유머 감각을 갖고 있음을 보여주기 위해 David Hume의 말을 인용합니다. “나는 온갖 종류의 과목을 썼다. 그러나 나는 적이 없다. 실제로 모든 휘그당 원들, 모든 토리당들, 그리고 모든 그리스도인들을 제외하고는 “ (여기에서 발견).

Bayes, T. (1764). 기회의 교리에서 문제를 해결하기위한 에세이 . 런던 왕립 학회 철학 연구, 53 , 370-418.

흄, 디 (1739). 인간 본성에 관한 논문 . 옥스포드, 영국 : 옥스포드 대학 압박.

Krueger, JI, & Heck, PR (2017). 유도 통계적 추론에서의 p의 발견 적 가치. 심리학의 국경 : 교육 심리학 . https://doi.org/10.3389/fpsyg.2017.00908