추론 통계가 필요한 이유?

"우리는 남성과 여성이 X가 서로 다른가요?"라는 질문이 있다고 상상해보십시오.

어떤 "X"가 높이, 공감, 13 세기 스페인 역사에 대한 지식, 또는 다른 어떤 것, 어떤 주어진 사람이 어떤 주어진 여자와 다를 것임을 알고 있지만, 우리가 모르는 것 평균 "은 여성과"평균적으로 다르다. "즉, 우리가 초기 질문을했을 때 우리는 남성에 대한 평균이 여성에 대한 평균과 어떻게 비교되는지 알고 싶었을 것입니다. 그러나 우리는 남성에 대한 실제 평균 또는 여성에 대한 실제 평균을 결코 알지 못할 것입니다. 그것은 70 억 명이 넘는 사람들을 측정해야하기 때문입니다! 그래서, 우리는 어떻게 든 남성 샘플과 여성 샘플을 얻고, 비교하고, 결론을 이끌어 낼 필요가 있습니다.

우리는 100 명의 남성과 100 명의 여성의 표본을 얻고 스페인 역사에 관해 질문합니다. 우리의 샘플에서 여성은 평균 68 %이고 남성은 평균 63 %입니다. 이것이 우리 샘플의 결과이며 견고한 결과입니다. 그러나 우리는 표본에 특별히 관심이 없다는 것을 기억하십시오. 우리는 "남자 대 여자"에 관심이 있습니다. "우리가 본 남자"대 "우리가 보았던 여자"가 아닙니다. 샘플을 사용하여 더 많은 인구에 대해 추측 할 수 있습니다 ( 추론 통계에 추론을 넣는 것입니다).

이러한 추측을하는 것은 심각한 도전 과제입니다. 샘플에서 볼 수있는 차이는 우연히 발생할 수 있습니다! 물론, 우리의 남성 그룹은 우리 그룹의 여성 그룹과 다르지만, 그 자체로 많은 것을 말하지는 않습니다. 왜냐하면 우리가 두 그룹의 남자를 무작위로 골랐다면, 그들은 또한 다를 것이기 때문입니다. 이것은 심각한 문제입니다 : 우리가 측정하려고하는 모든 것에서 거의 모든 두 샘플이 분명히 다름을 감안할 때 (샘플을 충분히 자세히 측정 할 수 있다면) 어떻게 샘플을 사용하여 결론을 도출 할 수 있습니까?

약간의 직관이 우리에게 말할 것 인 모두는, 그러나, 분실되지 않는다. 임의의 기회로 인해 발견 된 차이는 작을 가능성이 있으며 동일한 테스트를 다시 수행하면 매우 다른 크기가 될 수 있습니다. 우리가 100 번에서 100 번까지의 샘플을 20 번 받았을 때 남성보다 5 포인트 높은 점수를 얻은 여성을 찾을 때마다 우리는 더 많은 추론을 할 수있었습니다. 우리의 발견에 훨씬 더 확신을 가질 수 있습니다. 복제가 일반적으로 실용적이지는 않지만, 복제 한 경우 어떻게 될지 추측하기 위해 하나의 샘플을 사용할 수 있습니다. 그리고 우리의 직감은 우리에게도 도움이 될 수 있습니다. 적은 수의 사람들을 측정 한 후에 그룹간에 작은 차이를 발견하면, 그룹을 측정 한 후에 그룹간에 큰 차이를 발견하는 것보다 무작위 적 기회 때문일 가능성이 큽니다. 많은 사람들. 속보 : 1) 큰 차이는 작은 차이보다는 우연에 의한 것 같지 않으며, 2) 샘플의 크기가 클수록 더 많은 점 1이 사실입니다.

우리가 "덜 가능성 있음"과 "그럴듯한"부분에 대해 수학적으로 우수한 결과를 얻을 수 있다면 샘플을 사용하여 결과가 얼마나 복제 가능한지에 대한 추측을 시작할 수 있습니다. 즉, 단일 샘플을 사용하여 우리의 연구를 여러 번 복제하면 어떤 일이 발생할 것인지를 정확하게 예측할 수 있습니다. 우리는 이미 결과가 반복해서 반복 된다면 더 큰 인구에 대한 결론을 도출 할 수있을 것이라고 확신했습니다. 이제 우리는 하나의 샘플을 사용하여 샘플이 많을 경우 어떤 일이 발생할 것인지에 대한 결론을 도출 할 수 있음을 알고 있습니다. 마지막 두 문장 함께 : 우리 뒤에 수학을 얻을 수 있다면, 우리는 더 큰 인구에 대한 신뢰할 수있는 추론을하기 위해 우리의 단일 샘플을 사용할 수 있습니다.

따라서 우리가 사용하는 추론적인 통계가 무엇이든 상관없이, 질문은 항상 다음과 같을 것입니다 : "이 표본에서 우리가 발견 한 차이점, 우연히도 큰 차이 발견 할 확률은 무엇입니까?"우리가 관찰 한 차이 우연한 것이기 때문에, 그것이 진짜임을 확신합니다.