소수 다수주의

갈턴 최근 포스트에서 필자는 인간 (및 비 인간) 적합성의 기본 합리성에 대해 많은 것을 말할 수는 있지만 문제가있을 수 있다고 주장했다. 예 du jour는 아름다움 콘테스트였습니다. 여성 (다른 여성이 선택하는 남성을 선택하는 여성)간에 너무 많은 선택을하면 여성과 남성 모두 평균적으로 고통을 겪을 수 있습니다.

또 다른 제한 사항은 복사되는 대다수의 크기입니다. 당신이 유리 병에 대리석의 수를 예상하려고한다고 가정 해보십시오. 셀 수있는 것보다 더 많은 구슬이 있습니다. 그러나 항아리의 크기와 개별 구슬의 크기에 대한 인상을 사용하여 추측 할 수 있습니다. 이제 100 명의 다른 사람들이 이미 서로 독립적 인 견적을 작성했으며 이러한 견적의 95 %가 700과 800 사이라고 추측한다고 가정 해 보겠습니다.이 정보의 혜택을 얻으려면 가장 좋은 전략은 750 구슬이 항아리. 그 숫자를 200으로 추정했다면, 자신을 판단 할 가치가없는 이상 치로서 인식하게 될 것입니다. 다른 사람의 견적을 집계 한 정보를 사용하는 것은 "누가 백만장자가 되겠습니까?"라는 질문에 "관객 투표 (poll-the-audience)"생명선을 사용하는 것과 같습니다. 그러나 다른 사람들의 견적을 알기 전에 구슬의 수를 200으로 추정한다면 어떨까요? 나머지 그룹과 얼마나 멀리 떨어져 있는지 알게되면 추정치가 이상치로 제거 될 때이를 반대해서는 안됩니다.

일반적으로 관측 수가 증가하고 분산 또는 관측치가 감소함에 따라 특이 치를 식별하는 것이 쉬워집니다. 이제 당신이 낮은 견적을 준 반면 두 사람 모두 높은 견적을 준 사람이 2 명 밖에 없다고 가정 해보십시오. 당신은 당신의 의견에 동의하는 반면 서로 견해가 일치하기 때문에 자신의 견적이 아마도 당신의 견적보다 더 정확할 것이라는 점을 은혜로 인정해야합니까? 이것은 유혹스러운 생각입니다. 합의는 합당한 사람의 수가 논리적 인 최소치 일 때에도 정확성을 나타낼 수 있습니다.

나는 이제 합의가 정확성의 단순한 대리인이라는 것을 주장 할 것이다. 모든 판단이 정확하다면, 그들은 모두 서로 동의 할 것입니다. 그러나 그 반대는 정확성과 아무런 관련이없는 이유로 판결이 일치 할 수 있기 때문에 사실이 아닙니다. 이러한 이유 중 하나는 우연입니다.

진행할 수있는 다른 방법은 세 가지 판단 (너와 다른 두 가지의 판단)을 사용하고 평균을 계산하는 것입니다. 평균은 모두 캡처하려고하는 잠재 매개 변수의 최적 추정입니다. 이 접근 방식에 따르면 세 심사 위원은 각각 독립적 인 측정 도구이며 각 개별 판단은 정보 (진실)와 잡음 (오류)의 조합입니다. 오류는 서로 독립적이라고 가정하고 평균을 내리는 판단은 오류를 제거합니다.

우리는 두 가지 높은 판단과 하나의 낮은 판단이있는 경우 진행 방법에 대해 두 가지 경쟁 권고 사항을 갖게되었습니다. (A) 낮은 판단력을 제거하거나 외향적 인 판사를 설득하여 다수결에 참여한다. (B) 세 가지 판결을 그들 중 하나에 대한 편견없이 평균합니다. 각 방법마다 옹호자가 있습니다. A에 대한 주된 논거는 낮은 추정치가 "명백하게"이상치이며 그 합의는 정확성을 나타냅니다 [나는 이미이 생각에 의문을 제기했습니다]. 더욱이, A의 지지자들은 심사 위원들 사이의 합의를 구하는 토론은 항상 유익하다고 믿는다. 토론을 통해 판사는 진실에 더 가까이 다가 갈 수 있습니다. 하지만 진실은? 두 명의 고등 판사가 조금은 인정하고 낮은 판사가 많은 것을 인정한다면 그 결과는 원래의 판결에서 이미 계산 된 평균 일 수 있습니다. 그렇다면 그룹 토론은 낭비였습니다. 또는 외계인 판사 만이 동의하면 (비대칭 적 적합성 압력 하에서 발생할 가능성이 있음) 결과는 단순히 이상치를 무시함으로써 얻을 수있는 결과입니다. 다시 그룹 토론은 시간과 아드레날린 낭비였습니다. 세 번째 가능성은 외곽 판사가 동의 한 2 명의 판사보다 조금 더 양보한다는 것입니다. 결과는 각 개별 가중치가 전체 평균에 대한 판단의 근접성에 비례하는 가중치 평균으로 설명 할 수있는 그룹 판단입니다. 이것은 좋은 생각처럼 들리지만, 정확히 어떤 것이되어야하는지 아무도 모릅니다. 가중치 판단이 끝날 수있는 순수한 전략 A와 B 사이에는 많은 포인트가 있습니다. 따라서이 글의 나머지 부분에서는 A와 B 만 고려할 것입니다.

두 가지 통계 원칙을 사용함으로써 우리는 직감, 타당성 또는 전통에 호소하지 않고도 A 또는 B가 더 나은 전략인지 여부를 결정할 수 있습니다 (우리는 항상 이런 식으로했습니다!). 첫 번째 방법은 A 또는 B가 정확하다고 가정 할 때 세 가지 관찰 된 판단의 집합이 가능한지 묻는 것입니다. 세 가지 판단이 2, 2, -2라고 가정합니다. 이 수치를 표준 편차가 1 인 모집단에서 추출한 표본으로 생각하십시오. 그러나 표준 정규 분포와 달리 평균은 0이 아닙니다. 대신 이론 A가 정확하다고 가정하면 평균은 2이고, 이론 B가 정확하다면 .667 (2/3)이다. 2, 2 및 -2 (또는 더 극단적 인 수)를 찾는 확률은 이론 A에서는 0.000008이고 이론 B에서는 0.00003으로 나타납니다. 후자의 비율은 3.75이며 이는 둘 다 이론은 처음에는 똑같이 적용될 가능성이 있다고 여겨졌습니다. 이론 B는 이론 A보다 사실 일 가능성이 약 4 배 더 높습니다.이 결과는 외계인 판단을 제거하거나 (반체제 판사를 설득하여) 자신의 마음을 바꾸면, 당신은 중요한 정보를 잃어 버리고, 그 결과 집단 판단은 더욱 악화됩니다.

두 번째 방법은 다른 독립 관찰자들로부터 더 많은 판단이 수집되면 어떤 일이 일어날 것인가를 묻는 것이다. (실제로 그러한 판단을 할 필요가 없다는 것에 주목하라!) 이제 우리는이 모든 판단의 기초가되는 수의 인구가 표준 정규 (M = 0, SD = 1). 따라서 외계인 제거 또는 수정 (2, 2, 2) 후의 이론 A와 관련된 숫자 세트는 매우 긍정적입니다. 모집단에서 세 가지 판결로 이루어진 또 다른 세트가 샘플링되면 결과 평균은 0과 2 사이에 있고 측정 프로세스가 안정적이므로 후자에 더 가깝습니다. 측정에 오류가 전혀없는 것은 아니기 때문에 평균으로 회귀 할 것으로 예상됩니다. 이론 B (2, 2, -2)에 의해 주어진 수의 세트를 가정하면, 세 가지 판단의 두 번째 샘플의 평균은 0과 2/3 사이에 놓일 가능성이 높으며 2/3은 2보다 덜 극단적이므로, 예상 회귀 효과의 크기는 이론 A보다 이론 B보다 작다.

이 실습에서 알 수 있듯이, 작은 표본에서 이상치를 무시 (또는 표출)해도 측정에서 잘 알려진 회귀 효과가 수정되지는 않습니다. 대신, 그것은 그것을 더 나쁘게 만듭니다. 이론 B (2/3) 하에서 가장 좋은 추정치는 아마도 계속 샘플링 한 것보다 약간 더 높을 것이다. 어떤 것이 든이 견적은 감소되어야합니다. 그러나 이상치를 없애면 그룹 견적이 2/3에서 2로 이동합니다. 예상치를 극단적으로 정하면 긍정적으로 팽창 할 수 있습니다.

구체적인 숫자로 회귀 효과를 설명해 보겠습니다. 우리가 판단이 객관적으로 신뢰할 만하다면 (r = .9), 평균 판단 2 (평균 2, 2, 평균 2)가 평균 1.8으로 반복 될 것으로 예측됩니다. 비교해 보면, 2/3 (평균 2, 2, -2)의 평균 판단은 .6으로 복제 될 것으로 예측됩니다. 그것의 더 큰 사지의 덕택으로, 이전의 판단은 후자보다 더 팽창 된 것으로 밝혀진다. 그러나 합의가 정확성을 표명한다는 견해에 따르면, 이전의 판단이 더 나은 것입니다. 판단이 겸손한 신뢰도 (r = .6)만을 갖는다 고 비관 론적으로 가정하면 회귀 효과가 더 크지 만 같은 패턴을 보인다. 2의 원래 평균은 1.2의 예측 값으로 회귀하고, 원래의 평균 2/3은 회귀 분석 값 0.4로 회귀합니다.

이 이야기가 너무 추상적이어서 이론 A와 B는 어쨌든 결코 마음을 먹지 않습니다. 소규모위원회가 입학, 자금 조달, 판촉 등을 결정할 때 큰 문제가된다는 점을 강조하겠습니다. 돈을 신청하는 100 명의 후보자를 고려하십시오. 연구를해야합니다. 각 제안은 3 명의 심사 위원에 의해 평가되고 각 심사 위원의 점수는 표준화됩니다. 오직 소수의 사람들 만 자금을 지원받을 수 있습니다. 등급이 2, 2 및 2 인 제안서는 안전하지만 등급이 1, 1 및 1 인 제안서는 안전하지 않습니다. 이제 세 번째 제안은 위에 논의 된 종류의 것이다 (2, 2, -2). 이론 B (단순 평균)에 따르면,이 제안은 컷을 만들지 않습니다. 이론 A (이상 치 제거)에 따르면,이 제안은 두 번째 것보다 높아지고, 아마도 자금 조달을하지 못하게 할 것입니다. 따라서 그룹 토의는 많은 피해를 줄 수 있습니다. 이 예 에서처럼 상대적으로 높은 점수가 가장 큰 관심사라면, 하나의 부정적인 이상 치를 가진 제안 (사람들)이 선택적으로 선호 될 것입니다. 자금 조달 또는 판촉 컨텍스트에서 아무도 2 개의 낮은 점수와 1 개의 높은 점수를 가진 경우에 관심이 없습니다.

회귀는 또한 개별 결정에 영향을줍니다. 3 명의 심사 위원이 만장일치로 프로젝트 자금을 지원할 때 (동료 승진 또는 용의자의 무죄 선고) 투표를하면 다른 모든 사람들이 동의 할 것이라고 결론을 내리는 것은 무의미합니다. '예'의 실제 확률은 후자가 높으면 표본에서 확률보다 작을 것입니다. 예를 들어, 참 확률이 .9이면, 3 명의 독립적 인 재판관의 표본 (즉, 그들의 판단이 상관 관계가 없음)이 만장일치로 부합 될 가능성은 .73이다. 즉, 희귀 한 사건 (여기서는 부정 표)이 작은 표본에서 과소 표현됩니다. 3 명의 만장일치 재판관의 표본을 보았을 때, 진정한 합의는 완벽하지 못한 것 같습니다. 그러나 얼마나 불완전한가? 우리는 얼마나 많은 수정을해야 하는지를 어떻게 알 수 있습니까?

이 예제에서, 나는 p = .9이지만, p는 0이 아닌 다른 값을 가질 수 있다고 가정했습니다. p가 0이면 예 투표가 발생할 수 없습니다. 라플라스 (Laplace)가 제안한 우아한 해결책은 무지를 고백하는 것입니다. 그것은 처음에는 p의 모든 값이 똑같이 있다고 가정하는 것입니다. 표본을 관찰 한 결과,이 표본이 p의 각 가능한 값에서 추출 될 가능성이 얼마나 높은지를 물을 수 있습니다. 분명히 3 표의 3 표본은 p = .99이면 p = .98, p = .98이면 p = .01로 그려집니다. 이 일을하기 위해서는 통합 미적분이 필요하지만, 무지의 가정하에, 그것은 모두 단순하고 아름다운 공식으로 귀결됩니다. 가장 좋은 추정, 즉 회귀 오류와 반대 유형의 오류를 최소화하는 추정치는 (k + 1) / (n + 2)이며, 여기서 k는 "성공 횟수"[여기, yes votes]이고 n은 샘플 크기입니다. 3 개의 찬성표와 반대 의견을 보았을 때, 라플라시안 주민의 실제 지원 추정치는 4/5 또는 p = 0.8이었다. 라플라스를 무시하고 p = 1을 추정하는 것은 추정치의 1/5 크기 인 회귀 오류를 커밋하는 것입니다. 표본이 더 크고 만장일치가 계속 관찰된다면 진정한 일치 성을 가정하는 경우가 더 강할 것이다 [예를 들어 30 명의 표본 추출 된 판사 중 30 명이 찬성표를 던지면 p의 추정치는 31/32 또는 .969].

완벽한 만장일치가없는 패널로 돌아 가자. 29 명의 불경스럽게 말하는자를 제외하거나 마음의 변화를 유도한다면, 만장일치의 추정은 상당한 회귀 효과를 피할 수 있습니다 (.094 = 1- -906). 배제 또는 사회적 영향의 동일한 전략은 작은 표본에서 훨씬 더 큰 회귀 오류를 산출합니다. 2 명의 yea-sayer가 반대편을 제외하거나 변환하면 오류는 .4 (1-.6, 여기서 .6은 (2 + 1) / (3 + 2)입니다.

측정, 데이터 통합 ​​및 발생할 수있는 오류에 대한 수정의 논리는 어렵습니다. 많은 사람들은 기계적인 것처럼 보이기 때문에 번호 계산을 싫어합니다. 합리적인 사람들 사이에서 대화를 나누고 합의에 도달하는 것이 훨씬 더 인도적으로 보인다. 컨센서스는 기분이 좋다. 가능성이 높은 대다수의 구성원은 사실적으로 정확하고 사회적으로 설득력이 있다는 신념을 가질 수 있습니다 (반대자를 똑바로 세우는 것). 이전의 반체제 인사는 최소한 그룹에 의해 받아 들여지는 것에 대한 얕은 만족감을 가지고있다. 3 명의 재판관은 그날 밤 잘 자고, 그들이 불의를 저질렀다는 것을 깨닫지 못할 것입니다. 원래의 예에서 초기 분산 (1, 1, 1)이없는 좋은 경우는 이제 (2, 2, -2)에서 (2, 2, 2)로 상승한 경우보다 아래에 있습니다. 재정상의 맥락에서, 삶과 죽음 사이에 날카로운 경계가있는 경우, 검토 된 사건으로 인해 한 단계 떨어지는 경우 중 하나가 그 선을 넘을 것입니다. 비합리적으로 불공정 함을 느낄 수 있습니다.

여기에서 고려 된 의사 결정 유형에서, 각 판단을 이론 B에 의해 제안 된 것과 같은 독립적 인 표본으로 다루는 것은 합리적 (윤리적)이라는 결론을 내릴 수 있습니다. 판단이 연속적이면 평균을 구해야합니다. 판단이 분리 된 경우 비율로 변환해야합니다. 두 가지 유형의 추정치는 회귀 분석 효과를 극복하기 위해 샘플링 오류가 발생할 가능성을 보정 할 수 있습니다. 그것은 로켓 과학이 아니며, 판단 기준에 복종하는 사람들은 최고의 기준으로 대우 받아야합니다.

BTW, 사진의 신사는 Francis Galton 경입니다.