소수 다수주의

최근 포스트에서 필자는 인간 (및 비 인간) 적합성의 기본 합리성에 대해 많은 것을 말할 수는 있지만 문제가있을 수 있다고 주장했다. 예 du jour는 아름다움 콘테스트였습니다. 여성 (다른 여성이 선택하는 남성을 선택하는 여성)간에 너무 많은 선택을하면 여성과 남성 모두 평균적으로 고통을 겪을 수 있습니다.

또 다른 제한 사항은 복사되는 대다수의 크기입니다. 당신이 유리 병에 대리석의 수를 예상하려고한다고 가정 해보십시오. 셀 수있는 것보다 더 많은 구슬이 있습니다. 그러나 항아리의 크기와 개별 구슬의 크기에 대한 인상을 사용하여 추측 할 수 있습니다. 이제 100 명의 다른 사람들이 이미 서로 독립적 인 견적을 작성했으며 이러한 견적의 95 %가 700과 800 사이라고 추측한다고 가정 해 보겠습니다.이 정보의 혜택을 얻으려면 가장 좋은 전략은 750 구슬이 항아리. 그 숫자를 200으로 추정했다면, 자신을 판단 할 가치가없는 이상 치로서 인식하게 될 것입니다. 다른 사람의 견적을 집계 한 정보를 사용하는 것은 "누가 백만장자가 되겠습니까?"라는 질문에 "관객 투표 (poll-the-audience)"생명선을 사용하는 것과 같습니다. 그러나 다른 사람들의 견적을 알기 전에 구슬의 수를 200으로 추정한다면 어떨까요? 나머지 그룹과 얼마나 멀리 떨어져 있는지 알게되면 추정치가 이상치로 제거 될 때이를 반대해서는 안됩니다.

일반적으로 관측 수가 증가하고 분산 또는 관측치가 감소함에 따라 특이 치를 식별하는 것이 쉬워집니다. 이제 당신이 낮은 견적을 준 반면 두 사람 모두 높은 견적을 준 사람이 2 명 밖에 없다고 가정 해보십시오. 당신은 당신의 의견에 동의하는 반면 서로 견해가 일치하기 때문에 자신의 견적이 아마도 당신의 견적보다 더 정확할 것이라는 점을 은혜로 인정해야합니까? 이것은 유혹스러운 생각입니다. 합의는 합당한 사람의 수가 논리적 인 최소치 일 때에도 정확성을 나타낼 수 있습니다.

나는 이제 합의가 정확성의 단순한 대리인이라는 것을 주장 할 것이다. 모든 판단이 정확하다면, 그들은 모두 서로 동의 할 것입니다. 그러나 그 반대는 정확성과 아무런 관련이없는 이유로 판결이 일치 할 수 있기 때문에 사실이 아닙니다. 이러한 이유 중 하나는 우연입니다.

진행할 수있는 다른 방법은 세 가지 판단 (너와 다른 두 가지의 판단)을 사용하고 평균을 계산하는 것입니다. 평균은 모두 캡처하려고하는 잠재 매개 변수의 최적 추정입니다. 이 접근 방식에 따르면 세 심사 위원은 각각 독립적 인 측정 도구이며 각 개별 판단은 정보 (진실)와 잡음 (오류)의 조합입니다. 오류는 서로 독립적이라고 가정하고 평균을 내리는 판단은 오류를 제거합니다.

우리는 두 가지 높은 판단과 하나의 낮은 판단이있는 경우 진행 방법에 대해 두 가지 경쟁 권고 사항을 갖게되었습니다. (A) 낮은 판단력을 제거하거나 외향적 인 판사를 설득하여 다수결에 참여한다. (B) 세 가지 판결을 그들 중 하나에 대한 편견없이 평균합니다. 각 방법마다 옹호자가 있습니다. A에 대한 주된 논거는 낮은 추정치가 "명백하게"이상치이며 그 합의는 정확성을 나타냅니다 [나는 이미이 생각에 의문을 제기했습니다]. 더욱이, A의 지지자들은 심사 위원들 사이의 합의를 구하는 토론은 항상 유익하다고 믿는다. 토론을 통해 판사는 진실에 더 가까이 다가 갈 수 있습니다. 하지만 진실은? 두 명의 고등 판사가 조금은 인정하고 낮은 판사가 많은 것을 인정한다면 그 결과는 원래의 판결에서 이미 계산 된 평균 일 수 있습니다. 그렇다면 그룹 토론은 낭비였습니다. 또는 외계인 판사 만이 동의하면 (비대칭 적 적합성 압력 하에서 발생할 가능성이 있음) 결과는 단순히 이상치를 무시함으로써 얻을 수있는 결과입니다. 다시 그룹 토론은 시간과 아드레날린 낭비였습니다. 세 번째 가능성은 외곽 판사가 동의 한 2 명의 판사보다 조금 더 양보한다는 것입니다. 결과는 각 개별 가중치가 전체 평균에 대한 판단의 근접성에 비례하는 가중치 평균으로 설명 할 수있는 그룹 판단입니다. 이것은 좋은 생각처럼 들리지만, 정확히 어떤 것이되어야하는지 아무도 모릅니다. 가중치 판단이 끝날 수있는 순수한 전략 A와 B 사이에는 많은 포인트가 있습니다. 따라서이 글의 나머지 부분에서는 A와 B 만 고려할 것입니다.

두 가지 통계 원칙을 사용함으로써 우리는 직감, 타당성 또는 전통에 호소하지 않고도 A 또는 B가 더 나은 전략인지 여부를 결정할 수 있습니다 (우리는 항상 이런 식으로했습니다!). 첫 번째 방법은 A 또는 B가 정확하다고 가정 할 때 세 가지 관찰 된 판단의 집합이 가능한지 묻는 것입니다. 세 가지 판단이 2, 2, -2라고 가정합니다. 이 수치를 표준 편차가 1 인 모집단에서 추출한 표본으로 생각하십시오. 그러나 표준 정규 분포와 달리 평균은 0이 아닙니다. 대신 이론 A가 정확하다고 가정하면 평균은 2이고, 이론 B가 정확하다면 .667 (2/3)이다. 2, 2 및 -2 (또는 더 극단적 인 수)를 찾는 확률은 이론 A에서는 0.000008이고 이론 B에서는 0.00003으로 나타납니다. 후자의 비율은 3.75이며 이는 둘 다 이론은 처음에는 똑같이 적용될 가능성이 있다고 여겨졌습니다. 이론 B는 이론 A보다 사실 일 가능성이 약 4 배 더 높습니다.이 결과는 외계인 판단을 제거하거나 (반체제 판사를 설득하여) 자신의 마음을 바꾸면, 당신은 중요한 정보를 잃어 버리고, 그 결과 집단 판단은 더욱 악화됩니다.

두 번째 방법은 다른 독립 관찰자들로부터 더 많은 판단이 수집되면 어떤 일이 일어날 것인가를 묻는 것이다. (실제로 그러한 판단을 할 필요가 없다는 것에 주목하라!) 이제 우리는이 모든 판단의 기초가되는 수의 인구가 표준 정규 (M = 0, SD = 1). 따라서 외계인 제거 또는 수정 (2, 2, 2) 후의 이론 A와 관련된 숫자 세트는 매우 긍정적입니다. 모집단에서 세 가지 판결로 이루어진 또 다른 세트가 샘플링되면 결과 평균은 0과 2 사이에 있고 측정 프로세스가 안정적이므로 후자에 더 가깝습니다. 측정에 오류가 전혀없는 것은 아니기 때문에 평균으로 회귀 할 것으로 예상됩니다. 이론 B (2, 2, -2)에 의해 주어진 수의 세트를 가정하면, 세 가지 판단의 두 번째 샘플의 평균은 0과 2/3 사이에 놓일 가능성이 높으며 2/3은 2보다 덜 극단적이므로, 예상 회귀 효과의 크기는 이론 A보다 이론 B보다 작다.

이 실습에서 알 수 있듯이, 작은 표본에서 이상치를 무시 (또는 표출)해도 측정에서 잘 알려진 회귀 효과가 수정되지는 않습니다. 대신, 그것은 그것을 더 나쁘게 만듭니다. 이론 B (2/3) 하에서 가장 좋은 추정치는 아마도 계속 샘플링 한 것보다 약간 더 높을 것이다. 어떤 것이 든이 견적은 감소되어야합니다. 그러나 이상치를 없애면 그룹 견적이 2/3에서 2로 이동합니다. 예상치를 극단적으로 정하면 긍정적으로 팽창 할 수 있습니다.

구체적인 숫자로 회귀 효과를 설명해 보겠습니다. 우리가 판단이 객관적으로 신뢰할 만하다면 (r = .9), 평균 판단 2 (평균 2, 2, 평균 2)가 평균 1.8으로 반복 될 것으로 예측됩니다. 비교해 보면, 2/3 (평균 2, 2, -2)의 평균 판단은 .6으로 복제 될 것으로 예측됩니다. 그것의 더 큰 사지의 덕택으로, 이전의 판단은 후자보다 더 팽창 된 것으로 밝혀진다. 그러나 합의가 정확성을 표명한다는 견해에 따르면, 이전의 판단이 더 나은 것입니다. 판단이 겸손한 신뢰도 (r = .6)만을 갖는다 고 비관 론적으로 가정하면 회귀 효과가 더 크지 만 같은 패턴을 보인다. 2의 원래 평균은 1.2의 예측 값으로 회귀하고, 원래의 평균 2/3은 회귀 분석 값 0.4로 회귀합니다.

이 이야기가 너무 추상적이어서 이론 A와 B는 어쨌든 결코 마음을 먹지 않습니다. 소규모위원회가 입학, 자금 조달, 판촉 등을 결정할 때 큰 문제가된다는 점을 강조하겠습니다. 돈을 신청하는 100 명의 후보자를 고려하십시오. 연구를해야합니다. 각 제안은 3 명의 심사 위원에 의해 평가되고 각 심사 위원의 점수는 표준화됩니다. 오직 소수의 사람들 만 자금을 지원받을 수 있습니다. 등급이 2, 2 및 2 인 제안서는 안전하지만 등급이 1, 1 및 1 인 제안서는 안전하지 않습니다. 이제 세 번째 제안은 위에 논의 된 종류의 것이다 (2, 2, -2). 이론 B (단순 평균)에 따르면,이 제안은 컷을 만들지 않습니다. 이론 A (이상 치 제거)에 따르면,이 제안은 두 번째 것보다 높아지고, 아마도 자금 조달을하지 못하게 할 것입니다. 따라서 그룹 토의는 많은 피해를 줄 수 있습니다. 이 예 에서처럼 상대적으로 높은 점수가 가장 큰 관심사라면, 하나의 부정적인 이상 치를 가진 제안 (사람들)이 선택적으로 선호 될 것입니다. 자금 조달 또는 판촉 컨텍스트에서 아무도 2 개의 낮은 점수와 1 개의 높은 점수를 가진 경우에 관심이 없습니다.

회귀는 또한 개별 결정에 영향을줍니다. 3 명의 심사 위원이 만장일치로 프로젝트 자금을 지원할 때 (동료 승진 또는 용의자의 무죄 선고) 투표를하면 다른 모든 사람들이 동의 할 것이라고 결론을 내리는 것은 무의미합니다. '예'의 실제 확률은 후자가 높으면 표본에서 확률보다 작을 것입니다. 예를 들어, 참 확률이 .9이면, 3 명의 독립적 인 재판관의 표본 (즉, 그들의 판단이 상관 관계가 없음)이 만장일치로 부합 될 가능성은 .73이다. 즉, 희귀 한 사건 (여기서는 부정 표)이 작은 표본에서 과소 표현됩니다. 3 명의 만장일치 재판관의 표본을 보았을 때, 진정한 합의는 완벽하지 못한 것 같습니다. 그러나 얼마나 불완전한가? 우리는 얼마나 많은 수정을해야 하는지를 어떻게 알 수 있습니까?

이 예제에서, 나는 p = .9이지만, p는 0이 아닌 다른 값을 가질 수 있다고 가정했습니다. p가 0이면 예 투표가 발생할 수 없습니다. 라플라스 (Laplace)가 제안한 우아한 해결책은 무지를 고백하는 것입니다. 그것은 처음에는 p의 모든 값이 똑같이 있다고 가정하는 것입니다. 표본을 관찰 한 결과,이 표본이 p의 각 가능한 값에서 추출 될 가능성이 얼마나 높은지를 물을 수 있습니다. 분명히 3 표의 3 표본은 p = .99이면 p = .98, p = .98이면 p = .01로 그려집니다. 이 일을하기 위해서는 통합 미적분이 필요하지만, 무지의 가정하에, 그것은 모두 단순하고 아름다운 공식으로 귀결됩니다. 가장 좋은 추정, 즉 회귀 오류와 반대 유형의 오류를 최소화하는 추정치는 (k + 1) / (n + 2)이며, 여기서 k는 "성공 횟수"[여기, yes votes]이고 n은 샘플 크기입니다. 3 개의 찬성표와 반대 의견을 보았을 때, 라플라시안 주민의 실제 지원 추정치는 4/5 또는 p = 0.8이었다. 라플라스를 무시하고 p = 1을 추정하는 것은 추정치의 1/5 크기 인 회귀 오류를 커밋하는 것입니다. 표본이 더 크고 만장일치가 계속 관찰된다면 진정한 일치 성을 가정하는 경우가 더 강할 것이다 [예를 들어 30 명의 표본 추출 된 판사 중 30 명이 찬성표를 던지면 p의 추정치는 31/32 또는 .969].

완벽한 만장일치가없는 패널로 돌아 가자. 29 명의 불경스럽게 말하는자를 제외하거나 마음의 변화를 유도한다면, 만장일치의 추정은 상당한 회귀 효과를 피할 수 있습니다 (.094 = 1- -906). 배제 또는 사회적 영향의 동일한 전략은 작은 표본에서 훨씬 더 큰 회귀 오류를 산출합니다. 2 명의 yea-sayer가 반대편을 제외하거나 변환하면 오류는 .4 (1-.6, 여기서 .6은 (2 + 1) / (3 + 2)입니다.

측정, 데이터 통합 및 발생할 수있는 오류에 대한 수정의 논리는 어렵습니다. 많은 사람들은 기계적인 것처럼 보이기 때문에 번호 계산을 싫어합니다. 합리적인 사람들 사이에서 대화를 나누고 합의에 도달하는 것이 훨씬 더 인도적으로 보인다. 컨센서스는 기분이 좋다. 가능성이 높은 대다수의 구성원은 사실적으로 정확하고 사회적으로 설득력이 있다는 신념을 가질 수 있습니다 (반대자를 똑바로 세우는 것). 이전의 반체제 인사는 최소한 그룹에 의해 받아 들여지는 것에 대한 얕은 만족감을 가지고있다. 3 명의 재판관은 그날 밤 잘 자고, 그들이 불의를 저질렀다는 것을 깨닫지 못할 것입니다. 원래의 예에서 초기 분산 (1, 1, 1)이없는 좋은 경우는 이제 (2, 2, -2)에서 (2, 2, 2)로 상승한 경우보다 아래에 있습니다. 재정상의 맥락에서, 삶과 죽음 사이에 날카로운 경계가있는 경우, 검토 된 사건으로 인해 한 단계 떨어지는 경우 중 하나가 그 선을 넘을 것입니다. 비합리적으로 불공정 함을 느낄 수 있습니다.

여기에서 고려 된 의사 결정 유형에서, 각 판단을 이론 B에 의해 제안 된 것과 같은 독립적 인 표본으로 다루는 것은 합리적 (윤리적)이라는 결론을 내릴 수 있습니다. 판단이 연속적이면 평균을 구해야합니다. 판단이 분리 된 경우 비율로 변환해야합니다. 두 가지 유형의 추정치는 회귀 분석 효과를 극복하기 위해 샘플링 오류가 발생할 가능성을 보정 할 수 있습니다. 그것은 로켓 과학이 아니며, 판단 기준에 복종하는 사람들은 최고의 기준으로 대우 받아야합니다.

BTW, 사진의 신사는 Francis Galton 경입니다.

Intereting Posts

침대 머리에서 함께 마주 치다 연민은 훈련과 함께 강해지는 근육과 같습니다. Kratom : 만성 통증과 중독을 치료하는 법정 고소 디지털 세상이 우리의 정신 건강을 돕는 방법 트럼프 회장 : 랭크주의 포스터 보이 정서적 응급 처치가 복장 이었으면 우리의 남성 정체성 위기 : 남성에게는 어떻게 될까요? 준비 및 Excel에 대한 지연 방지 강간에서 (비디오) 게임 만들기 권위주의 부모를위한 10 가지 팁 웰빙 : 왜 그렇게 붙지 않을까요? 영웅주의와 영웅 상상력 프로젝트 1963 년 11 월 22 일 … 그리고 그 너머 보다 나은 의사 결정을 내리기위한 4 단계 당신은 정말로 당신이 체중을 잃을 수 있다고 생각합니까?