평준화의 편견

편견의 사랑은 요구되지 않습니다.

“Παν μέτρον άριστον. [온건주의 모든 것.] “- Lindos의 Kleoboulos, 기원전 6 세기

소음이 많은 데이터를 평균화하는 능력은 효과적인인지 및 의사 결정에 필수적입니다. 가우스 오차 분포에 도입 된 학생들은이 분포가 정상적 일뿐만 아니라 아름답 기 때문에 망가졌습니다. Gauss의 경우 평균값 (산술 평균), 모드 (피크) 및 중앙값 (50 번째 백분위 수)이 모두 동일하기 때문에 ‘ 중심 경향 ‘에 대한 다른 측정 값이 있다는 사실은 집에 아직 도달하지 않았습니다. ). 왜곡이 도입되면 세 부분으로 나뉩니다. 음의 비뚤어진 분포 (왼쪽에 얇은 꼬리가 있음)와 왼쪽에서 숫자가 증가하면 모드가 평균보다 커지며 평균보다 커집니다.

연구원들이 참가자들에게 일련의 숫자를 제시하고 평균을 추정하도록 요청할 때 그들은 세 가지 유형의 중심 경향을 설명하고 그들이 추구하는 것이 무엇인지 분명히 밝혀줍니다. 종종 연구자들은 ‘평균’을 묻는 것이 ‘산술 평균’으로 이해 될 것이라고 추정하는 것으로 보입니다. 평균 추정치가 실제 평균치에서 벗어나면 흥미로운 연구 결과가 나왔습니다.

평균 예상치가 항상 실제 평균치를 항상 웃도는 경우 심리학은별로 없을 것입니다 (Peterson & Beach, 1967). 불일치는 사람들이 실제로 작업을 해결하기 위해 수행하는 작업과 그 작업을 모델링하는 방법에 대한 질문을 제기합니다. Parducci (1965)는 평균에 대한 간단하면서도 우아한 설명을 제시했다. 그의 범위 – 주파수 이론 (RFT)에 따르면, 평균의 추정은 범위 원리계급 원리 사이의 타협에서 발생합니다. 범위 원칙은 가장 작은 관측 값과 가장 큰 관측 값 사이의 중간 점을 취하고 순위 원칙은 중앙값을 취합니다. 두 가지가 다른 경우 차이를 나눕니다. RFT는 다양한 상황에서 작업을 평균화하여 인간의 성과를 예측하는 데 성공했습니다 (Wedell & Parducci, 2000).

연구자들은 RFT를 재발견하거나 개선하기 위해 노력하고 있습니다. 성공은 제한적입니다. 이전 에세이 (Krueger, 2018)에서 저는 하버드 팀이 카테고리 확장에 대한 새로운 개념을 도입하기위한 노력에 대해 설명했습니다. RFT가 새로운 편견의 심리 과정을 요구하지 않고 데이터를 잘 설명하고 있음을 알게되었습니다.

이제 Yale과 Cornell의 연구원은 체계적 오류를 산출하는 평균화 된 휴리스틱바이너리 바이어스 에 대해 알려줍니다 (Fisher & Keil, 2018, Fisher et al., 2018). 심리적 인 죄악은 이분법입니다. 평균은 어렵고 응답자는 관측 된 값의 범위를 왼쪽 절반과 오른쪽 절반으로 나누고 (범위 원칙을 상기 함) 각 절반의 관측 수를 추정하고 나머지 한 관측 수를 뺀다 고 생각합니다 불균형 점수. 이것은 범위 원칙 (2 분법의 기준으로 절반 범위 사용)과 순위 원칙 (분포 왜곡을 사용하여)을 선택하기 때문에 RFT와 매우 유사합니다. 사실상 중요한 종속 척도 인 불균형 점수 는 전체 범위에 대한 평균의 추정치를 예측합니다. 놀랍게도, 바이너리 바이어스의 계산 모델은 불균형 스코어가 어떻게 평균값으로 변환되는지에 대해 알려지지 않았습니다. 두 가지가 분포의 쌍에 상관 관계가 있음을 예측할뿐입니다.

J. Krueger

2 메뉴의 이야기

출처 : J. Krueger

바이너리 바이어스 가설을 검증하기 위해, 저자는 두 가지 평균이 같지만 왜곡 이 다른 분포의 쌍을 구성합니다. 이제 스큐는 불균형 점수와 중앙값에 영향을 미치므로 두 점을 혼동하게됩니다. 두 개의 메뉴 (첫 번째 삽입 된 그림에 표시)의 예를 고려하십시오. 메뉴에는 10 개의 항목이 있습니다. 가격은 메뉴 1에서 12 달러에서 20 달러, 메뉴 2에서는 10 달러에서 17 달러입니다. 따라서 메뉴 1의 미드 레인지는 16 달러이고 메뉴 2의 미드 레인지는 13 달러입니다. 메뉴 1에서는 7 가지 항목이 중급 가격보다 저렴하며 3 가지 항목은 더 비싼. 이로 인해 불균형 점수는 4 (7 – 3)가됩니다. 메뉴 2에서 2 개 항목은 중급보다 비싸고 8 개는 저렴합니다. 이로 인해 불균형 점수는 -6 (2 – 8)이됩니다. 예상 결과에 따르면 응답자는 메뉴 1보다 평균 가격이 낮을 것으로 예상하고 실제로는 메뉴 2보다 낮습니다. Et voilà , 편향 오차.

그러나 중앙값은 동일한 불평등을 나타냅니다. 메뉴 1의 가격 분포는 (대부분의 요리가 싸지 만) 긍정적으로 왜곡되어있는 반면, 메뉴 2의 분포는 비뚤어지지 않습니다. 메뉴 1의 중간 가격은 14 달러이고 메뉴 2의 중간 가격은 16 달러입니다. RFT의이 부분은 잘하고 있습니다. 그러나 응답자가 평균값을 추정 할 때 중간 값과 중간 값 가격을 같게하면 메뉴 1의 예상 평균값은 메뉴 2의 예상 평균값보다 약간 높습니다.

그 평균을 추정 할 때 응답자가 그럴듯한 심리적 대안으로 평균을 취할 가능성. 저자들은 바이너리 바이어스와 중간 중심의 판단 사이의 혼란을 반복적으로 지적하지만이를 깨뜨리지는 않습니다. 가장 직접적인 테스트는 Fisher et al. (2018). 여기에서는 3 가지 유형의 분포 쌍을 찾습니다. 세 쌍 모두에서 양의 스큐를 갖는 분포는 음의 스큐를 갖는 분포보다 약간 낮습니다. 이 실험에서 숫자가 가치를 나타 내기 때문에 모든 응답자는 후자의 분포에서 선택해야합니다. 바이너리 바이어스와 일치하는 대부분은 그렇지 않습니다. 5 개의 쓰레기통이 ‘매우 가난한’에서 ‘매우 좋음’으로 분류되면 결과는 사실상 동일합니다. 여기서 하프 레인지는 중립 라벨과 일치합니다. 그러나 세 번째 조건에서 응답자는 ‘공평'(1)에서 ‘극도로 우수'(5)까지 실행되는 단일 규모를 찾습니다. 이 응답자의 약 절반은 여전히 ​​평균이 낮지 만 긍정적 인 스큐가있는 배포를 선호합니다. 저자는 오류의 원인이 어디에서 왜곡되면 라벨을 삽입하는 것이 중요하지 않다고 결론을 내립니다.

이것은 경쟁 가설을 분리하려는 흥미로운 방법입니다. ‘fair'(1)에서 ‘very good'(5)까지 레이블을 도입하면 바이너리 바이어스와 스큐 계정에 대한 새로운 경쟁이 생깁니다. 이 조건에서 의미 론적으로 제안 된 범주 경계는 3에서 1.5로 이동했습니다. ‘좋은’이라는 단어가 포함 된 모든 등급을 묶어야한다는 강한 요구가 있습니다. 그리고 결과적으로 평균이 낮은 분포는 평균이 더 높은 분포보다 공정한 항목이 적습니다. 이 테스트는 효과가 없다는 가설을 반박하는 중요한 효과가 있다고 생각하기 때문에이 테스트는 강력하지 않습니다 (Krueger & Heck, 2017). 강력하고 수요가 제안되는 조작을 전개함으로써 갑판이 쌓입니다. 이러한 긴급한 상황에서도 대다수의 응답은 다른 두 조건의 응답과 다르기보다는 비슷하다는 점을 쉽게 간과 할 수 있습니다.

J. Krueger

스테이크가있게 해주세요!

출처 : J. Krueger

이 검사가 끔찍하지는 않지만, 모든 검사를해야 할 때 약한 검사를 받아야합니다. 스큐 가설에 대한 바이너리 바이어스 가설을 구하기위한 또 다른 보완적인 방법을 찾는 것이 어렵지 않습니다. 메뉴 패러다임으로 돌아가서 값 비싼 품목 (립 스테이크 $ 30)을 각 목록에 추가합시다. 두 번째 그림은 평균이 올라 갔으며 두 번째 목록은 더 높은 중간 가격을 유지한다는 것을 보여줍니다. 비판적으로 불균형 점수는 이제 균형을 이루므로 이진 편차는 예측되지 않습니다. 절반 범위 및 순위 정보를 모두 사용하여 RFT는 작은 차이를 예측합니다.

조금 더 연구하면 바이너리 바이어스의 새로운 개념이 필요한지 알 수 있습니다. 이 연구의 오해의 소지가있는 부분은 그것이 사람들이 자발적으로 연속 자극 (Krueger & Clement, 1994; Tajfel, 1969)을 분류한다는 논쟁의 여지가없는 관찰을 사용한다는 것인데, 이는 이러한 경향이 웅대 한 평균.

참고 문헌

Fisher, M., Keil, FC (2018). 바이너리 바이어스 (binary bias) : 정보 통합에서의 체계적인 왜곡. 심리 과학 . DOI : 10.1177 / 09567718792256

Fisher, M., Newman, GE, & Dhar, R. (2018). 별을 보는 것 : 바이너리 바이어스가 고객 평점의 해석을 왜곡시키는 방식. 소비자 연구 저널 . DOI : 10.1093 / jcr / ucy017

Krueger, JI (2018, Jul 16). 사회 문제와 인간의인지. 심리학 온라인 오늘 . https://www.psychologytoday.com/intl/blog/one-among-many/201807/social-problems-and-human-cognition

Krueger, J., & Clement, RW (1994). 여러 카테고리에 대한 메모리 기반 판단 : Tajfel의 강조 이론의 개정 및 확장. 성격 및 사회 심리학 저널, 67 , 35-47.

Krueger, JI, & Heck, PR (2017). 유도 통계적 추론에서의 p의 발견 적 값. 심리학의 국경 : 교육 심리학 [연구 주제 : 사회 과학 연구의 인식 론적 윤리적 측면] . https://doi.org/10.3389/fpsyg.2017.00908

Parducci, A. (1965). 범주 판단 : 범위 – 빈도 모델. Psychological Review, 72 , 407-418.

Peterson, CR, & Beach, LR (1967). 직관적 인 통계 학자로서의 인간. Psychological Bulletin, 68 , 29-46.

Wedell DH, & Parducci A. (2000). 사회 비교. In : J. Suls, & L. Wheeler (eds.), 사회 비교 핸드북 : 이론과 연구 (pp. 223-252). 뉴욕 : Plenum / Kluwer.

Tajfel, H. (1969). 편견에 대한인지 적 측면. Journal of Social Issues, 25 , 79-97.