빅 데이터를 사용하여 심리학 연구

Amazon
출처 : 아마존

기업을위한 빅 데이터의 가치에 대해 많은 논의가 있습니다. 예를 들어 Amazon은 구매자와 페이지 뷰를 다른 구매자의 것과 비교하여 유사한 관심사를 가진 사람들을 찾습니다. 그런 다음 Amazon은 사용자가 좋아할 것으로 가정 한 사람들이 좋아하는 제품을 구매할 것을 제안합니다.

심리학 연구 커뮤니티에 관심있는 질문에 큰 데이터를 사용할 수 있습니까? 세스 스티븐스 – 다비우드 위츠 (Seth Stephens-Davidowitz)는 매혹적인 책 ' Everybody Lies '에서이 문제를 자세히 조사했습니다.

스티븐스 – 다비도 위츠의 책에 대해 내가 좋아하는 것은 큰 데이터뿐만 아니라 그것을 성공적으로 사용하기 어려운 몇 가지 것들로부터 우리가 배울 수있는 것들 모두에 대해 얼마나 명백한 가인 것입니다.

큰 데이터는 설문 조사에서 사람들이 대답하기를 꺼려하는 질문에 특히 유용합니다. 사람들이 컴퓨터와 상호 작용하는 방식은 종종 인터뷰 나 익명의 설문 조사에서 표현하지 않을 자신의 이익의 측면을 드러냅니다.

예를 들어 Stephens-Davidowitz는 성적 취향과 관련된 데이터를 탐색합니다. 그는 얼마나 많은 사람들이 게이임을보고하는 지에 큰 지역적 차이가 있다는 점을 지적합니다. 예를 들어,로드 아일랜드의 남성은 미시시피의 남성보다 설문 조사에서 동성애자로 밝혀졌습니다. 게이 남성이 관대 한 국가로 옮길 수도 있지만 관용이 낮은 국가의 게이 남성은 설문 조사에 정직하게 응답하지 않을 수도 있습니다.

스티븐스 – 다비우드 위츠 (Stephens-Davidowitz)는 동성애자로 자칭하는 남성이 태어난 곳과 이사 한 곳에서 Facebook 데이터를 사용했습니다. 관용도가 낮아짐에 따라 관용적 인 곳으로 이동하는 경향이있었습니다. 그러나 그 움직임만으로는 설문 조사에 나타난 큰 지역적 차이를 설명하지 못합니다.

그런 다음 Google의 데이터를 사용하여 사용자가 검색 한 내용을 추적하고 해당 검색이 발생한 위치에 대한 정보를 제공합니다. 특히 게이 남성 포르노를 찾는 포르노 검색에 대한 비율을 조사했습니다. 남성에 의한 모든 포르노 그라피 검색의 약 5 %는 동성애 남성 포르노를위한 검색이었습니다. 이것은 국가의 관대함에 관계없이 기본적으로 미국의 모든 주에서 마찬가지입니다. 이는 남성 인구의 약 5 %가 남성에게 끌려 들고 모든 국가에서 사실임을 암시합니다.

빅 데이터는 또한 다른 방법으로 대답하기가 어렵거나 불가능할 수도있는 질문을 처리하는 데 사용될 수 있습니다. 이 책에서 내가 좋아하는 예는 꿈 탐구에서 비롯된다. 프로이트는 꿈은 무의식적 인 성적 욕망을 상징적으로 드러 낼 것이라고 제안했다. 꿈에있는 바나나 또는 오이는 음경에 대한 대립이 될 수 있습니다.

Freud가 언급 한 욕구가 의식을 잃어 버렸기 때문에 이런 이론을 반박하는 것은 어렵습니다. 이는 사람들이 꿈에 대해 이야기를하더라도, 정의상 꿈의 의미를 알 수 없음을 의미합니다.

Stephens-Davidowitz는 사용자의 꿈에 대한 설명을 수집 한 앱에서 데이터를 가져 와서 꿈의 설명을보고 언급 된 모든 음식을 발견했습니다. 그는 특정 음식이 얼마나 자주 꿈에 나타나는지 예측 한 다음 그 음식이 소비 된 빈도가 음식의 맛뿐만 아니라 꿈에 대한 자신의 출현을 예측할 수 있다는 사실을 발견했습니다.

따라서 오이 나 바나나와 같은 꿈에 두꺼운 모양의 음식물이 있습니다. 그러나 그들은 다른 어떤 것보다 먹는 빈도가 더 많이 나타나는 것처럼 보입니다. 예를 들어, 오이는 꿈에서 일곱 번째로 가장 인기있는 야채이며, 또한 전반적으로 일곱 번째로 인기있는 야채입니다. 이것은 꿈에 바나나가 바나나 이상이라고 믿을만한 이유가 없음을 시사합니다.

마지막으로, Stephens-Davidowitz는 큰 데이터를 신뢰할 수없는 요인으로 만들 수있는 좋은 방법을 모색합니다. 지능과 같은 복잡한 특성이 있다고 가정하고 지능의 유전 적 예언자가 있는지 알고 싶습니다. IQ 테스트의 점수와 해당 테스트를 수행하는 사람들의 유전자를 연관 지 으려고 할 수 있습니다. 과학자들이 많은 사람들의 유전자 서열에 관한 데이터를 가지고 있기 때문에,이 분석은 여러 데이터 세트에서 여러 번 수행되었습니다.

이 분석이 완료 될 때마다 특정 유전자가 해당 데이터 세트 내의 IQ 점수를 예측하는 좋은 지표가됩니다. 문제는 다른 분석에서 다른 유전자가 튀어 나왔다는 것입니다. 많은 경우 잠재적 인 예측 인자 (예 : 유전자)가 많은 경우에도 데이터 세트가 무작위로 변한 결과 인 상관 관계를 확인할 수있는 기회가 많기 때문에 많은 데이터가있을 때 발생합니다. 결과적으로 지능과 같은 특성을 예측하는 특정 유전자가 발견되었다는보고를 듣는다면 여러 데이터 세트에서 유효성이 확인 될 때까지 회의적으로 취급해야합니다.

빅 데이터는 우리가 심리학을하는 전통적인 방식을 대체하지 않습니다. 궁극적으로 큰 데이터는 환경의 다양한 측면이 어떻게 관련되어 있는지를 볼 수있는 기회를 제공하지만 어떤 요인이 특정 행동을 유발하는지 알려주지는 못합니다. 이를 위해 심리학은 지난 세기 동안이 분야의 중심이었던 실험을 계속해야합니다. 그러나 큰 데이터는 사람들의 행동을 이해하는 데 중요한 도구 일 가능성이 큽니다.

트위터에 나를 따라와.

Facebook 및 Google+에서도 볼 수 있습니다.

가장 최근에 나온 Brain Briefs 에 대한 정보입니다.

내 책 스마트 생각 과 리더십 습관, 스마트 변화를 확인하십시오 .

오스틴의 KUT 라디오에서 내 라디오 쇼를 듣고 트위터와 페이스 북에서 2GoYH를 따라 가세요. 이 쇼는 iTunes 및 Stitcher에서 사용할 수 있습니다.