당신이 게시 할 때 당신이 정말로 밝히는 것

baranq/Shutterstock
출처 : baranq / Shutterstock

20 억 명이 넘는 사람들이 인터넷을 사용하고 있고 세상이 점점 더 상호 교류하면서 인터넷을 통해 더 많은 것을 얻게되면서 페이스 북, 트위터, 블로그 및 기타 소셜 네트워킹 사이트의 엄청난 양의 게시물이 압도적으로 많습니다. 많은 포스터들이 개인적인 삶의 어느 정도를 공유하고 싶은지 조심스럽게 생각하지만 사실 우리는 우리가 느끼는 것보다 우리의 감정과 내적인 삶에 대해 더 많은 온라인을 드러내는 경향이 있습니다. 이 수십억 개의 게시물에 포함 된 단어는 포스터에 풍부한 심리 정보를 담고 있으며 연구자는이를 깨닫기 시작하고 있습니다.

자살을 계획하고있는 사람들을 잡는 데있어 소셜 미디어 사용에 관한 조사와 함께 샌디 후크 (Sandy Hook) 나 버지니아 공대 (Virginia Tech)와 같은 폭력을 유발할 수있는 일종의 정서적 문제를 일찍 발견 할 수있는 가능성이 진지하게 받아 들여지고 있습니다. 페이스 북은 이미 자살 폭력의 위협에 대한 사용자보고를 용이하게하기위한 정책뿐만 아니라 자살 중재 정책을 시행하고있다.

그러나 온라인에 게시하는 사람들이 근본적인 성격에 대한 진정한 통찰력을 제공 할 수있는 정도는 어느 정도입니까?

우리가 사용하기로 선택한 언어는 종종 다른 성격 특성을 반영한다는 것이 오랫동안 인식되어 왔습니다. 예를 들어, 신경증 적으로 높은 점수를받은 사람들은 "나, 나, 광산"을 사용하여 1 인칭 진술을 자주 작성하는 반면 외향성이 높은 사람들은 일반적으로 긍정적 인 감정 표현 ( "위대하고 행복하고 놀랍습니다")을 사용합니다. 자기보고 된 성격 척도와 언어를 연결하는 다른 연구들은 성격과 언어가 강하게 연계되어 있다는 일관된 결과를 보여 주었다.

트위터 사용자가 매일 5 억 개의 메시지를 공유하기 때문에 연구자가 분석 할 수있는 엄청난 양의 데이터가 이미 흥미로운 결과를 가져 왔습니다. 아직도, 지금까지 완료된 연구는 배울 수있는 것의 표면만을 긁는 다. 연구원은 소셜 미디어 메시지를 연구하는 어려움에도 불구하고 감정, 사회적 프로세스 및 기본 기능을 반영하는 60 개 이상의 심리학 적 관련 카테고리에서 단어 빈도를 계산하는 언어 조사 및 단어 수 (LIWC)를 비롯한 다양한 방법을 개발했습니다. . 더 빨라진 컴퓨터는 의미 론적으로 관련된 단어의 클러스터를 생성하는 개방 된 어휘 방법과 심지어 이모티콘과 같은 단어가 아닌 더 정교한 언어 처리를 제공합니다. 이를 통해 연구자는 새로운 속어 및 자유로운 언어 사용 (예 : "lolpeak")의 추가를 포함하여 언어가 성장하고 변화함에 따라 언어를 연구 할 수 있습니다.

그러나 이런 종류의 공개 평가가 성격을 연구하는 데 사용될 수 있습니까?

성격 및 사회 심리학 저널에 발표 된 새로운 연구 조사에 따르면 그것이 가능함을 시사합니다. 펜실베니아 대학의 심리학자 인 그레고리 파크 (Gregory Park)가 이끄는 은 온라인 성격 테스트를 완료 한 6 만여 명의 페이스 북 사용자로부터 수집 한 데이터를 사용했습니다. 연구 목적으로, 제 3 자 Facebook 앱인 myPersonality는 2007 년과 2012 년 사이 450 만명 이상의 페이스 북 사용자에 대한 성격 테스트 데이터를 수집했습니다.이 앱은 NEO PI-R의 5 개 요소 모델을 사용하여 경험; 양심 성; 외향성; 동등성; 신경증. (사용자는 연구 결과를 사용하는 데 동의했다.)

또한 약 7 만 명의 myPersonality 사용자가 연구원이 Facebook 상태 메시지에 액세스 할 수 있도록 허용했습니다. 2009 년 1 월에서 2011 년 11 월 사이에 1,500 만 개의 메시지가 처리되었으며 사용자 당 평균 4,000 단어가 사용되었습니다. 연구 참여자의 평균 연령은 23 세 였고 60 % 이상이 여성이었다. 그들의 공개 프로필은 인구 통계 학적 데이터에 대해서도 조사되었습니다. 연구 참여자 중 일부는 자신이 말한 것과 함께 성격 측면에서 다른 참가자를 평가하는 정보 제공 보고서를 제공하기까지했습니다. 이것은 자체보고 된 데이터를 검증하는 방법으로 사용되었습니다. 연구자들은 세 시점에서 사용자가 게시 한 상태 메시지를 비교함으로써 시간 경과에 따라 결과가 일관됨을 보여줄 수있었습니다.

상태 메시지는 숙련 된 평가자가 개별 단어 및 구문 및 특정 주제에 따라 세분화하여 신중하게 검토하고 평가했습니다. "생일 축하합니다"또는 "나는 당신을 사랑합니다"와 같은 문구가 "omg"와 "lol"-plus 구두점 ( "!!!") 및 이모티콘과 같은 비 통상적 인 작품과 함께 수집되었습니다. 이 단어들과 문구들은 각 사용자에 대한 장기 추세를 산출하기위한 평균 연간 상태 메시지 산출물에 기초하여 표로 만들어졌다. 순전히 메시지 자체에 의해 정의 된 2,000 개가 넘는 자연 발생 주제가 확인되었습니다.

연구자들은 참가자 66,000 명의 최종 샘플에서 언어 샘플을 평가 한 후 예측 모델을 작성한 다음 두 번째 그룹의 4,800 명의 참가자를 대상으로 테스트를 수행했습니다. 이 참가자들은 또한 모든 참가자가 완료 한 Big Five 테스트 외에도 삶의 만족도, 충동 성 및 특수 성격 테스트를 측정하는 심리 측정 테스트를 완료했습니다.

연구원이 발견 한 것

각 사용자에 대해 측정 된 Big Five 특성 요소와 Facebook에서 게시 한 상태 메시지의 종류와 밀접한 관계가있었습니다. 예를 들어, 외향성이 높은 참가자는 일반적으로 "사랑", "파티", "흥분된", "훌륭함", "아름다운", "재미있는"등의 단어와 개념이 포함 된 게시물을 쓴 반면 참가자는 낮은 점수를 받았습니다 "인터넷", "하지 않을 것", "하지 않는다", "악마", "죽음", "끝내기"와 같은 외향적으로 선호되는 단어 Conscientiousness가 높은 참가자는 "아름답다", " "친구", "가족", "휴가"및 "추수 감사절". 반면에, Conscientiousness가 낮은 사람들은 "증오", "어리 석음"및 "이상한 . "

게시물에 사용 된 언어에 대한 전산 분석을 통해 연구자는 측정 된 모든 성격 특성에 대해 서로 다른 단어와 개념의 상대적인 인기를 나타내는 단어 구름을 만들 수있었습니다. 이러한 결과는 시간이 지남에 따라 일관 될뿐만 아니라 선호하는 단어와 개념을 기반으로 한 예측 모델은 참가자가 성격 테스트에서 응답 한 방식과 잘 관련이 있습니다. 이 결과는 또한 자기보고 데이터에만 의존하는 것을 피하기 위해 정보 제공자가 제공 한 성격 등급에 동의했습니다.

컴퓨터 화 된 언어 분석의 가장 큰 장점 중 하나는 얼마나 빨리 수행 할 수 있는가하는 것입니다. 유효성 검사 샘플에서 약 5,000 명의 참가자를 분석하는 데 단지 몇 분이 걸렸습니다. 컴퓨터 화 된 언어 평가는 성격을 측정하는 것 이상을 할 수 있습니다. Gregory Park와 그의 공동 저자에 따르면이 방법은 기분, 정서적 안녕 및 일반적인 태도를 비롯한 다양한 심리적 특성을 측정하는 데 적용 할 수 있습니다. 일부 연구자들은 트위터에서 수집 한 데이터를 사용하여 다른 지리적 영역에 거주하는 사람들의 평균 생활 만족도를 예측했습니다. 많은 소셜 미디어 게시물은 위치와 시간을 나타내는 메타 데이터로 태그가 지정되기 때문에 시간 경과에 따른 심리적 추세를 추적하는 데 사용할 수 있습니다. 이는 자살 위험이 있거나 폭력 범죄를 저지른 사람들을 식별하는 데 특히 중요합니다.

또한 컴퓨터 언어 분석을 이미지 및 선호도와 같은 다른 비언어적 데이터 소스와 결합하여 예측을 향상시킬 수도 있습니다. 일부 연구자들은 성격 특성, 성적 취향, 태도 및 지능 수준과 같은 다양한 사용자 특성을 식별하기 위해 페이스 북의 "좋아하는"패턴을 성공적으로 사용했습니다. 사람들이 메시지를 게시하거나 응답하는 빈도를 검토하는 것조차도 자신의 개성에 대한 중요한 단서를 제공 할 수 있습니다. 이러한 다양한 소스를 모두 결합하면 우리가 아직 상상조차 할 수없는 방식으로 사용될 수있는 매우 강력한 예측 모델이 될 수 있습니다.

그래서 자신에 대해 온라인에서 말하는 것에 대한 생각을 잊어 버려라. 당신이 깨닫는 것 이상으로 세상을 말하고 있을지 모른다.