트위터는 산후 우울증을 누가 개발할 것이라고 예측할 수 있습니까?

Mika Heittola/Shutterstock
출처 : Mika Heittola / Shutterstock

소셜 데이터 분석의 새로운 영역은 사회 현상을 조사하기 위해 이전보다 많은 리소스를 제공합니다. 소셜 데이터 분석의 새로운 분야가 어떻게 적용되고 있는지 내가 가장 좋아하는 사례 중 하나는 Microsoft Research의 아름다운 2013 연구에 있습니다. 임산부의 트위터 피드를 분석함으로써 연구원은 80 % 정확도 여성이 산후 우울증에 걸릴 경우.

그들은 400 명의 여성을 모집하여 참여하기 시작했습니다. 트위터에서 그들은 여성 짹짹, 자신이 좋아하는 것 및 답글의 텍스트를 포함한 데이터를 수집했습니다. 그런 다음 네 가지 유형의 행동을 측정했습니다.

  • 약혼. 여기에는 누군가가 얼마나 자주 트윗했는지, 얼마나 많은 트윗이 다른 사람들에게 응답되었는지, 얼마나 많은 링크, 리트 윗, 질문들이 게시되었는지 등이 포함됩니다.
  • 소셜 네트워크. 트위터에서, 이것은 단순히 따라 다니는 사람들의 수와 누군가가 가진 팔로워의 수입니다.
  • 감정. 사람들이 사용하는 단어의 유형을 분석하는 도구를 사용하여 행복, 슬픔, 불안, 슬픔 등을 표현한 단어에 대한 게시물을 측정했습니다.
  • 언어 스타일. 언어 적 세부 사항에 대해 알아 보았을 때,이 방법은 기사, 도우미 동사, 대명사 및 트윗의 전치사와 같은 것을 보았습니다. 이 단어들은 우리가 말하는 핵심 의미를 지니지 않기 때문에 흥미 롭습니다. 그러나 사람들의 기분, 성격, 또는 다른 특성에 따라 사람들 사이에서 변화하는 경향이 있습니다. 우리가 대부분 무의식적으로 선택하기 때문에 통제하기가 어렵습니다.

속성 목록을 작성한 후 여성들은 산후 우울증 (PPD) 징후가 있는지 모니터링했습니다. 임신 과정에서 모든 여성의 행동이 바뀌었지만, PPD를받은 여성들은 다른 방식으로 변했습니다. 연구자들은이 작은 차이를 활용하는 컴퓨터 모델을 만들었습니다. 그 컴퓨터 모델은 사람의 트위터 피드를보고 PPD 개발을 계속할 것인지 아닌지 추측 할 수 있습니다.

여성이 출산 되기 전의 데이터 만 사용하면 여성의 모델이 여성을 정확하게 70 %의 정확도로 PPD를 개발할 가능성이 있는지 없는지로 분류 할 수 있습니다. 그러나 PPD는 일반적으로 출산 후 약 1 개월 후에 발병합니다. 연구자가 산후 몇 주 동안 PPD 증상이 나타나기 전에 알고리즘을 추가하면 80 % 이상의 정확도를 보였다.

여성의 트위터 행동은 어떤면에서 바뀌 었습니까? PPD를 개발 한 여성들은 2 인칭 또는 3 인칭 인칭 대명사 ( "he", "they", "you")의 사용뿐만 아니라 짹짹 빈도와 추종자 수를 줄이는 경향이있는 반면, 실제로 모든 범주에서 PPD가 증가 하지는 않습니다 .

반면에 PPD를 개발하는 여성들은 더 많은 질문을하는 경향이있는 반면 여성은 질문 한 수를 줄이지 않았습니다.

재미있는 과학적 통찰력은 이것들이 모두 PPD의 직접적인 표현이 아닌 미묘한 단서들이라는 것입니다. 그것은 여성이 잠재적 인 상태를 숨기려고해도 최소한 알고리즘을 통해 그렇게 할 수는 없다는 것을 의미합니다.

의사를위한 진단 도구로서,이 기술은 큰 가능성을 가지고 있습니다. 그것은 비침 범성이며, 그렇게 높은 정확성을 지니고 있다면, 새로운 엄마들이 추가 모니터링과주의의 혜택을 누릴 수 있음을 알리는 데 큰 도움이 될 수 있습니다.

[1] De Choudhury, Munmun, Scott Counts, Eric Horvitz. "소셜 미디어를 통한 감정과 행동의 산후 변화 예측."컴퓨팅 시스템의 인간 요인에 관한 SIGCHI 회의 의회. 2013 년 ACM.