소셜 데이터 분석의 새로운 영역은 사회 현상을 조사하기 위해 이전보다 많은 리소스를 제공합니다. 소셜 데이터 분석의 새로운 분야가 어떻게 적용되고 있는지 내가 가장 좋아하는 사례 중 하나는 Microsoft Research의 아름다운 2013 연구에 있습니다. 임산부의 트위터 피드를 분석함으로써 연구원은 80 % 정확도 여성이 산후 우울증에 걸릴 경우.
그들은 400 명의 여성을 모집하여 참여하기 시작했습니다. 트위터에서 그들은 여성 짹짹, 자신이 좋아하는 것 및 답글의 텍스트를 포함한 데이터를 수집했습니다. 그런 다음 네 가지 유형의 행동을 측정했습니다.
속성 목록을 작성한 후 여성들은 산후 우울증 (PPD) 징후가 있는지 모니터링했습니다. 임신 과정에서 모든 여성의 행동이 바뀌었지만, PPD를받은 여성들은 다른 방식으로 변했습니다. 연구자들은이 작은 차이를 활용하는 컴퓨터 모델을 만들었습니다. 그 컴퓨터 모델은 사람의 트위터 피드를보고 PPD 개발을 계속할 것인지 아닌지 추측 할 수 있습니다.
여성이 출산 되기 전의 데이터 만 사용하면 여성의 모델이 여성을 정확하게 70 %의 정확도로 PPD를 개발할 가능성이 있는지 없는지로 분류 할 수 있습니다. 그러나 PPD는 일반적으로 출산 후 약 1 개월 후에 발병합니다. 연구자가 산후 몇 주 동안 PPD 증상이 나타나기 전에 알고리즘을 추가하면 80 % 이상의 정확도를 보였다.
여성의 트위터 행동은 어떤면에서 바뀌 었습니까? PPD를 개발 한 여성들은 2 인칭 또는 3 인칭 인칭 대명사 ( "he", "they", "you")의 사용뿐만 아니라 짹짹 빈도와 추종자 수를 줄이는 경향이있는 반면, 실제로 모든 범주에서 PPD가 증가 하지는 않습니다 .
반면에 PPD를 개발하는 여성들은 더 많은 질문을하는 경향이있는 반면 여성은 질문 한 수를 줄이지 않았습니다.
재미있는 과학적 통찰력은 이것들이 모두 PPD의 직접적인 표현이 아닌 미묘한 단서들이라는 것입니다. 그것은 여성이 잠재적 인 상태를 숨기려고해도 최소한 알고리즘을 통해 그렇게 할 수는 없다는 것을 의미합니다.
의사를위한 진단 도구로서,이 기술은 큰 가능성을 가지고 있습니다. 그것은 비침 범성이며, 그렇게 높은 정확성을 지니고 있다면, 새로운 엄마들이 추가 모니터링과주의의 혜택을 누릴 수 있음을 알리는 데 큰 도움이 될 수 있습니다.
[1] De Choudhury, Munmun, Scott Counts, Eric Horvitz. "소셜 미디어를 통한 감정과 행동의 산후 변화 예측."컴퓨팅 시스템의 인간 요인에 관한 SIGCHI 회의 의회. 2013 년 ACM.