야구와 드림 연구의 데이터 분석

최근 538 개의 블로그 포스트에서 Nate Silver는 야구 통계 분석에서 최근에 이루어진 탁월한 발전에 대해 논의했습니다. 저는 2008 년 538 개의 웹 사이트를 처음 시작한 이래 Silver의 작업을 추적 해 왔으며, 통계적 추론에 대한 그의 견해는 꿈 연구에서 비슷한 분석 방법을 사용하려는 문제를 생각하는 데 큰 도움이된다는 것을 알게되었습니다. "풍부한 데이터, 불쌍한 데이터"라고 불리는이 최신 게시물에서 실버는 야구 통계의 장점을 "다른 분야가 Moneyball 순간을 갖기 수십 년 전에 신속한 분석 진행을 가능하게합니다"라고 생각합니다. 이러한 장점을 검토하고 꿈 연구, 즉 "Moneyball"혁명의 위기에 처한 분야와 관련이있다.

실버는 야구의 세 가지 특정 기능, 그리고 일반적으로 스포츠 통계를 식별하여 분석 진행을 촉진합니다. 첫째, "스포츠에는 굉장한 데이터가 있습니다."는 말은 "정확하고 정밀하며 엄격한 품질 관리를받는 데이터"를 의미합니다. 이것은 실버가 "풍부한 데이터"즉 높은 볼륨과 높은 품질을 의미한다는 것입니다. 둘째, "스포츠에서는 규칙을 압니다."게임의 규칙과 경계는 명백하며, 인과 관계를 확인하는 것은 상대적으로 쉽습니다. 셋째, "스포츠는 빠른 피드백과 성공의 확실한 표시를 제공합니다."라고 Silver는 말합니다. "분석적으로 진보적 인 분야의 특징 중 하나는 연구자가 아이디어를 신속하게 테스트하고 바보 같은 것을 잡아낼 수있게하는 새로운 데이터의 일일 수집입니다."스포츠 및 기상 예측 이 품질; 매일 새로운 데이터와 새로운 이론을 테스트 할 수있는 기회를 제공합니다. 미국 대통령 선거는 그렇지 않다. 그들은 단지 4 년에 한번씩 올 것이며, 우리는 그 중 60 명 미만을 합계로 가지고 있습니다.

이러한 기준과 관련하여 꿈꾸는 운임 데이터는 어떻게됩니까?

드림 리서치는 스포츠 통계학자가 분석 한 정보보다 훨씬 복잡하지만 꽤 놀라운 데이터입니다. 드림 데이터에는 주관적인 1 인칭 내성 소재가 많이 포함되어 있으므로 데이터가 "정확하고 정확하며 엄격한 품질 관리를 받도록 보장하기 위해 사용하는 절차를 신중하게 설명해야합니다." 인구 통계 학적 조사, 심리적 실험, 수면 실험 연구, 상세한 역사 및 문화 분석을 비롯한 다양한 출처를 활용하여 다양한 방법으로 풍부한 데이터를 제공합니다. 이러한 다양한 유형의 정보는 거의 조정되지 않지만 신기술로 인해 연구원이 자신의 데이터를 공유하고 서로의 연구 결과를보다 쉽게 ​​만들 수있게되면서 변경 될 가능성이 큽니다.

둘째, 꿈 연구에서 우리는 규칙의 일부 (예 : 꿈꾸는 깨우기 연속성의 예측 가능한 패턴)를 알고 있지만 전부는 아니며 인과 관계는 다차원적인 사건입니다. 이는 야구와 드림 연구에서 데이터 분석의 가장 두드러진 구분 일 수 있습니다. 전자는 비교적 닫힌 시스템이고, 후자는 넓은 개방 시스템, 아마도 인간 심리학에서 가장 넓은 개방 시스템입니다. 결과적으로 꿈 연구는 가양 성 (false positives)에 대한 끊임없는 도전에 직면 해 있습니다 (즉, 그것이 존재하지 않을 때 연결을 생각하는 것). 불가분의 부분적이고 제한된 관찰 세트에 대한 일반적인 해석의 과도한 위험이 있습니다.

드림 리서치는 실버의 세 번째 원칙에 가장 잘 부합합니다. 우리 분야는 일일 데이터 수집, 분석, 대응 및 테스트의 빠른 사이클을 생성 할 수 있습니다. 이는 아마도 데이터 분석 분야 인 꿈 연구의 가장 큰 장점 일 것입니다. 꿈 연구에 대한 "분석적 진보"접근법을 개발하기위한 끊임없는 새로운 데이터 흐름을 활용할 수있는 기회입니다.