본문 바로가기
블로그 주인장 이야기/Sosciety (not Typo!)

페이스북의 "좋아요"를 통해 개인 특성을 예측한다?

by 바이오매니아 2013. 3. 16.

오늘 사이언스에 흥미로운 트윗 하나가 실렸습니다. 내용은 "Higgs Confirmed, Habitable Mars, and No Secrets on Facebook: Check out this week's top stories!" 그러고보니 이번 주에는 과학 관련 빅뉴스가 많았죠. 힉스 입자가 확인되었다고 했고 화성에 생물이 살지도 모른다고 했죠(솔직히 이건 좀 식상하지만). 그런데 마지막에 페이스북과 관련된 내용이 있더란 말이죠. 



아니, 사이언스에 무슨 페이스북에 대한 논문이 실렸나 봤더니 사이언스에 실린 내용이 아니라 다른 저널에 실린 논문을 소개하는 뉴스 기사더군요. 그 기사 제목은 "Facebook Preferences Predict Personality Traits." 가만 읽어보니 PNAS에 실린 논문을 소개하는 기사였습니다. 물론 PNAS는 peer review 저널이 아니라고 약간 무시하시는 분들도 계시지만[각주:1] PNAS가 어딥니까? 그래서 논문을 찾아보니 social sciences 분야에 실린 논문이더군요. 

PNAS에 실린 논문의 캡쳐


위 논문은 58,000명의 자원자를 대상으로 분석한 것인데 이 방법으로 여러가지 개인 특성을 추정한 결과, 백인/흑인 여부는 95% 정확도을 보였고 성(gender)은 93%, 남성 동성애자 (gay) 88%, 지지정당 85%, 종교(기독교 or 이슬람)는 82%의 정확도를 보였다고 합니다. 흥미롭게도 여성 동성애자의 추측은 75%로 낮게 나왔네요. 가장 정확도가 낮았던 것은 21세에 부모와 함께 살았는지의 여부인데 60% 정도만 맞췄다고 하는군요. (아래 그림 참조!)

Michal Kosinski et. al., PNAS, 2013 (early publication, page is not fixed)


사실 뭐 이런 결과가 그다지 놀라운 일은 아닙니다. 저 역시 페이스북의 개인 프로파일을 보고 그 사람의 성향을 대충 파악하고 그 사람을 불편하게 할 것 같은 글은 아예 그 사람이 읽지 못하게 하는 경우가 많이 있으니까요. 물론 다른 분들도 제 활동이나 "좋아요" 기록을 보고 저를 대충 파악하시겠죠. 그래서 사실 논문의 내용보다는 이런 논문이 실렸다는 것이 더 놀라운지도 모르겠습니다. 다만 앞으로 페이스북을 통해 개인 정보들이 수집되고 관리되고 상업적으로 이용되거나 정치적으로 이용될 가능성은 매우 높겠죠. 그렇지만 사실 구글님이 계신데 페북이 뭐 그리 대수냐 싶기도 합니다. 이미 조금만 노력하면 인터넷에서 신상털기는 꽤 쉬우니까요.     


흥미로운 것 한가지는 저자 중 한 명이 Microsoft Research 소속이라는 것입니다. MS가 경쟁사(?)를 열심히 분석한다고 봐야 하는 것일까요? 이런 논문으로 페북에 대한 경각심을 일으켜 페북을 위축시키려 하는 것은 아닐지 의심한다면 지나친 음모론이겠지요? 아무튼 아래 링크를 클릭하시면 누구나 논문 원문을 볼 수 있으니 참고하시기 바랍니다. (그러고 보니 논문을 그냥 공개한 것도 약간 의심스럽군요. ㅎㅎ)


Private traits and attributes are predictable from digital records of human behavior (Michal Kosinski et al., PNAS, 2013)



  1. 첫번째 댓글 참조해주세요. 모든 논문이 peer review를 하지 않는 것은 아닙니다. [본문으로]

댓글2

  • 김현중 2013.03.17 05:40

    PNAS, peer review 합니다.

    http://en.wikipedia.org/wiki/PNAS#Peer_review

    NAS 멤버 추천으로 올라가는 'contributed article'은 룰이 좀 바뀌어서 NAS member가 1년에 2개까지 보낼 수 있는데, 정확히 수는 모르겠습니다만 대충 20% 안쪽일 겁니다. Current issue에서 contributed article이랑 direct submission 갯수를 보니 10개 vs. 52개로 대충 19%쯤 되네요. 아마 다른 issue들도 비슷하게 맞출 겁니다. 이 contributed article때문에 PNAS가 peer review 안 한다는 루머가 돌았을 건데, 대개 NAS 멤버들이 자기 명성, 체면 생각해서라도 이상한 거 내보내서 억지로 게재시키지는 않아요. 좀 더 정확히 말하면, 리뷰어들에게 좀 더 담금질 당하면 네이처 자매지급에 보내질 만한 내용이 그냥 적당히 쉽게쉽게 리뷰를 거치면서 PNAS로 가는, 그런 개념으로 생각하시면 맞을 겁니다. 그래서 경우에 따라 좀 정략적으로 여기에 보내는 사람들도 있구요. NAS 멤버중에 2개 다 보내지 않는 사람들도 꽤 있는 걸로 들었습니다. 제 논문도 direct submission이었어요, 우리 교수는 NAS랑 아무 상관이 없던지라. ㅎㅎ

    답글

    • 그렇게 생각하는 사람들이 있다는 이야기지 내가 그렇게 생각한다는 것은 아니에요.ㅎㅎ 그런데 외신에서도 peer review 저널이 아니라고 쓴 것을 본 적은 있지.