제목없음
저는 KAIST 문화기술대학원에 재학 중인 대학원생입니다. 학부생 때는 생명과학과 전산학을 복수전공했는데, 워낙 다양한 경험을 하는 것을 좋아하는 터라 이런저런 분야를 많이 찔러봤습니다. 그러다가 문화와 기술의 접점 언저리에서 연구를 하는 곳까지 흘러왔네요. 지금은 문화 산업과 컨텐츠로부터 축적되는 정형, 비정형 데이터를 분석하는 연구를 주로 하고 있습니다. 저는 수학적, 전산적 모델과 도구를 이용해 문화 컨텐츠와 현상을 분석, 이해하는 것에 관심이 있습니다. 방법론으로 따지자면 딥러닝과 인공지능(특히 자연어처리), 정보 이론, 그래프 이론, 인과 추론, 그리고 기타 통계 기법들을 자주 사용하고 있습니다. 누가 제 연구 분야를 물어보면 디지털 인문학(Digital Humanities)이라고 답하긴 합니다..
[이 글은 아직 작성 중입니다] TOWARDS THE QUANTIFICATION OF THE SEMANTIC INFORMATION ENCODED IN WRITTEN LANGUAGE | Advances in Complex Systems www.worldscientific.com 0. About 연구실 사람들과 스터디를 하던 중 읽게 된 논문입니다. 정보이론의 개념들을 이용해 책 속에 있는 단어가 가진 정보량을 정의하고, 정보량이 많은 단어 - 그 책의 내용에 대해 무언가를 말해주는 단어 - 들을 찾아내는 연구입니다. 1. Background 들어가기에 앞서, 정보 이론이 생소하신 분들을 위해 기본 개념을 정리하겠습니다. 미국의 수학자 클로드 섀넌(Claude Shannon)은 1948년에 작성한 논문 A ..