매일신문

매일 탑리더스아카데미 정하웅 카이스트 석좌교수 '모든 가치는 데이터의 연결에서'

"정보화시대에는 데이터가 가치 창출, 검색 엔진 데이터로 선거 당선자 예측할 수 있는 시대"
여러 데이터 적절히 연결하고 그 속의 인과관계까지 찾는 것이 데이터 과학

정하웅 카이스트 석좌교수가 3일 매일 탑리더스 아카데미를 찾아 강연하고 있다. 사진 임경희 매일 탑리더스 아카데미 미디어전문위원
정하웅 카이스트 석좌교수가 3일 매일 탑리더스 아카데미를 찾아 강연하고 있다. 사진 임경희 매일 탑리더스 아카데미 미디어전문위원

"농업시대에는 땅이, 산업화시대에는 철이 가치를 창출했다면 정보화시대에는 데이터가 그 역할을 할 것입니다."

빅데이터 전문가인 정하웅 카이스트 석좌교수가 3일 매일신문 8층에서 열린 매일 탑 리더스 아카데미를 찾았다. 정 교수는 데이터 과학을 주제로 한 강연을 통해 "ICT를 기반으로 한 4차 산업혁명 시대에서 모든 것의 가치는 데이터와 데이터의 연결에서 나온다"며 데이터 분석의 중요성을 강조했다.

정 교수는 요즘 최고의 데이터 보고는 구글이라며 검색어, 검색 장소, 검색 시점 등 모든 것이 데이터로 남는 덕분에 활용 가능성이 무궁무진하다고 설명했다. 그는 "한국과 미국의 과거 주요 선거에서 후보자 이름을 키워드로 해서 검색 빈도를 분석하면 득표율과 비슷하게 나오는 사례들이 많았다"며 "이제는 구글이 당선자를 먼저 아는 셈"이라고 했다.

정 교수는 인터넷 검색엔진의 데이터가 높은 가치를 갖는 이유에 대해선 "설문조사는 응답자가 여러 요인으로 인해 솔직하게 대답하지 않을 개연성이 크기 때문에 엉터리 결과로 이어질 가능성이 있다"며 "혼자이고, 온라인상일 때, 조사를 통한 인센티브가 있을 때 가장 솔직한 답변이 가능한데 그것이 바로 인터넷 검색 환경"이라고 풀이했다.

또 데이터의 진정한 가치는 하나의 데이터가 아닌 복수의 데이터를 적절히 연결했을 때 나온다며 연결의 중요성을 강조했다. 그는 예시로 국세청 데이터와 교육청 데이터의 연결로 고소득자의 학적 정보를 분석해 개별 교사의 능력을 평가하는 방안을 제시했다. 정 교수는 "한 가지 자료만 봐서는 도저히 알 수 없는 통찰이 연결을 통해 가능해지는 것"이라고 설명했다.

다만 단순히 숫자만을 가지고 판단하는 '빅데이터의 함정'에 빠지는 것도 주의해야 한다고 경고했다. 정 교수는 "국가별 초콜릿 소비량과 노벨상 수상자 데이터를 조사하면 초콜릿을 많이 소비하는 국가에서 노벨상도 많이 타는 것으로 나타나지만 가치가 없는 데이터"라며 "데이터 과학은 그 속의 인과관계까지 찾는 것"이라고 설명했다.

서울대에서 이학박사 학위를 취득한 정 교수는 미국 노트르담대학교 물리학과 연구교수를 지냈으며 2015년 3월부터 21세기 인재양성소로 불리는 건명원 과학 분야 운영위원을 맡고 있다. 저서로는 '구글 신은 모든 것을 알고 있다' 등이 있다.

최신 기사

많이 본 뉴스

일간
주간
월간