대구경북과학기술원(DGIST)은 '한국어 성능이 개선된 초거대 AI 언어모델 개발 및 데이터 구축'을 목표로 과학기술정보통신부, 한국지능정보사회진흥원(NIA)이 주관·시행하는 '2023년 인공지능 학습용 데이터 구축 지원 사업'에 선정됐다고 5일 밝혔다.
이에 따라 DGIST는 과기정통부와 NIA로부터 총 14억원의 국비를 지원받아 과제에 착수했다.
이번 과제에는 과제 책임자인 DGIST 전기전자컴퓨터공학과 김대훈 교수를 중심으로 송진영 교수 연구팀, 인하대 김도국 교수 연구팀과 ㈜빅웨이브에이아이, DGIST 학생창업기업 ㈜유니바가 컨소시엄을 구성해 참여했다.
Chat-GPT, Google의 Bard와 같은 AI 언어 모델 기반 대화 서비스가 등장하면서 많은 사람들이 쉽게 초거대 언어 모델 기반의 서비스를 이용하고 있다. 하지만 이 서비스는 한국어에 대한 이해가 부족해 불편이 크다는 지적이 많았다. 연구팀은 이를 해결하기 위해 양질의 학습용 한국어 말뭉치 데이터 구축 및 모델을 개발해 초거대 AI 언어 모델의 한국어 성능을 개선하는 것을 목표로 하고 있다.
과제의 책임자인 김대훈 교수는 "언어 모델을 학습하기 위한 한국어 데이터가 매우 부족한 상황"이라며 "DGIST, 인하대 연구팀과 관련 기업이 함께 머리를 맞대 초거대 언어 모델 기반 서비스들의 한국어 성능 개선에 크게 기여를 할 수 있을 것으로 기대된다"고 말했다.
댓글 많은 뉴스
이재명 90% 득표율에 "완전히 이재명당 전락" 국힘 맹비난
권영세 "이재명 압도적 득표율, 독재국가 선거 떠올라"
이재명 "TK 2차전지·바이오 육성…신공항·울릉공항 조속 추진"
이재명, 민주당 충청 경선서 88.15%로 압승…김동연 2위
전광훈 "대선 출마하겠다"…서울 도심 곳곳은 '윤 어게인'