[전자신문] 정부, 초거대AI 확산 위해 ‘버티컬·추론 데이터’ 구축한다

ⓒ게티이미지뱅크
ⓒ게티이미지뱅크
정부가 초거대 인공지능(AI) 확산을 위해 버티컬(산업 특화)·추론 데이터를 구축한다.

우리나라가 강점을 가진 제조 분야 등 ‘산업 특화 AI 모델’과 차세대 AI 모델로 부상한 ‘추론형 AI 모델’ 개발에 기여할 전망이다.

과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 최근 ‘2025년 초거대AI 확산 생태계 조성 사업(1차)’ 사업을 공고했다. 이 사업은 AI 모델·서비스 성능을 좌우하는 데이터가 부족하다는 문제를 해소하는 게 목적이다.

정부는 2017년 ‘인공지능 학습용 데이터 구축사업’을 시작으로 9년째 AI 학습용 데이터를 구축을 지원하고 있다.

올해 사업이 기존과 다른 점은 산업에 보다 특화된 ‘버티컬 데이터’와 ‘추론 데이터’를 구축한다는 점이다.

올해에는 6가지 분야 데이터를 구축한다. △뷰티·헬스 △미디어·콘텐츠 △산업·제조 △재난·안전 △금융·회계 △자유 주제 등 6개 분야 30종 데이터를 구축한다.

올해 ‘산업·제조’ 분야와 지난해 ‘제조·로보틱스’ 분야를 비교하면, 올해 구축하는 데이터는 더욱 세분화됐다.

지난해에는 ‘제조환경 사람-로봇 공유 작업 데이터’, ‘대규모 물리 환경 로봇 조작 데이터’를 구축했다면, 올해에는 ‘배터리 열폭주 제어 멀티모달 데이터’, ‘에어 피팅 조립 상태 데이터’ 등 특정 분야에 초점을 맞췄다.

추론형 AI 모델 개발을 위한 추론 데이터도 구축한다.

추론형 AI 모델은 인간처럼 논리적으로 사고해 예측·인사이트 도출 등 결과물을 내놓는 모델이다. 이를 개발하기 위해 단답식이 아닌 전문적인 지식이나 고도의 추론 과정을 포함한 것이 추론 데이터라는 게 정부 설명이다.

올해에는 △스킨케어 성분-효능 추천 데이터 △K-스톡 콘텐츠 데이터 등 6종 추론 데이터를 구축한다.

NIA 관계자는 “지난해부터 대국민 수요 조사를 거쳐 데이터 구축 분야를 선정했다”며 “우리나라가 강점이 있는 전문·특화 영역에 활용하기 위한 AI 모델·서비스 개발과 중국 고성능 저비용 딥시크로 촉발된 추론형 AI 모델 개발에 기여할 수 있을 것”이라고 기대했다.

2024~2025 초거대AI 확산 생태계 조성 사업(1차) 비교. [자료=과학기술정보통신부]
2024~2025 초거대AI 확산 생태계 조성 사업(1차) 비교. [자료=과학기술정보통신부]
다만, 지난해보다 예산이 크게 줄어든 점에 대해선 우려 목소리가 나온다.

올해 1차 사업 예산은 171억2000만원으로, 지난해 420억원 대비 절반 이하로 삭감됐다. 이에 따라 구축 데이터 수는 지난해 63종에서 올해 30종, 데이터 구축을 위한 정부지원금은 지난해 6억~18억원에서 올해 3억~11억6000만원 수준으로 줄었다.

NIA 관계자는 “정부 예산이 전체적으로 줄어든 상황”이라며 “정부가 AI 발전에 힘을 주는 만큼, 추경 편성을 통해 AI 예산이 늘어날 것으로 보고 있다”고 설명했다.

현대인 기자 modernman@etnews.com

<구체적인 내용이나 첨부파일은 아래 [전자신문] 사이트의 글에서 확인하시기 바랍니다.>

Add a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다