[2021 JDC AI 대학생 아카데미] 이수지 디플리 대표, “퍼블릭 데이터셋 급증..데이터 가공·처리 중요”

 

ⓒ제주의소리
JDC AI 대학생아카데미 2021년도 1학기 아홉 번째 강의를 진행 중인 이수지 디플리 대표. ⓒ제주의소리

인공지능(AI) 스타트업은 어떻게 방대한 데이터를 수합하고, 인공지능 모델을 만들어 론칭, 판매하는지 AI스타트업이 일하는 모든 과정을 현직 스타트업 대표가 소개하는 강연이 열렸다.

제주국제자유도시개발센터(JDC)가 주최하고, [제주의소리]와 제주대학교가 공동주관하는 2021 JDC AI 대학생아카데미가 4일 비대면 온라인 영상으로 2021년도 1학기 아홉 번째 강의를 공개했다.

서울대, 카이스트 출신 오디오, 인공지능 석박사들이 창업한 인공지능 사운드 기술기반 스타트업 ‘디플리(Deeply)’의 이수지 대표가 ‘AI스타트업, 창업하고 알게 된 것들’을 주제로 강연을 펼쳤다.

디플리는 다양한 세상의 소리를 분석하는 인공지능 스타트업이다. 폐의 소리, 자동차 모터 소리, 아기 울음소리 등 상태나, 감정이 담긴 음향들을 분석해 구분해내는 알고리즘을 만들고, AI모델로 활용하거나 모바일 서비스를 제공하는 사업을 펼치고 있다.

디플리에서 개발해 론칭한 'WAAH'와 'BABBA' 서비스 이미지. 자료=이수지 디플리 대표.

이 대표는 AI 스타트업에 대해 “수많은 대기업에서 거의 모든 분야에 AI를 접목하고 있기 때문에 ‘AI 스타트업이 무엇인가’는 더 이상 중요하지 않다. 이제는 AI 자체로 만드는 기업보다는 어떤 서비스와 어떤 도메인을 운영하는지, 특정 사업에 어떤 AI 기술을 차용할 지가 더 중요하다. AI는 훨씬 범용성을 띠며 다양하게 발전, 접목되는 추세”라고 말했다.

그러면서 AI의 핵심인 머신러닝과 딥러닝 기술에 대해 “기계학습(머신러닝)은 기존 데이터를 학습하고 이를 기반으로 예측한다. 기계학습보다 딥러닝이 인간의 개입이 훨씬 적다. 신경망 모델에 데이터 자체를 넣어주면 결과 값을 뱉어내기 때문에 인간은 어떠한 이유로 이런 해석이 나왔는지 알 수 없다는 특징이 있다. 딥러닝이 머신러닝의 한 부분”이라고 설명했다.

이 대표는 AI 모델을 만들면서 가장 중요하다고 생각하는 부분으로 ‘다양한 GPU’도 꼽았다. 방대한 퍼블릭 데이터가 쏟아지는 최근, 데이터 분석을 위해 좋은 GPU가 필요하기 때문이다. 하드웨어 파워와 관련된 분야들이 산업계에서 중요한 이슈로 떠오를 수 있다고 예측했다. 

AI스타트업이 실전에서 일하는 과정은 데이터 수집, 데이터 정제, AI 모델링, 서비스 개발, 운영 및 판매의 5단계로 크게 나뉘었다. 자료=이수지 디플리 대표.

이 대표가 제시한 AI스타트업이 실전에서 일하는 과정은 데이터셋 확보(데이터 수집), AI 모델링, 시스템 적용, 현장 최적화, 운영 및 판매의 5단계로 크게 나뉘었다.

그는 “AI 스타트업이 일하기 위해서는 가장 먼저 데이터가 필요하다. 어떤 방식이 됐든 데이터를 수집해야 하는데, 크라우드 소싱 플랫폼을 이용하거나, 구매 또는 오픈돼있는 퍼블릭 데이터셋을 다운받을 수 있다”고 전했다.

이어 “디플리의 경우 직접 발로 뛰어 데이터를 수집했다. 생후 0~6개월 신생아를 키우는 가정집의 오디오 데이터를 모은 것만 약 7만 시간”이라며 “3~5년 전만 해도 퍼블릭 데이터셋이 부족했다. 요즘은 AI데이터들이 굉장히 다양하게 퍼블릭으로 오픈이 되고 있고, 이에 만족하지 못할 경우, 직접 지원을 받아 데이터바우처를 신청해 기업이 직접데이터를 가공하는 방법도 있다”고 말했다.

데이터를 수집했으면 분석이 가능하도록 데이터 라벨링 작업을 거쳐, AI 모델링 작업에 들어간다. 모델이 실제로 작동하는 곳이 서버인지, 디바이스인지 등 요구상황에 맞춰 알고리즘을 만드는 게 중요하다.

이 대표는 “이렇게 AI모델 적용 과정에 따라 디플리도 데이터 셋을 확보하고, 모델링을 작업해서, B2C 서비스 모바일 어플리케이션을 만들고, 현장에서 운영해 많은 사람들에게 알리기 위해 노력 중이다. 인공지능 모델을 적용하기 위해서는 현장 데이터를 어떻게 가공, 처리할지가 굉장히 중요한 요인”이라고 강조했다.

저작권자 © 제주의소리 무단전재 및 재배포 금지