40억 시리즈A 투자유치 ... 한국형 '아마존 테크니컬 터크' 셀렉트스타
상태바
40억 시리즈A 투자유치 ... 한국형 '아마존 테크니컬 터크' 셀렉트스타
  • 고명식
  • 승인 2020.09.16 14:40
  • 댓글 0
이 기사를 공유합니다

사진=픽사베이
사진=픽사베이

AI데이터 플랫폼 셀렉트스타(selectstar.ai)는 대중들이 참여하는 크라우드 소싱 방식으로 빅데이터 데이터 수집과 전처리 서비스를 제공하는 기업이다. 이 회사는 최근 40억원 규모의 시리즈A 투자유치를 완료했다. 코오롱인베스트먼트와 컴퍼니케이가 신규 투자자로 참여하고 카카오벤처스가 2019년 4억원 시드투자 이후 후속 투자를 집행했다. 이로써 셀렉트스타의 누적 투자유치 금액은 팁스 지원금을 포함해 49억원 규모에 이르게 됐다. 유사모델로 지난 6월 코스닥에 '사업모델 특례 1호'로 상장한 집단지성 번역 플랫폼 기업 플리토(300800)가 있다.

셀렉트스타(Select Star)는 KAIST 전산학부에서 딥러닝을 공부하던 신호욱(만24세) 씨가 설립했다. 2018년 11월 대전구 유성구에 자리잡은 셀렉트스타는 KAIST 학부생으로 구성된 스타트업이다. 2019년 매출은 14억원. 법인 설립 이후 누적매출 65억원에 이르는 것으로 알려져 있다.

# 인공지능 원천 데이터 모바일 앱으로 소싱 ... 데이터 라벨링 세계시장 12억 달러 = 셀렉트스타의 빅데이터 수집은 누구나 자투리 시간 활용해 모바일 앱으로 참여할 수 있다. 자체 개발한 모바일 앱(App) 캐시미션(Cash mission)을 통해 사용자가 수집한 데이터를 가공, 분석해서 데이터를 요구한 의뢰 기업에게 제공한다. 데이터 수집에 참여한 사용자는 이미지, 음성, 텍스트, 비디오 이미지를 수집해 관련 정보를 입력고 셀렉트스타는 수집된 데이터의 양과 품질에 따라 현금 환전이 가능한 리워드(보상)를 제공한다. 회사측에 따르면 현재까지 캐시미션 앱을 통해 데이터 수집에 참여하고 있는 사람은 전세계 4만명에 이른다.

셀렉트스타의 모바일 앱 캐시미션. 사진=구글 플레이.
셀렉트스타의 모바일 앱 캐시미션. 사진=구글 플레이.

인공지능(AI)의 발전과 함께 떠오르고 있는 것이 ‘데이터 라벨링’ 산업이다. 데이터 라벨링은 AI 학습데이터를 만들기 위한 원천데이터에 값(라벨)을 부여하는 작업이다. 시장조사 업체 커그니리티카에 따르면 시장규모는 2018년 5억 달러를 넘어섰고 오는 2023년에는 12억 달러까지 성장할 것으로 예측되고 있다. 국내 시장규모는 2019년 기준 17조원에 육박한다. 데이터 라벨링 관련 시장현황과 주요 기업소개는 컴퓨터월드 2020년7월30일자 기사에 자세히 소개돼 있다.

# 한국형 테크니컬터크 모델(Mechanical Turk) = 셀렉트스타의 데이터를 사용하는 기업 고객들은 LG CNS, 롯데 정보통신, 한국전력공사, 네이버, SK텔레콤, 파파고 등 120여개에 이른다. 기업 등 의뢰자의 요청을 받아 대중들이 데이터를 수집, 가공해 제공하는 HIT(Human Inteligence Tasks) 서비스는 아마존이 효시다. 2008년 시작된 아마존의 엠터크(www.mturk.com) 현재에도 아마존웹서비스(AWS) 고객을 위해 운영되고 있다.

# 테크니컬터크는 18세기 '체스 두는 기계'  = 테크니컬터크(Mechanical Turk)라는 명칭은 18세기 후반 만들어진 '체스 두는 튀르크(터키인)'이라는 마술도구에서 비롯됐다. 체스두는 기계 '테크니컬터크'는 나폴레옹 보나파르트와 벤저민 클랭클린 등과의 체스 대전을 펼친바 있다. 위키백과에 다양한 일화를 포함한 '테크니컬 터크' 이야기가 자세히 기술돼 있다.

18세게 프랑스에서 개발된 '체스 두는 기계' 테크니컬 터크.
18세기 프랑스에서 개발된 '체스 두는 기계' 테크니컬 터크.

# 가장 대중적인 HIT는 구글 리캡차 = 인간의 지능이 접목된 크라우딩 서비스 중에서 가장 잘 알려진 것은 구글 캡차다. 캡차(CAPCHA)는  Completely Automated Public test to tell Computers and Humans Apart의 줄임말 표현으로 '사람과 컴퓨터를 구분하는 자동화된 시스템'이라는 뜻이다. 인간 지은의 힘을 빌린다는 측면에서 일종의 HIT(Human Inteligence Tasks). 구글이 전세계 고서와 모든 논문들을 디지탈화하는 '쿠덴베르크 프로젝트'를 진행하면서 오래되거나 선명하지 않은 글자를 사람을 통해 판단하는 리캡차(reCAPCHA) 프로그램이 개발됐다. 리캡차는 인식되지 않은 문서의 글자 이미지를 추출해 이를 웹사이트 가입 인증 프로그램인 캡차(CAPTCHA)에 이용되고 있다.

구글 리캡차는 크라우드 소싱 방식으로 인간지능을 이용해 디지털 난독 문자를 확인해 낸다.
구글 리캡차는 크라우드 소싱 방식으로 인간지능을 이용해 디지털 난독 문자를 확인해 낸다.

 

고명식abc@the-stock.kr 다른기사 보기

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
이슈포토