2024-03-28 17:50 (목)
뉴스콘텐츠 전송 채널
'AI휴먼' 바람타고 비상하는 AI 음성기술 스타트업들…카카오·클레온·네오사피엔스
상태바
'AI휴먼' 바람타고 비상하는 AI 음성기술 스타트업들…카카오·클레온·네오사피엔스
  • 김동진 기자
  • 승인 2022.02.24 16:42
  • 댓글 0
이 기사를 공유합니다

실제 인간 쏙 빼닮은 'AI휴먼' 구현하면서 음성기술 업체들 '몸값' 상승
음성인식(STT)·음성합성(TTS)·자연어이해(NLU) 등 기술업체 보폭확대
카카오엔터프라이즈, 기업용 AI음성 인식변환 모델 '커스텀 STT' 공개
클레온, 스페인서 열리는 '모바일 월드 콩그레스(MWC)'에서 기술력 어필
네오사피엔스, BRV 캐피털매니지먼트로부터 256억원 시리즈B 투자유치
출처: 픽사베이
출처: 픽사베이

인공지능(AI) 기반의 음성기술 스타트업들이 최근 활동반경을 크게 확대하고 있어 주목된다. 

이들 업체는 음성인식(STT:Speech To TEXT)과 음성합성(TTS:Text To Speech), 자연어이해(NLU:Natural Language Understanding) 등의 솔루션과 플랫폼 등을 개발해 다양한 서비스 시장을 개척하고 있다. 

특히 최근에는 실재하는 특정인의 생김새와 표정, 목소리, 말투, 몸짓 등의 데이터를 AI에 학습시켜 만들어낸 'AI휴먼'의 보급이 확산하면서 그 기반이 되는 음성기술 스타트업들도 덩달아 각광받는 모습이다. 

24일 관련업계에 따르면, 카카오 계열의 AI 서비스 플랫폼 업체인 '카카오엔터프라이즈(대표 백상엽)'는 이날 기업용 AI 음성 인식변환 모델 '커스텀 STT'를 처음으로 공개하고, 시장 출시 계획 등을 밝혔다. 

'STT'는 AI를 활용해 음성을 문자로 변환하는 기술로 AI스피커와 음성 검색, 내비게이션 서비스 등에서 활용되고 있다. 

카카오엔터프라이즈의 '커스텀 STT'는 고객사의 사업 특성에 맞는 모델을 쉽고 빠르게 구축할 수 있다. 즉 고객사가 직접 단어와 패턴을 추가해 자신들에게 가장 적합한 AI 서비스 모델을 커스터마이징할 수 있다. 또한 고유명사나 길고 복잡한 단어 처리도 가능하며 음성인식 오류율이 기존 대비 30% 이상 개선됐다. 

카카오엔터프라이즈는 올 상반기 출시할 '카카오i 커넥트 센터(AICC)'의 문의응대나 상담 업무 등에도 '커스텀 STT'를 적용할 예정이다. 이 회사는 앞으로 STT 뿐 아니라 문자인식(OCR)과 TTS 분야에서도 커스텀 솔루션을 내놓을 계획이다. 

AI 기술 스타트업 '클레온(대표 진승혁)'은 이날 스페인 바르셀로나에서 열리는 글로벌 이동통신 박람회인 '모바일 월드 콩그레스(MWC)'에 참가해 국제적으로 기술력을 어필할 계획이라고 밝혔다. 

클레온은 이번 MWC에서 사진 1장과 30초 분량의 음성 데이터로 실시간으로 가상 얼굴과 음성을 생성할 수 있는 딥휴먼 기술을 기반으로 B2B SaaS(기업용 서비스형 소프트웨어)제품 '클론(KLone)'과 '클링(KLling)'을 공개할 예정이다. 

클레온의 '클론'은 기업의 브랜드 이미지에 맞는 가상인간을 제작할 수 있는 제품이다. 얼굴과 목소리를 실시간으로 바꾸거나 가상으로 만들 수 있을 뿐 아니라 성별, 인종, 직업 등 다양한 특징을 선택할 수 있다. 

이 회사의 '클링'은 한국어, 일본어, 중국어, 영어, 스페인어 등 5개국어로 동영상 원어를 자동으로 더빙하는 솔루션이다. 원본 인물의 목소리를 학습해 다국어 음성을 생성하고 음성에 맞는 입모양을 합성해 기존 더빙의 어색함을 없애는 것이 특징이다. 

진승혁 클레온 대표는 향후 사업계획에 대해 "올해 미국에서 시리즈A 투자를 유치하고 이를 통한 글로벌 시장 진출을 계획하고 있다"며 "처음 참가하는 MWC에서는 CES 때보다 발전된 제품을 선보일 예정"이라고 더스탁에 말했다. 

AI 콘텐츠 제작 서비스 업체인 '네오사피엔스(대표 김태수)'는 앞서 지난 23일 실리콘밸리 소재 투자사인 '블루런 벤처스'의 아시아 성장 투자 플랫폼 BRV 캐피탈매니지먼트(이하 BRV) 등으로부터 256억원 규모의 시리즈B 투자를 유치했다. 

네오사피엔스는 2020년 2월 시리즈A에 이어 2년 만에 시리즈B 투자유치를 하며 누적 투자유치액이 총 318억원에 달하게 됐다. 

네오사피엔스는 AI 기반 음성 및 영상 합성 원천기술을 바탕으로 가상 연기자를 활용한 콘텐츠 제작 플랫폼 '타입캐스트'를 운영중인 스타트업이다. 현재 100만명 이상 이용자들이 타입캐스트를 활용해 유튜브와 홈쇼핑, 교육 콘텐츠 등을 만들고 있다. 

네오사피엔스는 이번 투자를 통해 자사의 기술과 서비스를 더욱 고도화하고 글로벌로 확장할 계획이다. 이를 위해 해외 사업 거점을 마련하고, 인공지능 연구원, 소프트웨어 개발자 뿐만 아니라 제품개발, 서비스 운영, 사업개발 등 전 직군에 걸쳐서 우수한 인력을 확보한다는 방침이다. 

김태수 네오사피엔스 대표는 향후 계획에 대해 "이전까지는 기술적 차별화에 대한 인정을 받았다면 이번 투자 라운드에서는 사업 모델과 사업적 성과를 인정받았다는 점에서 의미가 있다"고 평가하면서 "앞으로 AI 가상 연기자를 활용한 미디어 분야 세계 최고의 스타트업이 되도록 노력하겠다"고 더스탁에 밝혔다.

김동진 기자mongsil2@the-stock.kr 다른기사 보기

관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
이슈포토