Header Fragments

ESTsoft

CONTACTSTHANKS
  1. Product
  2. AI Announcer

AI Announcer

인공지능 비전 기술과 음성 기술을 기반으로,
실제 사람의 형상과 기능으로 재현된 인공지능 아나운서를 만나보세요.
목소리 생성 AI (TTS)와 얼굴 생성 AI (STF)의 합성 기술을 바탕으로
특정 인물의 영상을 AI 기술로 학습하여
해당 인물과 동일한 말투, 억양, 목소리뿐만 아니라
말하는 얼굴, 표정 및 움직임까지 합성하는
AI 버추얼 휴먼 영상합성 솔루션입니다.

AI 변상욱 앵커가 출연한
YTN 뉴스가 있는 저녁 영상 다시보기

이스트소프트 AI 아나운서 모듈

이스트소프트만의 virtual human 기술로 탄생한
목소리 생성 AI(Text To Speech, TTS)얼굴 생성 AI(Speech To Face, STF) 기술

  • 목소리 생성 AI
    Text To Speech (TTS)

    목소리 생성 AI가 뉴스 텍스트를 음성으로 변환하여
    활자인 텍스트가 목소리로 생성됩니다.
    실제와 유사한 영상을 구현하고자 음성 신호 외에 얼굴 생김새도 입력했습니다.

  • 얼굴 생성 AI
    Speech To Face (STF)

    목소리에 맞는 얼굴을 생성하기 위해 얼굴 생성 AI를 거치게 됩니다.
    만들어진 음성과 얼굴을 합성하면 AI 아나운서를 위한
    템플릿 동영상이 만들어집니다.

이스트소프트 AI 아나운서 모듈

Virtual Human 기술을 활용한 콘텐츠 제작

이스트소프트 기술로 변화되는 콘텐츠 제작 환경

  • 2D/3D 애니메이션

    수작업으로 진행하던 2D와 다르게
    3D는 캐릭터가 있는 환경을
    컴퓨터 시뮬레이션을 통해 구현

  • 모션 캡쳐

    배우의 신체 움직임을 그대로 반영하여
    캐릭터의 움직임이나 표정이
    자연스러움

  • 최신 VFX 환경

    세트장이 아닌 실시간 nDisplay
    시스템으로 촬영하여
    제작 비용과 시간 감소

  • VFX+AI

    가상 인간(Virtual Human)의 등장
    case 1.AI로 배우의 얼굴을 학습해서 새로운 인물창조 case 2.딥페이크 기술로 배우의 젊은 시절 모습을 학습해서 현재 모습에 덮어쓰며 기존 인물 변형

AI 아나운서가
콘텐츠 제작 환경에 주는 변화

  • 가성비 스튜디오, 방송장비, 대량의 인력이 굳이 없이도
    균등한 품질의 콘텐츠 제작 가능
  • 편의성 인터넷 연결 환경만 있으면
    텍스트 입력 행위 하나만으로 영상 콘텐츠 제작
  • 신속성 재난, 속보성 뉴스 등
    신속함이 필요한 콘텐츠 제작에 강점
  • 대량의 편의성과 신속성을 바탕으로
    대량의 콘텐츠를 꾸준하게 생산

이전에 경험하지 못한 완벽한 AI 아나운서

최소한의 input으로 최고의 output을 만들어내는 이스트소프트만의 AI 기술입니다.

Q. 다른 AI 아나운서 개발 시
예상 소요 기간은?
A. 약 5일 소요데이터 검수 및 전처리 (2일)
AI 모델 학습 (2일), 튜닝 및 검수 (1일)
Q. 개발에 필요한
데이터 양은?
A. 5시간 분량으로 학습전처리를 거쳐서
정제한 데이터 기준
Q. 뉴스 동영상 생성에
필요한 시간은?
A. 뉴스 길이 대비 동일한 시간 소요20초 길이의 텍스트 입력 시
20초 후 뉴스 동영상 생성 완료

Contact Us

궁금하신 사항이 있으시면 오른쪽의 문의하기를 이용해주세요.
담당자가 자세하게 안내해드리겠습니다.

회사소개서 다운로드
문의 종류 선택
(해당 문의에 대한 회신 목적으로 이메일을 수집하며, 문의 민원 해결 후 파기합니다.)
Send Email
Footer Fragments 위로 가기