한국어/영어 발화 제스처 자동 생성 기술
한국전자통신연구원
윤영우
연구내용
- 한국어/영어 발화 오디오 및 문장에 적절한 상반신 발화 제스처 동작을 자동으로 생성
- 게임 캐릭터에서부터 디지털 휴먼, 휴머노이드 로봇 등 사람과 소통하는 가상 에이전트의 발화 제스처 모션을 기존에는 모션 캡처를 통해 녹화했으나, 가상 에이전트가 활동하는 영역이 넓어지고 발화 양이 늘어남에 따라 자동 제스처 생성에 대한 요구 증대
- 본 기술은 가상 에이전트 기반의 다양한 서비스에 활용될 수 있는 고품질의 제스처 모션을 적은 비용으로 생성하는 핵심요소 기술
- 사람 제스처 비디오로부터 제스처 생성 지능을 학습한 모델로 음성 오디오, 발화 텍스트의 멀티모달 정보를 사용하여 발화에 어울리는 자연스러운 제스처 생성