AVINchat

AVIN-Chat: An Audio-Visual Interactive Chatbot System with Emotional State Tuning

담당 파트

Unity 클라이언트 개발
- 웹캠 카메라 캡처, 음성 녹음, 3D object 다운로드\배치, 음성 재생
FastAPI 백엔드 개발(AI 모델 연동)
HRN - LDT - Blender / Whisper - ChatGPT - Emotivoice 파이프라인의 각 레이어 모듈 개발
- HRN 모델을 사용하여 이미지 입력 - 3D face 생성
- LDT를 사용해 base face로 52개의 표정 face object 생성(병렬처리로 처리 속도 개선)
- Blender python API를 사용하여 하나의 BlendShape object로 변환
- Whisper모델로 사용자의 음성을 텍스트로 변환
- ChatGPT API를 사용해 사용자의 발화에 맞는 응답 생성
- Emotivoice 모델을 사용해 감정이 들어간 응답 음성 생성
감정을 담은 대화를 생성할 수 있도록 ChatGPT 프롬프팅
코드 담당, 기술 파트 논문 작성

Face to face conversation with the 3D facial avatar made from single person’s photo by user input.

Generate Facial Avatar in 3D with single photo
Convert user’s voice to text using Whisper from OpenAI
Conversation using ChatGPT
Convert ChatGPT’s answer to voice using EmotiVoice

IJCAI Demo Track(Accepted)
IJCAI paper Link Arxiv

PREVIOUSVideo Generation Network

NEXTRefeat. ver2