RVC

덤프버전 :

1. 왕립 수의 대학의 줄임
2. AI 음성 합성 기술


1. 왕립 수의 대학의 줄임[편집]


파일:나무위키상세내용.png   자세한 내용은 왕립수의대학 문서를 참고하십시오.



2. AI 음성 합성 기술[편집]


Retrieval-based Voice Conversion
검색 기반 음성 변환

AI 음성 합성 기술으로 기존의 Diff-SVC와 비슷한 형태이지만 Diff-SVC는 Stable Diffusion을 이용해 음파 이미지를 만드는 방식이고 RVC는 기존의 음성데이터를 이용해 변조를 하는 방식이다.[1] 음성 변조와 비슷하다고 생각하면 될 듯하다.

모델을 만들려면 학습시키고자하는 목소리 파일이 5~10분 정도 필요하다.

보통 해당 기술을 이용해 본인의 목소리나 본인이 좋아하는 연예인이나 애니메이션/게임 속 캐릭터의 목소리를 학습시켜 노래를 부르게 하는 경우가 많다. 일종의 덕질 행위이다. 보통은 죠죠의 기묘한 모험디오 브란도의 목소리가 많이 사용되며 따로 모델까지 존재한다.

그림 인공지능과 같은 논란이 있다. 저작권에 관해서는 Github 레포지토리에서 문제가 없는 데이터들로만 학습했다고 한다.


파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-11-23 18:08:02에 나무위키 RVC 문서에서 가져왔습니다.

[1] VITS 기반으로 만들어졌다.