<- Back to projects and build log

RVQ

참고 [[Vector Quantization]] [[Hidden Singer]]로부터 설명을 가져왔습니다. [[RVQ]] 먼저, 들어온 latent vector에 대하여 첫 번째 Vector Quantizer가 [[Vector Quantization]]을 수행. 그 이후, 두 번째 Vector Quantizer 역시 동일한 latent vector에 대하여 [[Vector Quantizati...

rvq / vector-quantization / codebook / audio-autoencoder
RVQ 글 대표 일러스트
Jeffrey Kim의 SecondBrain 빌드 로그 아티클 커버

Quick context

First, this page captures one concrete build-log step, research note, or project lesson from Jeffrey Kim.

Next, use the tags, related reading, and home archive to move from this note to deeper material in the same topic cluster.

Finally, follow the RSS feed if you want the next experiment, retrospective, or paper review as soon as it ships.

Archive note

First, this imported note is intentionally compact. It acts as a pointer into the wider SecondBrain archive rather than a long-form standalone article.

Next, use the tags, related reading, and project sections to move toward deeper context. Those paths usually lead to fuller write-ups, experiments, or project retrospectives.

Finally, revisit this page together with the home archive and RSS feed when you want the follow-up posts that expand the same topic.

-참고 [[Vector Quantization]]

[[Hidden Singer]]로부터 설명을 가져왔습니다.

[[RVQ]]

Pasted%20image%2020250322222854

여기서 잠깐! Codebook이 뭐였는지 짚고 넘어가자. [[Vector Quantization]] 참고.

VQ를 하면 어떠한 Cluster로 각 벡터들이 바뀌게 되는데, 각각의 Cluster들을 **"Codeword"**, 해당 codeword들이 모인 집합을 **"Codebook"**이라고 부른다.

먼저, 들어온 latent vector에 대하여 첫 번째 Vector Quantizer가 [[Vector Quantization]]을 수행. 그 이후, 두 번째 Vector Quantizer 역시 동일한 latent vector에 대하여 [[Vector Quantization]]을 수행. 이것을 CC번 반복하고, 각각에서 나온 quantized vector를 모두 더해주면 최종 vector가 되는 방식!

Related reading

같이 읽으면 좋은 프로젝트 로그와 연구 노트를 이어서 탐색해보세요.

  • Hidden Singer 배경지식 [[Diffusion Model (DDPM)]] [[Latent Diffusion Model (LDM)]] 논문 논문의 핵심 1. Hidden Singer : 오디오를 압축된 representation으로...
  • Scalable and Effective Generative Information Retrieval Generative Retrieval, 들어는 보셨나요?? 논문 WWW 2024 Oral Generative Retrieval이란? Generative Retrieval의 기본적인 아이디어는 간단하다. 유저가 물어본...
  • VQ regularization 참고 : [[Regularization, Normalization, Standardization, Generalization]] 디코더에서 [[Vector Quantization]] Layer를 사용한다 = [[Ve...
  • Vector Quantization 도움받은 블로그 [[HuBERT]]의 예시를 들어보겠다. 여기서 여러 MFCCs 혹은 학습된 Encoder의 layer에서 나온 각각의 feature vector를 클러스터링을 통하여 각 카테고리들로 나누는 과정이...