<- Back to projects and build log

K-means

구체적인 설명 : https://velog.io/@jhlee508/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D K %ED%8F%89%EA%B7%A0K Means %EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98 Unsupervised learning 중 하나로, Clustering의 대표적인 방법이다. K는 군집의 개수를 뜻한다. K개의 군집을 만들 것인...

k-means / clustering / unsupervised-learning / machine-learning
K-means 글 대표 일러스트
Jeffrey Kim의 SecondBrain 빌드 로그 아티클 커버

Quick context

First, this page captures one concrete build-log step, research note, or project lesson from Jeffrey Kim.

Next, use the tags, related reading, and home archive to move from this note to deeper material in the same topic cluster.

Finally, follow the RSS feed if you want the next experiment, retrospective, or paper review as soon as it ships.

Archive note

First, this imported note is intentionally compact. It acts as a pointer into the wider SecondBrain archive rather than a long-form standalone article.

Next, use the tags, related reading, and project sections to move toward deeper context. Those paths usually lead to fuller write-ups, experiments, or project retrospectives.

Finally, revisit this page together with the home archive and RSS feed when you want the follow-up posts that expand the same topic.

구체적인 설명 : https://velog.io/@jhlee508/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-K-%ED%8F%89%EA%B7%A0K-Means-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98

Unsupervised learning 중 하나로, Clustering의 대표적인 방법이다. K는 군집의 개수를 뜻한다. K개의 군집을 만들 것인데, 임의의 centroid를 정하고 그 주변의 가까운 데이터들을 군집에 포함한다. 그 후 그 군집의 데이터의 centroid를 찾아 업데이트한다. centroid가 변하지 않을 때까지 이것을 반복하며 k개의 군집을 찾을 수 있다.

Related reading

같이 읽으면 좋은 프로젝트 로그와 연구 노트를 이어서 탐색해보세요.

  • Hidden Singer 배경지식 [[Diffusion Model (DDPM)]] [[Latent Diffusion Model (LDM)]] 논문 논문의 핵심 1. Hidden Singer : 오디오를 압축된 representation으로...
  • Auto Encoder 인풋을 latent로 보내는 인코더 latent에서 output을 다시 만드는 decoder input과 output이 비슷하도록 훈련됨
  • Regularization, Normalization, Standardization, Generalization 퍼플렉시티가 정리해 주었다. 요약 Regularization = 모델의 오버 피팅을 방지하기 위함. Normalization = 데이터의 범위를 0 1로 스케일링함. Standardization = 데이터의 분포를...
  • Vector Quantization 도움받은 블로그 [[HuBERT]]의 예시를 들어보겠다. 여기서 여러 MFCCs 혹은 학습된 Encoder의 layer에서 나온 각각의 feature vector를 클러스터링을 통하여 각 카테고리들로 나누는 과정이...