※ 'LLM을 활용한 실전 AI 애플리케이션 개발' 책을 정리한 내용입니다. QLoRA 16비트로 모델을 저장하고 있는 LoRA와 달리 4비트 형식으로 모델을 저장하는 형태로 세가지 핵심 요소로 이루어져있다.양자화 : 기존 데이터를 더 적은 메모리를 사용하는 데이터 형식으로 변환하는 방법저차원 적응 : 파라미터 효율성을 높이기 위해 모델의 전체 파라미터를 업데이트하는 대신, 작은 저차원 행렬을 학습하여 원래의 큰 행렬을 근사합니다.효율적인 메모리 사용 및 계산 최적화 만약 기존 데이터의 분포를 알고 있다면 많은 연산이나 메모리 사용 없이도 빠르게 데이터의 순위를 정할 수 있다. 예를 들어, 입력 데이터가 정규 분포를 따른다는 것을 알고 있다면 데이터를 균등하게 분리하기위해 사용할 경계값을 쉽게 계산할 ..