요약 한 줄: 구글이 LLM의 ‘작업 메모리’인 KV 캐시를 최소 6배 압축하고 어텐션 연산 속도 최대 8배 가속을 달성했다는 터보퀀트를 공개했습니다. 핵심은 PolarQuant(극좌표 양자화) + QJL(Quantized Johnson–Lindenstrauss) 이중 구조이며, 연구팀은 정확도 손실 없이 장문 문맥 벤치마크에서 성능을 유지했다고 밝힙니다. [research.google], [techcrunch.com], [venturebeat.com], [techspot.com] 1) 터보퀀트 한 줄 정의 & 핵심 수치무엇: LLM의 KV 캐시와 벡터 검색을 극단적으로 압축하는 이론적으로 근거 있는 양자화 알고리즘 묶음. 실제 구현은 PolarQuant + QJL을 결합해 오버헤드(추가 상수 저장) 없..