๐Ÿ‘‹ Hello, there

I am Hyeongcheol Geum. This site contains my usually thoughts and technical stories of ML/AI. I am a man with many questions about the world. You probably visited my blog for similar reasons. In that sense, I believe we could become good friends. Have a nice day!

[๋…ผ๋ฌธ] A Multi-Resolution Front-End for End-to-End Speech Anti-Spoofing

1. Motivation ๊ธฐ์กด ์Œ์„ฑ ์‹ ํ˜ธ ๋ถ„๋ฅ˜ ์ž‘์—…์—์„œ ์‹œ๊ฐ„-์ฃผํŒŒ์ˆ˜ ํ•ด์ƒ๋„์˜ ์ตœ์  ์„ ํƒ์€ ์„ฑ๋Šฅ์— ์ค‘์š”ํ•œ ์˜ํ–ฅ์„ ๋ฏธ์น˜์ง€๋งŒ, ์–ด๋–ค ํ•ด์ƒ๋„๊ฐ€ ๊ฐ€์žฅ ์ ํ•ฉํ•œ์ง€๋Š” ๋ช…ํ™•ํ•˜์ง€ ์•Š๋‹ค. ํŠนํžˆ, ์Šคํ‘ธํ•‘ ๋ฐฉ์ง€๋ฅผ ์œ„ํ•œ ์Œ์„ฑ ๋ถ„๋ฅ˜์—์„œ๋Š” ๋‹ค์–‘ํ•œ ์‹œ๊ฐ„-์ฃผํŒŒ์ˆ˜ ์Šค์ผ€์ผ์ด ํ•„์š”ํ•˜๋‹ค. ๊ธฐ์กด ์—ฐ๊ตฌ๋Š” ๊ณ ์ •๋œ ํ•ด์ƒ๋„์—์„œ ์ž‘์—…ํ•˜์—ฌ ์ •๋ณด ์†์‹ค ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์œผ๋ฉฐ, ์ด๋Š” ๋ถ„๋ฅ˜ ์„ฑ๋Šฅ์„ ์ œํ•œํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ๋‹ค์ค‘ ํ•ด์ƒ๋„ ๊ธฐ๋ฐ˜์˜ ์ „์ฒ˜๋ฆฌ(front-end) ๋ฐฉ์‹์„ ์ œ์•ˆํ•˜์—ฌ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž ํ•œ๋‹ค. 2. Related Work ๊ธฐ์กด ์—ฐ๊ตฌ์—์„œ๋Š” ๋‹ค์ค‘ ํ•ด์ƒ๋„ ๋˜๋Š” ๋‹ค์ค‘ ์Šค์ผ€์ผ ๊ตฌ์กฐ๋ฅผ ํ†ตํ•ด ๋ถ„๋ฅ˜ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๋ ค๋Š” ์‹œ๋„๊ฐ€ ์žˆ์—ˆ๋‹ค....

[๋…ผ๋ฌธ] Sparse Binarization for Fast Keyword Spotting

1. Motivation ์Œ์„ฑ ๊ธฐ๋ฐ˜ ๋””๋ฐ”์ด์Šค์™€ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์˜ ์ฆ๊ฐ€๋กœ ํ‚ค์›Œ๋“œ ์ŠคํฌํŒ…(Keyword Spotting, KWS)์€ ์‹ค์‹œ๊ฐ„ ์Œ์„ฑ ์ธ์‹์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋ฉฐ, ์—ฃ์ง€ ๋””๋ฐ”์ด์Šค์—์„œ์˜ ํ”„๋ผ์ด๋ฒ„์‹œ์™€ ๋Œ€์—ญํญ ํšจ์œจ์„ฑ์„ ๋†’์ธ๋‹ค. ์—ฃ์ง€ ๋””๋ฐ”์ด์Šค๋Š” ๋ฉ”๋ชจ๋ฆฌ์™€ ์—ฐ์‚ฐ ์†๋„๊ฐ€ ์ œํ•œ๋˜์–ด ์žˆ์–ด KWS ๋ชจ๋ธ์˜ ๊ฒฝ๋Ÿ‰ํ™”์™€ ์ตœ์ ํ™”๊ฐ€ ํ•„์ˆ˜์ ์ด๋‹ค. ์ด ๋…ผ๋ฌธ์—์„œ๋Š” ํšจ์œจ์ ์ด๊ณ  ์ •ํ™•ํ•œ KWS๋ฅผ ์œ„ํ•œ ์ƒˆ๋กœ์šด ๋ฐฉ๋ฒ•์œผ๋กœ Sparse Binarization์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ๋ชจ๋ธ SparkNet์„ ์ œ์•ˆํ•œ๋‹ค. SparkNet์€ ๊ธฐ์กด ์ตœ์ฒจ๋‹จ(SOTA) ๋ชจ๋ธ ๋Œ€๋น„ 4๋ฐฐ ๋น ๋ฅด๋ฉด์„œ๋„ ๋” ๋†’์€ ์ •ํ™•๋„๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ์†Œ์Œ ํ™˜๊ฒฝ์—์„œ๋„ ๋” ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค€๋‹ค. 2. Related Work Keyword Spotting (KWS) KWS๋Š” ์Œ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋ถ„์„ํ•ด ํŠน์ • ๋‹จ์–ด๋ฅผ ํƒ์ง€ํ•˜๋Š” ๊ธฐ์ˆ ์ด๋‹ค....

[๋…ผ๋ฌธ] Keyword Transformer: A Self-Attention Model for Keyword Spotting

1. Motivation Transformer ๊ตฌ์กฐ๋Š” ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ์™€ ์Œ์„ฑ ์ธ์‹ ๋“ฑ ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์—์„œ ์„ฑ๊ณต์ ์œผ๋กœ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ๋‹ค. ํ•˜์ง€๋งŒ ํ‚ค์›Œ๋“œ ์ŠคํฌํŒ… ๋ถ„์•ผ์—์„œ๋Š” ์ฃผ๋กœ Transformer๊ฐ€ ๊ธฐ์กด์˜ CNN์ด๋‚˜ RNN ๊ฐ™์€ ๊ตฌ์กฐ ์œ„์— ์ถ”๊ฐ€์ ์œผ๋กœ ์‚ฌ์šฉ๋˜์–ด ์™”๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์ด ๋…ผ๋ฌธ์€ ํ‚ค์›Œ๋“œ ์ŠคํฌํŒ…์— Transformer๋ฅผ ์ง์ ‘ ์ ์šฉํ•˜๋Š” ๋ชจ๋ธ์ธ Keyword Transformer(KWT)๋ฅผ ์ œ์•ˆํ•œ๋‹ค. KWT๋Š” ๋ณ„๋„์˜ ์‚ฌ์ „ ํ•™์Šต์ด๋‚˜ ์ถ”๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ํ•„์š”๋กœ ํ•˜์ง€ ์•Š์œผ๋ฉด์„œ ๊ธฐ์กด์˜ ๋ณต์žกํ•œ ํ˜ผํ•ฉ ๊ตฌ์กฐ๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, Google Speech Commands ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ตœ๊ณ  ์ˆ˜์ค€์˜ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ–ˆ๋‹ค....

[๋…ผ๋ฌธ] BEATS : Audio Pre-Training with Acoustic Tokenizercategories

1. Motivation ์ตœ๊ทผ ์ž๊ธฐ์ง€๋„ํ•™์Šต(SSL)์€ ์–ธ์–ด, ๋น„์ „, ์Œ์„ฑ์—์„œ ํฐ ์„ฑ๊ณผ๋ฅผ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ์ง€๋งŒ, ์˜ค๋””์˜ค ๋„๋ฉ”์ธ์—์„œ๋Š” ์—ฌ์ „ํžˆ ๋ณต์› ์†์‹ค(reconstruction loss)์ด ์ฃผ๋กœ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ๋‹ค. ๋ณต์› ์†์‹ค์€ ์ €์ˆ˜์ค€ ์‹œ๊ฐ„-์ฃผํŒŒ์ˆ˜ ํŠน์ง•์„ ์žฌํ˜„ํ•˜๋Š” ๋ฐ ์ดˆ์ ์ด ๋งž์ถฐ์ ธ, ๊ณ ์ˆ˜์ค€์˜ ์˜๋ฏธ ์ •๋ณด๋ฅผ ์ œ๋Œ€๋กœ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•˜๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. BEATS๋Š” ์—ฐ์†์ ์ธ ์˜ค๋””์˜ค ๋ฐ์ดํ„ฐ๋ฅผ ์ด์‚ฐ์ (discrete) ๋ผ๋ฒจ๋กœ ๋ณ€ํ™˜ํ•ด ๊ณ ์ˆ˜์ค€์˜ ์˜๋ฏธ์  ์ •๋ณด๋ฅผ ํ•™์Šตํ•˜๋Š” ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ธฐ์กด ๋ฐฉ์‹๋ณด๋‹ค ํšจ์œจ์ ์ด๊ณ  ์˜๋ฏธ ์ค‘์‹ฌ์ ์ธ ํ•™์Šต์ด ๊ฐ€๋Šฅํ•˜๋„๋ก ํ•œ๋‹ค. 2. Related Work ์˜ค๋””์˜ค ์‚ฌ์ „ ํ•™์Šต์€ ํฌ๊ฒŒ ์ง€๋„ ํ•™์Šต๊ณผ ์ž๊ธฐ์ง€๋„ํ•™์Šต์œผ๋กœ ๋‚˜๋‰œ๋‹ค....

[๋…ผ๋ฌธ] Filterbank Learning for Noise-Robust Small-Footprint Keyword Spotting

Filterbank Learning for Noise-Robust Small-Footprint Keyword Spotting 1. Motivation ํ‚ค์›Œ๋“œ ์ŠคํฌํŒ…(KWS)์€ ๋ณดํ†ต Log-Mel์ด๋‚˜ MFCC ๊ฐ™์€ ์ˆ˜์ž‘์—… ํŠน์ง•์„ ์‚ฌ์šฉํ•จ. ํ•™์Šต ๊ฐ€๋Šฅํ•œ ํ•„ํ„ฐ๋ฑ…ํฌ๊ฐ€ ๊ธฐ์กด ํŠน์ง•์„ ๋Œ€์ฒดํ•˜๋ ค๋Š” ์‹œ๋„๋Š” ์žˆ์—ˆ์œผ๋‚˜, ํฐ ์„ฑ๊ณผ๋Š” ์—†์—ˆ์Œ. ํ•„ํ„ฐ๋ฑ…ํฌ ์ฑ„๋„ ์ˆ˜๋ฅผ ์ค„์ด๋ฉด ํ•™์Šต๋œ ํ•„ํ„ฐ๋ฑ…ํฌ๊ฐ€ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ๋„ ์—๋„ˆ์ง€ ์†Œ๋น„๋ฅผ ํฌ๊ฒŒ ์ค„์ผ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์ฃผ์žฅํ•จ. ํ•ญ์ƒ ์ผœ์ ธ ์žˆ๋Š” ์ €์ž์› KWS ์‹œ์Šคํ…œ์— ํŠนํžˆ ์ค‘์š”ํ•จ. 2. Related Works SincNet: ํ•™์Šต ๊ฐ€๋Šฅํ•œ ํ•„ํ„ฐ๋ฑ…ํฌ๋ฅผ CNN ๊ธฐ๋ฐ˜ KWS์— ์ ์šฉํ•œ ์—ฐ๊ตฌ. ์ˆ˜์ž‘์—… ํŠน์ง•๊ณผ์˜ ์ง์ ‘ ๋น„๊ต๋Š” ๋ถ€์กฑํ–ˆ์Œ. ๊ธฐ์กด ์—ฐ๊ตฌ์—์„œ๋Š” Log-Mel๊ณผ MFCC๊ฐ€ ์—ฌ์ „ํžˆ ๋” ์šฐ์ˆ˜ํ•˜๋‹ค๊ณ  ๊ฒฐ๋ก ์ง€์Œ....

[๋…ผ๋ฌธ] Noise-Robust Keyword Spotting throught Self-Supervised Pretraikning

Noise-Robust Keyword Spotting throught Self-Supervised Pretraikning 1. Motivation ํ˜„๋Œ€์˜ ์Œ์„ฑ ๋น„์„œ๋Š” ๊ฑฐ์˜ ๋ชจ๋“  ์ปดํ“จํ„ฐ์™€ ์Šค๋งˆํŠธ ๊ธฐ๊ธฐ์—์„œ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•จ ์Œ์„ฑ ๋น„์„œ๋Š” ASR(์ž๋™ ์Œ์„ฑ ์ธ์‹) ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์ง€๋งŒ, ์ด๋Š” ๊ณ„์‚ฐ ๋น„์šฉ์ด ๋†’์•„ ์ž‘์€ ๊ธฐ๊ธฐ์—์„œ ์‹คํ–‰ํ•˜๊ธฐ ์–ด๋ ค์›€ ๋Œ€์‹  ํ‚ค์›Œ๋“œ ์ŠคํŒŸํŒ…(KWS) ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ํŠน์ • ํ‚ค์›Œ๋“œ๊ฐ€ ๋ฐœํ™”๋˜์—ˆ์„ ๋•Œ ASR์„ ํ™œ์„ฑํ™”ํ•จ ํ˜„์žฌ ์ตœ์‹  KWS ๋ชจ๋ธ๋“ค์€ ์ง€๋„ํ•™์Šต ๋ฐฉ์‹์œผ๋กœ ํ•™์Šต๋˜์–ด ๋งŽ์€ ์–‘์˜ ๋ ˆ์ด๋ธ”๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•œ ์ƒํ™ฉ ๋ ˆ์ด๋ธ”์ด ์—†๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์ž๊ธฐ์ง€๋„ํ•™์Šต์˜ ํ™œ์šฉ์ด ํ•„์š”ํ•œ ์ƒํ™ฉ 2. Related Works Data2Vec ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‚ฌ์šฉํ•œ transformer ๊ธฐ๋ฐ˜ KWS ๋ชจ๋ธ์˜ ์‚ฌ์ „ํ•™์Šต์ด ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ๋„์›€์ด ๋œ๋‹ค๋Š” ์—ฐ๊ตฌ๊ฐ€ ์žˆ์—ˆ์Œ ํ•˜์ง€๋งŒ ์ด์ „ ์—ฐ๊ตฌ๋Š” ๊นจ๋—ํ•œ ์˜ค๋””์˜ค ์ž…๋ ฅ๋งŒ์„ ๊ฐ€์ •ํ–ˆ๊ณ , ์‹ค์ œ ํ™˜๊ฒฝ์˜ ๋…ธ์ด์ฆˆ๋Š” ๊ณ ๋ คํ•˜์ง€ ์•Š์•˜์Œ ASR ๋ถ„์•ผ์—์„œ๋Š” ์ž๊ธฐ์ง€๋„ํ•™์Šต์„ ํ†ตํ•œ ๋…ธ์ด์ฆˆ ๊ฐ•๊ฑด์„ฑ ์—ฐ๊ตฌ๊ฐ€ ์ง„ํ–‰๋˜์–ด ์™”์Œ KWS์—์„œ๋Š” ๋Œ€๋ถ€๋ถ„ ์ง€๋„ํ•™์Šต ๊ธฐ๋ฐ˜์˜ multi-style training์ด๋‚˜ adversarial training ๋ฐฉ์‹์œผ๋กœ ๋…ธ์ด์ฆˆ ๊ฐ•๊ฑด์„ฑ์„ ํ™•๋ณด 3....

[๊ฐœ๋ฐœ] Mac OS์—์„œ LibTorch ์„ค์น˜ ๋ฐ ๋นŒ๋“œ

LibTorch LibTorch๋Š” C++ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ์ œ๊ณตํ•˜๋Š” PyTorch์˜ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ด๋‹ค. ์ด๋ฅผ ์„ค์น˜ํ•˜๋ฉด PyTorch์˜ ๋ชจ๋“  ๊ธฐ๋Šฅ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ํŒŒ์ด์ฌ ๊ธฐ๋ฐ˜์˜ ๋ชจ๋ธ ์„œ๋น™ ๋ง๊ณ , C++์—์„œ ํ™œ์šฉ ๊ฐ€๋Šฅํ•œ ๋ฉ€ํ‹ฐ์Šค๋ ˆ๋“œ์™€ ๊ฐ™์€ ๊ธฐ๋Šฅ์„ ์‚ฌ์šฉํ•˜๋ ค๋ฉด LibTorch๋ฅผ ์„ค์น˜ํ•ด์•ผ ํ•œ๋‹ค. ์ด ์ž‘์—…์€ CMakeLists.txt ํŒŒ์ผ์„ ํ†ตํ•ด ๋นŒ๋“œํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์ง„ํ–‰ํ•œ๋‹ค. ๋”ฐ๋ผ์„œ CMake๋ฅผ ๋จผ์ € ์„ค์น˜ํ•ด์•ผ ํ•œ๋‹ค. CMake ์„ค์น˜๋Š” ์ธํ„ฐ๋„ท์— ๋งŽ์ด ๋‚˜์˜ค๋ฏ€๋กœ, ๊ทธ ๋‚ด์šฉ์€ ์ƒ๋žตํ•œ๋‹ค. LibTorch ์„ค์น˜ ๋จผ์ € PyTorch ๊ณต์‹ ํ™ˆํŽ˜์ด์ง€์—์„œ ์„ค์น˜ ๊ฐ€์ด๋“œ๋ฅผ ์ฐธ๊ณ ํ•ด ์„ค์น˜ํ•œ๋‹ค. Locallyํ•˜๊ฒŒ ๋‹ค์šด๋ฐ›์•„๋„ ๋˜์ง€๋งŒ, ํ„ฐ๋ฏธ๋„์—์„œ ์•„๋ž˜ ๋ช…๋ น์„ ์‹คํ–‰ํ•ด๋„ ๋œ๋‹ค. (2.4.1 ๋ฒ„์ „ ๊ธฐ์ค€)...

[๊ธฐ์ˆ ] GPU์™€ CUDA (8) - ๊ณต์œ  ๋ฉ”๋ชจ๋ฆฌ

๊ณต์œ  ๋ฉ”๋ชจ๋ฆฌ ๊ณต์œ  ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ ๋ฐฉ๋ฒ•์€ ํฌ๊ฒŒ ์„ธ ๊ฐ€์ง€ ์ผ€์ด์Šค๋กœ ๊ตฌ๋ถ„ํ•œ๋‹ค. L1 ์บ์‹œ: ์ž์ฃผ ์‚ฌ์šฉ๋˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ง์ ‘ ๋ถ„๋ฅ˜, ๊ด€๋ฆฌํ•˜๊ธฐ ์–ด๋ ค์šด ๊ฒฝ์šฐ ์‚ฌ์šฉ์ž ๊ด€๋ฆฌ ์บ์‹œ 1: ๊ฐœ๋ฐœ์ž๊ฐ€ ์ปค๋„ ๋‚ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ๋ฐ์ดํ„ฐ ์ ‘๊ทผ ํŒจํ„ด์„ ํŒŒ์•… ํ›„, ์ง์ ‘ ์ œ์–ด ์‚ฌ์šฉ์ž ๊ด€๋ฆฌ ์บ์‹œ 2: ์ž์ฃผ ์‚ฌ์šฉํ•˜๋Š” ๋ฐ์ดํ„ฐ์˜ ์ „์—ญ ๋ฉ”๋ชจ๋ฆฌ ์ ‘๊ทผ์„ ์ค„์ด๊ธฐ ์œ„ํ•จ ์Šค๋ ˆ๋“œ ๊ฐ„ ๊ณต์œ  ๋ฉ”๋ชจ๋ฆฌ์™€ L1 ์บ์‹œ ํ™œ์šฉ ๋ฐฉ๋ฒ• ๊ณต์œ  ๋ฉ”๋ชจ๋ฆฌ (Shared Memory) ์—ญํ•  ๋ฐ ํŠน์ง•: ๊ณต์œ  ๋ฉ”๋ชจ๋ฆฌ๋Š” ๊ฐ ๋ธ”๋ก ๋‚ด ๋ชจ๋“  ์Šค๋ ˆ๋“œ๊ฐ€ ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๋Š” ๊ณ ์† ๋ฉ”๋ชจ๋ฆฌ ๊ณต๊ฐ„์ด๋‹ค....

[๊ฐœ๋ฐœ] ๋ฆฌ๋ˆ…์Šค ๊ฐœ๋ฐœ์„ ์œ„ํ•œ ๋ช‡ ๊ฐ€์ง€ ํ™˜๊ฒฝ ๊ตฌ์ถ•

๊ฐœ์š” ๋ฆฌ๋ˆ…์Šค ๊ฐœ๋ฐœ์„ ํ•˜๋‹ค๋ณด๋ฉด, ์—”๋น„๋””์•„ ๋“œ๋ผ์ด๋ฒ„, ๋„์ปค, CMake ๋“ฑ ํ™˜๊ฒฝ์„ ์žก์„ ์ผ์ด ์žˆ๋‹ค. GPU๊ฐ€ ์žˆ๋Š” ํ™˜๊ฒฝ์—์„œ ๊ฒฝํ—˜์ƒ ๊ฐ€์žฅ ์œ ์šฉํ•œ ๋ฐฉ๋ฒ•์€ NVIDIA ๋“œ๋ผ์ด๋ฒ„ ์„ค์น˜ NVIDIA ์ปจํ…Œ์ด๋„ˆ ํˆดํ‚ท ์„ค์น˜ Docker Hub์—์„œ ์ด๋ฏธ์ง€ ๋‹ค์šด๋กœ๋“œ CMake ๋“ฑ ์—ฌ๋Ÿฌ ๋นŒ๋“œ ๋„๊ตฌ ๋ฐ ํŒจํ‚ค์ง€ ์„ค์น˜ ์ด ๊ณผ์ •์ด๋ฉด NVIDIA GPU ํ™˜๊ฒฝ์—์„œ ์ž‘์—…๋งˆ๋‹ค ํŒจํ‚ค์ง€ ์˜์กด์„ฑ์„ ํ”ผํ•˜์—ฌ ๋…๋ฆฝ๋œ ํ™˜๊ฒฝ์„ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ๋‹ค. NVIDIA ๋“œ๋ผ์ด๋ฒ„ ์„ค์น˜ GPU๋ฅผ ํ™œ์šฉํ•œ๋‹ค๋ฉด, ์—”๋น„๋””์•„ ๋“œ๋ผ์ด๋ฒ„๋Š” ํ•„์ˆ˜์ด๋‹ค. ์•„๋ž˜ ๋ช…๋ น์–ด๋กœ ์ ์ ˆํ•œ NVIDIA ๋“œ๋ผ์ด๋ฒ„ ์„ค์น˜ ์œ ๋ฌด๋ฅผ ํ™•์ธํ•œ๋‹ค. nvidia-smi GPU ์ •๋ณด๊ฐ€ ์ œ๋Œ€๋กœ ๋œจ์ง€ ์•Š๋Š”๋‹ค๋ฉด, ์„ค์น˜ํ•ด์•ผ ํ•œ๋‹ค....

[๊ธฐ์ˆ ] LLM ๊ฒฝ๋Ÿ‰ํ™”๋ฅผ ์œ„ํ•œ ๊ฐ€์ด๋“œ

LLM Quantization ์ด ๊ธ€์€ โ€œMaarten Grootendorst"์˜ ํ—ˆ๋ฝ์„ ๋ฐ›๊ณ  Visual Guide To Quantization ๊ธ€์„ ๊ฐ„๊ฒฐํ•˜๊ฒŒ ์„ค๋ช…ํ•˜์˜€๋‹ค. ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ์ƒ์šฉ ํ•˜๋“œ์›จ์–ด์—์„œ ์‹คํ–‰ํ•˜๊ธฐ์—๋Š” ๋งค์šฐ ํฌ๋‹ค. ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์€ ์ˆ˜์‹ญ์–ต ๊ฐœ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋ณด์œ ํ•˜๋ฉฐ, ์ผ๋ฐ˜์ ์œผ๋กœ ์ถ”๋ก  ์†๋„๋ฅผ ๋†’์ด๊ธฐ ์œ„ํ•ด ๋งŽ์€ ๋ฉ”๋ชจ๋ฆฌ ์šฉ๋Ÿ‰์„ ๊ฐ€์ง„ GPU๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ๋”ฐ๋ผ์„œ ์ ์  ๋” ๋งŽ์€ ์—ฐ๊ตฌ๊ฐ€ ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์„ ๋” ์ž‘๊ฒŒ ๋งŒ๋“œ๋Š” ๊ฒƒ์— ์ดˆ์ ์„ ๋งž์ถ”๊ณ  ์žˆ๋‹ค. ์ด๋Š” ๊ฐœ์„ ๋œ ํ•™์Šต, ์–ด๋Œ‘ํ„ฐ ๋“ฑ์˜ ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค. ์ด ๋ถ„์•ผ์—์„œ ์ฃผ์š”ํ•œ ๊ธฐ๋ฒ• ์ค‘ ํ•˜๋‚˜๋Š” ์–‘์žํ™”(quantization)๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค....