[AI Lab ๊น๋ฌด์ฑ]
์คํ ํฌ๋์ CS25 : Transformers United ๊ฐ์ข ๋์์์ด ์ต๊ทผ ๊ณต๊ฐ ๋์์ต๋๋ค. [1]
๊ฐ์ข[2] ์์ฒด๋ ์๋ ํ๋ฐ๊ธฐ์ ๋๋ค๋ง, ๊ทธ๊ฐ ์ฌ๋ผ์ด๋๋ง ๊ณต๊ฐํ๊ณ ์์์ต๋๋ค. ๊ทธ๋ฐ๋ฐ ์ด๋ฒ์ ๋์์๋ ์ ํ๋ธ๋ฅผ ํตํด ๊ณต์ ํ์ต๋๋ค. ์ฌ๋ผ์ด๋ ์๋ฃ๋ ์ฐธ ์ข์ง๋ง ๊ทธ๋๋ ์ญ์ ์ง์ ๋ฐํ๋ฅผ ๋ฃ๋ ๊ฒ๋ง์ ๋ชปํ์ฃ . ์ต๊ทผ ๋ฅ๋ฌ๋์ ํ๋ฆ๊ณผ ํด๋น ์ฐ๊ตฌ์๋ค์ ์ธ์ฌ์ดํธ๋ฅผ ์์ํ๊ฒ ๋ค์ ์ ์์ด์ ์ด๋ฒ ํฌ์คํ ํ ํฝ์ผ๋ก ์ก์๋ณด์์ต๋๋ค.
์๋ง ์ด ๊ธ์ ๋ณด์๋ ๋๋ถ๋ถ์ ๋ถ๋ค์ด ๊ตฌ๊ธ์ ํธ๋์คํฌ๋จธ[3] ๋ชจ๋ธ์ ๋ํด ์๊ณ ๊ณ์๋ฆฌ๋ผ ์๊ฐํฉ๋๋ค. ํ์ง๋ง ์๋ฌด๋๋ ํธ๋์คํฌ๋จธ ๋ชจ๋ธ์ ์ฃผ์ ์์ฉ๋ถ์ผ๊ฐ ์์ฐ์ด์ฒ๋ฆฌ ์์ญ์ด์๊ณ , ํธ๋์คํฌ๋จธ ๊ตฌ์กฐ๊ฐ ๋์ ๋๋ฉด ๋ชจ๋ธ์ด ์ปค์ง๋ ๊ฒฝํฅ์ด ์์ด์ ‘๋ด ๋ถ์ผ์๋ ์๋ง์’๋ผ๊ณ ํ์๋ ๋ถ๋ค๋ ์์์๊ฑฐ์์. ํ์ง๋ง ์์ฆ ํธ๋์คํฌ๋จธ๊ฐ ์ฌ์ฉ๋๋ ๋ถ์ผ๊ฐ ์์ฒญ๋๊ฒ ๋น ๋ฅธ ์๋๋ก ํ์ฅ๋๊ณ ์์ต๋๋ค. ๊ทธ๋ฐ ์๋ฏธ์์ ๋จ์ ์์ฐ์ด์ฒ๋ฆฌ๋ฅผ ๋์ด์์ ์ด๋ค ๋ถ์ผ์ ์ด๋ค ์์ผ๋ก ๋์ ๋๊ณ ์๋์ง๋ฅผ ์ ์ ์๋ ์ข์ ์๋ฃ์ ๋๋ค.
์ด๋ค ์ฐ๊ตฌ์๋ค์ ํธ๋์คํฌ๋จธ ๋ชจ๋ธ์ ๋ฅ๋ฌ๋๊ณ์ ํธ๋์ง์คํฐ ๋ฐ๋ช ์ฒ๋ผ ์๊ฐํ๊ธฐ๋ ํฉ๋๋ค. ๊ฐ์ธ์ ์ผ๋ก ์ด๋ณด๋ค ๋ ํจ์จ์ ์ธ ๊ตฌ์กฐ์ ๋ชจ๋ธ์ด ๋์ฌ ๊ฒ ๊ฐ์ต๋๋ค๋ง, ๊ทธ๋๋ ๋น๋ถ๊ฐ์(ํน์ ์ด์ฉ๋ฉด ๊ฝค ์ค๋ ๊ธฐ๊ฐ) ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ AI ์์คํ ์ ์ฃผ์ ๋ ๊ณ ๋ธ๋ก์ผ๋ก ํธ๋์คํฌ๋จธ๋ฅผ ์ฌ์ฉํ๊ฒ ๋ ๊ฒ ๊ฐ์ต๋๋ค. ์ฌ๋ฌ ์ด์ ์ด ์๋๋ฐ, ์ฃผ๋ก ์ฐ๊ตฌ๋ณด๋ค๋ ์ฐ์ ์ ์์ฉ์ ์ด์ ์ด ํฝ๋๋ค. ์์ ์ฑ์ด ์๋ ๋ฐ์ดํฐ ๊ธฐ๋ฐ AI ์์คํ ์ ๊ตฌ์ถํ๋๋ฐ๋ ์๊ฐ๋ณด๋ค ๋ชจ๋ธ ์ด์์ ๋ง์ ์ปดํฌ๋ํธ๋ค์ด ํ์ํ ๊ฒ์ผ๋ก ๋ฐํ์ง๊ณ ์์ต๋๋ค. ์๋ ๋ณด์ด๋ ๊ทธ ์ ๋ช ํ ๊ทธ๋ฆผ์ฒ๋ผ ๋ง์ด์ฃ [4]. ML Core ์ธ์ ํ์ํ ๋ค๋ฅธ ์์คํ ๋ค๊ณผ ํ๋ก์ธ์ค๋ฅผ ๊ตฌ์ถํ๋๋ผ ํ์ฅ์์๋ MLOps๋ผ๋ ์ด๋ฆ์ผ๋ก ๋งค์ฐ ๊ณ ๊ตฐ๋ถํฌํ๊ณ ์์ต๋๋ค. ๊ทธ๋ฐ๋ฐ ์ MLCore๋ก ๋ค์ด๊ฐ ๋ชจ๋ธ์ด ๋จ์ํด์ง๋ฉด ์ ๋ง ๋ง์ ์ด์ ์ด ์์ต๋๋ค.
ํธ๋์คํฌ๋จธ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ฑํ๊ฒ ๋๋ฉด ๊ทธ๊ฒ ๊ฐ๋ฅํด์ง์ง ์์๊น๋ผ๋ฉฐ ์๋ํ๋ ๋ง์ ์ฐ๊ตฌ๋ค์ด ๋์ค๊ณ ์์ต๋๋ค. ์ด๋ฏธ์ง, ํ ์คํธ, ์์ฑ, ๋ก๋ด ์ก์ ๋ฑ์ ํ ํฌ๋์ด์ง -> ํ ํฐ ์๋ฆฌ์ฆ -> ํฌ์ง์ ์๋ฒ ๋ฉ -> ํ ํฐ ์์ธก ๋ก์ค ๋ฑ์ผ๋ก ์ผ์ํํ๋ ๊ฒ์ด์ฃ . ๋ถ๋ถ์ ์ผ๋ก ์ฑ๊ณต๋ ํ๊ตฌ์[5] (๋ฅ๋ง์ธ๋์ ์ด๋ค ์ฐ๊ตฌ์๋ ๋ฏธ๋ฆฌ ‘๊ฒ์ ์ค๋ฒ’๋ผ๋ฉฐ ์ ์ธํ๊ธฐ๋ ํ์ง๋ง ์ด๊ฑด ์ข ๋ ์ง์ผ๋ด์ผ๊ฒ ์ฃ ).
ํธ๋์คํฌ๋จธ ์ค์ฌ์ผ๋ก AI ์ํคํ ์ณ๋ฅผ ๊ตฌ์ฑํ๋ฉด ๊ท๋ชจ๋ฅผ ํค์ฐ๊ธฐ์๋ ์ข์ต๋๋ค. ๋ฌผ๋ก ‘์ ์ ๋ชจ๋ธ ํฌ๊ธฐ๋ง ํฌ๊ฒํ๋ ์นํจ ๊ฒ์์ผ๋ก ๊ฐ๊ณ ์๋ค’๋ผ๋ฉฐ ๋ชป๋ง๋ ํดํ๋ ์ฐ๊ตฌ์๋ค๋ ์์ง๋ง, ๋น๋ถ๊ฐ ์ด๋ฅผ ์ฃผ๋ํ๋ ๋น ํ ํฌ ๊ธฐ์ /์ฐ๊ตฌ์๋ ์ด๋ฅผ ๊ณ์ ์๋ํ ๋งํ ์ฌ๋ฌ ์ด์ ๊ฐ ์์ต๋๋ค. ์ด๋ฐ ์กฐ์ง๋ค์ ๋น๋ก ์ด๋ ๊ฒ ๊ท๋ชจ๊ฐ ์ปค์ง AI ์์คํ ์์ฒด๋ ์์ ์ฑ์ด ๋จ์ด์ง์ง๋ง ํด๋ผ์ฐ๋๋ฅผ ๋น์ฆ๋์ค ์ฃผ๋ ฅ์ผ๋ก ์ผ๊ฑฐ๊ฑฐ๋ API ํธ์ถ๋น ๊ณผ๊ธํํ ํด์ ๊ท๋ชจ์ ๊ฒฝ์ ๋ก ์ฌ๋ฌ ์ฌ์ฉ์/๊ธฐ์ ๋ค์๊ฒ ํ๋งคํ์ฌ ํ์ต/์ถ๋ก ๋น์ฉ์ ๋ฎ์ถ๋ค๋๊ฐ ํ๋ ์์ผ๋ก ๊ฝค ๊ทน๋ณตํด ๋ผ ์ ์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ AI ์ฐ์ ๊ฒฝ์์ ๋์ ์ธ์์ผ๋ก ์ ํ์์ผ ๊ฒฝ์ ๊ทธ๋ฃน๋ณด๋ค ์์๋๊ฐ ์ ์๊ณ ๋ฏธ๋ ์ธํ๋ผ๋ฅผ ์ฐจ์งํ๊ฒ ๋ ์๋ ์์ฃ .
์ค์๊ท๋ชจ ๊ธฐ์ /์ฐ๊ตฌ์กฐ์ง์ AI๊ธฐํ/MLOps/ML ์์ฉ ์ดํ๋ฆฌ์ผ์ด์ ๊ฐ๋ฐ์๋ค๋ ํธ๋์คํฌ๋จธ ๊ธฐ๋ฐ์ผ๋ก ํ์ฅ๋๊ณ ์๋ ํ์ฌ์ ํ๋ฆ์ ์ดํดํ๋ ๊ฒ์ ๊ฝค ๋ง์ ์ด์ ์ด ์์ต๋๋ค. ๋ฌผ๋ก ์ด๋ฅธ๋ฐ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ[6]์ด๋ผ ๋ถ๋ฅด๋ ๋ฉํฐ๋ชจ๋ฌ-๋ฉํฐํ์คํฌ ๋ชจ๋ธ๋ค์ ์ง์ ํ์ต/๊ตฌ์ฑํ๋ ๊ฒ์ ์ด๋ ต์ต๋๋ค. ํ์ง๋ง ์ด๋ฐ ๊ฑฐ๋๊ท๋ชจ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ๋ค์ด ๊ฐ์ง๋ ‘์ ์ด ํ์ต’ ๋ฅ๋ ฅ์ ‘few-shot learning(ํจ์ท ๋ฌ๋)’์ด๋ ‘Prompt learning(ํนํ in context learning ๋ฐฉ์)’ ๋ฑ์ผ๋ก ์ด์ ๋ณด๋ค ๋ ์ ์ ๋ฐ์ดํฐ๋ก ๋ ์ฌ์ด ํ์ต๋ฐฉ์(ํน์ ๋นํ์ต ๋ฐฉ์)๊ณผ ์ถ๋ก ๋ฐฉ์์ ํ์ฉํ ์ ์๊ฒ ๋๊ณ ์์ต๋๋ค. ์ฐ์ ์์ฉ์ ์ธก๋ฉด์์๋ ์๋ ๊ทธ๋ฆผ์ฒ๋ผ ๊ฐ๋ฐ-๊ฐ์ ํ๋ก์ธ์ค๊ฐ ๋จ์ํ๋ ์ ์์ต๋๋ค. ๊ฑฐ๊ธฐ์ ๋ํด ํ๊น ํ์ด์ค์ transformers [7] ๋ผ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค์ฌ์ผ๋ก ์ข์ ๋๊ตฌ ์ํ๊ณ๊ฐ ๋ง๋ จ๋์ด ์๊ณ ์ ์ ํ์ฅ๋๊ณ ์๊ธฐ์ ์ด๋์ ๋ ๊ท ์งํ๋ AI ์์ฉ ์ดํ๋ฆฌ์ผ์ด์ ์ธ๋ ฅ์ ์ฑ์ฉ/๊ต์กํ ์ ์์ต๋๋ค. ์ฌ์ง์ด GPU/TPU[8] ๋ฑ์ ๋ฅ๋ฌ๋ ์ ์ฉ ๊ฐ์ํ ๊ธฐ๊ธฐ๋ค์ด on-demand๋ก ํด๋ผ์ฐ๋์์ ์ฌ์ฉํ ์ ์๊ณ , JAX/Flax ๋ฑ์ ์๋ํฅ์๋ ํ์ด์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๊ธฐ๋ฐ ๊ตฌํ์ฒด๋ค์ด ํด๋น ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ํตํฉ๋๊ณ ์์ต๋๋ค. ์ด๋ค์ ํ์ฉํ๋ฉด BERT๋ GPT-2 ๋ฑ์ ๋ชจ๋ธ์ ์ฒ์ ๋ฑ์ฅํ์ ๋์ ๋น๊ตํด์ ์/์คํ ๋ชจ๋ธ์ด๋ผ๊ณ ํ ์ ์์ผ๋ ์ ์ ํ๊ฒ ์ด๋๊ท๋ชจ ๋ชจ๋ธ๊ณผ ๋ฏธ๋์ ๋ชจ๋ธ๋ค์ ํ์ฉํ์ฌ ํจ์จ์ ์ธ ์์คํ ์ ๊ตฌ์ฑํ๊ธฐ ์ฌ์์ง๊ณ ์์ต๋๋ค. ์๋ง ํ์ฌ ๋ถ๋ถ๊ณ ์๋ NPU ์ฐ๊ตฌ๋ค์ด ์ด๋ ์ ๋ ์ฑ๊ณผ๋ฅผ ๋ณด์ด๊ฒ ๋ ๊ทผ๋ฏธ๋์๋ ํธ๋์คํฌ๋จธ ๊ธฐ๋ฐ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ์ API ํธ์ถ์ด ์๋ ๋ฐฉ์์ผ๋ก ์ด์ํ๋ ๊ฒ๋ ROI๊ฐ ๋์ค๋ ์ํฉ์ด ๋๊ฒ ์ฃ .
์ฐ๊ตฌ์๋ก์๋ ํธ๋์คํฌ๋จธ ๊ธฐ๋ฐ ์ฐ๊ตฌ๋ค์ ์ต์ ํ๋ฆ์ ๋ฐ๋ผ๊ฐ๋ ๊ฒ์ ๋ง์ ์ด์ ์ด ์์ต๋๋ค. ์ฌ๋ฌ ์์ญ์ ๋จ์ผํ ์ํคํ ์ณ๋ก ๋๋๋ค ์ ์์ผ๋ฉฐ, ๊ฑฐ๋ํ๋๊ณ ์๋ ๋ชจ๋ธ๋ค์์ ํ์๋๋ ์ฌ๋ฌ ๋ฌธ์ ๋ค์ ๋ฏธ๋ฆฌ ์ฒดํํด๋ณด๊ฑฐ๋ ๋๋นํ ์ ์์ต๋๋ค. ํจ์ท, ์ ๋ก์ท ํ์๋ค, ๋ฉํฐ๋ชจ๋ฌ ๋ฉํฐํ ํฐ, ๊ท๋ชจ๊ฐ ์ปค์ง๋ฉด์ ์ถํํ๊ณ ์๋ ์ฌ๋ฌ ํ์๋ค. ๋ฌผ๋ก ์ง์ ์ด๋ฐ ๊ท๋ชจ๋ก ๋ง๋ค ์ ์๋ ์ํฉ์ ์๋ ์ฐ๊ตฌ์๋ ์ฐ๊ตฌ์ง๋จ์ด ๋ ๋ง๊ฒ ์ง๋ง ๊ทธ๋๋ API ํธ์ถ์ด๋ ํ์ธํ๋, ๋๋ ์กฐ๊ธ์ฉ ๊ณต๊ฐ๋๊ณ ์๋ ์คํ์์คํ ๊ฑฐ๋๋ชจ๋ธ๋ค์ ํตํด ๊ฐ์ ์ ์ผ๋ก ์ฐ๊ตฌํ ์ ์๊ณ ๋๋นํ ์ ์์ต๋๋ค. ๋ํ MLOps์ ๋ค๋ฅธ ์์ญ๋ค๋ก ์ฐ๊ฒฐ๋๋ ์ง์ ์ผ๋ก ์ฐ๊ตฌ์ญ๋์ ํ์ฅํ ์ ์์ต๋๋ค. ์ด๋ป๊ฒ ๊ท๋ชจ๊ฐ ์ปค์ง๋ ๋ชจ๋ธ์ ์๋นํ ์ง – ๋ชจ๋ธ/๋ฐ์ดํฐ ๋ณ๋ ฌํ ๋ผ๋๊ฐ, Foundation Model์ ์๊ธฐ๋ง์ ํนํ๋ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ๊ฒฐํฉํ๊ณ ์ํธ์ด์ฉํ ์ง์ ๋ํ Data-Centric AI๋ผ๋๊ฐ ๋ง์ด์ฃ .
๊ทธ๋ฆฌ๊ณ ํ์ฌ๋ ํธ๋์คํฌ๋จธ๋ฅผ ํตํด ์งํ๋์ง๋ง, ๋์ค์ ํธ๋์คํฌ๋จธ๋ฅผ ๋์ฒดํ ๋ ์ข์ ๋ชจ๋ธ์ด ๋์ค๋๋ผ๋ MLCore๋ง ๊ต์ฒด๋์ง ๋๋จธ์ง ๋ถ๋ถ๋ค๋ค์ ์๋ง๋ ์ฌ์ ํ ํต์ฌ์ ์ธ ํํ๋ก ๋จ์์ – 10%์ ์๊ฐ์ผ๋ก ๋ฉํฐ๋ชจ๋ฌ-๋ฉํฐํ์คํฌ Foundation Model์ ์์ง์ฒ๋ผ ๊ตฌ์ฑํ๊ณ , ์ด ๋ชจ๋ธ์ด ๋ด๋ฑ๋ ๊ฐ๋ ฅํ์ง๋ง ๋ถ์ ํํ ๊ฒฐ๊ณผ๋ฌผ๋ค์ ๋ณด์ ํ๊ณ ์ ์ดํ๊ณ ํด์ํ๋ ค๊ณ ์ ์ฐ๋ 90%์ ๋ ธ๋ ฅ์ ํํ๋ก – ๊ณ์ ์ค๋ฌด์/์ฐ๊ตฌ์๋ค์๊ฒ ๋์ ๊ณผ ๋ณด์์ ๋ถ์ฌํ ๊ฒ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค.
——————
์ฐธ๊ณ ์๋ฃ
[1] Stanford CS25: Transformers United (Autumn 2021) youtube – https://www.youtube.com/playlist?list=PLoROMvodv4rNiJRchCzutFw5ItR_Z27CM
[2] CS25: Transformers United Stanford – Fall 2021 – https://web.stanford.edu/class/cs25/
[3] Attention Is All You Need / Google / 2017 – https://arxiv.org/abs/1706.03762
[4] Hidden Technical Debt in Machine Learning Systems / Google / 2014 – https://research.google/pubs/pub43146/
[5] A Generalist Agent / DeepMind / 2022 – https://arxiv.org/abs/2205.06175
[6] On the Opportunities and Risks of Foundation Models – https://arxiv.org/abs/2108.07258
[7] hugging face’s transformers – https://huggingface.co/docs/transformers/index
[8] Cloud TPU – https://cloud.google.com/tpu