[์ตํฉ์ฐ๊ตฌํ ์ฌํ๋งค]
NLP ๋ถ์ผ์์ 2020๋ Top 10 ํค์๋๋ฅผ ๋ฝ๋๋ค๋ฉด GPT-3(Language Models are Few shot Learners) ๋น์ฐํ ์์ ๋ด์ ์์ ๊ฒ๋๋ค. ํ์ฌ๊น์ง๋ GPT-3์ ์์ฒญ๋ ์์ ๋งค๊ฐ๋ณ์์ ์ฐ์ํ ์ฑ๋ฅ์ ์ฌ์ ํ โโNLP ๋ถ์ผ ๋ด์ธ๋ฅผ ๋ง๋ก ํ๊ณ ์ธ๊ธฐ๋ฅผ ๋ํด๊ฐ๊ณ ์์ต๋๋ค. ๊ทธ๋ฌ๋ NLP ์ฐ๊ตฌ์์ผ๋ก์ ์ต์ฒจ๋จ ์ฐ๊ตฌ์ ๋ํ GPT-3์ ๊ฐ์ฅ ํฐ ๊ธฐ์ฌ๋ ์ผ๋ฐ ์์ ( ํนํ zero-shot , few-shot ) ์์ Prompt-tuning ๊ธฐ์ ์ ์์ฉ ๊ฐ๋ฅ์ฑ์ ์ ์ฆํ ๊ฒ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค. GPT-3 ์ด์ ์๋ Prompt-tuning์ด ์ฃผ๋ก ์ธ์ด ๋ชจ๋ธ์ ํฌํจ(์ ์ฌ)๋ ์ง์์ ํ์ํ๋ ๋ฐ ์ฌ์ฉ๋์๋ค๋ฉด GPT-3 ์ดํ Prompt-tuning์ ๋ค์ํ ์ ํ์ NLP Task (๋ฉํฐ ๋ชจ๋ฌ Task, ์ฝ๋ ์์ฑ Task ๋ฑ)์ ์ฌ์ฉ๋์์ผ๋ฉฐ ์ง๋ 2๋ ๋์ ์์ฃผ ํซํ ํค์๋๋ก์จ ๊ด๋ จ ๋ ผ๋ฌธ๋ค์ด ๋ง์ด ์์์ ธ ๋์์ต๋๋ค.
Prompt-tuning๊ณผ GPT-3์ ์ํธ ์ด๋ฃจ์ด๋ธ ์ฑ์ทจ๋ NLP ๊ฐ๋ฐ์ ์ญ์ฌ์์ ๋ฌด์ํ ์ ์๋ค๊ณ ์๊ฐํฉ๋๋ค. Prompt-tuning ๊ธฐ๋ฐ์ GPT-3๋ ๋ค์ํ ์ ํ์ Task๋ฅผ ์ํํ๋๋ฐ ์์ด์ ์ข์ ์ฑ๋ฅ์ ๋์ง๋ง ์๊ฐํด๋ณด๋ฉด ์ด์ฒ๋ผ ๋๋ผ์ด Task ๋ค์ ์ํํ ์ ์๋ GPT-3์ ๋ ์ข์ zero-shot , few-shot ํ์ต ๋ฅ๋ ฅ์ด ์์ง ์์๊น? Prompt-tuning ์ด GPT-3๋ฅผ ์ฌ์ฉํ๋ ๊ฐ์ฅ ์ข์ ๋ฐฉ๋ฒ์ธ๊ฐ?ํ๋ ๊ถ๊ธ์ฆ๋ค์ ํ๋ฒ์ฏค์ ๊ฐ์ง๊ฒ ๋ ๊ฒ์ ๋๋ค.
์ต๊ทผ Google ์ฐ๊ตฌ์๋ค์ GPT-3(175B) ๋ณด๋ค ์ ์ ๋งค๊ฐ๋ณ์(137B)๋ฅผ ์ฌ์ฉํ์ฌ 25๊ฐ Task ์ค 19๊ฐ Task์์ GPT-3์ ํฌ๊ฒ ๋ฅ๊ฐํ๋ Istruction Tuning (๋ช ๋ น/์ง์นจ ์กฐ์ )๋ฐฉ๋ฒ์ธ FLAN (Finetuned LANguage Models are zero-shot Learners)์ ์ ์ํจ์ผ๋ก์จ GPT-3๊ฐ ๋ ๊ฐํด์ง ์ ์์์ ์๋ ธ์ต๋๋ค.
GPT-3 ( LANguage Models are zero-shot Learners)๊ณผ ๋น๊ต ์ FLAN์ ์ฐจ๋ณ ์ฑ์ ๋ฐ๋ก finetune์ ์์ต๋๋ค. FLAN์ ํต์ฌ ์์ด๋์ด๋ ๋ค์ํ NLP Task๋ฅผ Natural Language Instructions ํํ(์ผ์ข ์ Task ๋ช ๋ น ํน์ ์ง์นจ)๋ก ๋ณํํด์ ์ด๋ฌํ ๊ณผ์ ๋ฅผ ํ๋๋ก fine-tuning ํ๋ ๊ฒ์ ๋๋ค. (์๋ [๊ทธ๋ฆผ 1] ๋ด์ (C) ์ฐธ๊ณ )
์ข ๋ ์์ธํ ์ค๋ช ์ ๋๋ฆฌ๋ฉด FLAN์ ๋จผ์ Pretrained LM์ ๋ฒ์ญ, ์์ ์ถ๋ก , ๊ฐ์ ๋ถ๋ฅ ๋ฑ์ ํฌํจํ ๋ง์ ๋ค์ํ NLP Task๋ฅผ ์ํํ ์ ์๋๋ก fine-tuning ํฉ๋๋ค. ์๋ฅผ ๋ค๋ฉด ์๋ [๊ทธ๋ฆผ 2]๊ณผ ๊ฐ์ด ๋ฒ์ญ Task์ ๋ํด์๋ “Translate this sentence to Spanish” ๋ฅผ, ๊ฐ์ ๋ถ๋ฅ Task์ ๋ํด์๋ “Is the sentiment of this movie review positive or negative?”๋ผ๋ ๋ช ๋ น/์ง์นจ์ ์ด์ฉํฉ๋๋ค. ๋ชจ๋ธ์ด ์ด๋ฌํ ๋ช ๋ น์ด/์ง์นจ์ด ํฌํจ๋ ์ ๋ณด๋ฅผ ์ด์ฉํ์ฌ ๋ค์ํ Task๋ฅผ ์ํํ ์ ์๋๋ก fine-tuning ์๋ฃํ๋ฉด, ์ต์ข ํ์ต์ ์ ํ ์ถ๋ก Task์ธ “Does the premise entail the hypothesis?”๋ผ๋ ๋ช ๋ น์ ๋ํด์๋ ๊ธฐ์กด ์ง์์ ๋ ์ ํ์ฉํ์ฌ ๋ตํ ์ ์์ต๋๋ค.
๋ ผ๋ฌธ์์ ์ ์๋ค์ FLAN์ด ์น ํ์ด์ง, ํ๋ก๊ทธ๋๋ฐ ์ธ์ด, ๋ํ ๋ฐ Wikipedia ๋ฌธ์ฅ์ ๋ํ ํ์ต ํ ๋ช ์์ ์ผ๋ก ํ์ต๋์ง ์์ Task์ ๋ํด์๋ ์๋ํ๋ ๋ฐฉ๋ฒ์ ํ์ต ํ ์ ์์์ ๋ฐ๊ฒฌํ์ต๋๋ค. ์ด์ฒ๋ผ Instruction Tuning์ ๋ชจ๋ธ์๊ฒ ์ผ์ข ์ ๋ช ๋ น/์ง์นจ์ผ๋ก ํํ๋ NLP Task๋ฅผ ์ํํ๋ ๋ฐฉ๋ฒ์ ๊ฐ๋ฅด์ณ์ ์์ฐ์ด๋ฅผ ์ฒ๋ฆฌํ๊ณ ์ดํดํ๋ ๋ฅ๋ ฅ์ ํฅ์ ์ํฌ ์ ์์ต๋๋ค. ์ฆ, ์์ฐ์ด์ ์ง์ ํ ์๋๋ฅผ ๋ถ๋ถ์ ์ผ๋ก ์ดํดํ ์ ์์์ ์๋ฏธํฉ๋๋ค.
FLAN์ ๋ ผ๋ฌธ์์๋ 12๊ฐ์ ์นดํ ๊ณ ๋ฆฌ์ ์ด 62๊ฐ์ ๊ณตํต ์์ฐ์ด ์ฒ๋ฆฌ ๋ฐ ์์ฑ Task ๊ด๋ จ ๋ฐ์ดํฐ๋ฅผ ์ ํํ์ฌ tuning ์คํ์ ์ํํ์ต๋๋ค. ([๊ทธ๋ฆผ 3] ์ฐธ๊ณ )
์ ์๋ค์ ๊ธฐ๋ณธ ์ธ์ด ๋ชจ๋ธ๋ก 137B ํฌ๊ธฐ์ ์๊ธฐ ํ๊ท ์ธ์ด ๋ชจ๋ธ(Base LM)์ ์ด์ฉํ์์ต๋๋ค. Instruction Tuning ํ์ดํ๋ผ์ธ์ 60๊ฐ ์ด์์ nlp task๋ค์ ๋ํ ๋ชจ๋ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ํผํฉํ๊ณ ๊ฐ ๋ฐ์ดํฐ ์ธํธ์์ ์ํ์ ๋ฌด์์๋ก ์ถ์ถํฉ๋๋ค. ๊ฐ ๋ฐ์ดํฐ ์ธํธ์ ์ํ ์๋ ํฌ๊ฒ ๋ค๋ฅด๋ฉฐ ์ผ๋ถ ๋ฐ์ดํฐ ์ธํธ์๋ ์ฒ๋ง ๊ฐ ์ด์์ ํ๋ จ ์ํ(์: ๋ฒ์ญ)์ด ์์ด์ ์ต์ข ๊ฐ ๋ฐ์ดํฐ ์ธํธ์ ํ์ต ์์ ์๋ 30,000๊ฐ๋ก ์ ํํ์์ต๋๋ค. ์คํ์์๋ T5-11B ๋ฐ GPT-3์ ๊ธฐ์ค ๋ชจ๋ธ๋ก ์ฌ์ฉํ์ต๋๋ค.
์คํ ๊ฒฐ๊ณผ ์์ฐ์ด ์ถ๋ก Task ๋ฐ QA Task์์ FLAN์ zero-shot ์๋๋ฆฌ์ค์์ ์ด๋ฏธ few-shot GPT-3๋ณด๋ค ๊ฒฐ๊ณผ๊ฐ ์ข์์ผ๋ฉฐ ๋ง์ Task์์๋ Supervised model๊ณผ ๋น์ทํ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ต๋๋ค.(์๋ [๊ทธ๋ฆผ 4], [๊ทธ๋ฆผ 5] ์ฐธ๊ณ .) ์ด ์ธ์ ๋ค์ํ Task์ ๋ํ ์คํ ๊ฒฐ๊ณผ๋ค๋ ๋ ผ๋ฌธ์ ํฌํจ๋์ด ์์ผ๋ ํ์ํ์๋ฉด ์ง์ ๋ ผ๋ฌธ์ ํ์ธ ๋ฐ๋๋๋ค.
NLP ๊ด๋ จ ๋ถ์ผ์ ์ต์ํ ๋ถ๋ค์ ์ด ๊ธ์ด ๋ ๋ค๋ฅธ “A+B” Task(A=prompt tuning, B=Multi-task Learning)์ด๋ผ๊ณ ์๊ฐํ ์๋ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ด๋ฌํ A+B๊ฐ ํฅํ ์ผ๋ฐ ์์ฐ์ด ์ฒ๋ฆฌ ๋ชจ๋ธ์ ์ํํ๋ ์๋ฃจ์ /๋ฐฉ๋ฒ์ด ๋ ์ ์๋ค๊ณ ์๊ฐํฉ๋๋ค. ์ฒซ์งธ, ๋ง์ ์์ ๋ ์ด๋ธ์ด ์ง์ ๋์ง ์์ ๋ง๋ญ์น๋ฅผ ํตํด ์์ฒ์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๊ฐ ์๋ ๋๊ท๋ชจ ์๊ธฐ ํ๊ท ์ฌ์ ํ๋ จ ๋ชจ๋ธ์ ํ๋ จํ๊ฑฐ๋ ํน์ ๊ธฐ ์กด์ฌํ๋ ํ๋ จ ๋ชจ๋ธ์ ์ ํํ๊ณ , ๋ ๋ฒ์งธ ๋จ๊ณ์์ ์ด๋ฌํ ๋ชจ๋ธ์ Instruction Tuning์ ํตํด ์ดํด์ ์์ฑ Task๋ฅผ fine-tuning ํ ์ ์์ต๋๋ค. fine-tuning ๊ณผ์ ์์ ์ฝ์ค ํ์ต๊ณผ ์ ์ฌํ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ฌ ๋จผ์ ํ์ ์์ค Task(์: NER ์๋ณ, ์ํ์ค ์๋ฉํฑ ์ด๋ ธํ ์ด์ )์ ํ์ตํ ๋ค์ ์์ ์์ค Task(์: ๋ ผ๋ฆฌ์ ์ถ๋ก , QA)์ ํ์ตํ ์ ์์ต๋๋ค. ๋ํ ๋จผ์ ๋ฆฌ์์ค๊ฐ ํ๋ถํ Task(์: ์์ด/๋น ๋ฐ์ดํฐ Task)๋ฅผ ๋ฐฐ์ด ๋ค์ ๋ ์ ์ ๋ฆฌ์์ค(์: ๊ธฐํ ์ธ์ด/์ ์ ๋ฐ์ดํฐ Task)๋ฅผ ํ์ตํ๊ณ Adapter๋ฅผ ์ด์ฉํ์ฌ ๋ชจ๋ธ์ Task๋ณ๋ก ๊ด๋ จ ๋ถ๋ถ์ ์ ์งํฉ๋๋ค. ๋ง์ง๋ง์ผ๋ก ๋ชจ๋ธ์ด ์ ๋ฐ์ดํฐ์ ์ Task์ ๋ํด ์ถ๋ก ํ ์ ์๋๋ก ๋ช ๋ น/์ง์นจ์ ์ ๊ณตํฉ๋๋ค. ์ด๋ฌํ versatileํ ๋ฐฉ๋ฒ์ ์ถฉ๋ถํ ํ์ฉํ๋ค๋ฉด ๋ ์ด๋ ํ ์๋ก์ด Task๋ค์ ์ํ ํ ์ ์์ ์ง ๊ธฐ๋๊ฐ ๋ฉ๋๋ค.!
์ฐธ๊ณ ๋ฌธํ:
https://arxiv.org/pdf/2109.01652.pdf