[선행연구팀 김성현]
자연어의 큰 반향을 일으킨 causal language model이 (e.g. GPT-3) 이제는 자연어를 넘어서 프로그래밍 언어까지 적용됐습니다! 🤗
지난 6월, Github과 OpenAI가 공동 개발한 Copilot이 공개되었습니다.
Copilot은 자연어에서의 GPT-3처럼, 주어진 코드 문맥을 분석하고 이해한 뒤, 적절한 코드를 새롭게 생성해낼 수 있습니다.
위의 링크를 클릭하시면 Copilot에 대한 사용 신청이 가능합니다.
사용이 허가되고 나면, API를 통하거나, vscode의 플러그인을 통해 테스트해볼 수 있습니다.
그럼 테스트를 한 번 해볼까요?
먼저 huggingface의 gpt-2를 이용해 자연어를 생성하는 코드를 작성해보았습니다!
특정 라이브러리를 지정해서 만드는 것이기 때문에, 해당 라이브러리에 대한 지식이 없다면 불가능한 과제겠죠?
매우 잘 생성되네요! 🙂
다음으로는 알고리즘의 시작, 정렬 알고리즘들을 생성해보겠습니다!
약간의 에러가 있기는 하지만, 그래도 원하는 방향대로 매우 잘 생성하네요!
추가로, 자연어 전처리의 꽃, 정규표현식을 테스트해보겠습니다.
실제로 저는 최근에 코딩을 하면서 항상 copilot을 활성화 시켜놓고 코딩을 하는데요,
코딩을 엄청나게 잘하는 도우미 한 명과 함께 pair 코딩을 하는 느낌이 들더라구요 🙂
이러한 Copilot은 OpenAI가 개발한 Codex를 기반으로 만들어져있는데요, Codex는 수 테라바이트의 Github 코드를 학습했다고 합니다.
최근 codex의 예제가 공개됐는데요, 아래 영상처럼 엄청난 결과들을 보여줄 수 있다고 합니다.