컴퓨터가 말을 배운 이야기
자, 네가 좋아하는 게임 있지? 마인크래프트든 뭐든. 처음엔 게임이 어땠어? 뛰어다니고, 부수고, 만들고. 그게 다였어.
그런데 누가 "이 게임에서 말도 할 수 있으면 어떨까?"라고 생각했다고 쳐봐. 근데 문제가 있어. 컴퓨터는 원래 말을 못해. 숫자만 알아.
그래서 과학자들이 두 팀으로 나뉘었어.
팀 1: "뇌를 따라하자"
이 사람들은 생각했어. "우리 뇌가 어떻게 생겼나 보자."
뇌를 현미경으로 보면 뭐가 보일까? 전선 같은 게 엄청 많아. 1000억 개. 서로 연결돼 있어. 전기 신호를 주고받아.
"아, 그럼 컴퓨터도 전선 연결하듯이 만들면 되겠네?"
그래서 만든 게 '인공 신경망'이야. 진짜 뇌는 아니고, 흉내만 낸 거야.
처음엔 개망했어. 고양이 사진도 못 알아봤어. "이게 고양이야, 토스터야?"
그러다 2012년에 터졌어.
누가 신경망을 엄청 크게 만들었더니 갑자기 고양이를 알아보기 시작한 거야. 개도 알아보고, 자동차도 알아보고.
팀 2: "단어를 세자"
다른 팀은 이렇게 생각했어. "말은 단어로 되어 있잖아? 단어를 분석하면 되지 않을까?"
예를 들어:
- "나는 배고파" 다음엔 뭐가 올까?
- "밥 먹고 싶다"가 자주 오네?
- 그럼 확률이 높은 거 고르면 되겠다!
이 사람들은 책을 다 세기 시작했어. "the"가 몇 번 나오나, "사랑"이 몇 번 나오나. 미친 짓이었지만 조금씩 작동했어.
컴퓨터가 "날씨가 좋네요" 다음에 "소풍 가실래요?"를 말할 수 있게 됐어.
근데 한계가 있었어.
"나는 학교에 가서 ___를 만났다"
빈칸에 뭐가 올까? 친구? 선생님? 외계인? 컴퓨터는 그냥 통계로만 찍었어. 맥락을 모르니까.
2017년: 만남
그러던 어느 날, 구글 사람 8명이 모였어.
"야, 우리가 지금까지 틀렸어. 단어를 하나씩 보면 안 돼. 문장 전체를 한번에 봐야 해."
무슨 말이냐면:
"나는 은행에 갔다"
'은행'이 뭐야? 돈 있는 곳? 강가?
전체 문장을 봐야 알 수 있잖아.
그래서 만든 게 '트랜스포머'야. 변신 로봇 아니고, 문장을 변신시키는 기계야.
이게 뭘 하냐면:
- 문장의 모든 단어를 동시에 봐
- 어떤 단어가 어떤 단어랑 친한지 계산해
- "나는 - 갔다", "은행에 - 갔다" 이런 관계를 파악해
갑자기 번역이 잘 되기 시작했어.
그 다음 해: GPT 탄생
OpenAI라는 회사가 있었어. 직원 50명.
"트랜스포머 좋은데... 이걸로 뭘 더 할 수 없을까?"
그래서 미친 짓을 했어. 인터넷에 있는 글을 다 먹였어. 위키피디아, 책, 뉴스, 블로그... 8백만 권 분량.
컴퓨터한테 이렇게 시켰어:
"다음 단어 맞춰봐. 맞추면 상 줄게. 틀리면 다시."
8백만 권을 다 외우려면 어떻게 해야 할까?
패턴을 찾아야 해.
- "하늘은" 다음엔 대부분 "파랗다"
- "사과는" 다음엔 "빨갛다"나 "맛있다"
- "수학은" 다음엔... 뭐가 올까?
이렇게 패턴을 찾다 보니, 컴퓨터가 말이 통하기 시작한 거야.
폭발
- GPT-1 (2018): 유치원생 수준. "안녕"하면 "안녕"
- GPT-2 (2019): 초등학생 수준. 짧은 이야기 쓰기 가능
- GPT-3 (2020): 중학생 수준. 시도 쓰고 코드도 짜
- ChatGPT (2022): 대학생 수준. 너랑 대화 가능
왜 갑자기 똑똑해졌을까?
비밀은 간단해. 크기야.
네 뇌: 뉴런 1000억 개 GPT-3: 인공 뉴런 1750억 개
처음으로 컴퓨터 뇌가 인간 뇌만큼 커진 거야.
그래서 뭐가 대단한데?
봐봐. 네가 ChatGPT한테 물어봐:
- "피자 만드는 법 알려줘"
- "수학 숙제 도와줘"
- "재미있는 이야기 만들어줘"
다 대답하잖아?
근데 진짜 신기한 건 이거야:
아무도 ChatGPT한테 피자 만드는 법을 직접 가르친 적 없어. 수학 공식을 외우라고 한 적도 없어.
그냥 인터넷 글을 많이 읽고 패턴을 찾았을 뿐이야.
마치 네가 책 많이 읽으면 자연스럽게 글 잘 쓰게 되는 것처럼.
정리하면
- 뇌 따라하기 팀: 고양이 사진 구별하는 데 성공
- 단어 세기 팀: 다음 단어 예측하는 데 성공
- 2017년 만남: 둘을 합쳐서 문장 전체를 이해하는 기계 완성
- 2018년 이후: 책 엄청 먹이니까 말 잘하게 됨
컴퓨터가 정말로 '이해'하는 걸까? 몰라. 아무도 몰라.
하지만 네가 "설명해줘"라고 하면 설명하고, "이야기 만들어줘"라고 하면 만들어주잖아.
그거면 충분하지 않아?
마치 친구가 진짜로 너를 이해하는지는 모르지만, 같이 놀면 재밌는 것처럼.