컴퓨터가 말을 배운 이야기

자, 네가 좋아하는 게임 있지? 마인크래프트든 뭐든. 처음엔 게임이 어땠어? 뛰어다니고, 부수고, 만들고. 그게 다였어.

그런데 누가 "이 게임에서 말도 할 수 있으면 어떨까?"라고 생각했다고 쳐봐. 근데 문제가 있어. 컴퓨터는 원래 말을 못해. 숫자만 알아.

그래서 과학자들이 두 팀으로 나뉘었어.


팀 1: "뇌를 따라하자"

이 사람들은 생각했어. "우리 뇌가 어떻게 생겼나 보자."

뇌를 현미경으로 보면 뭐가 보일까? 전선 같은 게 엄청 많아. 1000억 개. 서로 연결돼 있어. 전기 신호를 주고받아.

"아, 그럼 컴퓨터도 전선 연결하듯이 만들면 되겠네?"

그래서 만든 게 '인공 신경망'이야. 진짜 뇌는 아니고, 흉내만 낸 거야.

처음엔 개망했어. 고양이 사진도 못 알아봤어. "이게 고양이야, 토스터야?"

그러다 2012년에 터졌어.

누가 신경망을 엄청 크게 만들었더니 갑자기 고양이를 알아보기 시작한 거야. 개도 알아보고, 자동차도 알아보고.


팀 2: "단어를 세자"

다른 팀은 이렇게 생각했어. "말은 단어로 되어 있잖아? 단어를 분석하면 되지 않을까?"

예를 들어:

  • "나는 배고파" 다음엔 뭐가 올까?
  • "밥 먹고 싶다"가 자주 오네?
  • 그럼 확률이 높은 거 고르면 되겠다!

이 사람들은 책을 다 세기 시작했어. "the"가 몇 번 나오나, "사랑"이 몇 번 나오나. 미친 짓이었지만 조금씩 작동했어.

컴퓨터가 "날씨가 좋네요" 다음에 "소풍 가실래요?"를 말할 수 있게 됐어.

근데 한계가 있었어.

"나는 학교에 가서 ___를 만났다"

빈칸에 뭐가 올까? 친구? 선생님? 외계인? 컴퓨터는 그냥 통계로만 찍었어. 맥락을 모르니까.


2017년: 만남

그러던 어느 날, 구글 사람 8명이 모였어.

"야, 우리가 지금까지 틀렸어. 단어를 하나씩 보면 안 돼. 문장 전체를 한번에 봐야 해."

무슨 말이냐면:

"나는 은행에 갔다"

'은행'이 뭐야? 돈 있는 곳? 강가?

전체 문장을 봐야 알 수 있잖아.

그래서 만든 게 '트랜스포머'야. 변신 로봇 아니고, 문장을 변신시키는 기계야.

이게 뭘 하냐면:

  1. 문장의 모든 단어를 동시에 봐
  2. 어떤 단어가 어떤 단어랑 친한지 계산해
  3. "나는 - 갔다", "은행에 - 갔다" 이런 관계를 파악해

갑자기 번역이 잘 되기 시작했어.


그 다음 해: GPT 탄생

OpenAI라는 회사가 있었어. 직원 50명.

"트랜스포머 좋은데... 이걸로 뭘 더 할 수 없을까?"

그래서 미친 짓을 했어. 인터넷에 있는 글을 다 먹였어. 위키피디아, 책, 뉴스, 블로그... 8백만 권 분량.

컴퓨터한테 이렇게 시켰어:

"다음 단어 맞춰봐. 맞추면 상 줄게. 틀리면 다시."

8백만 권을 다 외우려면 어떻게 해야 할까?

패턴을 찾아야 해.

  • "하늘은" 다음엔 대부분 "파랗다"
  • "사과는" 다음엔 "빨갛다"나 "맛있다"
  • "수학은" 다음엔... 뭐가 올까?

이렇게 패턴을 찾다 보니, 컴퓨터가 말이 통하기 시작한 거야.


폭발

  • GPT-1 (2018): 유치원생 수준. "안녕"하면 "안녕"
  • GPT-2 (2019): 초등학생 수준. 짧은 이야기 쓰기 가능
  • GPT-3 (2020): 중학생 수준. 시도 쓰고 코드도 짜
  • ChatGPT (2022): 대학생 수준. 너랑 대화 가능

왜 갑자기 똑똑해졌을까?

비밀은 간단해. 크기야.

네 뇌: 뉴런 1000억 개 GPT-3: 인공 뉴런 1750억 개

처음으로 컴퓨터 뇌가 인간 뇌만큼 커진 거야.


그래서 뭐가 대단한데?

봐봐. 네가 ChatGPT한테 물어봐:

  • "피자 만드는 법 알려줘"
  • "수학 숙제 도와줘"
  • "재미있는 이야기 만들어줘"

다 대답하잖아?

근데 진짜 신기한 건 이거야:

아무도 ChatGPT한테 피자 만드는 법을 직접 가르친 적 없어. 수학 공식을 외우라고 한 적도 없어.

그냥 인터넷 글을 많이 읽고 패턴을 찾았을 뿐이야.

마치 네가 책 많이 읽으면 자연스럽게 글 잘 쓰게 되는 것처럼.


정리하면

  1. 뇌 따라하기 팀: 고양이 사진 구별하는 데 성공
  2. 단어 세기 팀: 다음 단어 예측하는 데 성공
  3. 2017년 만남: 둘을 합쳐서 문장 전체를 이해하는 기계 완성
  4. 2018년 이후: 책 엄청 먹이니까 말 잘하게 됨

컴퓨터가 정말로 '이해'하는 걸까? 몰라. 아무도 몰라.

하지만 네가 "설명해줘"라고 하면 설명하고, "이야기 만들어줘"라고 하면 만들어주잖아.

그거면 충분하지 않아?

마치 친구가 진짜로 너를 이해하는지는 모르지만, 같이 놀면 재밌는 것처럼.