본문 바로가기

기술자료

슈퍼 인공지능(ASI)’로 바로 뛰어드는 방식

‘슈퍼 인공지능(ASI)’로 바로 뛰어드는 방식
기존에는 인공지능을 조금씩 발전시키는(예: GPT-1 → GPT-2 → GPT-3 등) 방식이 일반적이었습니다. 그런데 일야 수츠케버(Ilya Sutskever)는 이러한 ‘단계적 모델 개선’을 건너뛰고, 처음부터 최종 목표인 슈퍼 인공지능(ASI) 수준을 노리는 작업을 시도했다는 것입니다.
‘테스트 타임 컴퓨트(test-time compute)’란 무엇인가

인공지능 모델은 보통 ‘학습(훈련) 단계’와 ‘추론(사용) 단계’로 나눌 수 있습니다.
‘테스트 타임 컴퓨트’란, 학습이 끝난 뒤 실제로 모델을 사용할 때(추론 단계) 투입되는 연산량을 의미합니다.
예를 들어 대규모 언어모델(LLM)을 클라우드 서버 등 강력한 컴퓨팅 자원에서 실행하여 막대한 양의 연산을 수행하는 것이 ‘테스트 타임 컴퓨트’를 확장하는 전형적인 예입니다.
점진적 모델 발전 vs. ‘테스트 타임 컴퓨트’ 반복

보통 인공지능은 △학습 데이터를 준비하고 △모델을 학습시킨 뒤 △업데이트된 모델을 조금씩 공개하면서 개선해 나가는 방식을 거칩니다.
그러나 일야 수츠케버가 택한 방식은, 한 번 학습된 모델에 대해 추론 시점(테스트 시점)에서 가능한 한 많은 연산(테스트 타임 컴퓨트)을 투입하여 모델의 논리·추론 능력을 극대화시키는 것을 강조한다는 것입니다.
이 접근법에 따르면, 굳이 모델을 여러 버전으로 나누어 단계적으로 내놓기보다, 한 번 잘 훈련된 모델을 활용해 추론 단계에서 컴퓨팅 리소스를 계속 늘려나가면 더 빠르게 고성능 인공지능(ASI)에 도달할 수 있다는 주장입니다.
왜 이런 방식이 효과적인가

전통적으로 모델의 능력을 크게 올리려면 학습 과정(트레이닝 단계) 자체를 엄청난 규모로 반복해야 하므로, 시간과 비용이 많이 듭니다.
반면, 한 번 훈련된 모델이라도 사용 단계에서 연산량(test-time compute)을 늘려가는 것만으로도 모델이 갖고 있는 잠재적 패턴 인식·추론 능력을 한층 강화할 수 있다는 견해입니다.
이는 마치 **“학습을 꼭 다시 할 필요 없이, 이미 배운 것에 기반해 생각하는(추론하는) 시간을 크게 늘려주는 것”**으로 볼 수 있습니다.
결론적으로

일야 수츠케버가 세운 SSI에서는 단계적 모델 진화 없이, 곧바로 슈퍼 인공지능을 목표로 하는 청사진을 그렸고, 그 핵심 열쇠로 ‘테스트 타임 컴퓨트’ 확장을 지목했습니다.
따라서 앞으로 인공지능 경쟁에서는, 모델 구조와 학습 데이터뿐 아니라 **‘추론할 때 얼마나 강력한 연산 능력을 동원할 수 있는가’**가 성능을 가르는 중요한 요인이 될 것이라는 전망을 뒷받침하고 있습니다.