GPT-5.5 Instant: 환각 52% 감소, ChatGPT 기본 모델이 바뀌었다

GPT-5.5 Instant: 환각 52% 감소, ChatGPT 기본 모델이 바뀌었다

5분 읽기원문 보기

안녕하세요, Tom입니다.

지난 4월 말에 GPT-5.5 출시를 다뤘는데, 이번에는 그 후속이에요. OpenAI가 GPT-5.5 Instant를 출시하면서 ChatGPT의 기본 모델을 GPT-5.3 Instant에서 교체했어요. 무료 사용자 포함 모든 ChatGPT 사용자에게 즉시 적용됐어요.

숫자만 나열하면 와닿지 않을 수 있는데, 이번 업데이트는 수치가 특히 인상적이에요. 환각이 절반 이상 줄었다는 게 그냥 홍보 문구가 아니라 실제 측정 기반이라는 점에서요.

환각 52.5% 감소

GPT-5.5 Instant에서 가장 강조하는 숫자가 이거예요. 고위험 프롬프트에서 환각이 52.5% 감소했다는 거예요.

고위험 프롬프트는 의료, 법률, 금융 관련 질문이에요. 잘못된 답변이 실제로 해가 될 수 있는 영역이죠. 이런 영역에서 환각이 절반 이상 줄었다는 건 실용적인 의미가 있어요. ChatGPT를 건강 관련 질문에 쓰는 사람이 많은데, 그 응답의 신뢰도가 올라간다는 거예요.

더불어 어려운 대화에서 부정확한 주장도 37.3% 감소했어요. 어려운 대화란 모델이 확신 없이 지어내기 쉬운 맥락, 예를 들면 생소한 사람 이름, 오래된 통계, 특정 지역 관련 사실 같은 거예요.

저도 GPT 계열 모델을 쓸 때 가장 불만스러웠던 게 확신 없이 틀린 정보를 당당하게 내뱉는 패턴이었거든요. 이게 실제로 줄었는지는 좀 써봐야 알겠지만, 측정 방법론이 명확하게 공개된 점에서 신뢰도가 있어요.

스타일 변화: 덜 떠들고 덜 아부한다

환각 감소 못지않게 반가운 변화가 있어요. ChatGPT가 갖고 있던 몇 가지 거슬리는 스타일 습관이 개선됐어요.

불필요한 이모지가 제거됐어요. 이전 모델은 대화마다 이모지를 남발하는 경향이 있었는데, 이게 AI 냄새의 큰 원인 중 하나였어요. 이번 업데이트에서 이 패턴을 줄였어요.

응답이 간결해졌어요. "물론이죠! 훌륭한 질문입니다. 제가 도와드리겠습니다."처럼 본론 전에 늘어놓는 서두를 줄였어요. 이것도 많은 사람이 꼽던 불편함이에요.

불필요한 후속 질문도 줄었어요. 이전 모델이 답변 끝에 "더 궁금한 점 있으세요?" 같은 질문을 자동으로 달아주던 패턴도 완화됐어요.

이런 변화들이 수치로 표현되지는 않지만, 일상적인 ChatGPT 사용에서 체감 품질을 높이는 부분이에요. 덜 AI스러운 대화를 만들어주는 거예요.

메모리 소스 추적

개인화 기능도 한 단계 발전했어요. GPT-5.5 Instant는 이전 대화, 업로드된 파일, Gmail 컨텍스트를 활용해서 더 맞춤화된 응답을 제공해요.

그런데 이것보다 더 의미 있는 건 메모리 소스 기능이에요. 모델이 응답할 때 어떤 컨텍스트를 사용했는지 표시해줘요. "이 응답은 지난주 업로드한 파일과 2개월 전 대화를 참조했습니다"처럼 보여주는 거예요.

이게 왜 중요하냐면, 개인화 기능이 강해질수록 모델이 무엇을 알고 있는지가 불투명해지거든요. 메모리 소스 기능은 그 불투명함을 걷어내려는 시도예요. 원치 않는 컨텍스트를 사용했다면 직접 확인하고 조정할 수 있어요.

주의: 메모리 소스 기능은 메모리가 활성화된 계정에서만 동작해요. 개인정보 설정에서 메모리를 끈 상태라면 이 기능도 보이지 않아요.

무료 사용자와 유료 사용자 구분

배포 방식도 명확하게 나눠요.

무료 사용자는 지금 바로 GPT-5.5 Instant가 기본 모델이에요. 별도 설정 없이 자동 적용돼요.

유료 사용자(Plus, Pro)는 좀 복잡해요. GPT-5.5 Instant로 기본 전환되지만, GPT-5.3 Instant를 앞으로 3개월은 선택해서 쓸 수 있어요. 특정 작업에서 GPT-5.3 Instant가 더 맞는다고 판단하면 여전히 선택지가 있다는 거예요.

저는 이 정책이 꽤 좋다고 생각해요. 기본 모델을 바꾸되 이전 버전을 갑자기 없애버리지 않는 방식이에요. 업그레이드에 적응할 시간을 주는 거예요. 특히 GPT-5.3 Instant 기반으로 특정 작업 플로우를 잡아놓은 사람들에게는 여유가 필요하거든요.

솔직한 평가

저는 Claude Code를 주로 쓰다 보니 ChatGPT는 비교 대상 정도로 써왔어요. 그런데 이번 GPT-5.5 Instant의 변화를 보면서 OpenAI가 "더 똑똑한 모델"보다 "더 신뢰할 수 있는 모델"이라는 방향으로 무게를 옮기고 있다는 인상을 받아요.

환각 감소, 장황함 제거, 메모리 소스 추적. 이 세 가지가 공통적으로 가리키는 건 신뢰성이에요. 답변이 화려하거나 길기보다, 사실에 근거하고 사용자가 검증할 수 있어야 한다는 방향이요.

이 방향은 맞다고 생각해요. 특히 고위험 영역에서 AI를 쓰는 사람이 늘어날수록, 환각 감소는 단순한 품질 지표가 아니라 신뢰의 기반이 되는 거니까요.


원문: GPT-5.5 Instant

관련 글