기사제보 |  광고문의 |  발행일: 2025-10-22



문화경제신문

오픈AI, 챗GPT 무료 사용자 '고급 음성' 기능 대폭 확대…'표준 음성' 30일 후 종료

천경선 기자 (latte1971@gmail.com)


오픈AI, 챗GPT 무료 사용자 '고급 음성' 기능 대폭 확대…'표준 음성' 30일 후 종료

천경선 기자 (latte1971@gmail.com)




최초 작성일 : 2025-09-10 | 수정일 : 2025-10-01 | 조회수 : 992


오픈AI, 챗GPT 무료 사용자 '고급 음성' 기능 대폭 확대…'표준 음성' 30일 후 종료
핵심 요약
오픈AI가 챗GPT 무료 사용자에게 제공되는 '고급 음성 모드(AVM)'의 사용 시간을 대폭 확대했습니다. 기존 '표준 음성' 모드는 30일 뒤 종료될 예정이며, 이는 사용자 경험 향상을 위한 조치로 풀이됩니다. 이번 업데이트는 텍스트 기반 AI에서 더욱 자연스럽고 감성적인 음성 인터페이스로의 전환을 가속화할 전망입니다.

인공지능(AI) 챗봇의 음성 기능이 한층 진화하고 있습니다. 오픈AI가 무료 사용자에게 제공되던 '고급 음성 모드(Advanced Voice Mode, AVM)'의 이용 시간을 대폭 확대하고, 기존의 '표준 음성(Standard Voice)' 모드는 30일 뒤 종료할 예정이라고 밝혔습니다. 이번 결정은 챗GPT의 사용자 경험을 개선하고, 보다 자연스럽고 풍부한 상호작용을 제공하기 위한 전략의 일환으로 분석됩니다.

무료 사용자의 '고급 음성 모드' 접근성 강화 🚀

오픈AI의 챗GPT 제품 총괄 책임자인 닉 털리(Lars Torry)는 현지 시간 9일, 자신의 X(구 트위터) 계정을 통해 "무료 사용자의 AVM 사용 시간이 일일 분 단위에서 시간 단위로 확대되었다"고 공식 발표했습니다. 이는 이전보다 훨씬 긴 시간 동안 AI의 고급 음성 기능을 무료로 이용할 수 있게 되었음을 의미합니다. 털리 책임자는 유료 사용자에게는 AVM 사용 시간이 거의 무제한으로 확대되었다고 덧붙여, 유료와 무료 사용자 간의 음성 기능 접근성 격차를 줄이려는 노력을 시사했습니다.

AI 음성 서비스, 진화의 발자취

오픈AI는 지난해 5월 'GPT-4o' 모델을 출시하면서 챗GPT에 AVM 기능을 처음으로 도입했습니다. AVM은 기존의 단순한 텍스트-음성 전환(Text-to-Speech, TTS) 기능을 넘어, 다양한 톤과 감정을 담아낸 인간적인 목소리를 제공하는 것이 특징입니다. 지난해 말부터 유료 사용자에게 우선적으로 개방되었던 이 기능은 올해 초 무료 사용자에게도 일부 미리보기 형태로 제공되기 시작했습니다. 이후 지난 6월에는 AVM을 더욱 자연스럽고 풍부하게 개선하는 업데이트가 이루어졌고, 7월에는 이 개선된 기능이 무료 사용자에게도 적용되는 등 올해 들어 오픈AI는 챗GPT의 음성 서비스 강화에 박차를 가해왔습니다.

💡 용어 설명: 고급 음성 모드(AVM)란?
텍스트-음성 전환(TTS) 기술의 한계를 넘어, AI가 사람처럼 다양한 톤과 감정을 표현하며 대화하는 기능을 의미합니다. 사용자와의 자연스러운 상호작용을 가능하게 하여 몰입도를 높이는 데 중점을 둡니다.

현재 챗GPT는 9가지의 다양한 음성을 서비스하고 있습니다. 그러나 AVM은 사용량에 제한이 있어, 일정 시간을 초과하면 작동 모델이 GPT-4o에서 'GPT-4o 미니'로 전환되는 방식이 적용되어 왔습니다. 이번 사용 시간 확대 조치는 이러한 제한을 완화하여 무료 사용자들의 AI 음성 경험을 한층 풍요롭게 만들 것으로 기대됩니다.

'표준 음성' 종료 결정과 사용자 반응 ⚠️

오픈AI의 이번 AVM 확대 결정과 더불어 주목받는 부분은 기존 '표준 음성' 모드의 종료입니다. 오픈AI는 'GPT-5' 출시와 함께 'GPT-4o'를 폐지하려 했다가 사용자들의 강력한 반발에 직면했던 경험이 있습니다. 이와 같은 전례 때문에, 표준 음성 모드의 폐지 결정에 대해서도 신중한 태도를 보이고 있습니다.

오픈AI 챗GPT 제품 총괄 책임자 닉 털리는 "많은 사람이 표준 음성 모드가 특별하다는 의견을 줬기 때문에, 우리는 이번 전환 과정을 원활하게 진행하려고 한다"라며 "여러분의 의견을 반영하는 동안 표준 음성 모드는 계속 사용할 수 있다"라고 말했습니다.

표준 음성 모드는 비교적 담백하고 일정한 톤을 유지하는 반면, 고급 음성 모드는 사람의 말투처럼 자연스럽고 감정 표현이 풍부하다는 차이가 있습니다. 이러한 차이점에도 불구하고, 일부 사용자들은 표준 음성 모드에 익숙해져 있어 이를 유지해달라는 의견을 커뮤니티 등에 이미 제기하고 있는 상황입니다. 특히 지난 4월 만우절 이벤트로 한시적으로 선보였던 '먼데이'라는 나른한 목소리를 다시 듣고 싶다는 요청도 상당수 등장한 것으로 알려졌습니다. 이는 사용자들이 AI의 응답 내용뿐만 아니라 음성의 톤과 특성에도 애착을 느끼고 있으며, 익숙해진 목소리에 대한 선호도가 높다는 것을 보여줍니다.

⚠️ 향후 전망 및 리스크
표준 음성 모드 종료에 대한 사용자들의 반발이 예상보다 거셀 경우, 오픈AI는 사용자 피드백을 반영하여 종료 시점을 조정하거나, 특정 기능에 한해 표준 음성 옵션을 유지하는 방안을 고려할 수 있습니다. 또한, AVM의 지속적인 개선에도 불구하고, AI 음성의 자연스러움과 감정 표현 능력에 대한 기대치가 높아짐에 따라 기술적 한계와 사용자 만족도 사이의 균형점을 찾는 것이 중요해질 것입니다.

이처럼 챗GPT는 모델의 응답 내용 자체를 넘어, AI가 전달하는 음성의 톤과 감성까지도 사용자 경험의 중요한 요소로 자리 잡고 있습니다. 닉 털리 책임자는 "AVM에 곧 더 많은 개선 사항이 적용될 예정이니 기대해 달라"고 덧붙여, 향후 챗GPT의 음성 기능이 더욱 발전할 것임을 예고했습니다. 오픈AI의 이러한 행보는 AI가 단순한 정보 제공 도구를 넘어, 더욱 인간적이고 다채로운 방식으로 사용자와 소통하는 미래를 향해 나아가고 있음을 보여줍니다.

Tags  #인공지능  #오픈AI  #챗GPT  #고급  #음성  #모드  #AVM  #표준  #음성  #GPT-4o  #AI  #음성  #닉  #털리  #사용자  #경험  #인공지능  #기술  #동향  #음성  #AI  

Author Photo
천경선 기자

(latte1971@gmail.com)

문화경제일보 경제부

닉네임:
댓글내용:
🎖️ '문화경제신문' 카테고리의 다른 인기글

📸 이미지 프롬프트 복사 완료!
이제 어떤 이미지 생성 도구로 이동하시겠어요?
🧠 ImageFX 🧪 Whisk