안녕하세요! 똑똑한 주부들의 즐거운 AI 활용법, ‘주부들을 위한 AI 따라잡기’입니다.
요즘 매일같이 쏟아지는 새로운 AI 소식에 정신이 없으시죠? 자고 일어나면 세상이 바뀌어 있는 것 같다는 말이 실감 나는 요즘입니다.
오늘은 정말 신기하고 유용한 AI 음성 생성, 즉 TTS(Text-to-Speech) 기능을 소개해 드릴게요. 바로 대부분이 아직 잘 모르시는 구글의 숨겨진 보석, AI 스튜디오의 음성 생성(generate-speech) 기능입니다.
지금 듣고 계신 제 목소리, 어떠세요? 바로 구글 제미나이(Gemini)의 최신 음성 생성 기능으로 만들었답니다. 단순히 글자를 읽어주는 수준을 넘어, 목소리의 감성과 스타일을 직접 지시하고, 심지어 두 명의 AI가 대화를 나누는 팟캐스트 형식까지 버튼 하나로 만들 수 있게 됐어요!
우리 집만의 전문 성우, 아니 이젠 라디오 DJ까지 되어줄 구글 AI의 최신 음성 기능, 지금 바로 시작합니다!
한 단계 진화한 AI 성우: 감정을 ‘디렉팅’하다
과거의 TTS 기능들은 텍스트를 그대로 입력하면 감정 처리 없이 딱딱하게 읽어주기 일쑤였죠. 그래서 자연스러운 억양을 만들기 위해 단어 사이에 쉼표(,)나 물결표(~)를 넣어가며 많은 시간을 들여야 했습니다.
하지만 이제는 그럴 필요가 없습니다. 완전히 새로워진 구글 AI 음성 생성 기능은 마치 우리가 PD나 감독이 된 것처럼 AI 성우에게 직접 ‘연기 디렉팅’을 할 수 있게 되었거든요.
모드 1: Single-speaker (한 명의 목소리로 자연스럽게 말하기)
가장 기본이 되는 ‘Single-speaker’ 모드부터 차근차근 알아볼까요? 한 명의 목소리로 오디오를 만드는 기능이지만, 이전보다 훨씬 강력해졌습니다.
핵심은 바로 ‘Style instructions (스타일 지시어)’입니다.
이 입력창이 바로 AI 성우를 위한 ‘연기 디렉팅’ 노트입니다. 그냥 글만 주는 게 아니라, 어떤 감정과 스타일로 읽어줄지 직접 지시할 수 있어요.

따라해 보세요!
Style instructions 입력: “따뜻하고 친절한 톤으로, 엄마가 아이에게 이야기하듯이” 라고 입력해 보세요. (‘활기차고 명랑하게’, ‘차분한 뉴스 앵커처럼’ 등 원하는 스타일을 자유롭게 지시할 수 있습니다.)
Text 입력: 아래 ‘Text’ 창에 원하는 글을 붙여넣습니다.
우리 딸, 오늘 하루도 정말 고생 많았어. 넌 세상에서 가장 소중한 보물이란다.
Voice 선택: 왼쪽 창에서 원하는 목소리를 고릅니다.
꿀팁! 샘플 듣기가 대부분 영어로 나온다고 당황하지 마세요. 마음에 드는 음색의 목소리를 고른 뒤, 텍스트 창에 한글을 입력하면 아주 자연스러운 한국어로 읽어준답니다.
Run 버튼 클릭: 우측 하단의 ‘Run’ 버튼을 누르면 끝! 잠시 후 AI가 멋지게 연기한 목소리를 들을 수 있습니다.
완성된 음성 파일은 다운로드 버튼을 눌러 WAV 파일로 저장하고 블로그나 영상 등 어디든 자유롭게 활용할 수 있습니다.
모드 2: Multi-speaker (AI 팟캐스트, 라디오 드라마 만들기)
자, 이제 정말 신기한 팟캐스트 만들기, ‘Multi-speaker audio’ 모드를 써볼 시간입니다. 이 기능을 사용하면 두 명의 AI가 자연스럽게 대사를 주고받는 오디오 콘텐츠를 만들 수 있습니다.
화면이 ‘Speaker 1’과 ‘Speaker 2’ 두 구역으로 나뉘어, 각각 다른 목소리를 지정하고 대사를 따로 입력할 수 있습니다.
따라해 보세요!
Voice 선택:
Speaker 1: 아내 역할에 어울리는 여자 성우 목소리 선택
Speaker 2: 남편 역할에 어울리는 묵직한 톤의 남자 성우 목소리 선택
Text 입력: 각 스피커의 텍스트 창에 대사를 입력합니다.
Speaker 1 (아내):
여보, 오늘 저녁 뭐 먹을까? 매일 하는 고민인데 제일 어려워.
Speaker 2 (남편):
글쎄… 어제 사 온 두부 있으니까, 얼큰하게 김치찌개 끓여서 막걸리 한잔할까?
Run 버튼 클릭: 아래의 ‘Run’ 버튼을 누르면, 정말 두 사람이 대화하는 것처럼 자연스러운 오디오가 뚝딱 완성됩니다.
아이와 함께 역할극 오디오를 만들거나, 상품 리뷰를 문답 형식으로 재미있게 만들 때, 또는 블로그 글을 두 사람이 대화하는 형식으로 제공할 때 활용하면 정말 좋겠죠?
이제 우리도 오디오 크리에이터!
오늘 배운 제미나이의 최신 음성 생성 기능, 어떠셨나요?
이제 우리 주부님들도 ‘스타일 지시’로 아이에게 동화책을 더 실감 나게 읽어줄 수 있고, ‘팟캐스트 모드’로 온 가족이 함께 즐길 수 있는 오디오 콘텐츠를 손쉽게 만들 수 있게 되었습니다.
제가 제미나이 Pro를 구독하며 사용해보니, 긴 블로그 글 전체를 넣어도 아주 자연스럽게 읽어주어 정말 만족스럽습니다. 이제는 긴 글을 눈으로 읽는 대신, 음악처럼 편안하게 귀로 들을 수 있는 시대가 온 거죠.
기술이 우리를 더 행복하게 만들어주는 시대, 두려워하지 말고 마음껏 즐겨보세요!
‘주부들을 위한 AI 따라잡기’, 다음 시간에도 더 신기하고 유용한 정보로 찾아뵙겠습니다