우리 집 전용 성우와 DJ 탄생! 구글 AI로 만드는 초간단 팟캐스트

안녕하세요! 똑똑한 주부들의 즐거운 AI 활용법, ‘주부들을 위한 AI 따라잡기’입니다.
요즘 매일같이 쏟아지는 새로운 AI 소식에 정신이 없으시죠? 자고 일어나면 세상이 바뀌어 있는 것 같다는 말이 실감 나는 요즘입니다.

오늘은 정말 신기하고 유용한 AI 음성 생성, 즉 TTS(Text-to-Speech) 기능을 소개해 드릴게요. 바로 대부분이 아직 잘 모르시는 구글의 숨겨진 보석, AI 스튜디오의 음성 생성(generate-speech) 기능입니다.

지금 듣고 계신 제 목소리, 어떠세요? 바로 구글 제미나이(Gemini)의 최신 음성 생성 기능으로 만들었답니다. 단순히 글자를 읽어주는 수준을 넘어, 목소리의 감성과 스타일을 직접 지시하고, 심지어 두 명의 AI가 대화를 나누는 팟캐스트 형식까지 버튼 하나로 만들 수 있게 됐어요!

우리 집만의 전문 성우, 아니 이젠 라디오 DJ까지 되어줄 구글 AI의 최신 음성 기능, 지금 바로 시작합니다!

한 단계 진화한 AI 성우: 감정을 ‘디렉팅’하다

과거의 TTS 기능들은 텍스트를 그대로 입력하면 감정 처리 없이 딱딱하게 읽어주기 일쑤였죠. 그래서 자연스러운 억양을 만들기 위해 단어 사이에 쉼표(,)나 물결표(~)를 넣어가며 많은 시간을 들여야 했습니다.

하지만 이제는 그럴 필요가 없습니다. 완전히 새로워진 구글 AI 음성 생성 기능은 마치 우리가 PD나 감독이 된 것처럼 AI 성우에게 직접 ‘연기 디렉팅’을 할 수 있게 되었거든요.

모드 1: Single-speaker (한 명의 목소리로 자연스럽게 말하기)

가장 기본이 되는 ‘Single-speaker’ 모드부터 차근차근 알아볼까요? 한 명의 목소리로 오디오를 만드는 기능이지만, 이전보다 훨씬 강력해졌습니다.

핵심은 바로 ‘Style instructions (스타일 지시어)’입니다.
이 입력창이 바로 AI 성우를 위한 ‘연기 디렉팅’ 노트입니다. 그냥 글만 주는 게 아니라, 어떤 감정과 스타일로 읽어줄지 직접 지시할 수 있어요.

구글 AI 오디오

따라해 보세요!

Style instructions 입력: “따뜻하고 친절한 톤으로, 엄마가 아이에게 이야기하듯이” 라고 입력해 보세요. (‘활기차고 명랑하게’, ‘차분한 뉴스 앵커처럼’ 등 원하는 스타일을 자유롭게 지시할 수 있습니다.)

Text 입력: 아래 ‘Text’ 창에 원하는 글을 붙여넣습니다.
우리 딸, 오늘 하루도 정말 고생 많았어. 넌 세상에서 가장 소중한 보물이란다.

Voice 선택: 왼쪽 창에서 원하는 목소리를 고릅니다.
꿀팁! 샘플 듣기가 대부분 영어로 나온다고 당황하지 마세요. 마음에 드는 음색의 목소리를 고른 뒤, 텍스트 창에 한글을 입력하면 아주 자연스러운 한국어로 읽어준답니다.

Run 버튼 클릭: 우측 하단의 ‘Run’ 버튼을 누르면 끝! 잠시 후 AI가 멋지게 연기한 목소리를 들을 수 있습니다.
완성된 음성 파일은 다운로드 버튼을 눌러 WAV 파일로 저장하고 블로그나 영상 등 어디든 자유롭게 활용할 수 있습니다.

모드 2: Multi-speaker (AI 팟캐스트, 라디오 드라마 만들기)

자, 이제 정말 신기한 팟캐스트 만들기, ‘Multi-speaker audio’ 모드를 써볼 시간입니다. 이 기능을 사용하면 두 명의 AI가 자연스럽게 대사를 주고받는 오디오 콘텐츠를 만들 수 있습니다.

화면이 ‘Speaker 1’과 ‘Speaker 2’ 두 구역으로 나뉘어, 각각 다른 목소리를 지정하고 대사를 따로 입력할 수 있습니다.

따라해 보세요!

Voice 선택:
Speaker 1: 아내 역할에 어울리는 여자 성우 목소리 선택
Speaker 2: 남편 역할에 어울리는 묵직한 톤의 남자 성우 목소리 선택
Text 입력: 각 스피커의 텍스트 창에 대사를 입력합니다.

Speaker 1 (아내):
여보, 오늘 저녁 뭐 먹을까? 매일 하는 고민인데 제일 어려워.

Speaker 2 (남편):
글쎄… 어제 사 온 두부 있으니까, 얼큰하게 김치찌개 끓여서 막걸리 한잔할까?

Run 버튼 클릭: 아래의 ‘Run’ 버튼을 누르면, 정말 두 사람이 대화하는 것처럼 자연스러운 오디오가 뚝딱 완성됩니다.
아이와 함께 역할극 오디오를 만들거나, 상품 리뷰를 문답 형식으로 재미있게 만들 때, 또는 블로그 글을 두 사람이 대화하는 형식으로 제공할 때 활용하면 정말 좋겠죠?

이제 우리도 오디오 크리에이터!

오늘 배운 제미나이의 최신 음성 생성 기능, 어떠셨나요?
이제 우리 주부님들도 ‘스타일 지시’로 아이에게 동화책을 더 실감 나게 읽어줄 수 있고, ‘팟캐스트 모드’로 온 가족이 함께 즐길 수 있는 오디오 콘텐츠를 손쉽게 만들 수 있게 되었습니다.
제가 제미나이 Pro를 구독하며 사용해보니, 긴 블로그 글 전체를 넣어도 아주 자연스럽게 읽어주어 정말 만족스럽습니다. 이제는 긴 글을 눈으로 읽는 대신, 음악처럼 편안하게 귀로 들을 수 있는 시대가 온 거죠.

기술이 우리를 더 행복하게 만들어주는 시대, 두려워하지 말고 마음껏 즐겨보세요!
‘주부들을 위한 AI 따라잡기’, 다음 시간에도 더 신기하고 유용한 정보로 찾아뵙겠습니다

관련글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다