본문 바로가기
테크맥락 정리

갤럭시 버즈4 프로가 목소리를 분리하는 방식

삼성전자는 갤럭시 버즈4 프로에서 통화 중 음성을 포착하고 전달하는 구조를 다시 설계했다. 핵심은 3개의 마이크, VPU 센서, 온디바이스 AI 알고리즘을 결합한 센서 퓨전 기술이다.

갤럭시 버즈4 프로가 목소리를 분리하는 방식 — 모노라 편집부 codex hero
사진 · 모노라 편집부 (AI 생성)

갤럭시 버즈4 프로는 통화 환경에서 사용자의 목소리가 주변 소음에 묻히는 문제를 줄이는 데 초점을 맞췄다. 이어버드는 스마트폰보다 입에서 떨어진 위치에 있어, 마이크가 받는 음성 신호가 소음과 섞이기 쉽다. 삼성전자는 이 한계를 보완하기 위해 주변 환경을 인식할 수 있는 Environment-Aware 센서 퓨전 기술을 적용했다.

이 제품은 3개의 마이크와 골전도 기반의 진동 센서인 Voice Pickup Unit sensor로 음성을 수집한다. 입에서 나오는 소리, 신체 내부를 통해 전달되는 음성 데이터, 발화 때 생기는 두상의 물리적 진동을 함께 반영해 사용자의 목소리를 복원하는 구조다. 이렇게 모인 신호는 노이즈 저감 알고리즘을 작동시키는 데 쓰인다.

센서 퓨전 기술의 중심에는 AI 기반 심층신경망, DNN, Deep Neural Network 기술이 있다. 삼성전자는 이 알고리즘을 On-device 환경에 맞게 조정해 연산 부담을 기존 대비 약 10% 수준으로 낮추고, AI 모델 크기도 약 30% 수준으로 줄였다고 밝혔다. 초소형 이어버드 안에서 AI 음성 처리를 실행하기 위한 설계다.

갤럭시 버즈4 프로는 소음을 줄이는 데서 그치지 않고 목소리의 자연스러움도 함께 다룬다. 과거와 현재, 향후 변화가 예상되는 음향 데이터를 실시간으로 분석해 주변 환경 변화에 대응한다. 또 이전 모델 대비 16배 더 많은 음성 디테일을 포착하도록 알고리즘을 고도화해, 높은 음역대의 소리와 자음, 단어 끝의 미세한 발음까지 전달하는 방향으로 설계됐다.

이어버드 위치가 일상적인 움직임으로 조금 바뀌는 상황도 고려했다. 귀와 이어버드 사이에 틈이 생기면 배경 소음이 들어올 수 있는데, 갤럭시 버즈4 프로는 내부 및 외부 마이크 신호를 계속 분석해 소음 유입 정도를 추정하고 오디오를 조정한다. 갤럭시 스마트폰과 함께 사용할 때는 최대 16kHz 대역폭의 슈퍼 와이드밴드, SWB, Super Wideband 연결도 지원한다.

삼성전자는 실험실과 실제 장소에서 통화 품질 검증을 진행했다. 실험실에서는 대형 풍동 장비 Wind Simulator 등을 사용해 실제 장소에서 수집한 음향 데이터를 바탕으로 여러 음향 시나리오를 재현했다. 현장 테스트는 사람들이 많은 카페와 백화점, 울림이 큰 기차역, 늦은 밤 야외, 창문을 연 차량 안 등에서 반복됐다. 삼성전자는 해당 기술이 Galaxy Buds Live부터 적용됐다고 설명했다.

관련 기사

참고한 출처

태그