멀티모달 AI의 정확도, 손실 지형 평탄화로 설명됐다

UNIST 윤성환 인공지능대학원 교수팀이 멀티모달 인공지능(AI)의 정확도를 ‘손실 지형’ 관점에서 규명했다. 여러 모달리티를 함께 학습하면 손실 지형이 더 평탄해져 강건성이 높아진다는 내용이다.

테크데스크발행 2026.06.28 13:06업데이트 2026.06.28 12:38

멀티모달 AI의 정확도, 손실 지형 평탄화로 설명됐다 — 모노라 편집부 codex hero — 사진 · 모노라 편집부 (AI 생성)

UNIST는 윤성환 인공지능대학원 교수팀이 멀티모달 인공지능(AI)이 한 종류 데이터만 학습한 AI보다 더 정확한 이유를 ‘손실 지형’ 평탄화 관점에서 밝혔다고 28일 전했다. 멀티모달 학습은 이미지, 음성, 텍스트처럼 서로 다른 ‘모달리티’ 데이터를 함께 활용하는 방식이다.

연구팀에 따르면 음성이나 이미지 등 여러 모달리티 데이터를 동시에 학습하면 ‘손실 지형’이 더 평탄해진다. 이 과정에서 학습 중 접하지 못한 상황에 대응하는 능력인 ‘강건성’이 향상된다.

‘손실 지형’은 AI 모델의 학습 오차가 모델 파라미터에 따라 어떻게 달라지는지를 지형처럼 나타낸 개념이다. 손실지형이 날카로우면 성능 변동이 커질 수 있고, 넓고 평탄하면 데이터나 잡음에 대해 상대적으로 안정적인 성능을 유지한다.

연구팀은 이 현상을 ‘합성곱 스무딩 효과’로 설명했다. 윤성환 교수는 “멀티모달 학습 손실함수가 단일 모달리티 손실 함수에 다른 모달리티 데이터 분포를 합성곱한 형태로 표현될 수 있음을 이론적으로 밝힌 것”이라고 설명했다.

연구팀은 멀티모달 손실 지형의 최대 곡률이 단일 모달리티보다 커지지 않고, 주파수 관점에서도 불규칙한 고주파 성분이 감소한다는 점도 증명했다. 이어 분포적 멀티모달 학습(DML) 방법을 제안했으며, 윤성환 교수는 “향후 데이터를 보다 효율적으로 활용하면서도, 외부 노이즈나 교란에도 흔들림 없이 안정적으로 작동하는 강건한 AI를 설계하는 중요한 기반 기술이 될 것”이라고 말했다.

테크
라 팔마 화산 위에 생긴 동심원 구름의 이유
스페인 카나리아 제도 라 팔마 섬 상공에서 동심원 모양 구름 고리가 포착됐다. 2021년 10월 화산 분화 때 연기와 화산재가 상공에 갇히며 생긴 현상이다.
테크데스크1일 전
테크
어도비가 토파즈랩스를 품고 파이어플라이 AI 보정 기능을 넓힌다
어도비가 인공지능(AI) 기반 이미지·영상 보정 기술 기업 토파즈랩스를 인수한다. 토파즈랩스는 어도비 크리에이티브 사업 부문으로 편입되고, 거래는 올 하반기 마무리된다.
테크데스크1일 전
테크
갤럭시 버즈4 프로가 목소리를 분리하는 방식
삼성전자는 갤럭시 버즈4 프로에서 통화 중 음성을 포착하고 전달하는 구조를 다시 설계했다. 핵심은 3개의 마이크, VPU 센서, 온디바이스 AI 알고리즘을 결합한 센서 퓨전 기술이다.
테크데스크3일 전
테크
삼성전자가 비바테크 2026에서 꺼낸 커넥티드 케어
삼성전자가 19일(현지시간) 프랑스 파리 ‘비바테크(VivaTech) 2026’에서 ‘커넥티드 케어(Connected Care)’를 주제로 패널 토론을 열었다. 삼성 헬스, 스마트싱스(SmartThings), 파트너 솔루션을 연결하는 개방형 헬스케어 생태계가 핵심이었다.
테크데스크6일 전

참고한 출처

ZDNet Korea
media요약 사용zdnet.co.kr

관련 기사

라 팔마 화산 위에 생긴 동심원 구름의 이유

어도비가 토파즈랩스를 품고 파이어플라이 AI 보정 기능을 넓힌다

갤럭시 버즈4 프로가 목소리를 분리하는 방식

삼성전자가 비바테크 2026에서 꺼낸 커넥티드 케어

참고한 출처

태그