본문 바로가기
테크요약

제미나이 3.5 플래시에 컴퓨터 유즈가 들어간다

구글이 제미나이 3.5 플래시에 컴퓨터 유즈 기능을 기본 도구로 내장한다고 밝혔다. 화면 조작, 검색 그라운딩, 지도 연동을 한 모델에서 처리하는 방식이다.

제미나이 3.5 플래시에 컴퓨터 유즈가 들어간다 — 모노라 편집부 codex hero
사진 · 모노라 편집부 (AI 생성)

구글은 현지 시각 6월 25일 AI 에이전트가 화면을 인식하고 클릭·입력·탐색을 수행하는 컴퓨터 유즈(Computer Use) 기능을 제미나이 3.5 플래시에 기본 도구로 넣는다고 밝혔다. 개발자는 제미나이 API와 제미나이 엔터프라이즈 에이전트 플랫폼에서 이 기능을 사용할 수 있다.

컴퓨터 유즈는 AI가 마우스와 키보드를 쓰는 것처럼 소프트웨어를 조작하는 기능이다. 기존에는 2025년 10월 출시된 별도 제미나이 2.5 컴퓨터 유즈 모델에서만 제공됐지만, 이번에는 함수 호출, 검색 그라운딩, 지도 연동을 지원하던 같은 모델 안에 네이티브 도구로 통합됐다.

이에 따라 제미나이 3.5 플래시 에이전트는 화면을 보고, 검색으로 정보를 찾고, 지도와 상호작용하는 작업을 한 흐름에서 처리한다. 여러 모델을 이어 붙이는 구성이 줄어드는 구조다.

구글이 공개한 OSWorld-Verified 결과에서 제미나이 3.5 플래시는 78.4점을 기록했다. GPT-5.5는 78.7점으로, 두 모델의 차이는 0.3점이다. 가격은 100만 토큰당 입력 1.5달러(약 2,310원)·출력 9달러(약 1만3,860원)이며, GPT-5.5(5달러·30달러)의 3분의 1 수준이다.

화면 조작형 에이전트는 오픈AI와 앤트로픽도 내놓은 분야다. 오픈AI는 오퍼레이터를, 앤트로픽은 클로드의 컴퓨터 조작 기능을 각각 선보였다. 구글은 플래시 라인업에 해당 기능을 넣어 개발자 생태계에서 같은 기능을 더 낮은 가격으로 제공하려 한다.

이 기능은 웹 양식 작성, 사내 시스템 운영, 반복 업무 자동화와 연결된다. 국내 기업이 업무 자동화를 검토할 때도 정확도와 토큰당 비용이 함께 변수로 작동할 수 있다. 다만 에이전트가 실제 시스템을 조작하는 만큼, 오작동을 줄이기 위한 권한 통제와 검증 절차가 필요하다.

관련 기사

참고한 출처

태그