본문 바로가기
테크요약

구글, 제미나이와 AI 에이전트 묶은 인터랙션스 API 정식 출시

구글이 제미나이(Gemini) 모델과 AI 에이전트를 한 창구에서 다루는 인터랙션스 API(Interactions API)를 정식 출시(GA)했다. 2025년 12월 베타 공개 이후 제미나이를 다루는 구글의 기본 API가 됐다.

구글, 제미나이와 AI 에이전트 묶은 인터랙션스 API 정식 출시 — 모노라 편집부 codex hero
사진 · 모노라 편집부 (AI 생성)

구글은 6월 22일 제미나이(Gemini) 모델과 AI 에이전트를 함께 다루는 통합 인터페이스 인터랙션스 API(Interactions API)를 정식 출시(GA)했다고 밝혔다. 이 API는 2025년 12월 베타로 공개됐고, 이번 정식 출시로 제미나이를 다루는 구글의 기본 API가 됐다.

인터랙션스 API는 모델 호출과 에이전트 실행을 하나의 엔드포인트로 묶는다. 모델 ID를 넘기면 추론을 실행하고, 에이전트 ID를 넘기면 자율 작업을 실행한다. “background=True”를 설정하면 오래 걸리는 작업은 서버가 비동기로 처리한다.

정식 출시에는 서버 측 상태 저장, 백그라운드 실행, 여러 도구 조합, 멀티모달 생성 기능이 포함됐다. 매니지드 에이전트는 API 호출 한 번으로 원격 리눅스 샌드박스를 띄우고, 에이전트가 추론과 코드 실행, 웹 탐색, 파일 처리를 하게 한다. 기본 에이전트로 안티그래비티(Antigravity)가 제공되며, 지침·스킬·데이터 소스를 직접 정한 커스텀 에이전트도 만들 수 있다.

도구 조합 기능은 구글 검색·지도 같은 내장 도구와 자체 함수를 한 요청에 섞어 쓰게 한다. 도구 결과는 텍스트와 이미지로 함께 반환된다. 딥리서치 기능은 속도형과 심층형 두 버전으로 나뉘며, 협업 계획과 차트·인포그래픽 생성, 이미지·PDF·오디오 기반 분석을 지원한다.

미디어 생성에서는 나노바나나 2(Nano Banana 2) 이미지 생성, 리리아 3(Lyria 3) 음악 생성, 다중 화자 음성 합성을 제공한다. 스키마는 기존 역할(Roles) 구조에서 모든 동작을 개별 단계(Steps)로 다루는 방식으로 단순화됐다.

비용 구조는 플렉스(Flex)와 프라이어리티(Priority) 티어로 나뉜다. 이용자는 비용이나 지연 시간을 기준으로 최적화할 수 있고, 플렉스는 비용을 50% 낮춘다. 인터랙션스 API는 구글 AI 스튜디오와 제미나이 API, 공식 문서의 기본값이 됐으며, 기존 generateContent API도 계속 지원된다. 장시간 작동하는 모델과 에이전트의 최신 기능은 점차 인터랙션스 API에만 들어갈 전망이다.

챗GPT

관련 기사

참고한 출처

태그