
웹사이트나 앱을 운영하다 보면 "방문자가 얼마나 오는지", "어떤 페이지를 많이 보는지" 궁금해집니다. 이런 데이터를 수집하고 분석하는 도구가 바로 Google Analytics 4(GA4)와 Google Tag Manager(GTM)입니다.
GA4와 GTM이 뭔가요?
GA4 (Google Analytics 4)
구글이 제공하는 웹/앱 분석 플랫폼입니다. 사용자 행동 데이터를 수집하고 시각화된 대시보드로 보여줍니다.
GTM (Google Tag Manager)
태그(추적 코드) 관리 도구입니다. 코드 수정 없이 GA4, 광고 픽셀 등을 웹사이트에 추가하고 관리할 수 있습니다.
핵심 차이
구분 GA4 GTM
| 역할 | 데이터 분석 플랫폼 | 태그 관리 도구 |
| 필수 여부 | GA4만으로도 분석 가능 | 선택사항 (편의성 제공) |
데이터는 어떻게 수집되나요?
기본 흐름
┌─────────────┐
│ 사용자 행동 │ (클릭, 페이지 이동)
└──────┬──────┘
↓
┌─────────────┐
│ gtag.js │ (자동 실행)
└──────┬──────┘
↓
┌─────────────┐
│ Google 서버 │ (실시간 전송)
└──────┬──────┘
↓
┌─────────────┐
│ GA4 대시보드 │ (자동 집계)
└──────┬──────┘
↓ (선택)
┌─────────────┐
│ BigQuery │ (Raw 데이터 저장)
└─────────────┘
코드 삽입 예시
window.dataLayer = window.dataLayer || [];
function gtag(){dataLayer.push(arguments);}
gtag('js', new Date());
gtag('config', 'G-XXXXXXXXXX');
이게 끝! 코드만 넣으면 페이지뷰, 스크롤, 클릭 등이 자동으로 수집됩니다.
커스텀 이벤트가 필요하면 이렇게 추가할 수 있습니다:
// 특정 버튼 클릭 추적
gtag('event', 'button_click', {
'button_name': 'signup'
});
실시간일까요? 자동일까요?
✅ 완전 자동
gtag.js 코드만 삽입하면 자동으로 수집됩니다. 수동 주입은 필요 없고, 커스텀 이벤트만 선택적으로 추가하면 됩니다.
✅ 실시간 전송
사용자 행동이 발생하면 즉시 Google 서버로 전송됩니다.
- GA4 실시간 보고서: 최근 30분 데이터
- 일반 보고서: 24~48시간 후 완전 집계
BigQuery 연동
- 기본: 매일 1회 전날 데이터 적재 (무료)
- 스트리밍: 실시간 적재 가능 (유료)
BigQuery는 왜 필요한가요?
GA4만 사용할 때
- ✅ 무료, 설정 간단
- ✅ 기본 대시보드 제공
- ❌ 복잡한 분석 불가
- ❌ 데이터 보관 14개월만 가능
- ❌ 다른 데이터와 결합 어려움
BigQuery 연동 시
- ✅ Raw 데이터 접근 가능
- ✅ SQL로 자유로운 분석
- ✅ 무제한 데이터 보관
- ✅ 다른 데이터와 결합 분석
- ✅ 커스텀 대시보드 제작
실전 예시
-- 특정 페이지 방문자의 전환율 분석
SELECT
event_date,
COUNT(DISTINCT user_pseudo_id) as visitors,
COUNTIF(event_name = 'purchase') as conversions
FROM `프로젝트.analytics_XXXXX.events_*`
WHERE _TABLE_SUFFIX BETWEEN '20240101' AND '20240131'
GROUP BY event_date;
결론: GA4는 집계된 대시보드, BigQuery는 Raw 데이터 창고입니다.
GA4 말고 다른 선택지는?
도구 특징 비용 장점 단점
| Matomo | 오픈소스 | 무료 (셀프) | 데이터 완전 소유 | 설치/관리 필요 |
| Plausible | 경량 | $9~/월 | 쿠키 없음, 빠름 | 기능 단순 |
| Umami | 오픈소스 | 무료 (셀프) | 가볍고 빠름 | 커뮤니티 작음 |
| Mixpanel | 제품 분석 특화 | $25~/월 | 이벤트 추적 강력 | 마케팅 분석 약함 |
선택 가이드
- GA4: 무료로 시작, Google Ads 연동, BigQuery 활용 계획
- 오픈소스: 데이터 주권 중요, 쿠키 없는 추적
- 유료 SaaS: 제품 분석 깊이 필요, 빠른 속도
데이터 웨어하우스 vs 일반 DB
BigQuery 아키텍처
┌──────────────────────────────────────┐
│ BigQuery 아키텍처 │
├──────────────────────────────────────┤
│ │
│ ┌─────────┐ ┌─────────┐ │
│ │ Storage │◄──────►│ Compute │ │
│ │(Colossus)│ │(Dremel) │ │
│ └─────────┘ └─────────┘ │
│ ▲ ▲ │
│ │ │ │
│ └──────┬───────────┘ │
│ │ │
│ Jupiter Network │
│ (초고속 네트워크) │
└──────────────────────────────────────┘
Storage와 Compute가 분리되어
독립적으로 확장 가능!
일반 데이터베이스 (MySQL, PostgreSQL)
실시간 처리를 위한 DB입니다. 주문, 회원가입 같은 서비스 운영에 사용됩니다.
데이터 웨어하우스 (BigQuery)
대규모 분석을 위한 DB입니다. 수억 건의 데이터를 집계하고 복잡한 분석 쿼리를 처리합니다.
핵심 차이
구분 일반 DB 데이터 웨어하우스
| 주 목적 | 서비스 운영 | 데이터 분석 |
| 쿼리 패턴 | 간단, 빠른 응답 | 복잡, 오래 걸려도 OK |
| 데이터 볼륨 | GB ~ TB | TB ~ PB |
비유: DB는 편의점 계산대(빠른 처리), DW는 물류창고(대량 보관/분석)