빅쿼리(Big Query)가 뭔가요?
빅쿼리(Big Query)는 구글 클라우드 플랫폼(GCP, Google Cloud Platform)에서 제공하는 클라우드 기반의 데이터 웨어하우스 서비스*입니다. 빅쿼리는 데이터를 저장하고 분석하는데 도움을 주는 도구로, 많은 양의 데이터를 빠르게 처리할 수 있는 도구인데요. 또한, 빅쿼리는 SQL 쿼리를 그대로 사용할 수 있고 따로 설치의 필요성이 없어 좋은 접근성을 자랑하는 데이터 웨어하우스 서비스입니다.
흠.. 🤨 GA4도 데이터가 저장되고, 분석이 가능하지 않냐고요? 네 어느정도 가능합니다. 다만, GA4에서 조회되는 데이터는 대부분 집계(Aggregation)된 데이터라는 제한 사항이 있어요. 가령, GA4 내 보고서에서는 오늘 하루 '연어 젤리츄' 상품을 클릭한 사람이 20명이 있다는 것은 알 수 있지만 '연어 젤리츄' 상품을 클릭한 5명의 사이트 유입 경로 및 활동은 알기가 어렵습니다. 하지만, 빅쿼리에서는 원본 데이터(Raw data) 수준에서 접근이 가능하기 때문에 '연어 젤리츄'를 본 고객이 들어온 유입 경로, 이후 사이트 내 활동을 빠르게 확인할 수 있어요. 또한, 빅쿼리에 결제 데이터까지 GA4 데이터와 연동한다면 '연어 젤리츄' 상품을 클릭한 고객의 과거 결제 내역까지도 확인할 수 있겠죠.
즉, 빅쿼리는 다양한 소스에서 집계되지 않은 원본 데이터를 쌓고, 통합하며 분석 가능하다는 측면에서 GA4와 큰차이가 있어요.
* 데이터 웨어하우스란? Data(정보)와 창고(Warehouse)의 합성어로 다양한 소스에서 얻은 대량의 데이터를 연결, 통합하는 데이터 중앙 저장소입니다.
구글 애널리틱스를 빅쿼리와 연동시킬 때 할 수 있는 것
빅쿼리는 정말 다양한 데이터를 불러오는 게 가능한데요. 내가 소유한 텍스트 파일부터 다른 데이터베이스 시스템의 데이터 및 스트리밍 데이터까지 다양한 데이터 원본을 갖고 올 수 있어요. 이렇게 가져오는 다양한 데이터를 분석하면, 시장 트렌드에 대한 인사이트를 얻을 수 있을 뿐만 아니라 개별 고객의 미래 행동을 예측하는 것도 가능해집니다.
이번 콘텐츠에서는 구글 애널리틱스의 데이터를 빅쿼리에 연동시킬 때 할 수 있는 세 가지를 소개하고자 합니다.
(1) 효과적인 데이터 분석 및 시각화
먼저, 빅쿼리는 대용량 데이터 처리가 가능합니다. 구글 애널리틱스는 로그분석 툴로써 웹 내에서 이뤄지는 사용자의 행동과 웹 트래픽과 관련된 대량의 데이터를 수집하는데요. 빅쿼리에서는 이러한 대용량의 데이터를 신속하게 가공 및 분류와 분석이 가능합니다. 게다가, 위에서도 언급했듯이 빅쿼리는 SQL쿼리를 사용하여 데이터 추출 및 분석이 가능하기 때문에 비즈니스/데이터 분석가와 데이터 사이언티스트라면 SQL 쿼리문을 활용하여 고급 데이터 분석도 가능하죠. 이렇게 빅쿼리 안에 원데이터 형태로 쌓이고, 또 분석된 데이터는 시각화 도구(ex.루커 스튜디오, 태블로, 파워 BI 등)를 사용하여 쉽게 대시보드로 만들고, 시각화 할 수 있습니다.
(2) 커스텀한 사용자 세분화 및 퍼널 분석
위에서 구글 애널리틱스를 빅쿼리와 연동하면 집계되지 않은 원본 데이터를 쌓을 수 있다고 말했는데요. 구글 애널리틱스에서 수집되는 데이터를 빅쿼리에 연동시켜 쌓을 경우, 웹 사이트 내 개별 사용자의 행동을 파악할 수 있고, 고객 행동에 따라 사용자를 세분화할 수 있게 됩니다. 이렇게 고객 프로파일을 파악하고, 사용자 세분화를 진행한다면 개별 고객 경험을 개선을 하는 데도 큰 도움이 될 수 있어요. 또한, 이렇게 고객 행동의 패턴을 이해하게 된다면 내 비즈니스에 더 적합한 구매 퍼널을 형성할 수도 있죠. 이를 통해 효과적인 세일즈 전략을 세우고, 고객의 이탈을 줄이는 방법을 개발할 수 있습니다.
(3) 고급 예측 및 머신러닝 진행
마지막으로 빅쿼리와 구글 애널리틱스를 연동하면 다양한 종류의 고객 데이터가 수집되기 때문에 머신러닝 및 예측 모델을 구축할 수 있습니다. 예를 들어, 고객 방문 빈도에 따른 사용자 이탈 예측 모델, 고객 별 특정 상품의 구매 행동 예측 등과 같은 모델도 개발할 수 있죠. 사실, 이러한 통계 분석 및 알고리즘 개발은 R이나 Python과 같은 고급 분석 도구를 통해 많이 진행되는데요. 구글 애널리틱스에서 수집한 데이터를 빅쿼리에 쌓았다면, 빅쿼리를 고급 분석 도구에 연결시켜 더 정교한 분석 및 모델링 작업을 진행할 수 있습니다.
GA4와 빅쿼리를 연동하는 방법
GA4와 빅쿼리의 연동은 어떻게 진행할까요? 방법은 매우 간단합니다. 아래 과정을 천천히 따라와주세요.
잠깐!✋ 해당 과정을 진행하기 위해서는 빅쿼리 계정(구글 클라우드 서비스 계정)이 있어야 합니다. 계정이 없다면 Google Cloud 무료로 사용해 보기 링크에 접속하여, 계정을 생성하세요. 아래 과정은 구글 계정을 통해 구글 클라우드 서비스 계정을 생성 후 '사용 가능 상태(결제 수단까지 등록 완료)'가 되었을 때를 시작 단계로 두었습니다.
(1) 계정 생성 후 기본 생성된 좌측 상단의 '프로젝트' 클릭 후, 팝업창 내 '새 프로젝트' 클릭
* 프로젝트를 따로 만든 적이 없다면 ①번 부분에는 기본 프로젝트(My First Project)가 나타납니다.
(2) 프로젝트 이름 설정 후 '만들기' 버튼을 클릭
위 과정까지 진행했다면 GA4와 연결하기 위한 빅쿼리의 준비는 완료된 상태입니다. 이제 GA4에 들어가 빅쿼리를 연결하는 과정을 진행해봅시다.
(3) GA4에 접속하여 '관리' 클릭 후, 'BigQuery 링크'를 클릭
(4) 우측 상단 '연결' 버튼 클릭 후, 'BigQuery 프로젝트 선택하기' 클릭
(5) 연결하고자 하는 프로젝트 선택 후 '확인'을 눌러 연결
※ 하나의 GA속성에는 하나의 빅쿼리만이 연결 가능합니다.
(6) 데이터 저장 위치 및 설정 구성을 비즈니스 상황에 맞게 체크
1) 데이터 위치는 데이터 관련 업무를 하는 지역과 가까운 곳을 선택하는 것을 권장합니다.
2) '매일' 옵션을 선택하는 경우, 하루에 한 번 전체 데이터가 전송됩니다.
3) '스트리밍' 옵션을 선택하는 경우, 실시간 수준으로 이벤트가 전송되며, 1GB*당 $0.05의 비용이 추가 발생됩니다.
*1GB는 약 60만 건의 구글 애널리틱스 이벤트가 발생할 때 생기는 정도의 용량인데요. 트래픽 양이 많지 않거나, 실시간 분석 및 마케팅을 진행할 정도의 리소스가 확보되지 않는다면 '매일'을 선택하시는 것을 추천드려요.
(7) 최종 설정을 검토, '보내기' 버튼을 클릭
위까지의 과정을 마무리하면 정상적으로 GA4에서 빅쿼리로 데이터가 수집됩니다. 이제 빅쿼리로 다시 들어가 'analytics_xxxxxxxx'라는 데이터 시트를 확인했다면 정상적으로 연동이 된 것으로 볼 수 있습니다. 여기서 테이블을 선택해서 확인한다면 실제 수집된 데이터 확인이 가능합니다.
테이블에는 'events_yyyymmdd'와 'events_intraday_yyyymmdd'가 있는데요. events_yyyymmdd에서는 스트리밍으로 누적된 데이터, 'events_intraday_yyyymmdd'는 매일 전송되는 일일 데이터의 누적을 확인할 수 있습니다.
*다만, 안정적 연결까지는 최대 72시간까지 소요될 수 있다고 하니 해당 부분은 참고바랍니다.
GA4, 그냥 쓰지 말고 ‘잘’ 쓰세요.
GA4의 데이터가 빅쿼리에 쌓이는 것은 GA4와 빅쿼리 연결을 완료한 이후부터입니다. 빅쿼리와 연결을 진행하지 않았다면 구글 애널리틱스에서 수집한 데이터를 빅쿼리에서 분석하는 것은 불가능하죠. GA4 데이터를 보다 더 잘 활용하고 싶다면 빠르게 GA4 계정과 BigQuery 연동을 시작하세요. :) !
혹시, 빅쿼리 연동이 어려우신가요? 빅쿼리 연동 후 해당 데이터를 어떻게 활용해야 할 지가 고민되시나요? 언제든지 GAwiz의 데이터 전문가 그룹에게 상담을 요청해보세요. 😊
GA4의 더 커진 확장성을 쉽고 제대로 누리는 방법, GAwiz와 함께해요.
Comments