오픈소스마케팅

구글 신호 데이터(Google Signal)와 GA4 기준점 적용

구글 신호 데이터(Google Signal)와 GA4 기준점 적용

구글 신호 데이터(Google signals)에 대해 이미 오래전부터 알고 계셨던 분들도 있을 것이고, GA4로의 전환을 본격화하면서 새롭게 접해보신 분들도 있을 것 같습니다. GA4 설치 후 바로 세팅해야 하는 항목으로 항상 등장하는 구글 신호 데이터. 왜 활성화를 권장하는지, 구글 신호 데이터는 정확하게 어떤 것인지 알아보도록 하겠습니다.

목차

구글 신호 데이터란?

다음은 구글 애널리틱스 공식 도움말에 명시되어 있는 구글 신호 데이터에 대한 설명입니다.

Google 신호 데이터는 Google에서 Google 계정에 로그인한 사용자 및 광고 개인 최적화 를 사용 설정한 사용자와 연결한 사이트 및 앱의 세션 데이터입니다. 로그인한 사용자와의 데이터 연결을 통해 Google Ads로 교차 기기 보고서, 교차 기기 리마케팅, 교차 기기 전환 내보내기를 사용 설정합니다.

구글 신호 데이터는 명칭 그대로 ‘구글의 신호를 기반으로 한 데이터’로, 쉽게 설명하면 구글이 직접 수집한 다양한 사용자의 활동 데이터입니다. 사용자가 로그인한 상태로 Chrome, YouTube와 같은 특정 Google 서비스를 사용할 때 검색한 내용, 방문한 웹사이트, 시청한 동영상 등의 활동 정보를 Google 계정에 데이터로 저장하는 것이죠.

광고 개인 최적화 사용 = 구글 신호 데이터 수집 동의

구글 신호 데이터는 구글 계정에 로그인되어있고 동시에 ‘광고 개인 최적화’를 사용 설정한 사용자들에 한해서만 수집이 가능한데요. 놀랍게도 우리는 이미 이 ‘광고 개인 최적화’를 사용하고 있습니다. 구글 계정 관리 메뉴에서 직접 이 기능을 끄지 않았다면 말이죠.

많은 분들이 눈치채셨겠지만, 구글은 ‘옵트 아웃(opt-out)’ 방식으로 우리의 활동 데이터를 수집 및 활용하고 있습니다. 즉, 구글 계정을 생성하면 활동 데이터 수집 관련 항목들은 디폴트로 ‘활성화’ 되어 있고, 사용자가 이를 ‘사용 중지’할 경우에만 활용을 중단하는 선사용 후배제 방식입니다.

구글 애널리틱스와 구글 신호 데이터

이런 구글 신호 데이터는 2018년 07월에 처음 ‘구글 애널리틱스에서 활용 가능’ 하다고 발표되었고, 발표 이후 베타 버전으로 제공되다가 2020년 10월 출시된 GA4에서부터는 beta 딱지를 떼고 정식으로 사용 가능 해졌습니다. 결과적으로 구글의 자체 데이터인 구글 신호 데이터를 구글 애널리틱스에서도 활용할 수 있게 된 것입니다.

구글 신호 데이터 활성화의 장점

구글 애널리틱스에서 구글 신호 데이터를 활성화하면 우리는 다음과 같이 더 많은 정보를 수집할 수 있어 GA4 데이터의 정확도를 높여줍니다.

  1. 교차 플랫폼 보고
  2. 인구통계 및 관심분야
  3. Google 애널리틱스를 사용한 리마케팅
  4. 광고 보고 기능

비즈니스에 방문하는 사용자들을 각각의 사용자로 정확하게 인식할 수 있게 해주고, 사용자들의 인구통계 및 관심분야와 같은 추가 정보를 알 수 있으며, 이 정보들을 분석 및 광고에 다양하게 이용할 수 있게 된다는 것이죠. (단, 구글에 로그인하고 광고 개인 최적화 기능에 동의한 유저 한정입니다.)

예시 상황을 통해 좀 더 구체적으로 살펴보겠습니다.

신호데이터

가상의 인물 A의 예시입니다. A는 구글 크롬 브라우저와 유튜브, Gmail 등의 구글 다양한 제품을 활용하기 위해 구글 계정을 보유하고 있으며, 가입 후 별도의 계정 설정을 변경하지 않았습니다. 그리고 스마트폰, 데스크톱, 랩톱, 태블릿 등 다양한 기기를 활용하고 있는 A는 모든 기기에 자신의 구글 계정을 로그인해두었습니다.

신호데이터 예시

키보드 구매를 고려하던 A는 출근길에 스마트폰으로 키보드를 검색하던 중 오소마전자의 웹사이트를 방문합니다. 직장에 도착한 A는 근무 중에도 데스크톱으로 틈틈이 오소마전자의 웹사이트에서 다양한 제품을 탐색한 뒤, 퇴근하고 저녁 식사를 하며 태블릿으로 맘에 드는 제품을 비회원 결제했습니다.

이때 오소마전자 웹사이트에 구글 애널리틱스가 설치되어 있고 구글 신호 데이터가 활성화되어 있다면, GA4에서 다음과 같이 활용이 가능합니다.

  • A가 오소마전자 웹사이트에 로그인하지 않았음에도 A의 모든 교차 기기 활동을 GA4는 하나의 사용자로 인식하고 통합합니다. 이를 통해 사용자가 스마트폰으로 제품을 탐색한 후 데스크톱 또는 태블릿으로 넘어가 구매를 완료하는 현상을 파악할 수 있습니다.

교차기기

  • 교차 기기 사용 정보를 기반으로 광고 캠페인은 사용자의 행동/구매 패턴에 맞는 광고 상품과 교차 기기 리마케팅을 활용하여 광고 운영 및 예산 지출을 최적화합니다.

교차기기

  • A와 같이 Google 계정에 로그인하고 광고 개인 최적화를 활성화한 상태로 웹사이트를 방문한 많은 유저들의 인구통계 및 관심분야에 대한 추가 정보를 알 수 있습니다.

인구통계학 보고서

하지만 구글 신호 데이터가 비활성화되어 있다면 아래와 같이 인구통계 및 관심분야 데이터가 제공되지 않습니다.

이처럼 구글 신호 데이터 활성화를 통해 얻을 수 있는 정보들 역시 GA4의 다른 속성과 동일하게 소급 적용이 되지 않기 때문에, 구글 신호 데이터 활성화 설정 이후 시점부터 데이터 수집이 시작됩니다. 아직 구글 신호 데이터 활성화를 진행하지 않았다면 다음 글을 통해 활성화를 진행하세요.

구글 신호 데이터 보고 ID(Reporting ID)

그런데 구글 신호 데이터 활성화 버튼 클릭 한 번으로 어떻게 별도의 자바스크립트 코드 구현도 없이 이런 교차 기기 추적 기능이 가능한 걸까요?

그 비밀은 바로 Google Analytics의 보고 ID(Reporting ID)에 있습니다. GA4의 보고 ID(Reporting ID)는 구글 애널리틱스가 여러 기기와 플랫폼에서 사용자를 구별하고 측정하는 방식으로, 다음과 같이 총 네 가지 방식이 존재합니다.

  1. Device-ID (Client-ID web & Instance-ID app)
  2. User-ID
  3. Google 신호 데이터
  4. 모델링

결국 구글 신호 데이터도 우리에게 익숙한 User-ID와 Device-ID와 같이 구글 애널리틱스에서 이벤트와 사용자를 연결하고 식별하는 데 사용되는 방식 중 하나인 것입니다.

구글 애널리틱스는 이 네 가지 방식을 다음 순서에 따라 순차적으로 수집하여 사용 합니다.

사용자 식별 방식 적용 순서

User-ID → Google 신호 데이터 → Device-ID → (모델링)

  1. User-ID가 수집되면 수집된 User-ID를 사용
  2. User-ID가 수집되지 않으면 애널리틱스에서 Google 신호 데이터의 정보를 사용(사용 가능한 경우)
  3. User-ID와 Google 신호 데이터 정보를 모두 사용할 수 없으면 애널리틱스에서 Device-ID를 사용
  4. 위 식별자를 모두 사용할 수 없으면 애널리틱스에서 모델링을 사용

사용 순서에 따라 이 네 가지 방식 대해 좀 더 자세히 알아보겠습니다.

  1. User-ID
    • 비즈니스 웹/앱에 가입한 후 생성된 계정을 활용하는 사용자들을 각각 식별할 수 있도록 구글 애널리틱스에게 정보를 전달해 주는 방법으로, 가입 및 로그인 기능이 있는 경우에 활용 권장. 별도 개발 작업 필요
    • 로그인 기반 측정 방식으로 쿠키 제한 환경, 교차 기기 환경 등에서도 안정적으로 측정 가능
    • 로그인 사용자에게만 작동
  2. Google 신호 데이터
    • Google에 로그인하고 광고 개인 최적화를 사용 설정한 사용자의 데이터
    • 구글 신호 데이터는 ‘집계 데이터’ 익명 처리를 통해 개인 데이터 보호
    • GDPR 및 기타 개인 정보 보호법을 위반하지 않으며 3사(Third party) 이슈에 영향 없음
  3. Device-ID (Client-ID web & Instance-ID app)
    • 구글 애널리틱스 추적 코드에 의해 임의로 생성되어 쿠키에 저장되는 식별자
    • 쿠키 기반 식별자이므로 한 사용자가 다양한 기기/브라우저를 사용할 경우 하나의 사용자로 인식 불가
    • 브라우저 쿠키 기간 제한 등에 영향을 받아 정확한 추적 불가능
  4. 모델링
    • 쿠키 또는 사용자 ID와 같은 식별자를 충분히 이용할 수 없을 때 사용자 활동을 예측한 추정 데이터
    • 모델링을 하지 않으면 직접 관찰할 수 없는 데이터는 보고서에 표기되지 않음

구글 신호 데이터와 쿠키, 그리고 개인정보

위 설명을 통해 보고 ID 사용의 우선순위는 가장 안정적이고 정확할 것으로 판단되는 방식을 우선하여 적용되어 있다는 것을 확인할 수 있습니다. 쿠키포칼립스(cookiepocalypse) 즉 쿠키리스 시대의 도래에 따라 쿠키 제한 환경에 가장 영향이 적은 방식을 우선적으로 사용하며 쿠키 퇴출에 대비하고 있는 것입니다.

특히 이번 글의 주제인 구글 신호 데이터는 2순위 사용 방식으로, 구글의 자체 데이터이면서 익명 처리 된 ‘집계 데이터’로 쿠키와 개인정보보호법에서 자유롭다는 점에서 최근 더욱 주목받고 있습니다. 따라서 구글 신호 데이터는 개인정보를 보호하기 위해 아래 표와 같은 기능 활용은 지원되지 않습니다. 구글 신호 데이터는 어찌 되었든 나의 데이터가 아닌 익명 처리된 ‘구글의 자체 집계 데이터’이기 때문에 외부로 데이터를 전송하거나 내보내는 기능 활용이 불가한 것입니다.

구글 애널리틱스 기능 지원되지 않는 기능
BigQuery Export Google 신호 데이터를 통해 수집된 데이터를 BigQuery로 내보내지 못합니다.
대시보드 대시보드의 Google 신호 데이터를 통해 수집된 데이터를 사용할 수 없습니다.
맞춤 보고서 맞춤 보고서의 Google 신호 데이터를 통해 수집된 데이터를 사용할 수 없습니다.
맞춤 표 맞춤 표의 Google 신호 데이터를 통해 수집된 데이터를 사용할 수 없습니다.
User ID 보기 사용자 ID 보기의 Google 신호 데이터에 액세스할 수 없습니다.
세그먼트 교차 기기 보고서에 세그먼트를 적용할 수 없습니다.
일일 시간별 데이터 처리 교차 기기 보고서에 일일 데이터가 표시되지 않습니다.
모바일 앱 속성 교차 기기가 앱 속성에 대해 활성화되지 않습니다.
Reporting API Reporting API의 Google 신호 데이터를 통해 수집된 데이터를 사용할 수 없습니다.
Looker Studio Looker Studio 보고서에서 Google 신호 데이터를 통해 수집된 데이터를 사용할 수 없습니다.
스마트 목록 스마트 목록을 만들 때 Google 신호 데이터를 통해 수집된 데이터를 사용할 수 없습니다.

GA4 기준점 적용됨

구글 애널리틱스 보고서 데이터가 안 보이는 이유

이외에도 구글 애널리틱스에서는 구글 신호 데이터 활용과 동시에 개별 사용자들의 개인정보를 보호할 수 있도록 ‘데이터 기준점’을 적용합니다. 실제로 GA4에서 보고서와 탐색 메뉴를 통해 이런저런 데이터를 살펴보다 보면, 분명 문제없이 수집되고 있는 데이터가 보이지 않거나 누락되는 경우가 있습니다. ‘데이터 수집이 안되는 걸까? 유실되는 건가? 뭐가 잘못된 거지?’ 당황스러우셨던 분들도 있으실 텐데요.

기준점 적용

이런 경우 ‘데이터 기준점’이 원인일 수 있습니다. 데이터 기준점이 적용될 경우 GA4 대시보드에서 위와 같이 기준점 적용됨이라는 경고 문구를 발견할 수 있습니다.

GA4 기준점 적용됨은 어떤 기능일까요?

보고서 및 탐색 분석에서 데이터가 제외되는 이유
보고서 또는 탐색 분석에서 데이터가 제외되었다면 Google 애널리틱스에서 데이터 기준점을 적용했기 때문일 수 있습니다. 보고서 또는 탐색 분석을 보는 사용자가 데이터에 나온 인구통계, 관심분야, 기타 신호를 바탕으로 개별 사용자의 신원을 추론하지 못하도록 데이터 기준점이 적용됩니다.

공식 도움말에 따르면 Google 애널리틱스에서는 보고서를 통해 개별 사용자를 특정하지 못하도록 개인정보 보호를 위해 데이터 기준점을 적용하며, 다음과 같은 상황에서 적용됩니다.

  1. 구글 신호 데이터가 활성화 되어 있는 상태에서 설정한 해당 기간의 사용자 수가 적을 경우
  2. 구글 신호 데이터 활성화로 인해 보고서에 인구통계 정보가 포함되어 있을 때
  3. 보고 ID가 기기 ID 중심으로 작동하는 상태에서 총 사용자 수가 충분하지 않을 경우

즉 GA4에서 데이터를 볼 때 지정된 기간의 사용자 수가 적을 경우 개인정보보호를 위해 구글 애널리틱스가 자체적으로 보고서 또는 탐색 분석에서 규모가 작은 행을 숨기거나 삭제하여 데이터가 안보이는 것입니다. 데이터 기준점은 구글이 자체적으로 정의하여 적용하는 사항으로 GA4 사용자인 우리가 직접 조정할 수 있는 사항이 아닙니다.

그렇다면 이 기준점 적용으로 가려지는 수많은 ‘작은 볼륨의 보고서 데이터’를 확인할 방법은 없는 걸까요? 아예 방법이 없는 것은 아닙니다. 우리는 아래의 세 가지 방법을 활용해 데이터 기준점 적용을 막을 수 있습니다.

  • 가장 좋은 방법은 BigQuery를 함께 활용하여 데이터 분석을 하는 방법입니다.
  • 두 번째 방법은 보고 ID(Reporting ID)를 기기 기반으로 설정하는 방법입니다.
    보고 ID를 ‘기기 기반’으로 설정할 경우 구글 신호 데이터가 활용되지 않기 때문에 데이터 기준점이 적용되지 않습니다. 또한 보고 ID 방식 변경은 소급 적용이 가능하기 때문에 데이터 기준점 적용으로 보이지 않았던 데이터에 대한 분석이 필요할 경우 보고 ID 식별 방식을 일시적으로 변경하여 데이터를 확인한 후 다시 원래 설정으로 되돌려두는 방식으로 활용할 수 있습니다. (하지만 잦은 변경은 수집 환경에 좋지 않은 영향을 끼칠 수 있으므로 추천하지 않습니다.)
  • 세 번째 방법은 구글 신호 데이터 비활성화하는 방법입니다.
    구글 신호 데이터는 수집을 비활성화할 경우 적용 이후 인구 통계 및 기타 추가 제공 데이터가 손실되고 소급 적용이 되지 않기 때문에 신중하게 진행해야 합니다.

개인 정보와 쿠키 이슈, 그리고 GA4의 미래

이번 글에서 다뤄 본 GA4의 구글 신호 데이터 활용 방식과 데이터 기준점 적용 등의 기능은 결국 개인정보보호 목적으로 도입된 기능입니다. 이렇듯 구글 애널리틱스 4는 GDPR을 비롯한 다양한 개인정보 보호법을 준수하기 위해 많은 기능을 도입하며 대처하고 있습니다.

하지만 개인정보보호 관련 이슈에 따른 규제가 날로 늘어나고 있는 요즘 앞서 설명한 구글 신호 데이터 수집 방식에 의문을 제기하는 사람들도 점차 늘고 있습니다. 독점이 지나치게 강한 구글이 사용자의 자각과 실질적인 동의 없이 사용자의 정보를 제공하도록 한다는 겁니다. 이에 구글 신호 데이터 역시 데이터 수집과 활용에 앞서 동의를 먼저 받는 ‘옵트인(opt-in)’방식을 따라야 한다는 주장이 늘고 있으며, 개인정보 보호에 민감해진 사용자들이 직접 구글 계정 관리의 설정을 통해 개인 정보 수집 항목을 모두 해제(거부) 하는 경우도 크게 늘었다고 합니다. 이뿐만이 아닙니다. 일부는 GDPR 개인정보 보호 규제에 의해 구글 신호 데이터는 결국 구글 애널리틱스에서 사용하지 못하게 될 것이라는 예언까지 보이고 있습니다.

이렇듯 개인정보보호 이슈와 쿠키의 종말, 사용자의 데이터 수집 및 활용 거부 등 다양한 이유로 나날이 사용성에 많은 제한이 생기고 있는 구글 애널리틱스. 과연 구글 애널리틱스의 미래는 어떤 모습일지, 급변하는 개인정보보호 관련 국제 법안들과 이슈를 늘 예의주시하여 GA4 사용에 대비해야 하겠습니다.

작성자

박하빈

구글 신호 데이터(Google Signal)와 GA4 기준점 적용
이전 글

GA4의 전환수가 소수로 보이는 이유, 모델링된 전환의 이해

다음 글

[웨비나]구글 애널리틱스 4 AMA(20221117)

구글 신호 데이터(Google Signal)와 GA4 기준점 적용
무료 상담 받기
무료 상담 받기

문의 남기기

오픈소스마케팅의 컨설팅이 필요하시다면 문의를 남겨주세요.

[email protected]