AI Business Archives - AI Digester

Google이 ICE에 넘긴 것들 — 신용카드, 계좌번호까지

Google이 ICE 소환장에 따라 학생 기자의 금융 정보를 제공했다
신용카드 번호, 은행 계좌번호, IP 주소, 전화번호 등이 포함됐다
EFF와 ACLU는 빅테크에 유사 소환장 거부를 촉구하고 있다

코넬대 5분 시위가 부른 금융정보 유출

The Intercept가 입수한 소환장에 따르면, Google은 코넬대 학생 기자 아만들라 토마스-존슨의 개인정보를 ICE에 제공했다.^{[The Intercept]} 2024년 취업박람회에서 5분간 시위에 참여한 것이 발단이었다.

소환장에는 사용자명, 주소, 서비스 내역은 물론 신용카드 번호와 은행 계좌번호까지 포함됐다. 토마스-존슨은 Google 알림으로 메타데이터 공유 사실은 알았지만, 금융정보까지 넘어간 건 이번에 처음 확인됐다.

사전 통지 없는 데이터 제공, 법적 쟁점

같은 사건의 모모두 탈은 사전 통지를 받고 법적으로 이의를 제기했다. 토마스-존슨에게는 그런 기회가 없었다.^{[The Intercept]} 카도조 법학대학원 린지 내시 교수는 “당사자의 이의 제기 기회를 원천 차단한다”고 지적했다.^[EFF]

빅테크와 정부 감시의 경계

Google은 “집행 가능한 정부 요청”에 데이터를 제공한다고 밝히고 있다. 광범위한 요청에는 이의를 제기한다고도 한다. 하지만 지난 10년간 정부 요청 대부분에 응했다.

영국 국적인 토마스-존슨은 ICE의 추적을 우려해 제네바와 세네갈로 피신했다. EFF와 ACLU는 Google, Amazon, Apple, Meta 등에 소환장 거부와 사용자 사전 통지를 촉구하는 서한을 보냈다.^[ACLU]

자주 묻는 질문 (FAQ)

Q: ICE 소환장으로 Google이 제공한 정보는?

A: 사용자명, 주소, IP 주소, 전화번호, 서비스 내역 외에 신용카드 번호와 은행 계좌번호까지 포함됐다. 소환장에는 이민법 집행 관련 조사라는 포괄적 근거만 있었고, 소환장 존재 자체를 무기한 비공개하라는 요구도 담겨 있었다.

Q: Google은 왜 소환장에 응했나?

A: Google은 정책상 집행 가능한 정부 요청에 데이터를 제공한다. 과도한 요청에는 이의를 제기한다고 하지만, 투명성 보고서를 보면 지난 10년간 대부분의 정부 요청을 수용해왔다. 이번에도 사전 통지 없이 데이터를 넘겼다.

Q: 사용자가 데이터 제공을 막을 방법은?

A: 현행법상 직접 막기는 어렵다. 저장통신법에 따라 사전 통지를 받으면 법적 이의를 제기할 수 있다. EFF와 ACLU는 기업들이 사용자 사전 통지를 강화하고 과도한 소환장에 이의를 제기할 것을 촉구하고 있다.

이 글이 유용했다면 AI Digester를 구독해주세요.

참고 자료

Google Gave ICE Student Journalist’s Bank, Credit Card Numbers – The Intercept (2026-02-10)
Electronic Frontier Foundation – EFF (2026-02-10)
ACLU of Northern California – ACLU (2026-02-10)

뉴스 매체들의 인터넷 아카이브 차단 현황

9개국 241개 뉴스 사이트가 robots.txt로 인터넷 아카이브 크롤러를 차단했다. 가디언, 뉴욕 타임스, 파이낸셜 타임스, 르몽드 등이 포함됐다^{[Nieman Lab]}. 차단 사이트 중 87%는 가넷 소유 매체다. 가넷은 2025년 9월에만 7500만 건의 AI 봇을 차단했다.

웨이백 머신이 학습 데이터 우회 경로가 된 배경

인터넷 아카이브는 1조 개 이상의 웹페이지 스냅샷을 보유하고 있다. 구조화된 API로 대량 추출이 가능하다는 게 문제다. 가디언 측은 “아카이브 API가 AI 기업이 지적재산을 빨아들이기 딱 좋은 곳”이라고 했다^{[Nieman Lab]}. 실제로 아카이브는 구글 C4 데이터셋에서 187번째로 많이 등장하는 도메인이다.

아카이브 설립자 브루스터 케일은 “도서관을 제한하면 공공의 역사 기록 접근이 줄어든다”고 반박했다^{[Internet Archive]}. AI 기업의 무분별한 수집이 디지털 보존 생태계를 위협하는 셈이다. 뉴스 매체는 콘텐츠를 보호하려 하지만, 공공 정보 접근성이 희생될 수 있다.

자주 묻는 질문 (FAQ)

Q: 인터넷 아카이브의 웨이백 머신이란?

A: 1996년부터 웹페이지 스냅샷을 저장해온 디지털 도서관이다. 현재 1조 개 이상의 페이지를 보유하고 있으며 누구나 무료로 과거 웹페이지를 열람할 수 있다. 비영리 단체가 운영하지만 최근 AI 학습 데이터 수집 논란의 중심에 섰다.

Q: 뉴스 매체는 어떻게 아카이브를 차단하나?

A: robots.txt 파일로 크롤러 접근을 차단한다. 웹 크롤러에게 접근 허용 또는 차단 영역을 알려주는 표준 프로토콜이다. 다만 이미 수집된 과거 데이터에는 소급 적용이 어렵다는 한계가 있다.

Q: AI 기업이 아카이브를 활용하는 이유는?

A: 방대한 웹 콘텐츠를 구조화된 API로 대량 추출할 수 있기 때문이다. 개별 사이트가 크롤링을 차단해도 이미 저장된 과거 기사를 가져올 수 있다. 구글 C4 데이터셋 기준 187번째로 많이 등장하는 도메인이다.

이 글이 유용했다면 AI Digester를 구독해주세요.

참고 자료

Google이 ICE에 넘긴 학생기자 금융정보 — 그 전말 [2026]

Google이 ICE에 넘긴 것들 — 신용카드, 계좌번호까지

코넬대 5분 시위가 부른 금융정보 유출

사전 통지 없는 데이터 제공, 법적 쟁점

빅테크와 정부 감시의 경계

자주 묻는 질문 (FAQ)

참고 자료

뉴스 매체 241곳이 인터넷 아카이브를 차단한 이유 [2026]

AI 스크래핑 우려에 241개 뉴스 매체가 아카이브 차단

뉴스 매체들의 인터넷 아카이브 차단 현황

웨이백 머신이 학습 데이터 우회 경로가 된 배경

디지털 보존과 저작권의 충돌

자주 묻는 질문 (FAQ)

참고 자료