jaysnote
11분

공짜인데 왜 안 쓰지? — Apple Private Cloud Compute에 숨은 두 장의 청구서

WWDC26 Foundation Models. PCC는 자격 되는 개발자에게 무료지만 '더 똑똑하고 공짜면 무조건 클라우드 아냐?'가 틀린 이유 — 성공하면 빼앗기는 무료 자격(2백만 게이트), 앱끼리 나눠 쓰는 사용자별 쿼터(공유지의 비극), 그리고 PCC를 잃어도 프라이버시는 안 잃는 이유(온디바이스라는 진짜 바닥)까지.

앞 글에서 정리했듯, Apple Foundation Models framework는 목적지(온디바이스 / Private Cloud Compute / 서드파티)를 개발자가 명시적으로 고릅니다. 그러면 자연히 이런 생각이 듭니다 — “클라우드(PCC) 모델이 더 똑똑하고, 게다가 개발자한텐 공짜라며? 그럼 그냥 무조건 클라우드로 보내면 이득 아냐?”

결론부터: 아닙니다. “공짜”라는 말 뒤에는 두 장의 청구서가 접혀 있고, 그 청구서는 앱이 성공할수록 커집니다. 그리고 그 구조를 알고 나면, 왜 Apple이 “서버 모델은 기본값이 아니라 의도적 선택”이라고 못 박았는지가 비로소 납득됩니다.

공짜 PCC에 숨은 두 장의 청구서 — 개발자 자격 게이트와 사용자별 쿼터


1. “성능이 더 좋다”의 함정 — 외부화되지 않는 비용들

먼저 “클라우드가 성능이 좋다”부터 분해해야 합니다. 여기서 ‘성능’은 모델의 능력이지, 사용자가 체감하는 응답 속도가 아닙니다. 둘은 다릅니다.

  • 지연시간 — 클라우드는 네트워크 왕복이 붙습니다. 분류·추출·짧은 요약처럼 가벼운 작업은 온디바이스가 end-to-end로 더 빠릅니다(왕복 0). 큰 모델이 더 똑똑한 것과 더 빠른 것은 별개입니다.
  • 오프라인 — 온디바이스는 비행기 모드에서도 돕니다. 클라우드는 연결이 끊기면 그냥 죽습니다.
  • 프라이버시 — 온디바이스는 데이터가 기기를 아예 안 떠납니다. 클라우드는 (아무리 잘 만들어도) 떠나긴 합니다.
  • 예측 가능성 — 목적지를 고정하면 지연·품질·프라이버시 특성이 결정적입니다.

핵심은 이겁니다 — 이 네 가지 비용은 어디로도 떠넘겨지지 않습니다. 클라우드를 고른 개발자 자신의 UX에 그대로 꽂힙니다. 그래서 “무조건 클라우드”는, 비용 얘기를 꺼내기도 전에 이미 손해 보는 선택입니다. 작업이 작은 모델로 충분하면 더 큰 모델의 품질 향상은 사실상 0인데, 위 비용은 다 떠안으니까요.

한 줄로: 클라우드는 “더 똑똑한 모델”이지 “모든 면에서 우월한 선택”이 아니다.

이제 진짜 흥미로운 부분 — 떠넘겨지긴 하는 단 하나의 비용, 돈과 쿼터로 갑니다.


2. 첫 번째 청구서 — 성공하면 빼앗기는 ‘무료 자격’

PCC가 개발자에게 무료인 건 맞습니다. 토큰당 과금이 없고, 연산비는 Apple이 부담합니다. 하지만 그 무료에는 자격 게이트가 있습니다. 셋을 전부 만족해야 합니다.

  • App Store Small Business Program 가입
  • 전 앱 합산 최초 다운로드 2백만 미만
  • PCC entitlement 신청·승인 (Apple Developer에서 별도 요청)

그리고 여기에 반전이 있습니다. Apple 문서 원문:

“If any app subsequently exceeds the 2 million first-time downloads threshold, or the developer is no longer enrolled in the App Store Small Business Program, the developer will be notified and must migrate to an alternative solution within 6 months.”

즉 앱이 2백만 다운로드를 넘기면, 통지를 받고 6개월 안에 다른 솔루션으로 옮겨야 합니다. 무료 PCC가 끊깁니다. (TestFlight·ad hoc 테스트 설치는 이 카운트에 안 들어갑니다.)

이 조항을 한 문장으로 바꾸면 이렇게 됩니다 — 앱이 성공할수록 공짜 클라우드를 못 쓴다. 처음부터 모든 핵심 기능을 PCC 위에 올려두면, 성공하는 순간이 곧 마이그레이션 청구서가 날아오는 순간이 됩니다.

한 줄로: 무료 PCC는 인디·소형 개발자에 대한 한시적 선물이지, 영구 권리가 아니다.


3. 두 번째 청구서 — 사용자별 일일 쿼터 (그것도 공유 풀)

개발자 자격을 통과해도 끝이 아닙니다. 사용자마다 일일 쿼터가 또 걸립니다. WWDC26 세션 319 원문:

“Requests are counted with your user’s iCloud account. Each user gets a daily limit. And users can upgrade to iCloud+ to get higher limits.”

요청은 유저의 iCloud 계정 단위로 카운트되고, 일일 한도가 있으며, iCloud+ 구독자는 한도가 더 높습니다. 한도에 도달하면 요청이 그냥 에러를 던집니다. 그래서 개발자가 이걸 코드로 직접 다뤄야 합니다.

private var model = PrivateCloudComputeLanguageModel()

if model.quotaUsage.isLimitReached {
    // 한도 초과 — 이후 요청은 throw된다
}
if case .belowLimit(let info) = model.quotaUsage.status, info.isApproachingLimit {
    // 한도 임박 — 미리 경고 UI
}
if let suggestion = model.quotaUsage.limitIncreaseSuggestion {
    Button("Show options") { suggestion.show() }   // iCloud+ 업그레이드 유도
}

여기서 멈추지 말고 한 단계 더 들어가 봅시다. 쿼터가 유저의 iCloud 계정에 묶인다는 말은, 그 유저가 깔아둔 모든 앱이 하나의 풀을 나눠 쓴다는 뜻입니다. 앱별 격리가 없습니다. 그러면 재미있는 게임이 생깁니다.

한 줄로: 온디바이스 모델엔 per-user 쿼터도 스로틀도 없다. 쿼터 게임은 PCC에서만 벌어진다.


4. 공유지의 비극 — 그런데 왜 생태계가 안 무너지나

쿼터가 앱별이 아니라 유저 단위 공동 풀이라면, 개별 개발자에겐 이런 유혹이 생깁니다 — “내가 아껴봤자 옆 앱이 쓸 텐데, 그냥 내가 먼저 많이 쓰자.” 비용(연산비)은 Apple이, 고갈(쿼터)은 유저의 공동 풀이 부담하니, 전형적인 공유지의 비극(tragedy of the commons), 무임승차 구조입니다.

공유지의 비극 — 여러 앱이 하나의 iCloud 풀을 나눠 쓰지만, 2백만 게이트가 최대 남용자를 잘라낸다

그런데도 생태계가 무너지지 않는 이유가 있습니다. 셋입니다.

(1) 외부화되는 건 ‘쿼터’ 하나뿐이다. 1절에서 본 지연·오프라인·프라이버시·예측불가능성은 전혀 떠넘겨지지 않고 개발자 자기 UX에 꽂힙니다. 그래서 이기적인 개발자라도, 빠르고 오프라인 되고 프라이빗한 경로가 필요하니 여전히 온디바이스를 기본으로 깔게 됩니다. 공유지 비극은 “always cloud”를 정당화하지 못합니다.

(2) 공동 풀은 내 풀이기도 하다. 풀이 마르면 내 앱 기능도 같이 죽습니다. 게다가 한도 초과 UI(iCloud+ 업그레이드 유도)를 들이미는 게 하필 내 앱이면, 유저는 “이 앱이 내 AI를 다 써먹네”로 인식합니다. 경쟁적으로 불리한 자살골입니다.

(3) 2백만 게이트의 숨은 역할. 이게 영리한 지점입니다. 유저 풀을 대규모로 빨아들일 수 있는 잠재적 남용자는 결국 유저가 많은 대형 인기 앱입니다. 그런데 그 앱들이 바로 2백만 다운로드 게이트에서 구조적으로 배제됩니다. 가장 위험한 free-rider를 정확히 잘라내는 셈이죠. 3절에서 “성공하면 빼앗긴다”고 했던 그 조항이, 여기선 생태계를 지키는 방어막으로 다시 등장합니다.

한 줄로: Apple은 공유지의 비극을 ‘제거’한 게 아니라, 자격 게이트·회수 가능 entitlement·iCloud+ 밸브로 ‘가둬둔’ 것이다.


5. 그럼 PCC를 잃으면 프라이버시도 잃나?

여기서 가장 날카로운 질문이 나옵니다. PCC의 존재 이유가 프라이버시(stateless·무보존·암호학적 검증)인데, 정작 그 프라이버시가 가장 중요할 대형 앱을 무료 PCC에서 쫓아낸다. 그리고 흔한 대체재인 서드파티 클라우드(Claude·Gemini)로 옮기면 그 보장이 사라진다. 모순 아닌가?

이 모순은 전제가 한 칸 어긋나서 생깁니다. 프라이버시 보장은 사실 3단 사다리고, 강도가 다릅니다.

프라이버시 3단 사다리 — 온디바이스(최강·무제한·누구나), PCC(강·검증·2백만 미만), 서드파티(약·계약·누구나)

단계프라이버시 강도비용·자격앱 크기 제한
온디바이스최강 — 데이터가 기기를 아예 안 떠남무료·무제한없음 (누구나)
PCC강 — 떠나지만 stateless·무보존·암호학적 검증 가능무료(자격 게이트)2백만 미만만
서드파티(Claude·Gemini)약 — 계약상 보장만(제공자 약관을 신뢰)유료, 누구나없음

핵심은 PCC가 프라이버시의 ‘바닥’이 아니라 ‘중간 칸’이라는 겁니다. 온디바이스 모델은 앱 크기와 무관하게 영원히 무료·무제한이고, 프라이버시는 PCC보다도 강합니다(데이터가 기기를 안 떠나므로). 그래서 2백만을 넘긴 앱의 실제 폴백은:

  • 진짜 민감한 워크로드온디바이스로 폴백. 프라이버시 바닥은 안 무너집니다.
  • 무겁지만 덜 민감한 워크로드 → 서드파티로. 프라이버시는 계약(no-retention·no-training DPA)으로 관리.

PCC를 잃는 건 “온디바이스보다 똑똑하면서 + 서드파티보다 프라이버시 강한” 중간 칸을 잃는 것이지, 프라이버시 자체를 잃는 게 아닙니다.

그래도 완전히 안 풀리는 한 구석은 남습니다. 온디바이스로는 능력이 부족하면서 동시에 계약이 아니라 하드웨어로 검증되는(attested) 프라이버시가 꼭 필요한 기능 — 이 조합은 2백만을 넘긴 순간 갈 곳이 없습니다. 온디바이스는 능력이 안 되고, 서드파티는 PCC급 검증을 (현재) 제공하지 않으니까요. PCC→서드파티는 기술적 보장 → 계약적 보장으로의 다운그레이드이고, 이건 코드 한 줄로 못 메웁니다. 이 코너에 대해 Apple은 침묵합니다 — paid/enterprise PCC를 낼지조차 공식 발표가 없습니다.

한 줄로: 프라이버시의 진짜 바닥은 PCC가 아니라 온디바이스다. 그 바닥은 앱이 아무리 커져도 사라지지 않는다.


정리 — 그래서 무엇을 토대로 깔 것인가

처음 질문 — “더 똑똑하고 공짜인데 무조건 클라우드 아냐?” — 에 대한 답:

  • 클라우드의 우위는 ‘모델 능력’ 하나뿐이고, 지연·오프라인·프라이버시 비용은 떠넘겨지지 않는다.
  • 공짜에는 두 장의 청구서가 있다 — 성공하면 빼앗기는 개발자 자격(2백만 게이트)과 앱끼리 나눠 쓰는 사용자별 쿼터.
  • 그 쿼터는 공유 풀이라 공유지의 비극 압력이 실재하지만, 2백만 게이트가 최대 남용자를 잘라내며 생태계를 가둬둔다.
  • 프라이버시의 바닥은 온디바이스다. PCC를 잃어도 그 바닥은 남는다.

이 모든 게 하나의 설계 교훈으로 모입니다 — PCC를 앱의 토대로 깔지 마라. 무료 PCC 위에 핵심 기능을 올리면, 성공하는 순간(2백만 돌파) 비용 구조도 프라이버시 스토리도 함께 무너지는 앱이 됩니다. 대신:

  • 온디바이스를 바닥에 — 무조건·무기한·최강 프라이버시. 여기서 되는 건 다 여기서.
  • PCC는 중간 가속 — 온디바이스로 부족할 때만, “있으면 좋은 보너스”로.
  • 서드파티는 확장 밸브 — 진짜 무거운 작업, 프라이버시는 계약으로 관리.

이렇게 깔면 통일 API의 진짜 효용이 살아납니다 — 앱이 커져 무료 PCC를 잃어도, 세션 로직을 안 건드리고 목적지만 갈아끼우면 되니까요. Apple이 “자동 선택” 대신 “무비용 전환”을 준 이유가 바로 여기서 빛납니다.

한 줄 결론: 공짜 클라우드는 성공하기 전까지만 공짜다. 그러니 성공해도 안 깨지는 토대 — 온디바이스 — 위에 짓고, 클라우드는 갈아끼우는 부품으로 둬라.


출처

※ 미공개·추측 표시: ⑴ paid/enterprise PCC 티어의 존재 여부와 2백만 초과 후 정확한 옵션은 Apple이 공식 발표하지 않았다. ⑵ “하루 1000 요청” 같은 구체적 한도 수치가 일부 분석글에 돌지만 Apple 확정 수치인지는 미확인. ⑶ 쿼터를 앱별로 attribution하는 텔레메트리가 있는지도 문서화돼 있지 않다.

관련 글

← 목록으로