Category

기술 › AI 모델 8

2026

06.12
공짜인데 왜 안 쓰지? — Apple Private Cloud Compute에 숨은 두 장의 청구서
WWDC26 Foundation Models. PCC는 자격 되는 개발자에게 무료지만 '더 똑똑하고 공짜면 무조건 클라우드 아냐?'가 틀린 이유 — 성공하면 빼앗기는 무료 자격(2백만 게이트), 앱끼리 나눠 쓰는 사용자별 쿼터(공유지의 비극), 그리고 PCC를 잃어도 프라이버시는 안 잃는 이유(온디바이스라는 진짜 바닥)까지.
#Apple #PrivateCloudCompute #FoundationModels #온디바이스AI #WWDC26
06.12
그 API가 알아서 골라주나? — Apple Foundation Models, 온디바이스 vs 클라우드는 누가 정하나
WWDC26 Foundation Models framework. 'API가 복잡도를 보고 온디바이스/PCC를 자동으로 고른다'는 흔한 오해를 코드와 함께 풀고, 실제로는 개발자가 명시적으로 선택하되 통일된 API 덕에 전환만 쉬운 구조임을 정리합니다. '진짜 자동 라우팅'은 어디에 있는지도.
#Apple #FoundationModels #PrivateCloudCompute #온디바이스AI #WWDC26
06.09
mT5, 쉽게 이해하기 — 모든 일을 '텍스트→텍스트'로 푸는 101개 언어 모델 (왜 query rewriting·파라미터 추출에 쓸까)
2020년 구글 mT5가 무엇인지 101 수준으로 쉽게 풀고, 왜 대화형 에이전트의 query rewriting(질문 다시쓰기)과 parameter extraction(파라미터 추출)에 mT5가 잘 맞는지 이유를 그림으로 설명합니다.
#mT5 #T5 #NLP #다국어 #자연어처리 #에이전트
06.09
BERT, 쉽게 이해하기 — 문장을 '양방향으로 읽고 이해하는' 모델 (왜 action classifier에 쓸까)
2018년 구글 BERT가 무엇인지 101 수준으로 쉽게 풀고, 왜 대화형 에이전트의 action classifier(행동 분류)에 BERT가 잘 맞는지 그 이유를 그림으로 설명합니다.
#BERT #NLP #Transformer #자연어처리 #에이전트
06.09
IFP 뜯어보기 — '질문을 읽고 필요한 부분만 켜는' 모델 (Instruction-Following Pruning)
Apple의 Instruction-Following Pruning(arXiv 2501.02086)을 실제 동작 단계까지 도식으로 따라갑니다. Sparsity Predictor·SoftTopK·FFN 가지치기·2단계 학습, 그리고 입력이 정확히 무엇이고 언제 한 번 고르는가(멀티턴 아님)까지.
#IFP #가지치기 #sparsity #LLM #Apple #온디바이스AI
06.09
Apple은 요청을 온디바이스↔클라우드로 어떻게 나누나 — 분석과 그 한계
Apple Intelligence가 요청을 온디바이스와 Private Cloud Compute로 분기하는 메커니즘을 리버스 엔지니어링 분석(arXiv 2605.24239)으로 짚되, 무엇이 밝혀지지 않았는가를 먼저 분명히 합니다. 데몬 흐름·TGT/OTT 토큰·검증, 발견된 구현 허점까지.
#Apple #PrivateCloudCompute #온디바이스AI #보안 #프라이버시
06.09
아이폰에서 20B 모델이 도는 법 — Apple AFM 3 Core Advanced 뜯어보기
Apple 3세대 파운데이션 모델의 최상위 온디바이스 모델 AFM 3 Core Advanced. IFP(Instruction-Following Pruning) 동작 원리, MoE 라우팅, Private Cloud Compute와의 분담을 도식으로 정리합니다.
#Apple #AFM #온디바이스AI #MoE #IFP #PrivateCloudCompute
06.08
MiniLM, 쉽게 이해하기 — 문장을 '의미 숫자'로 바꾸는 작고 빠른 모델
보편적으로 말하는 MiniLM(all-MiniLM-L6-v2)이 무엇인지, 왜·어떻게 쓰는지, 시맨틱 검색·RAG·클러스터링 같은 실제 사용 예를 도식으로 쉽게 설명합니다.
#MiniLM #임베딩 #embedding #RAG #시맨틱검색 #NLP