여러분, 혹시 X(구 트위터)를 하다가 '와, 이건 진짜 내 취향인데 어떻게 알았지?' 싶어서 소름 돋았던 적 없으신가요? 아니면 반대로 '이건 왜 보여주는 거야?'라고 화냈던 적은요? 드디어 그 비밀이 담긴 상자가 열렸습니다! 일론 머스크가 약속했던 대로 X의 추천 알고리즘 소스코드가 세상에 나왔거든요. 저도 이거 분석해 보느라 밤을 꼴딱 새웠답니다. 자, 이제 우리 피드를 지배하는 그 '보이지 않는 손'의 정체를 함께 파헤쳐 볼까요?
- 내가 팔로우한 계정(Thunder)과 전 세계 핫한 글(Phoenix)을 섞어서 보여줘요.
- 'Grok' 기반의 강력한 트랜스포머 모델이 내 활동(좋아요, 답글 등)을 실시간 분석합니다.
- 사람이 억지로 끼워 맞춘 규칙은 가라! 이제 순수 머신러닝이 순위를 결정해요.
내 피드를 구성하는 두 개의 엔진: 썬더와 피닉스
X의 'For You' 피드는 단순하지 않아요. 크게 두 가지 통로에서 글을 가져옵니다. 바로 Thunder(썬더)와 Phoenix(피닉스)예요. 이름부터 뭔가 멋있지 않나요? 마치 어벤져스 팀 같아요!
- Thunder (In-Network):
여러분이 팔로우하는 사람들의 최신 글을 담당해요. 0.001초도 안 되는 초고속으로 데이터를 긁어오는 인메모리 저장소죠. - Phoenix (Out-of-Network):
팔로우하지는 않았지만, 여러분이 좋아할 만한 전 세계의 글을 발굴해요. Grok 기반의 트랜스포머 모델이 작동하는 '진짜 뇌'라고 할 수 있죠.
알고리즘이 내 취향을 저격하는 7단계 과정
글 하나가 여러분의 스마트폰 화면에 나타나기까지는 생각보다 험난한(?) 과정을 거칩니다. 알고리즘의 퇴근 없는 7단계를 소개합니다!
- 데이터 수집: 사용자가 최근에 뭘 눌렀는지, 누구를 팔로우했는지 싹 훑어봅니다.
- 후보 발굴: 썬더와 피닉스가 각자 담당 구역에서 후보 글들을 모아옵니다.
- 데이터 보강 (Hydration): 글 내용뿐만 아니라 작성자가 누군지, 인증(블루 체크)은 받았는지, 동영상 길이는 얼마인지 정보를 덧붙여요.
- 1차 필터링: 중복된 글, 너무 오래된 글, 내가 차단했거나 뮤트한 키워드가 포함된 글을 과감하게 버립니다. (휴, 다행이죠?)
- 점수 매기기 (Scoring): 피닉스 모델이 등판해서 '이 사람이 이 글에 좋아요를 누를 확률'을 계산합니다.
- 최종 선택: 점수 높은 순으로 상위 K개를 뽑아냅니다.
- 최종 검증: 스팸이나 폭력적인 내용이 없는지 마지막으로 체크하면 끝!
썬더 vs 피닉스 비교 분석
왜 머신러닝 위주로 바뀌었을까?
예전에는 엔지니어들이 직접 '리트윗이 많으면 가중치 20점' 같은 수동 규칙(Heuristics)을 넣었대요. 하지만 지금은 그런 수작업을 싹 걷어냈습니다. 왜냐고요? 트랜스포머 모델이 사람보다 훨씬 더 정교하게 사용자의 복잡한 마음을 이해할 수 있기 때문이죠. 사용자의 행동 데이터를 스스로 학습해서 패턴을 찾아내니까요. 역시 인공지능의 시대네요!
자, 이렇게 X의 심장을 들여다보았습니다. 결국 핵심은 '우리의 행동이 피드를 만든다'는 거네요. 알고리즘은 단지 거울일 뿐! 오늘부터는 더 멋진 글들에 '좋아요'를 눌러서 내 피드를 예쁘게 가꿔보는 건 어떨까요? 저는 또 재미있는 테크 이야기로 돌아올게요. 안녕! 👋
[본 포스팅은 X(구 트위터) 공식 깃허브 공개 자료를 바탕으로 작성되었으며, 플랫폼의 업데이트 상황에 따라 실제 알고리즘과 차이가 있을 수 있습니다. 정보 전달을 목적으로 하며 전문적인 기술 조언을 대체하지 않습니다.]