내 마음을 읽었나? X(트위터) '추천 피드' 알고리즘 전격 공개! (비밀은 피닉스? 🐦🔥)

X(트위터) 추천 피드 알고리즘의 핵심인 피닉스 모델을 형상화한 이미지

여러분, 혹시 X(구 트위터)를 하다가 '와, 이건 진짜 내 취향인데 어떻게 알았지?' 싶어서 소름 돋았던 적 없으신가요? 아니면 반대로 '이건 왜 보여주는 거야?'라고 화냈던 적은요? 드디어 그 비밀이 담긴 상자가 열렸습니다! 일론 머스크가 약속했던 대로 X의 추천 알고리즘 소스코드가 세상에 나왔거든요. 저도 이거 분석해 보느라 밤을 꼴딱 새웠답니다. 자, 이제 우리 피드를 지배하는 그 '보이지 않는 손'의 정체를 함께 파헤쳐 볼까요?

📌 에디터의 3줄 요약
  • 내가 팔로우한 계정(Thunder)과 전 세계 핫한 글(Phoenix)을 섞어서 보여줘요.
  • 'Grok' 기반의 강력한 트랜스포머 모델이 내 활동(좋아요, 답글 등)을 실시간 분석합니다.
  • 사람이 억지로 끼워 맞춘 규칙은 가라! 이제 순수 머신러닝이 순위를 결정해요.

내 피드를 구성하는 두 개의 엔진: 썬더와 피닉스

X의 'For You' 피드는 단순하지 않아요. 크게 두 가지 통로에서 글을 가져옵니다. 바로 Thunder(썬더)Phoenix(피닉스)예요. 이름부터 뭔가 멋있지 않나요? 마치 어벤져스 팀 같아요!

  • Thunder (In-Network):
    여러분이 팔로우하는 사람들의 최신 글을 담당해요. 0.001초도 안 되는 초고속으로 데이터를 긁어오는 인메모리 저장소죠.
  • Phoenix (Out-of-Network):
     팔로우하지는 않았지만, 여러분이 좋아할 만한 전 세계의 글을 발굴해요. Grok 기반의 트랜스포머 모델이 작동하는 '진짜 뇌'라고 할 수 있죠.

알고리즘이 내 취향을 저격하는 7단계 과정

글 하나가 여러분의 스마트폰 화면에 나타나기까지는 생각보다 험난한(?) 과정을 거칩니다. 알고리즘의 퇴근 없는 7단계를 소개합니다!

  1. 데이터 수집: 사용자가 최근에 뭘 눌렀는지, 누구를 팔로우했는지 싹 훑어봅니다.
  2. 후보 발굴: 썬더와 피닉스가 각자 담당 구역에서 후보 글들을 모아옵니다.
  3. 데이터 보강 (Hydration): 글 내용뿐만 아니라 작성자가 누군지, 인증(블루 체크)은 받았는지, 동영상 길이는 얼마인지 정보를 덧붙여요.
  4. 1차 필터링: 중복된 글, 너무 오래된 글, 내가 차단했거나 뮤트한 키워드가 포함된 글을 과감하게 버립니다. (휴, 다행이죠?)
  5. 점수 매기기 (Scoring): 피닉스 모델이 등판해서 '이 사람이 이 글에 좋아요를 누를 확률'을 계산합니다.
  6. 최종 선택: 점수 높은 순으로 상위 K개를 뽑아냅니다.
  7. 최종 검증: 스팸이나 폭력적인 내용이 없는지 마지막으로 체크하면 끝!

썬더 vs 피닉스 비교 분석

특징Thunder (인-네트워크)Phoenix (아웃-네트워크)
대상 소스내가 팔로우한 계정전체 글로벌 코퍼스
핵심 기술Kafka 이벤트 스트림Two-Tower 임베딩 모델
응답 속도초저지연 (서브밀리초)복잡한 ML 연산 필요
주요 목표지인 소식 전달새로운 관심사 발굴

왜 머신러닝 위주로 바뀌었을까?

예전에는 엔지니어들이 직접 '리트윗이 많으면 가중치 20점' 같은 수동 규칙(Heuristics)을 넣었대요. 하지만 지금은 그런 수작업을 싹 걷어냈습니다. 왜냐고요? 트랜스포머 모델이 사람보다 훨씬 더 정교하게 사용자의 복잡한 마음을 이해할 수 있기 때문이죠. 사용자의 행동 데이터를 스스로 학습해서 패턴을 찾아내니까요. 역시 인공지능의 시대네요!

❓ 왜 가끔 전혀 모르는 사람의 글이 내 피드에 뜨나요?
💡 그게 바로 'Phoenix Retrieval'의 힘입니다! 여러분이 과거에 좋아요를 눌렀던 글들의 특징을 분석해서, 비슷한 임베딩(데이터 값)을 가진 전 세계의 인기 글을 가져오는 거죠. 여러분의 취향을 확장해 주기 위한 알고리즘의 배려랍니다.
❓ 알고리즘이 '좋아요'보다 '답글'을 더 중요하게 생각하나요?
💡 정답은 '그때그때 달라요'입니다. 피닉스 모델은 좋아요, 리플, 리포스트, 클릭 등 여러 행동에 대해 각각의 확률을 예측합니다. 보통은 긍정적인 행동(좋아요, 공유)에 가중치가 높지만, 여러분의 개인적인 이용 패턴에 따라 우선순위가 계속 바뀝니다.
❓ 내가 쓴 글이 남들에게 안 보여요. 혹시 필터링된 건가요?
💡 알고리즘은 '이미 본 글', '너무 오래된 글', 그리고 '스팸성 콘텐츠'를 가장 먼저 쳐냅니다. 또한, 동일한 대화 스레드에서 너무 많은 글이 노출되지 않도록 조절하기도 해요. 유익하고 새로운 내용을 정성껏 쓰시면 다시 노출될 거예요!

자, 이렇게 X의 심장을 들여다보았습니다. 결국 핵심은 '우리의 행동이 피드를 만든다'는 거네요. 알고리즘은 단지 거울일 뿐! 오늘부터는 더 멋진 글들에 '좋아요'를 눌러서 내 피드를 예쁘게 가꿔보는 건 어떨까요? 저는 또 재미있는 테크 이야기로 돌아올게요. 안녕! 👋


[본 포스팅은 X(구 트위터) 공식 깃허브 공개 자료를 바탕으로 작성되었으며, 플랫폼의 업데이트 상황에 따라 실제 알고리즘과 차이가 있을 수 있습니다. 정보 전달을 목적으로 하며 전문적인 기술 조언을 대체하지 않습니다.]

댓글 쓰기

다음 이전