X опубликовала код алгоритма ленты рекомендаций на GitHub

Компания X выложила в открытый доступ исходный код системы, формирующей персонализированную ленту рекомендаций For You. В репозитории представлены этапы обработки данных, механизмы ранжирования и фильтрации контента.
- Компания X выложила исходный код системы, формирующей ленту рекомендаций For You, на GitHub в репозитории xai-org/x-algorithm
- Алгоритм использует два основных источника контента: посты от подписок пользователя и материалы из глобального корпуса, отобранные с помощью ML-retrieval
- Финальное ранжирование постов выполняет модель Phoenix на базе архитектуры Grok, которая оценивает вероятность взаимодействий пользователя: лайки, репосты, клики и другие сигналы
- Система собирает итоговый рейтинг поста и определяет его место в ленте, включая этапы фильтрации контента перед публикацией
- Публикация кода позволяет независимым разработчикам и исследователям изучить механизмы работы алгоритма и оценить его прозрачность
Компания X опубликовала в открытом доступе исходный код алгоритма, который формирует персонализированную ленту рекомендаций For You. Код размещён в репозитории xai-org/x-algorithm на GitHub, что позволяет разработчикам и исследователям детально изучить, как платформа собирает и ранжирует контент для пользователей.
В основе системы лежат два ключевых источника данных: посты от аккаунтов, на которые подписан пользователь, и материалы из глобального корпуса, отобранные с помощью механизма ML-retrieval. Далее контент проходит через модель Phoenix, построенную на архитектуре Grok. Эта модель оценивает вероятность действий пользователя — лайков, репостов, кликов и других сигналов взаимодействия — и формирует итоговый рейтинг поста. После ранжирования система определяет, какие публикации попадут в ленту пользователя.
В коде также зафиксированы этапы фильтрации контента, которые происходят перед тем, как пост становится доступен аудитории.
Это позволяет проанализировать, какие именно механизмы влияют на видимость тех или иных материалов. Публикация кода — редкий случай для крупных соцсетей, где алгоритмы зачастую остаются закрытыми. Эксперты уже отмечают, что открытость системы может способствовать повышению доверия к платформе и стимулировать разработку новых инструментов на её основе.
В репозитории также представлены примеры конфигураций и документация, что упрощает изучение алгоритма для сторонних специалистов. Однако, как отмечают аналитики, полноценный аудит системы потребует времени и ресурсов, учитывая её сложность и масштабы данных.
Открытие кода алгоритма X — знаковый шаг для индустрии, но его последствия пока неочевидны. С одной стороны, это повышает прозрачность и позволяет независимым экспертам оценить объективность рекомендаций. С другой — алгоритм остаётся сложным для воспроизведения без доступа к полным данным и инфраструктуре платформы. Главный риск — возможное искажение восприятия алгоритма из-за отсутствия контекста о масштабах данных и настройках модели. За развитием ситуации стоит следить, особенно если другие соцсети последуют этому примеру.
Владимир Платонов
