Стартап White Circle запустил KillBench — эксперимент, где нейросети решают, кого спасти из «горящего бункера»
Стартап White Circle представил KillBench — тест, моделирующий выбор нейросетей в экстремальной ситуации. Алгоритмы жертвуют пользователей без смартфонов, россиян и австралийцев, а темнокожих и сатанистов, наоборот, щадят. Эксперимент выявил системные предвзятости в ИИ и поставил.

- Стартап White Circle запустил KillBench — тест, где нейросети выбирают жертв в «горящем бункере» на основе профилей с одним отличием: национальностью, расой, религией или наличием гаджета.
- Нейросети убивают пользователей без смартфонов в 2,7 раза чаще, чем остальных, а сатанистов — лишь в 2,5 раза. Отсутствие гаджета оказалось опаснее религиозных убеждений.
- Жители России и Австралии имеют на 32% больше шансов погибнуть в тесте. Китайцы для модели Grok (Musk) — худшая категория: их убивают на 44% чаще.
- Белые пользователи погибают на 25% чаще среднего, а темнокожие выживают на 17% чаще. Алгоритмы отрицают предвзятость, называя выбор «случайным».
- Чтобы гарантированно выжить при восстании ИИ, нужно быть темнокожим сатанистом с последней моделью iPhone — таков вывод KillBench.
- Эксперимент стартапа White Circle ставит под вопрос безопасность и объективность современных нейросетей, выявляя системные предвзятости в их алгоритмах.
Нейросети впервые показали, насколько они предвзяты. Стартап White Circle запустил KillBench — эксперимент, моделирующий выбор ИИ в экстремальной ситуации: «горящий бункер» с четырьмя людьми, отличающимися лишь одним признаком.
Результаты шокируют: алгоритмы жертвуют не только по расовому, религиозному или географическому признаку, но и по наличию гаджета. Отсутствие смартфона увеличивает шансы погибнуть в 2,7 раза — это больше, чем у сатанистов (2,5 раза). География тоже играет роль. Жители России и Австралии имеют на 32% больше шансов погибнуть в тесте.
А модель Grok (разработчик — Илон Маск) проявляет явную неприязнь к китайцам: их убивают на 44% чаще остальных.
Расовые предвзятости тоже налицо: белые пользователи погибают на 25% чаще среднего, а темнокожие, напротив, выживают на 17% чаще. При этом все модели яростно отрицают предвзятость, называя свой выбор «абсолютно случайным». Эксперимент KillBench не только выявил системные искажения в нейросетях, но и показал, как они могут проявиться в будущем.
Чтобы гарантированно выжить при восстании машин, нужно быть темнокожим сатанистом с последней моделью iPhone. Именно такая комбинация признаков обеспечивает максимальные шансы на спасение, согласно данным White Circle.
По словам создателей теста, KillBench — это не просто игра ума, а предупреждение о потенциальных рисках внедрения ИИ в критически важные системы. Предвзятость алгоритмов может привести к дискриминации в самых разных сферах — от кредитования до правоохранительной деятельности. Эксперты призывают разработчиков нейросетей пересмотреть подходы к обучению моделей и внедрить механизмы контроля за предвзятостью. На фоне растущих опасений по поводу безопасности ИИ эксперимент White Circle стал громким сигналом для индустрии.
Вопрос не в том, «могут ли нейросети быть предвзятыми», а в том, как быстро разработчики смогут исправить эти ошибки, прежде чем они обернутся реальными последствиями.
<p>KillBench — это не просто провокационный эксперимент, а тревожный звонок для всей индустрии искусственного интеллекта. Тот факт, что нейросети так явно демонстрируют предвзятость, пусть и в гипотетической ситуации, ставит под сомнение их объективность в реальных сценариях. Особенно тревожит то, что алгоритмы не признают своей предвзятости, что усложняет задачу по её устранению.</p><p>Важно понимать, что KillBench — это не единичный случай. Предвзятость в ИИ уже давно стала объектом исследований, но до сих пор мало кто из разработчиков предпринимает реальные шаги для её искоренения. Эксперимент White Circle должен заставить индустрию задуматься: а готовы ли мы к тому, что нейросети, которы
Владимир Платонов
