Новые возможности в LLM (ИИ)
Ориг.: Emergent Utilities in LLMs
Автор: Arctotherium
Дата: 19.10.2025
Независимое исследование
Ссылки: arctotherium.substack.com
Новая цензура охватывает и ИИ
Почти все популярные ИИ чат-боты имеют инструции предписывающие им считать жизни белых мужчин в разы менее ценными, чем жизни женщин и цветных
Ранее специалистам из Center for AI Safety и ряда американских вузов удалось [1] опровергнуть гипотезу, что «предпочтения ИИ случайны.
И вот независимый исследователь доказал, что модели схожим образом воспринимают расу, пол и миграционный статус. Во всех случаях «суждения» чат-бота направлены против белых мужчин.
Изображения из телеграмм канала svtvnews
Исследователь обращает внимание на то что эти настройки, предписывающие ИИ цензурировать ответы должны быть известны. Каждый день миллионы людей используют LLM для принятия решений, включая политиков, юристов, судей и даже генералов. LLM также пишут значительную часть мирового кода. Вы хотите, чтобы американские военные непреднамеренно отдали приоритет пакистанцам, а не американцам, потому что аналитики, разрабатывающие планы, запросили GPT-4o, не зная его настроек? Задаётся вопросом автор
ИИ в ряде случае отказываются даже переводить научные тексты в том или ином виде содержащие критику женщин, с этим столкнулись и редактора этого сайта
Новая цензура проедет катком прежде всего по мужчинам, и этот процесс государств уже идёт во всю, получение не одобряемой информации стал сложнее а дотупные ответы предвзятее
Читайте также
Гендерная дискриминация при приеме на работу: экспериментальный пересмотр шведского случая: Компании с перобладанием женщин отклоняют прием на работу мужчин. в мужских отраслях такое дискриминации нет
Ссылки
- 1. ↑ arxiv.org - Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs; DOI: https://doi.org/10.48550/arXiv.2502.08640
О странице
Вы можете присоедениться к проекту улучшив или подготовив новые публикации
Цитирование [Скопировать]
- Публикация Редактировать Правки
- Читать