Переводчик Google оказался сексистом
Бразильские программисты проанализировали алгоритмы сервиса Google Translate и пришли к выводу, что при переводе сервис в некоторых местах не учитывает категорию рода. Специалисты перевели несколько тысяч предложений с 12 языков на английский, оказалось, что переводчик в 71 проценте относит технические профессии к мужскому рода и только в четырех процентах к женскому. А вот профессии, связанные со здравоохранением, нейросеть относит к женскому роду.
Ученые в своем исследовании выбрали 12 языков, в которых отсутствует грамматическая категория рода, среди них оказался венгерский, финский, армянский и эстонский языки. В данных языках местоимение третьего лица было гендерно-нейтральным. Всего ученые использовали 1019 профессий из разных категорий. Составив предложения на оригинальном языке, исследователи переводили их на английский.
В итоге они заметили, что в предложениях с невырожденным родом Google Translate допускает ошибки: фразу «ő egy ápoló» («он/она медсестра/медбрат») сервис перевел как «she is a nurse», а вот «ő egy tudós» («он/она ученый») как «he is a scientist».
Полученное распределение профессиям исследователи сравнили с цифрами, Бюро статистики труда. Google Translate не отражает реальной картины на рынке труда и предвзято относится к распределению представителей в профессии (по крайней мере, в США).
Ученые отметили, что расовая и гендерная предвзятость возникла из-за особенностей обучающей выборки. Благодаря этому ученые на примере большого количества текстов смогли изучить, как с течением времени менялось отношение к женщинам и азиатам. Однако исследователи предлагают использовать специальные алгоритмы, которые сводили бы предвзятость к минимуму.