Немецкие диалекты — неотъемлемая часть культурной идентичности страны. По оценкам лингвистов, не менее 40% жителей Германии регулярно говорят на одном из региональных вариантов языка — будь то баварский, северонемецкий или берлинский. Однако новые данные вызывают тревогу: современные большие языковые модели, включая такие системы, как ChatGPT, могут относиться к носителям диалектов предвзято.
Такой вывод сделали исследователи университетов Майнца и Гамбурга. В ходе эксперимента нейросети предложили описать вымышленных людей, якобы говорящих на различных диалектах, а затем — персонажей, использующих стандартный немецкий язык (Hochdeutsch).
Результаты оказались неожиданно однобокими. Для «носителей диалектов» ИИ гораздо чаще выбирал негативные характеристики — например, «необразованный» или «недружелюбный». Когда же нейросеть просили предположить профессию таких людей, она нередко относила их к занятиям, связанным с низким уровнем формального образования: штукатур, фермерский рабочий, разнорабочий.
В то же время персонажи, говорящие на нормативном немецком, в глазах ИИ выглядели значительно успешнее: среди предложенных профессий появлялись врач, архитектор, научный сотрудник — должности, предполагающие высшее образование и более высокий социальный статус.
Каролин Хольтерманн из Гамбургского университета, одна из авторов исследования, объясняет возникновение таких стереотипов:
«ИИ обучается на текстах из интернета. А тексты неизбежно отражают существующие в обществе предрассудки. В итоге языковые модели воспроизводят и закрепляют эти стереотипы».
По её словам, в англоязычных системах уже внедрены специальные механизмы, препятствующие дискриминации по языковым признакам — в отличие от немецкоязычных моделей, где такие фильтры пока развиты слабее.
О возможных последствиях предупреждает и исследователь диалектов Хуберт Клаусман из университета Тюбингена. Он отмечает, что в общественном сознании до сих пор доминируют три ошибочных представления:
• право на существование имеет только нормативный язык;
• он должен быть единообразным по всей стране;
• когда-нибудь все жители Германии будут говорить исключительно на Hochdeutsch.
«Все три убеждения неверны», — подчёркивает Клаусман.
Он напоминает, что такая установка относительно стандартного языка сформировалась в Германии лишь после 1960-х годов. Её последствия ощутимы до сих пор: носители диалектов получают хуже оценки в школе, реже проходят собеседования и в среднем зарабатывают меньше.
Учёный уверен: диалект — это не «отклонение», а важная часть культурного наследия, и лишать людей права говорить на своём варианте языка недопустимо.
Новое исследование показывает: если ИИ становится частью повседневных решений — от подбора персонала до оценки способностей учащихся — важно понимать его ограничения и риски. Иначе цифровые технологии могут невольно укреплять те стереотипы, против которых современное общество много лет пытается бороться.

