Создание LLM, которое не является расистским или сексистским

Большие языковые модели (LLM), такие как ChatGPT, являются расистскими, сексистскими, гомофобными и в целом наполнены всеми худшими предубеждениями общества, потому что они обучены на предвзятых данных. Как Браун и др. утверждают, что «модели, обученные в Интернете, имеют предубеждения в масштабе Интернета». В этом посте я рассмотрю конкретные примеры предвзятости в LLM, представлю несколько существующих методов для…