Яндекс разработал метрику для точной диагностики ошибок — ЕникееваРазвитие машинного перевода ускоряется, но даже современные модели сталкиваются с трудностями, когда речь заходит о передаче естественного звучания фраз. Исследователи ищут способы точнее фиксировать ошибки, которые замечает пользователь, но игнорируют формальные метрики. Новая разработка "Яндекса" стала попыткой закрыть этот разрыв и приблизить перевод к человеческому уровню. Об этом сообщает naked-science.
Зачем понадобился новый подход к оценке перевода
В последние годы машинный перевод получил значительное развитие, и модели крупных разработчиков уверенно справляются с большим массивом текстов. Однако их результат всё ещё далёк от идеального: даже если смысл передан верно, формулировки нередко звучат слишком официально или не соответствуют стилю оригинала. Проблема особенно заметна в бытовой переписке и живых диалогах, где важна не только точность, но и интонация. Примером служат фразы вроде sorry, my bad, которые формальная модель выводит как "приношу извинения, это моя вина", тогда как корректнее и естественнее звучало бы "извини, ошиблась".
Такие несостыковки ощущаются пользователем мгновенно, однако существующие системы оценки перевода — в первую очередь классические метрики, ориентированные на точность — не фиксируют эти стилистические нарушения. Исследователи "Яндекса" сочли это одним из ключевых препятствий для развития моделей и приступили к созданию инструмента, который сможет учитывать естественность перевода и качество стилистической адаптации.
Tue, 09 Dec 2025 23:18:00 +0300