07/03/17
ZN.ua

Google "научил" искусственный разум понимать русский язык

Компания Google объявила о том, что система Google Translate теперь использует искусственный интеллект для перевода текстов с русского языка и на русский язык, о чем сообщил в своем блоге Барак Туровский, ведущий разработчик системы перевода Google.

"В ноябре прошлого года наши пользователи из Турции, Бразилии и Японии заметили, что Google Translate начал заметно лучше понимать их языки. Это произошло благодаря тому, что мы начали использовать глубинные нейронные сети для перевода целых предложений, а не отдельных слов, сразу для восьми языков мира. Сегодня к ним присоединяются хинди, русский и вьетнамский, а через несколько недель – множество других языков", — заявил инженер.

В последние несколько лет компания Google начала активно развивать и использовать различные формы искусственного интеллекта для поиска информации в сети, обработки фотографий и их каталогизации и множества других целей, где классические алгоритмы обработки данных не работают. Ярким примером этого подхода стала система искусственного интеллекта AlphaGo, открыто обыгравшая чемпионов мира и Европы по Го в прошлом году, и анонимно победившая сотни топ-игроков в онлайн-системах игры в эту древнекитайскую игру.

Большая часть этих разработок основывается на так называемых глубинных или сверточных нейросетях. Они представляют собой каскады или многослойные структуры из нескольких десятков или сотен более простых нейросетей. Каждая из них обрабатывает не исходные данные, а продукты анализа, полученные сетью, расположенной выше, что позволяет упрощать очень сложные проблемы и решать их при помощи относительно скромных вычислительных ресурсов.

Нечто похожее происходит и при использовании искусственного разума для перевода с одного языка на другой. Когда Google Translate "читает" переводимый текст, система не пытается перевести ее по фразам или отдельным словам, а ищет ответ целиком, используя данные, накопленные при анализе текстов, переведенных человеком. Это, как объясняют разработчики алгоритма GNMT, позволяет избежать проблем  редкими или неправильно написанными словами, которые обычно смущают классические системы машинного перевода. По оценкам программистов, переход на нейросети снизил уровень ошибок в переводах Google Translate на 60%.

Подобная система, как показывают внутренние тесты Google, позволяет добиться почти человеческого качества перевода для некоторых пар языков, таких как французский и английский или английский и испанский. Кроме того, искусственный интеллект сделал автоматический перевод с самых сложных языков, таких как китайский, понятным для читателя.