В прошлом году поисковая система Google перешла на технологию BERT (Bidirectional Encoder Representations from Transformers или двунаправленная нейросеть-кодировщик), наделяющую поисковик способностью понимать естественный человеческий язык. В рамках Search On 2020 компания анонсировала еще ряд улучшений, чтобы более точно интерпретировать запросы пользователей.
По словам Прабхакара Рагхавана, главы отдела, отвечающего за поиск и фирменного ассистента, около 15% от ежедневного объема поисковых запросов Google — это совершенно новые запросы. Это означает, что компании необходимо постоянно работать над улучшением выдачи.
Как утверждается, отчасти это обусловлено плохими запросами с ошибками. По словам Кэти Эдвардс, вице-президента по разработке в Google, каждый десятый поисковый запрос содержит ошибки. Компания Google уже давно борется с неграмотными запросами с помощью функции «Возможно, вы имели в виду: », которая предлагает правильное написание. К концу месяца єта функция получит крупное обновление с новым алгоритмом проверки орфографии на базе нейронной сети с 680 миллионами параметров. Он срабатывает менее чем за три миллисекунды после каждого поиска, и компания обещает, что новый алгоритм предложит еще более точные подсказки для слов с ошибками. Только одно это изменение существенно улучшит правописание, чем все совершенствования за последние пять лет, говорится в блоге Google.
Еще одно новшество: поиск Google теперь может не просто индексировать веб-страницы целиком, а отдельные разделы этих страниц. Лучше поняв релевантность конкретных отрывков, а не страницы целиком, можно легче найти нужную информацию. Google заверяет, что внедрение этой технологии (в следующем месяце) на 7% улучшит выдачу на всех языках, включая украинский. Технология будет внедряться по всему миру.Еще Google подключит нейронные сети, чтобы понимать подтемы поискового запроса. Это обеспечит большее разнообразие контента, когда поисковый запрос охватывает широкое понятие (например, это поможет найти домашнее тренажерное оборудование, предназначенное для небольших квартир, а не просто предоставит общую информацию о тренировочном снаряжении).
Наконец, Google также начинает использовать компьютерное зрение и распознавание речи, чтобы понимать глубинную семантику видео и автоматически выделять ключевые моменты. Автоматические метки позволят разбить видео на части по аналогии с разделами книги. Например, кулинарные видео или запись спортивных событий можно будет анализировать и автоматически разделять на главы. Это позволит узнать то, что вас интересует без необходимости просмотра или прокрутки записи. Google приступила к тестированию технологии выделения ключевых моментов видео и рассчитывает к концу года использовать ее по меньшей мере для 10% всех поисковых запросов.
Источник: Google