Электронная библиотека » Анатолий Косарев » » онлайн чтение - страница 4


  • Текст добавлен: 30 марта 2023, 12:40


Автор книги: Анатолий Косарев


Жанр: Справочники


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 4 (всего у книги 9 страниц)

Шрифт:
- 100% +
Алгоритм Google BERT

BERT: Сравнительно новый алгоритм Google, который обещает революцию в поисковой выдаче

Google уже стал настолько сложной частью жизни людей, что многие из нас общаются непосредственно с ним.

Пользователи делают запросы: «как мне попасть на рынок» или «когда начнется весна», как будто они естественно разговаривают с человеком. Но стоит помнить: Google состоит из алгоритмов, которые упакованы в фильтры.

И это один из тех алгоритмов – Google BERT – который помогает поисковой системе понять, о чем просят люди, и дает ответы, которые они хотят.

Правильно: боты не люди, но технологии настолько продвинулись вперед, что могут понимать человеческий язык, включая сленг, ошибки, синонимы и языковые выражения, присутствующие в нашей речи, а мы даже не замечаем.

Этот новый поисковый алгоритм был создан Google, чтобы лучше понимать поисковые намерения пользователей и содержание веб-страниц.

Но как это работает? И как это влияет на ваши стратегии SEO?

Давайте все сейчас разберемся:

Что такое Google BERT?

Google BERT – это алгоритм, который улучшает понимание человеческого языка поисковой системой.

Это важно во вселенной поиска, поскольку люди спонтанно выражают себя в поисковых запросах и содержании страниц, а Google работает над тем, чтобы найти правильное соответствие между одним и другим.

BERT – это аббревиатура от Bidirectional Encoder Representations from Transformers (двунаправленных представлений кодировщика от трансформеров). Сбивает с толку? Давайте объясним это лучше!

Чтобы понять, что такое BERT, нам нужно разобраться с некоторыми техническими терминами, хорошо?

Во-первых, BERT – это нейронная сеть.

Вы знаете, что это такое?

Нейронные сети – это компьютерные модели, вдохновленные центральной нервной системой животных, которые могут обучаться и распознавать закономерности. Они являются частью машинного обучения.

В случае BERT нейронная сеть способна изучать формы выражения человеческого языка. Он основан на модели обработки естественного языка (NLP), называемой Transformer, которая понимает отношения между словами в предложении, а не просматривает их по очереди.

BERT – это предобучающая модель обработки естественного языка. Это означает, что набор данных модели обучается в текстовом корпусе (например, в Википедии) и может использоваться для разработки различных систем.

Например, можно разработать алгоритмы, ориентированные на анализ вопросов, ответов или настроений.

Все это находится в области искусственного интеллекта. То есть все делают боты!

После программирования алгоритм непрерывно изучает человеческий язык, обрабатывая миллионы получаемых данных.

Но помимо мира искусственного интеллекта, который больше похож на научную фантастику, важно знать, что BERT понимает весь контекст слова – термины, которые идут до и после, и отношения между ними – что чрезвычайно полезно для понимания содержания сайтов и намерения пользователей при поиске в Google.

Когда был выпущен BERT?

В ноябре 2018 года Google запустила BERT с открытым исходным кодом на платформе GitHub.

С этого момента каждый может использовать предварительно обученные коды и шаблоны BERT для быстрого создания собственной системы.

Сам Google использовал BERT в своей поисковой системе. В октябре 2019 года Google объявил о своем самом большом обновлении за последнее время: внедрении BERT в алгоритм поиска на английском языке.

Google уже принял модели для понимания человеческого языка, но это обновление было объявлено одним из самых значительных скачков в истории поисковых систем.

Изначально BERT был запущен только в США и на английском языке. Но к декабрю 2019 года модель уже была расширена до более чем 70 языков. Таким образом, результаты поиска по всему миру стали более качественными.

Что такое НЛП?

Если кто-то думает, что здесь речь пойдет о нейро-лингвистическом программировании, то нет. Здесь рассматриваем другое НЛП.


Чтобы объяснить, что такое BERT, мы упомянули, что этот алгоритм является моделью обработки естественного языка (NLP).

НЛП – это область искусственного интеллекта, которая сходится с лингвистикой при изучении взаимодействия человека и вычислительных языков. Намерение состоит в том, чтобы заполнить пробелы между одним языком и другим и заставить их общаться.

Этот тип системы существует уже давно, начиная с работы Алана Тьюринга в 1950-х годах.

Но именно в 1980-х годах модели НЛП оставили свои рукописи и были внедрены в искусственный интеллект. С тех пор компьютеры обрабатывают большие объемы данных, что произвело революцию в отношениях между людьми и машинами.

Мы можем не замечать этого в нашей повседневной жизни, но наше вербальное выражение чрезвычайно сложно и разнообразно.

Существует так много языков, синтаксических правил, семантических отношений, сленгов, поговорок, сокращений и ежедневных ошибок, что порой люди едва понимают друг друга!

Это становится еще сложнее для компьютеров, поскольку мы используем для них неструктурированный язык, которому затем нужны системы, чтобы понять его.

Для этого в НЛП используется ряд техник, таких как абстрагирование того, что не имеет отношения к тексту, исправление орфографических ошибок и приведение слов к их радикальным или инфинитивным формам.

Оттуда можно структурировать, сегментировать и классифицировать контент, чтобы понять, как части имеют смысл вместе. Затем система также вырабатывает ответ на естественном языке для взаимодействия с пользователем.

Такая система позволяет, например, сказать «Алекса, расскажи мне рецепт шоколадного торта», а виртуальный помощник Amazon отвечает ингредиентами и способом приготовления. Заметьте, что ответ не содержит слов Алекса, расскажи мне, а выдаёт ответ, которого ждет пользователь.

Это решение используется сегодня в нескольких ресурсах, таких как взаимодействие с чат-ботами, автоматический перевод текстов, анализ эмоций в мониторинге социальных сетей и, конечно же, поисковая система Google.

Заменил ли BERT RankBrain?

Google постоянно изучает способы улучшения взаимодействия с пользователем и достижения наилучших результатов. Это не начинается и не заканчивается с BERT.

В 2015 году поисковая система объявила об обновлении, которое изменило поисковую вселенную: RankBrain.

Алгоритм впервые использовал искусственный интеллект для понимания контента и поиска.

Как и BERT, RankBrain также использует машинное обучение, но не выполняет обработку естественного языка. Метод фокусируется на анализе запросов и группировании слов и фраз, которые семантически похожи, но не могут понимать человеческий язык сами по себе.

Таким образом, когда в Google делается новый запрос, RankBrain анализирует прошлые поисковые запросы и определяет, какие слова и фразы лучше всего соответствуют этому запросу, даже если они не соответствуют точно или никогда не искались.

Получая сигналы взаимодействия с пользователем, боты узнают больше о взаимосвязях между словами и улучшают рейтинг.

Таким образом, это был первый шаг Google в понимании человеческого языка. Даже сегодня это один из методов, используемых алгоритмом для понимания целей поиска и содержимого страницы, чтобы предоставить пользователям лучшие результаты.

Таким образом, BERT не заменил RankBrain – он просто принес еще один метод понимания человеческого языка. В зависимости от запроса алгоритм Google может использовать любой метод (или даже комбинировать оба), чтобы предоставить пользователю наилучший ответ.

Имейте в виду, что алгоритм Google формируется из огромной сложности правил и операций. RankBrain и BERT играют значительную роль, но они являются лишь частью этой надежной поисковой системы.

Как работает Google BERT?

Одним из отличий Google от других систем обработки языка является его двунаправленный характер. Но что это значит?

Другие системы являются только однонаправленными. То есть они только контекстуализируют слова, используя термины, которые находятся слева или справа от них в тексте.

BERT работает в обоих направлениях: анализирует контекст слева и справа от слова. Это приводит к гораздо более глубокому пониманию отношений между терминами и между предложениями.

Другое отличие заключается в том, что BERT строит языковую модель с небольшим текстовым корпусом.

В то время как другие модели используют большие объемы данных для обучения машинному обучению, двунаправленный подход BERT позволяет обучать систему более точно и с гораздо меньшим объемом данных.

Таким образом, после обучения модели в текстовом корпусе (например, в Википедии) она проходит «тонкую настройку».

На этом этапе BERT подвергается конкретным задачам с входными и выходными данными в соответствии с тем, что вы хотите, чтобы он делал. Именно тогда он начинает адаптироваться к различным требованиям, таким как вопросы и ответы или анализ настроений.

Обратите внимание, что BERT – это алгоритм, который можно использовать во многих приложениях. Поэтому, когда мы говорим о Google BERT, мы говорим о его применении в поисковой системе.

В Google BERT используется для понимания поисковых намерений пользователей и содержимого, индексируемого поисковой системой.

В отличие от RankBrain, ему не нужно анализировать прошлые запросы, чтобы понять, что имеют в виду пользователи. BERT понимает слова, фразы и весь контент так же, как и мы. Ну, почти, как мы.

Но также поймите, что эта модель НЛП – только часть алгоритма. Google BERT понимает, что означают слова и как они связаны друг с другом.

Google по-прежнему нужна вся работа остального алгоритма, чтобы связать поиск со страницами индекса, выбрать лучшие результаты и ранжировать их в порядке значимости для пользователя.

Почему Google BERT важен для удобства поиска?

Теперь мы немного оставим в стороне ИТ-термины, чтобы поговорить о том, что BERT означает для поиска Google.

Вы понимаете, что алгоритм помогает Google расшифровывать человеческий язык, но какое это имеет значение для поиска пользователя?

Важно помнить, что миссия Google состоит в том, чтобы систематизировать весь контент в Интернете, чтобы предоставить пользователям наилучшие ответы.

Для этого поисковая система должна понимать, что ищут люди и о чем говорят веб-страницы. Таким образом, он может обеспечить правильное соответствие между ключевыми словами и веб-контентом.

Например, когда вы ищете «густая коса», поисковик понимает, что «коса» в вашем запросе не относится к косе на реке, и не относится к режущему инструменту, или песчаной отмели в море.

Если вы искали «рецепты еды» (с орфографической ошибкой), она также поняла бы, что вы имели в виду.

BERT понимает значение этого слова в ваших поисковых запросах и в содержимом проиндексированных страниц.

Но искатель идет дальше: он также понимает намерение, стоящее за этим поиском.

Выполняя этот поиск, Google понимает, что вы возможно ищете компанию рядом с вами. Таким образом, на странице результатов, вероятно, будут показаны учреждения, которые предоставляют такого рода услуги в вашем регионе, особенно если у них есть хорошая локальная стратегия SEO.

Таким образом, Google становится более интеллектуальным, чтобы предоставлять результаты, которые действительно предоставляют то, что хотят найти пользователи. Это опыт поиска, который Google хочет предложить.

Однако на заре существования Google не все поисковые запросы давали то, что искал пользователь. Поисковик был ограничен точным соответствием ключевому слову.

То есть, когда человек вводил, например, «купить обувь», он мог предоставить результаты только страниц, на которых использовался именно это сочетание слов. Сейчас алгоритмам достаточно понять, что пользователь ищет интернет-магазин, и предоставит ему на выбор туфли, если это летом, а зимой – сапоги. И, как правило, слов из запроса может и не быть на сайте.

С момента выхода RankBrain Google уже начал понимать, что «забота» очень близка к «как заботиться». Таким образом, поисковая система также будет показывать страницы с терминами «как ухаживать за больным».

BERT дает Google понять, что человек хочет знать, как ухаживать за больным, не придерживаясь точных ключевых слов.

Проблема в том, что первоначальная модель точного соответствия ключевых слов Google создала интернет-пороки. Чтобы появиться в поисковой системе, многие сайты начали использовать ключевые слова в тексте именно так, как будет искать пользователь. Тем не менее, это делает чтение в некоторых случаях бессмысленным.

Подумайте, какой текст стали бы вы читать.

Тот, в котором естественно говорится об уходе за больным, или текст, в котором несколько раз повторяется «уход за больным», но этот текст не содержал бы каких-либо рекомендаций, или не имел никакого смысла?

Таким образом, переход Google к пониманию целей поиска также улучшает впечатления пользователя от чтения.

Сайты ориентированы на создание контента на естественном языке с использованием терминов, понятных читателю.

При этом Google также борется с заполнением ключевых слов, практикой черных методов продвижения, которые нарушает политику поисковых систем. Поэтому пользователь только выигрывает!

Каково влияние BERT на поисковую выдачу?

Когда Google запустил BERT, было сказано, что обновление затронет около 10% поисковых запросов в США.

Как и каждое обновление алгоритма, объявление вызвало движение на рынке SEO, так как многие сайты опасались потерять позиции.

Однако, в отличие от обновлений, направленных на противодействие недобросовестным практикам, BERT не оштрафовал ни один сайт. Что он делает, так это улучшает соответствие между поиском пользователя и содержимым страницы.

Поэтому, если кто-то потерял позиции по тому или иному ключевому слову, значит, оно не принесло хорошего ответа на этот запрос.

С другой стороны, если страница подходит для Google, она, вероятно, была лучше согласована с другим запросом и смогла улучшить качество своего трафика, что повысило вероятность того, что посетителям понравится контент.

Google показал пример (см. ниже), объясняющий изменения, которые BERT вызывает в поисковой выдаче. На изображении ниже вы можете увидеть, как поиск выглядит до и после BERT.



Ключевое слово: «Путешествующему из Бразилии в США в 2019 году нужна виза». BERT понимает намерение пользователя узнать, нужна ли бразильским путешественникам виза для въезда в Соединенные Штаты.

Однако до обновления Google понял, что поиск был для информации о туристических визах США в Бразилию.

Большая разница в одной детали: слово «to», которое указывает направление поездки (из Бразилии в США).

До BERT это слово игнорировалось ботами, и выдавало поисковику неправильные результаты. Теперь все слова анализируются в их контексте. В этом случае предлог изменяет весь смысл фразы.

В объявлении BERT Google также сказал, что обновление повлияет на избранные фрагменты, которые представляют собой выделенные разделы, которые появляются в «нулевой позиции» поисковой выдачи.

Google начал выбирать наиболее релевантные сниппеты для поиска. Таким образом, еще раз, те, кто потерял избранные фрагменты, не были оштрафованы – они просто не предоставили лучший быстрый ответ на то, что искал пользователь. Ниже вы можете увидеть еще один пример, который приводит Google в своих объяснениях работы этого фильтра.



В поиске «парковка на холме без бордюра» искатель будет уделять гораздо больше внимания словам «парковка», «на склоне холма» и «бордюр», и проигнорирует слово «без бордюра».

Таким образом, это принесло бы результаты, объясняющие, как парковаться на бордюре. BERT понимает, что пользователь хочет знать, как парковаться на пандусе без бордюра.

Контент и SEO: как оптимизировать для BERT?

Итак, перед лицом обновления, объявленного Google, и изменений в поисковой выдаче, что вы можете сделать, чтобы улучшить свои результаты SEO?

Что ж, правда, в том, что оптимизировать для BERT особо нечего.

Если вы искали советы по оптимизации в этом описании фильтра, возможно, эта фраза разочаровывает. Но вы должны понимать, что Google сделал это обновление именно для того, чтобы не оптимизировали страницы и контент для ботов. Но выдавали максимально полезный текст для пользователей.

Поисковая система хочет предложить пользователям ценный контент. И хочет рассчитывать на ваш сайт для этого.

Так что не оптимизируйте свой сайт для BERT – оптимизируйте для пользователей. Вот почему мы не даем советов по оптимизации, но хотим укрепить некоторые передовые методы создания контента, чтобы предложить вашим посетителям наилучшие ответы на их вопросы.


ПИШИ ПРАВИЛЬНО

И RankBrain, и BERT утверждают: контент должен делаться для людей, а не для ботов! Итак, забудьте о точном соответствии ключевых слов.

Вспомогательные, или стоп-слова, это такие слова как «в», «кому», «за», «от», «один» и т. д.

Если прежде вспомогательные слова в формулировки запроса пропускались, то теперь учитываются. Чтобы точно соответствовать поисковым запросам, многие люди по-прежнему, в запросах пропускают стоп-слова, пытаясь приблизиться к терминам, которые используют поисковики, и напрасно.

Это генерирует сверхоптимизированные тексты, например, для «велосипед, как выбрать», что, по крайней мере, создает странное впечатление от чтения.

Еще одно заблуждение – оптимизировать тексты с учетом орфографических ошибок, которые допускают пользователи. Так, вместо того, чтобы писать «адвокат», как было бы правильно, в тексте используется «адвАкат», так как многие люди могли бы так написать.

Google понимает ошибки пользователей, и выдаёт правильное написание. Но отрицательно относится к ошибкам на веб-страницах.

Помимо того, что ошибки на сайте, не помогает SEO, от ошибок сайт еще и теряет доверие!

Так что пишите естественно и на хорошем руссом языке (по мере возможность) о том, как выбрать велосипед и как нанять юриста. Не беспокойтесь о стоп-словах или орфографических ошибках. Google подсчитывает количество стоп-слов, и их в тексте должно бы в определенном количестве. Плохо если этих слов больше или меньше определенного процента для естественного текста.

Помните, что Google понимает естественный язык, поэтому вам не нужно (и не следует!) заставлять его точно соответствовать поисковым запросам пользователей.


ОПТИМИЗИРУЙТЕ ПОИСКОВЫЕ НАМЕРЕНИЯ

Хорошо, понятно, что точные ключевые слова больше не находятся в центре внимания SEO. Итак, чтобы контент отображался в результатах поиска пользователей, как его следует оптимизировать?

Вместо того, чтобы сосредотачиваться на ключевых словах, переключите внимание на поисковые намерения.

Если раньше вы фокусировались на оптимизации того, что ищет пользователь, теперь вам следует оптимизировать то, что пользователь хочет найти.

Вы видите разницу?

Секрет в том, чтобы понять намерения вашего покупателя, то есть, какие сомнения они хотят решить, и на которые может ответить ваш сайт.

Вы можете убедиться в этом, выполнив поиск, по ключевым словам, и контрольным показателям, определив поисковые тенденции в вашей области и возможности ранжирования. Исходя из восприятия общественных требований, производственная команда должна создавать высококачественный контент, отвечающий им.

Помните, что в определении места в поисковой выдаче только на первом этапе определяется фильтрами. На втором этапе всё решают посетители: нравится контент, его изучают, и не возвращаются в поиск, не нравится – быстро покидают веб-страницу, и продолжают поиск.


ПОИСК СМЫСЛОВЫХ ОТНОШЕНИЙ МЕЖДУ СЛОВАМИ

Возможно, там возникло еще одно сомнение: если точное соответствие уже не подходит для SEO, то поиск, по ключевым словам, все еще имеет смысл?

Конечно! Поиск, по ключевым словам, остается мощным инструментом планирования.

С его помощью вы можете понять, какие поисковые запросы ведут на ваш сайт, какие термины используют пользователи и какие темы находятся на подъеме в вашей области. Таким образом, можно спланировать руководящие принципы для удовлетворения этих поисков.

Разница в том, что вы больше не будете чрезмерно оптимизировать статьи блога с помощью этих точных терминов. Теперь вы можете определить основные условия поиска и найти слова, которые устанавливают с ними семантические отношения.

Синонимы, антонимы, сленг и совпадения являются частью семантического поля слова. Таким образом вместо того, чтобы повторять ключевое слово несколько раз, вы можете изучить эти варианты в своем тексте вместе с основными терминами.

Эта практика обогащает опыт чтения и помогает Google понять смысл ваших материалов.


СОЗДАВАЙТЕ КАЧЕСТВЕННЫЙ КОНТЕНТ

Эта ориентация кажется очевидной, но ее всегда полезно подкрепить. По сути, Google хочет, чтобы вы производили качественный контент для людей. Google BERT – одно из основных обновлений в этом смысле.

Так что не тратьте больше времени на размышления об оптимизации того или иного термина.

Помимо достижения целей поиска, посвятите себя созданию оригинального, обновленного, надежного и полезного контента для пользователей. Создавайте контент, который стоит прочитать и которым стоит поделиться.

Google советует, чтобы высококачественный контент имел высокий уровень EAT, то есть опыт, авторитет и доверие.

Таким образом, именно эти слова должны направлять вашу стратегию контент-маркетинга. Google будет знать, как распознать вашу работу.


ПРЕДЛАГАЙТЕ ЛУЧШИЙ ОПЫТ ЧТЕНИЯ

Наконец, всегда думайте об опыте чтения. Вы знаете эту книгу, от которой просто невозможно оторваться? Или та статья, которая обогащает вас таким большим количеством полезной информации?

Вдохновитесь ими!

Поймите, как строится это содержание, как оно рассказывает истории, и вовлекайте читателя. Конечно, вам придется адаптировать формат и язык для Интернета, например, с использованием ссылок и изображений.

Это то, что вы должны делать в своих текстах, чтобы заинтересовать аудиторию и заставить читателей вернуться. В SEO это взаимодействие посылает положительные сигналы в Google, говоря, что вы предлагаете хороший материал и заслуживаете высокого ранжирования.

Наконец, теперь вы знаете все подробности о Google BERT и влиянии этого обновления на вселенную SEO.

Вы видите, что Google не шутит, верно?

Самые передовые технологии искусственного интеллекта используются для улучшения работы поисковой системы как со стороны веб-сайта, так и со стороны пользователя. И, конечно же, инвестиции не остановятся на BERT.


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации