Текст книги "Поисковые алгоритмы ранжирования сайтов"
Автор книги: Анатолий Косарев
Жанр: Руководства, Справочники
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 1 (всего у книги 23 страниц) [доступный отрывок для чтения: 8 страниц]
Поисковые алгоритмы ранжирования сайтов
Анатолий Косарев
© Анатолий Косарев, 2024
ISBN 978-5-0056-8998-6
Создано в интеллектуальной издательской системе Ridero
Введение
Представьте, что Google создал свою вселенную. В этой вселенной много стран, городов, и мелких населенных пунктов – это сайты. Как и в любом цивилизованном обществе Google придумал как систематизировать, чтобы жители-пользователи могли в этой вселенной находить нужные им уголки, и совершать желаемые действия: покупать, получать информацию, развлекаться.
Google установил закон, по которому ранжирует сайты, когда что-то ищется пользователем.
Но, как и в любом цивилизованном обществе кроме честных граждан есть и те, которые нарушают установленный закон.
Нужна полиция, которая штрафует нарушителей, и создает благоприятные условия для честных.
Эту полицию принято называть фильтрами, или алгоритмами, по которым и происходит определение качества сайтов и дальнейшее их ранжирование по запросам пользователей.
Сейчас мало создать сайт и наполнить его информацией, сейчас нужно подготовить сайт в 2-х направлениях.
1. Распределить информацию в соответствии с законом (руководствами) Google.
2. Подготовить такой контент (материал), который будет полезен конечному потребителю.
Причем последнему Google неустанно учит оптимизаторов сайтов, как и что должен иметь сайт, чтобы последний понравился пользователям, и получил высокое место в результатах поиска.
Существует три вида SEO оптимизации.
1. Чёрные методы.
Ими пользуются начинающие сеошники, которые ещё не понимают принципов ранжирования, и не знакомы с законом Google. К чёрным методам относятся нарушения, которые Google описал в своих руководствах, и находя их:
· Пессимизирует (понижение позиции сайта в выдаче поисковой системы искусственное снижение релевантности запросу).
· Штрафует см. фильтр «Unnatural Links».
· Удаляет из своего индекса, что случается чрезвычайно редко, и то только с теми сайтами, которые умышленно занимаются обманом, распространяют вредоносное программное обеспечение, и нечестными заработками.
Черная оптимизация делается быстро, не дорого, она не долговечна. Полиция (фильтры) Google их быстро находят, а хозяева таких сайтов несут прямые и косвенные убытки.
2. Серые методы. Включают в себя трудно фиксируемые нарушения, которые чаще всего исходят от фильтров Panda, Penguin, Phantom, и других фильтрах, о которых будем говорить в этой книге.
Серые методы требуют наибольший подготовки, потому что нужно четко представлять,
a. что и в какой мере нарушаешь, чтобы безболезненно обойти. Обычно нарушается то, что по закону не положено делать, но фильтры ещё не научились выявлять эти нарушения. Именно эти нарушители и больше всех шумят, когда их сайты теряют свои высокие позиции.
b. Это самые высокооплачиваемые специалисты экстра-класса, которые как отличные адвокаты выискивают что ещё не запрещено делать, разрабатывают системы, и внедряют их. Например, продажа ссылок – распространённое явление, которое отлично поднимает рейтинг сайта, но доказать, что ссылка куплена – достаточно сложно. Например, гостевые посты на момент написания книги Google приветствовал. Но как доказать, что пост был куплен?
3. Белые методы продвижения сайтов
заключаются в том, чтобы не нарушать закон Google, и делать всё по им установленным правилам. Для сайтов, не нарушающих закон фильтры – это не жандармы, которые рубят все подряд, а добрые полицейские, которые удаляют (пессимизируют) сайты нарушители. Кроме этого Google занимается исследованием поведенческих факторов, и делится своими исследованиями с SEO-специалистами, показывая, как нужно делать, чтобы не только высоко позиционироваться в результатах ответов на запросы пользователей, но и после перехода на сайт посетитель получал максимальное удовлетворение, и совершал желаемое действие.
В большинстве случаем Google не объясняет почему нужно делать так, а не иначе, но выполняющие рекомендации получает преимущество перед другими видами SEO-продвижения. Поясню на одном известном исследовании, направленном на то, как «заставить» человека выбирать желаемое продавцу. В США популярно в кинотеатре перед просмотром фильма покупать попкорн.
Простой эксперимент. Продается попкорн в двух бумажных стаканчиках. Один стаканчик маленький – стоит $4, другой большой – стоит $7. Подавляющее количество посетителей покупали маленький стаканчик. Вторая часть эксперимента. К этим двум стаканчикам добавили третий, средний по размеру по цене $6. И посетители стали покупать большой стаканчик многократно чаще. Средний редко кто брал, иногда брали маленький. Объяснение было простое: «Выгоднее брать большой стакан, чем средний!» Маленький и большой стаканчики остались без изменения, появился только средний стаканчик, который почти никто не брал. Но он (стаканчик) поменял что-то в мышлении. Так и Google в своих руководствах учит нас делать так, чтобы посетитель делал нужный выбор. Одна из частей этого магнетического воздействия на посетителя качественный и полезный контент. Для Google качественный и полезный контент фундаментальные и разные понятия, о который описывается в фильтре Panda.
Google в своих ответах выдачи преследует только одну цель – первым же результатом поиска выдать сайт, который максимально ответит на запрос (ключевую фразу) пользователя. Идеальным считается ответ, если пользователь не вернулся в поисковик, чтобы продолжать поиск ответа на свой вопрос.
Для решения этой задачи требуется:
· понять, чего ищет пользователь – это часть работы фильтров: Possum, Pigeon, Hummingbird;
· среди миллиардов сайтов подобрать лучшие, т.е. выстроить сайты в ответе на запрос пользователя в убывающим порядке – это работа других фильтров.
Есть и большая группа алгоритмов, включенных в Hummingbird, которые развивают идею безкликового поиска. Это когда пользователь в строке поиска Google ввел некоторый вопрос, и в результатах поиска на первом же экране получил ответ на свой вопрос.
Как не вступая в противоречия с руководством Google, и понимая работу фильтров выводить сайт в лидеры посвящена эта книга.
Качественный, полезный и авторитетный контент
Перед тем как начать рассматривать фильтры желательно понимать их основную цель, чтобы правильно оценивать их работу, и пользоваться их благами.
Итак, начнем.
Google стремится к тому, чтобы в результатах поиска первую позицию всегда занимал лучший ответ, а далее по убыванию остальные, которые более-менее соответствуют запросу пользователей.
Для решения этой задачи фундаментом всего поиска Google приняты три кита, на основании которых и строятся все фильтры, или алгоритмы по результатам работы, которых выстраиваются сайты в результатах поиска пользователей на их запросы.
Эти три кита следующие.
Качественный контент
a. оригинальные тексты (копии и рера́йтинг это не качественный контент) и оригинальные изображения (сделанные самостоятельно);
b. тексты без орфографических, синтаксических и других ошибок;
c. хорошо структурированный текст;
d. LSI-терминология см. в следующей главе, и достаточный объем.
Кроме перечисленных пунктов качественного контента к его качеству относится длинна предложения и слов с учетом образованности аудитории, которой предназначается текст. Например, если магазин продает товары, рассчитанные на блондинок (по жизни, а не по способностям), то предложения должны быть короткими, со словами, которые употребляет именно это группа людей. Если же текст рассчитан на людей с высшим образованием, то и предложения, и тексты должны быть более длинными.
Google считает, что текст на сайте должен быть информативен. Большое количество не информативных слов (в, на, весьма, вполне) – понижает вес страницы. У каждого поисковика свой набор не информативных слов и фраз, которые, как и Google они держат в секрете. Эти слова и фразы называют стоп-словами, или шумовыми.
По мнению Google стоп-слова не несут информацию, и раздражают читателя. Но все же небольшое количество для связки должно быть. Мы не говорим, например, «перелез забор», но говорим «перелез через забор».
Чтобы было проще понять смысл слов, которые понижают рейтинг поясню на примере. Девочки, которые прошли курсы по копирайтингу, получают деньги за свою работу из расчета количества напечатанных знаков. У них расчёт простой чем больше, знаков в тексте тем больше они получат. Имея набор ключевых фраз, они умудряются вплетать массу бессмысленного текста.
Например: «Наша быстро развивающаяся компания молодых специалистов с большим опытом работы…». Какая информация, полезная в этой фразе?
Смотрите: «быстро развивающаяся» – ничего не говорящая фраза, читатель видит стандартный штамп, как на других сайтах, и сразу пропускает эту информацию. Нет информации.
Лучше написать: «В прошлом году мы обслужили 150 человек, а в этом 200!». Но эти цифры ничем не подкреплены. Но что значит обслужили? Пришел к ним человек, они ответили на его вопрос, и тот ушел. Можно считать, что они его обслужили. В добавок как проверить? Да в таком варианте есть информация, но как её проверить?
Убедительнее звучит: «В прошлом году мы заплатили 10 000 € налогов, а в этом – 14тыс.». Такая фраза внушает доверие, потому что её можно проверить.
Еще один плюс последний фразы – мы не говорим, что фирма развивается быстро, мы предоставляем возможность читателю самостоятельно сделать вывод, что фирма развивается быстро. Ведь могут оказаться люди, для которых увеличение прибыли на 40% за год не такой уж хороший результат.
Такой вариант, не навязанное мнение для каждого человека – самое ценное его собственное заключение. Более убедительным будет скриншот оплаты налогов за прошлый и текущий год, сделанный с официального сайта, с соответствующей подписью к скриншоту.
Далее «молодых». Вместо молодых лучше написать конкретно: «Возраст работников от 25 до 30 лет». Плюс за мой вариант – для 18—20 летнего заказчика 30 лет – это зрелый возраст. Для 50-ти летнего – это пацаны. Цифры вместо прилагательных для посетителя звучат убедительнее, а значит и полезнее. И Google воспринимает цифры более весомым фактором.
Идеально будет показать фотографии работников, с кратким описанием, возраста, образованием, стажем работы, и дугой информацией, чтобы каждый мог выносить свое суждение.
Фотографии с подписями для Google тоже положительный сигнал, что информация подается разнообразно, ведь мы любим разнообразие.
«Специалистов» – требуется доказать, что работники действительно специалисты. Например, закончил такой-то университет, стажировался там-то. Google уже имеет большой набор штампов, пустых фраз, которые не несут информации? Но снижают вес веб-страницы.
И последнее явное противоречие: «с большим опытом работы». Как у молодого специалиста может быть большой опыт работы?
Специалисты Google утверждают, что они отслеживают достоверность информации, и заметив неправду пессимизируют такие страницы. В качестве примера приводится такая фраза: «Колумб родился в Австралии» как явная ложь. Не берусь утверждать Google уже отлавливает фразы типа «молодых специалистов с большим опытом работы», но уверен, что и такие фразы будут попадать в их черный список.
Наше мировосприятиеустроено так, что если мы видим хоть одно противоречие, уход от четкого ответа, то в нас возникает недоверие ко всему сказанному. Google это знает и снижает вес веб-страниц, которые имеют такие фразы.
Сейчас мы разобрали один небольшой пример, как пример бесполезного текста. Разбирать же все ограничения, которыми пользуется Google нет смысла. Лучше довериться его Руководству, чтобы понять за что может быть наказан сайт. Повторюсь, что не на все уловки Google уже реагирует, но те, кто желает делать качественный, полезный и авторитетный сайт должны уже сегодня стараться избегать запреты, декларированные поисковиком.
Google не любит клише и штампы. Не любит прилагательные, местоимения, наречия, причастные и другие обороты. И наоборот, чем больше существительных и глаголов действия и состояния, числительных тем лучше.
Вспомните А. С. Пушкина
«Буря мглою небо кроет, Вихри снежные крутя; То, как зверь, она завоет, То заплачет, как дитя, То по кровле обветшалой Вдруг соломой зашумит, То, как путник запоздалый, К нам в окошко застучит.»
Посчитайте сколько здесь существительных и глаголов, а сколько прилагательных, и других частей речи.
Уверен, что у многих тексты на сайтах менее качественные по мнению Google.
Полезный контент
это:
· ответы на задранные вопросы (на фразы, которые набирает пользователь) поисковику;
· что комментируют, ставят лайки;
· пишут отзывы.
Полезный контент – это не просто статья на сайте, в блоге, или интернет-магазине, – это ценная информация, которой автор желает поделиться с другими людьми. Ценная информация – это то, что автор отправляет поисковикам, чтобы те помогли поделиться её с другими пользователями.
Так что по мнению Google качественный контент —
· Это то, чем можно поделиться.
· Это реальные ответы пользователю на задранные вопросы поисковику.
· Это то, что люди обсуждают в сети, на работе, в кругу друзей или дома.
· Это то, что цитируют.
Поэтому Google уделяет внимание сколько ссылок сделано на веб-страницу, сколько раз процитировали. Возможно, что, сдирая фрагменты текста с других сайтов Google добавляет вес сайту донору. Но уж точно не увеличивает вес, где замечен плагиат. Однако если фрагмент текста берется в кавычки, и пишется откуда взята цитата, то Google считает, что тема глубоко изучена, а поэтому статья полезная. Конечно, если цитата из авторитетного сайта.
LSI – скрытое (латентное) семантическое индексирование. Методика, разрабатываемая Google, и др. поисковыми системами. Цель – улучшение понимания содержания страниц сайта для более точной сортировки и выдачи соответствующего запросу пользователя.
Если прежде было достаточно ключевую фразу повторить несколько раз на странице сайта, чтобы войти в ТОП 10 при выдаче, то сейчас поисковики считают такое повторение фразы поисковым спамом, и за это понижают рейтинг сайта. Если же поисковый СПАМ – на множестве страниц, то поисковик может исключить этот сайт из поиска.
Сейчас Google проводит семантический анализ страниц сайта, и на основании результатов их ранжировать.
Факторов, влияющих на скрытое семантическое индексирование много, но остановимся на 5-ти наиболее значимых.
1. Направленность сайтаПоисковые машины разделяют сайты по запросам пользователей.
Грубо все сайты делятся на 3 категории.
· У пользователя есть информационные намерение? Информационное намерение – это когда человек ищет информацию по теме. Например, «что такое LSI копирайтинг». Отчасти для таких запросов был создан фильтр Hummingbird.
· Имеют ли человек навигационные цели? Навигационное намерение заключается в том, что поисковик ищет конкретную марку (автомобиля, телевизора, др.), веб-сайт, бизнес или продукт, используя поиск.
· У ищущего есть транзакционные намерения? Транзакционные намерения – это когда человек ищет что-то, потому что хочет это купить. Если предполагаемая покупка не предполагает длительной перевозки, например, пиццы, дивана, садового домика, или покупка услуги, то это геозависимые запросы, то в работу вступают такие фильтры как Pigeon и др. Обо всех пойдет речи далее.
Исходя из намерений страница должна иметь кроме текста и дополнительные атрибуты.
Например, информационный сайт должен иметь поиск, навигацию по разделам, категориям, статьям, чтобы пользователь мог за пару кликов перейти от одного нужного материала к другому. А также комментарии к статьям, и многое другое. Чем больше атрибутов, соответствующих типу сайта, тем сайт имеет больший вес.
Интернет-магазин должен иметь кнопку купить, корзину, цену, описание товара, отзывы на товар, доступную ссылку на доставку. Трудно будет интернет-магазину выбиться в лидеры, если он не имеет всех дополнительных атрибутов, которые есть у лидеров этого запроса.
Например, интернет-магазин, лидер выдачи имеют всё необходимое по требованиям Google. Чтобы иметь шансы обойти лидера другому магазину, нужно иметь все эти же атрибуты, плюс добавить свою изюминку. Если у сайта лидера в магазине нет видео, то новому сайту можно добавить видео-демонстрацию товара. Конечно, у сайта лидера могут быть высокими и другие показатели, но с изюминкой у новичка появляется шанс.
Кроме оценки всего сайта на направленность, и с наличием необходимых атрибутов важную роль играет LSI копирайтинг страниц сайта.
2. СловосочетанияЕсли Вы в Гугл наберёте слово «Кухня», то Google не поймет, что нужно, и выдаст всего понемногу, по разным темам.
· Кухня смотреть.
· Кухни стран мира.
· Дизайн кухни.
· Кухонная мебель.
· И много другого.
Но если написать «Кухни смотреть», то поисковик поймет, что человек хочет посмотреть сериал, и ему будут выбраны сайты, на которых можно смотреть сериал.
Если же написать «Кухонная мебель», то будут ранжироваться сайты по этой тематике. Стоит добавить слово купить, и поисковик поймет, что человеку нужен интернет-магазин. Причем Google понимает, что по такому запросу нужно выбрать близлежащие магазины, а не магазины из которых доставка будет стоить дороже мебели.
Но это начало. Для поисковика если появилось слово «мебель», и статья посвящена этой теме, то дополнительно Гугл ищет и другие слова, которые часто употребляются со словом «мебель». Например, фото, гарнитура, дерево, стол, стул, и др.
Слову «концерт» сопутствуют слова: билеты, места, аншлаг, премьера, выступление. Если прежде для SEO было достаточно написать на странице слово «Концерт» несколько раз, и выбиться в лидеры, то теперь оценивается полезность по сопутствующим словам.
По технологии скрытого семантического индексирования, если слову «концерт», не будет найдено сопутствующих слов, то такая страница будет расценена как СПАМ. А под такой фильтр уже попало много сайтов.
Сравнивая несколько статей с разных сайтов Гугл позиционирует выше ту статью, в которой было употреблено больше сопутствующих слов. Чем больше сопутствующих слов в статье, тем Google считает тема раскрыта лучше, тем присваивается выше рейтинг статьи. Также учитывается и количество запросов по сопутствующим словам.
3. LSI-компонентыКаждая веб-сайт должен иметь соответствующие дополнительные компоненты.
Например, если сайт некоторого доктора, то желательна форма для записи на прием, карта как добраться, сертификаты, и многое другое. Собрать сопутствующие компоненты можно посмотрев на первый десяток сайтов в поисковой выдаче, по соответствующим ключевым фразам. Если дополнительных компонентов на сайте будет недостаточно, то будет трудно рассчитывать па высокие места.
4. СинонимыПовторение одной и той же фразы много раз на странице сейчас понижает релевантность. Поисковики считают, что такой текст плохо читается, а поэтому не интересен. Теперь пришло время синонимов – слова различные по звучанию, но совпадающие по значению.
Например, синонимы слова «дом»: здание, дворец, изба, хата, хижина, землянка, лачуга, мазанка, палата, хоромы, терем, чертог, усадьба, дача, вилла, загородный дом. Барак, балаган, беседка, будка, караулка, кибитка, куща, намет, палатка, сторожка, шалаш, чум, шатер, юрта.
Чем больше синонимов расстановлено в тексте, тем выше рейтинг статьи.
Синонимы можно брать из словарей синонимов, но латентное семантическое индексирование опирается опять-таки на запросы пользователей, именно на те синонимы, которыми наиболее часто пользуются люди.
Например, синонимами слову «обучение» являются: Подготовка, Образование, Бизнес-обучение, Учеба, Преподавание, и еще несколько десятков.
Задача LSI копирайтера в том, чтобы выбрать самые популярные, и равномерно их расставить по тексту.
5. Стоп-слова или шумовые словаПрежде к стоп-словам относились союзы, предлоги, причастия, и др. Они считались не информационными, и не учитывались.
Теперь палитра стоп-слов заметно расширилась. К ним добавились некоторые прилагательные (если это информационная статья) и ряд «крылатых» выражений, например, «добро пожаловать на наш сайт», или «индивидуальный подход к каждому клиенту».
Поэтому не стоит писать подобные фразы: «У нас работают профессионалы с большим опытом работы». Это уже бесит не только читателей, но и поисковики.
Пользователь на эту фразу сразу же дает 2-а возражения.
· А у кого работают не профессионалы? И
· А у кого работают профессионалы без опыта?
Да и вообще разве есть профи без опыта?
Для поисковика же эта фраза – поисковый СПАМ.
Чем больше на странице шумовых слов и фраз, тем менее информативна статья. Тем ниже её рейтинг.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?