Текст книги "Поисковые алгоритмы ранжирования сайтов"
Автор книги: Анатолий Косарев
Жанр: Руководства, Справочники
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 2 (всего у книги 23 страниц) [доступный отрывок для чтения: 8 страниц]
Сейчас у людей преобладает клиповое мышление. Это значит, что люди слабо воспринимают информацию, на изучение сути которой уходит больше времени, чем на просмотр клипа.
А это значит, что тексты должны быть как СМС. Предложения должны быть простыми, не более 160 печатных знака, которые выражают суть.
Л. Толстовские предложения на пол страницы – не годятся. Считается, что лучше писать простыми предложениями по 6—8 слов, потому как если предложение длинное – читатель забудет о том, что говорилось в начале. Тем более если текст сложный в осмыслении.
Чес проще, тем лучше для любой аудитории.
Google для определения читаемости текста возможно пользуется индексом Фога и формулой Флеша.
Во всяком случае что-то подобное Google включил в свои фильтры.
Суть индекса и формулы – просты. Чем меньше слов в предложении, и чем короче слова, тем текст более читаемый, а значит такие статьи получают и больший рейтинг.
Это и понятно. Ведь трудно поверить, что человек, зашедший на веб страницу, не имеет проблем. Невероятно, что у него ни о чем не болит голова, к примеру, его жене, детям, тёще от него ничего не надо…
Сейчас любой заходит на страницу, чтобы по-быстрому получить нужную информацию, и использовать её.
Поисковые системы прекрасно понимают направленность сайта.
Для научного, информационного или сайта-магазина язык подачи информации различен.
Если сайт, к примеру, новостной, то там не должно быть длинных и сложных предложений. Должно быть больше действия, глаголов и минимум превосходной степени. Информация действия!
Если же это литературный сайт, то предложения могут быть длиннее, для простора творческих фантазий. Конечно, если сайт рассчитан на то, чтобы человек просто расслаблялся на нем.
Так SEO оптимизация из набора ключевых фраз превращается в более сложную систему продвижения сайта. А LSI-копирайтинг помогает создавать более приемлемые тексты для читателей, и максимально релевантные для поисковых систем.
Авторитетный контент
Это
e. Что цитируют на других сайтах и в соц. сети.
f. LSI-объекты: сертификаты, галереи работ.
g. Возраст сайта, и другие сигналы, о которых будет рассказано далее.
h. Сертификация безопасности: сертификат SSL.
Продолжу, и укажу на некоторые значительные признаки авторитетности, которые определяются различными фильтрами.
Например, если пользователь ищет характеристики некоторого бренда, то большее доверие вызовет описание с официального сайта, чем с сайта некоторой ремонтной мастерской, а тем более с домашней странички какого-то Васи. Если же Вася захочет по некотором запросу обойти сайт Apple, то это невозможно – никакой ссылочной массы сайту Васи не хватит, чтобы превзойти всемирный бренд.
Наличие политики конфиденциальности указывает Google, что владелец веб-сайта заботится о соблюдении законов и обеспечении безопасности своего веб-сайта.
Контактная информация – ещё один сигнал, который повышает авторитет сайта. А лично вы к какому сайту испытывает большее доверие, на котором один телефон, или возможность связаться с разными людьми по разным номерам. Это говорит о том, что предприятие большое, и может себе позволить, чтобы разные люди отвечали на вопросы по разным темам.
Наличие адреса компании, её филиалов тоже увеличивает авторитет сайта.
Маленькие виджеты из социальных сетей, таких как VK или OK, с фотографиями людей, которым понравился этот конкретный сайт.
Авторитетный веб-сайт – действующий сайт, а это определяется по
· обновлениям, и новостям;
· активности в социальных сетях;
· текущий год в авторском праве.
Если сайт авторитетный, то на него ссылаются другие сайты. Чем выше авторитет ссылаемого сайта, тем выше авторитет сайта, на который ссылаются. Кроме этого, учитывается и схожесть тематики. Авторитета не добавит даже самый крутой сайт рецептов сайту по ремонту компьютеров.
Материал, публикуемый на сайте, должен быть актуальным, убеждать фактами и ссылками, на сайты подтверждающие эти факты.
Пользовательская проверка
После этой предварительной (для Google оценки) наступает пользовательская проверка.
Если посетитель зашел на страницу, пробыл там время необходимое для изучения, изложенного материала, то к рейтингу страницы по этому запросу добавляется дополнительный вес. Если пользователь после изучения страницы не вернулся обратно в поиск, то для Google – эта страница идеально отвечает на запрос. Чем больший процент пользователей не возвращается в поиск, тем ценнее эта страница при ответе на такой запрос пользователей. Google знает, что нет ничего совершенного, поэтому устраивает некоторую ротацию, и посмотреть на реакцию пользователей при изучении других сайтов. Кроме этого, есть и дополнительные фильтры, такие как Hummingbird (Колибри), Pigeon (Голубь), и другие, которые помогают молодым и перспективным сайта оказаться в верхней части первой страницы поиска.
Сейчас ещё в тренде покупать ссылки. Чем вsit ранжируется сайт, тем больше считается вес ссылки. Но это только первое время. Далее Google учитывает ценность этой ссылки количеством пользовательских переходов. Сколько должно быть переходов по ссылке, чтобы считать её качественной, очевидно рассчитывается как CTR (количество переходов по ссылки к количеству показов страницы). Очевидно, учитывается популярность страницы из расчета популярности запроса.
Конечно, ещё алгоритмы далеки от совершенства, и бывает, что Google выдает не понятный результат.
Посмотрите на пример, из которого видно, что Google определил, что в этом запросе для него главное купить в Риге, а не сам товар. Google понял, что ищется, зарядка (блок питания) для ноутбука, но почему-то проигнорировал марку и / или параметры. Заметьте, что Google СЕМЬ раз вывел один и тот же сайт, и ни разу именно ту зарядку, которую я тестировал в поиске, а она есть на сайте.
Этот пример говорит о том, что ещё не всё в алгоритмах идеально, и не более того. Google непрерывно работает над усовершенствованием ранжирования, и уже через пару недель ошибка была исправлена.
И хотя я работал над этим сайтом, когда остался один снипет из 7, но тот, который будет отсылать на нужный блок питания, я как оптимизатор доволен, потому что если пользователь ищет зарядку с определенными параметрами, то он не будет переходить на те зарядки, которые ему не нужны.
Другой пример. Обратилась к нам небольшая фирма с просьбой продвинуть их сайт. Бюджет на продвижение у них был весьма ограничен, и мы предложили им для начала на каждой странице проставить Meta Keywords, чтобы знать какую страницу оптимизировать под какую ключевую фразу. Page Title и Meta Description у них уже были прописаны.
Представляете, этого было достаточно, чтобы их сайт через некоторое время оказался в первой десятке. Да все ключевые фразы были низкочастотные, и конкуренция в их отрасли маленькая.
И всё же ключевые слова, на которые Google объявил много лет назад больше не учитываются, оказалось были учтены. Возможно, что ключевые слова не учитываются для определения направленности веб-страницы, но, очевидно влияют на качество и авторитет страницы, ведь тег Meta Keywords никто не отменял, и правила хорошего тона желают, чтобы этот тег был заполнен.
К слову сказать, что мы всегда прописываем ключевые слова для себя, чтобы видеть под какие запросы оптимизировалась страница.
Но вернёмся к идеологии идеального поиска по мнению Google.
Проделаем мысленный эксперимент, представьте, что вы приглашаете к себе в гости людей на банкет.
Что им предложить, если вам дороги эти люди, и желаете показать, что вы заботитесь о них?
Во-первых, то, что они любят. Затем, чтобы продукты были свежими, вкусными и качественными. Если вы заботитесь об их здоровье, то продукты должны быть полезными, без содержания вредных веществ.
Так поступают гостеприимные хозяева.
Тоже самое и с сайтом. Приглашая зайти на сайт, нужно, чтобы предлагаемый материал был качественным и полезным.
Кроме этого, хозяева застолья позаботятся о том, чтобы обслуживающий персонал был авторитетным: еда была вкусно приготовленная и подавалась быстро. Гостей не принято заставлять ждать. Само собой тарелки должны быть чистыми, салфетки свежими, и будут соблюдены ещё тысяча мелочей.
Google формально описал, что должно быть на сайте, подобно нормам хорошего банкета, и с помощью своих фильтров по этим критериям определяет полезность, качественность и авторитетность сайта, и декларировал их в своем Руководстве.
А теперь представьте, что хозяин, который претендует на звание лучшего будет жульничать, обещать одно, а подавать другое, и из недоброкачественных продуктов на грязных тарелках…
Заметьте, что Google из миллионов предложений выбирает лучшее и поднимает их в выдаче. Разве и это не справедливо?
Мне не нравится распространенное слово «пессимизация», т.е. понижение в рейтинге. Мне кажется, что более объективно говорить о повышении в рейтинге хороших сайтов. Почему менее качественные сайты должны быть выше лучших? Многие оптимизаторы воют на весь интернет, когда какой-либо алгоритм «считает», что его сайт хуже других. Но разве алгоритм виноват, что конкурент сделал лучше.
ДА! Уходит время халявы, когда материал на сайте искусственно подстраивался под определенный алгоритм оставался в лидерах надолго. Алгоритмы совершенствуются все быстрее и быстрее. Поэтому становится выгоднее работать на перспективу, следуя Руководству Google, чем пользоваться ещё неучтенными фактами, чтобы получить минутное признание.
Но есть алгоритмы создания высоко ранжируемых сайтов, следуя инструкциям, которых, даже в конкурентных нишах возможно получить хороший результат.
Да не все Пушкины, Шекспиры и Рубенсы, и с этим нужно смериться. Не все способны пробежать стометровку меньше, чем за 12 секунд. Не все способны сделать что-то стоящее, и стать первыми, но многие хотят, поэтому выискиваются лазейки, придумываются уловки, а в результате, как всегда, страдает конечный потребитель.
Вот и получается, аналогичная ситуация: несколько человек приглашают вас на банкет. Google оценивает у кого банкет лучше, туда и направляет посетителей. Тот, кто лучше направляет, к тому и обращается конечный пользователь, поэтому Google заинтересованы в качественном поиске.
Чтобы понять, что значит для Google качественный контент нужно не забывать, что ПОИСК – это бизнес, а продуктом этого бизнеса является результат выдачи. Чем качественнее выдача, тем больше людей пользуются этим поисковиком, а это уже монетизированный продукт. Каждая ключевая фраза, введенная пользователем в строке поиска для Google – это вопрос, на который пользователь хочет найти ответ.
Первая цель поисковика понять какой вопрос был задан. Эта задача как известно из обрывков заявлений Google об организации поиска состоит из двух частей.
Это по этим или подобным запросам подобрать лучшие сайты, которые прежде удовлетворили пользователей. Заметьте, не накрученные сайты, а реальные.
Это и на основании прежних запросов этого пользователя понять, что же заданным вопросом (введенной ключевой фразой) пользователь желает узнать. Например, если прежде человек искал характеристики телевизоров и сравнивал их, а после этого набрал в поисковике «мониторы», то вероятнее всего он желает сравнивать теперь мониторы. Если же, Google заметил, что пользователь купил уже и телевизор, и другое в интернет-магазинах, то вероятнее всего имеет намерение купить монитор. Ни для кого не секрет, что Google отслеживает действия пользователя, знает о его намерениях не хуже, чем сам пользователь, и «подсовывает» ему не только рекламу, но и страницы в рамках пожеланий пользователя.
Для Google постоянный пользователь социальных сетей – это открытая книга. Можно представить какой мощностью обладает Google, если сейчас при приеме на работу работодатели стали обращаться к небольшим формочкам, которые собирают в социальных сетях всю открытую информацию, например с кем дружит, на кого подписан, что комментирует и репостит. Вторая цель – подобрать страницы и вывести их пользователю первыми, чтобы ознакомившись с первой же, посетитель получил ответ на свой вопрос. Согласитесь, что эта задача – искусственного интеллекта, и все больше напоминает разговор людей: один задает вопрос, а другой отвечает. Заметьте Google оценивает и ранжирует разные ответы на поставленный вопрос.
Резюме от Google
Google – имея миллиарды страниц с помощью алгоритмов научился определять какие веб-страницы отвечают на запросы пользователей, а какие имитируют свою полезность.
К наиболее распространенным способам имитации качества полезности и авторитетности Google относит следующие:
· Автоматически сгенерированное содержание:
o Текст, который бесполезен для читателей, но содержит ключевые слова, часто используемые в поиске.
o Текст, который переведен с помощью автоматического инструмента и опубликован без редактирования.
o Текст, созданный с помощью автоматических средств, например, цепей Маркова.
o Текст, созданный автоматически с помощью методов подбора синонимов.
o Текст, сформированный путем копирования контента из фидов Atom/RSS или результатов поиска.
o Контент, скопированный с различных веб-страниц без добавления уникальной информации.
· Участие в схемах обмена ссылками, например,
o Покупка или продажа ссылок, которые учитываются в системе PageRank. К этой категории относится выплата денег за размещение ссылок или сообщений, содержащих ссылки, предоставление товаров или услуг в обмен на публикацию ссылок, а также раздача «бесплатных» товаров с условием размещения отзывов о них со ссылками.
o Чрезмерный обмен ссылками («Сошлись на меня, а я сошлюсь на тебя») и партнерские страницы, служащие исключительно для перекрестного обмена ссылками.
o Масштабная реклама с помощью статей или комментариев с текстовыми ссылками, насыщенными ключевыми словами.
o Использование программ или сервисов для автоматизированного создания ссылок на сайт.
o Требование разместить ту или иную ссылку в соответствии с условиями использования или другим соглашением, если при этом владельцу контента со стороннего ресурса не предоставляется возможность заблокировать PageRank доступ к своей странице, например, с помощью директивы nofollow.
· Публикация страниц с некачественным или скопированным контентом, например,
o автоматически созданное содержание;
o бесполезные партнерские страницы;
o плагиат, например, скопированное содержание или некачественные публикации в блоге;
· Маскировка, например,
o Предоставление поисковым системам страницы с HTML-текстом, а пользователям – страницы с картинками или Flash.
o Добавление на страницу текста или ключевых слов только в ответ на запрос этой страницы агентом пользователя, связанным с поисковой системой.
· Скрытая переадресация, например,
o Поисковый сканер анализирует одну страницу, а пользователям показывается совершенно другая.
o Пользователи компьютеров видят обычную страницу, в то время как пользователи смартфонов перенаправляются хакерами на совершенно другой домен.
· Скрытый текст и скрытые ссылки, например,
o Использовать текст белого цвета на белом фоне
o Поместить изображение поверх текста
o Поместить текст за пределами экрана с помощью CSS
o Установить для размера шрифта значение 0
o Скрыть ссылку, используя в качестве текста ссылки один незаметный символ (например, дефис в середине абзаца)
· Дорвеи, например,
o Несколько доменных имен или страниц с таргетингом на отдельные регионы или города для переадресации пользователей на одну и ту же страницу.
o Страницы, единственной целью которых является перенаправление пользователей в определенный раздел сайта.
o Практически одинаковые страницы, которые скорее соответствуют возможным результатам поиска, чем выстроены в четкую иерархию.
· Скопированное содержание, например,
o Сайты, размещающие контент из других источников без дополнительной обработки.
o Сайты, на которых публикуется скопированное содержание с незначительными изменениями (например, слова заменены синонимами или используются автоматические методы обработки).
o Сайты, транслирующие с других ресурсов фиды, без собственных функций для работы с ними.
o Сайты, содержащие только встраиваемый контент, например, видео, изображения и прочие мультимедийные материалы, с других сайтов без дополнительной значимой информации.
· Участие в партнерских программах, если вы не создаете контент самостоятельно, например,
o Страницы со ссылками на товары, на которых размещены только описания и отзывы, скопированные с сайта продавца, и отсутствует какой-либо уникальный контент.
o Бесполезные страницы, которые содержат преимущественно материалы из других ресурсов и минимум оригинального контента.
· Загрузка страниц с нерелевантными ключевыми словами, например,
o Список телефонных номеров без дополнительной информации
o Текстовые блоки с перечнем городов и областей, по запросам которых веб-мастер пытается повысить рейтинг страницы
o Многократное повторение слова или фразы, из-за чего текст не воспринимается как естественный.
· Создание вредоносных страниц для фишинга и установки вирусов, троянов или другого нежелательного ПО, например,
o Манипулирование контентом таким образом, что при нажатии пользователем на конкретную ссылку или кнопку фактически происходит нажатие на другой элемент страницы.
o Внедрение на страницы новых объявлений или всплывающих окон, или замена существующих объявлений другими, а также реклама или установка программного обеспечения, которое выполняет эти действия.
o Добавление нежелательных файлов при загрузке содержания, запрошенного пользователем.
o Установка вредоносного ПО, троянских программ, шпионского ПО, рекламы или вирусов на компьютер пользователя.
o Изменение домашней страницы в браузере или настроек поиска без ведома и согласия пользователя.
· Некорректное использование разметки для расширенных описаний веб-страниц.
· Автоматические запросы в Google.
Заметьте, что начинающему вэб-мастеру нужно неистово «стараться» для того, чтобы его сайт попал под бан поисковой системы.
Google редко применяет репрессивные меры, исключая из индекса сайты, ограничиваясь пессимизацией – искусственным понижением в позиции поисковой выдачи.
Для этого специалисты интернет гиганта предусмотрели несколько основных алгоритмов.
Фильтры
Если человек на машине, нарушает правила дорожного движения, мешает другому транспорту, создавая опасную ситуацию на дороге, то это считается очень плохо. Если такого нарушителя останавливает полиция, штрафует его, ставя нарушителя тем самым на место, то это считается нормой.
Если же Google ставит нарушителя правил на место, то это почему-то называется пессимизацией. Мне кажется, что все-таки более правильно называть действия Google определение более точного положения сайта в рейтинге.
Реально Google редко кого штрафует, и это происходит после ручной проверки. Понижение же в рейтинге – это усовершенствование алгоритма, который прежде не точно оцени истинное значение сайта.
Есть и искусственное понижение, настоящая пессимизация, когда Google не доверяет ещё не известному, или мало известному сайту, что в общем-то похоже на поведение человека, который вступает в общение с незнакомцем.
1 – Domain Name Age (возраст доменного имени)
Представьте, что к вам на улице подходит незнакомый человек, и начинает вам что-то рассказывать. Поверите ли вы ему? Уверен, что нет! Но в сети верят, потому что соприкосновение идет постоянно с сотнями неизвестных пользователю сайтов. Если культура поведения в быту диктует одни нормы поведения, то в сети бдительность утрачивается. Появляются сайты, которые направлены, чтобы обмануть человека.
Google пытается защитить доверчивых пользователей, и берет на себя некоторую ответственность, не доверяя молодым сайтам и понижает их рейтинг.
Google имеет доступ к регистрационным данным всех доменов, знает когда появился сайт, и как любой человек не доверяет новичкам. Сайт должен сначала зарекомендовать себя. Так Google борется с сайтами однодневками, которые приходят в сеть не с целью донести полезную информацию, или продать достойный товар конечному пользователю.
Первым фильтром, под который попадают все новые сайты, точнее доменные имена – это «Возраст доменного имени» (Domain Name Age). Этим фильтром Google ПЕРЕСТРАХОВЫВАЕТСЯ, и в течение года следит за новым сайтом.
Незначительно можно сократить действие этого фильтра, если покупать доменное имя не на год, а на пять лет. Это для Google хороший сигнал, что сайт не однодневка.
По оценкам разных компаний в 2018 году ежедневно создавалось от миллиона до полутора миллионов сайтов. И как показывает практика более 80% из них исчезают в течении первого же года. Ещё 10—15% из них не имеют развития.
В эти 95% сайтов входят:
· спамерские сайты, которые создаются для увеличения рейтинга основного сайта;
· мошеннические сайты, которые под благовидными предлогами выманивают деньги у пользователей;
· фишинг сайты;
· другие вредные, или бесполезные для пользователя сайты;
· сайты начинающих веб-мастеров, которые не приносят результат и закрываются через год по окончанию срока действия домена.
Именно поэтому Google, и не присваивает сайту на молодом домене высокий ранг. Соответственно и статьи на сайте, как ответы на вопросы пользователей имеют понижающий коэффициент рейтинга.
Покупка существующего несколько лет доменного имени увеличит вес веб-сайта и страниц при соблюдении определенных Google (м) формальностей.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?