Автор книги: Александр Загуменов
Жанр: Интернет, Компьютеры
сообщить о неприемлемом содержимом
Текущая страница: 6 (всего у книги 25 страниц) [доступный отрывок для чтения: 8 страниц]
Пополнение базы ресурсов Апорта происходит двумя путями.
Во-первых, при индексировании новых страниц проверяются все имеющиеся там ссылки; те, которые отвечают определенным требованиям, добавляются в базу ресурсов. В основном, конечно же, проверяется принадлежность к России и странам ближнего зарубежья. Ресурсы других доменов могут быть добавлены только вручную.
Во-вторых, любой пользователь может добавить ресурс вручную на странице, которая доступна по ссылке Добавить URL (http://www.aport.ru/addurl.php) почти с любой страницы Апорта. При указании ресурса вручную проверяется его наличие и корректность. Сразу после нажатия кнопки Добавить Апорт пытается получить корневую страницу ресурса и определяет, является ли страница русскоязычной. При этом простого использования кириллицы недостаточно: Апорт ищет закрепленные в языке русские слова. Если оба условия выполнены, то ресурс добавляется в базу и будет проиндексирован.
Прибегать к помощи страницы Добавить URL следует, если добавляемый ресурс – это сервер и есть вероятность, что он еще не известен Апорту, или если новый ресурс – это часть сервера и вы предполагаете, что на него нет ссылок с других страниц сервера.
Регистрационная анкета в поисковой системе Rambler находится по адресу http://www.rambler.ru/doc/add_site.shtml. Ее заполнение гарантирует, что, по крайней мере, эта анкета будет найдена при соответствующем поиске, и по ссылке с нее пользователь сможет попасть на ваш сайт. Рекомендуется также воспользоваться регистрацией в случае, если ваши страницы располагаются на зарубежных сайтах. Роботы сканируют ресурсы, находящиеся в странах ближнего зарубежья, и игнорируют остальные иностранные сайты.
Если ваш сайт находится за рубежом, но существенная его часть содержит русскоязычные материалы, или если он расположен в пределах ближнего зарубежья, но входит в иные домены первого уровня (.com, .org, .net и пр.), вы можете отослать письмо с просьбой включить сайт в число сканируемых. Сотрудники Rambler рассмотрят ее и примут решение о целесообразности такого включения.
Что не надо делать при регистрацииНе надо регистрировать ваш сайт в одной и той же поисковой системе слишком часто. Излишняя активность чревата не только отказом в очередной регистрации, но и удалением всех имеющихся в базе данных сведений о вашем ресурсе.
Вводите только те ключевые слова, которые соответствуют вашему сайту, и не используйте заведомо чужеродных.
Как управлять индексированием
На сегодняшний день разработчик Web-узла располагает скромным арсеналом технических средств, которые позволяют управлять роботами поисковых машин, занятых индексированием. Основных способов всего два: размещение файла со специальным именем robots.txt в корневом каталоге сервера и применение мета-тэгов в секции HEAD отдельного документа. Оба метода рассматривались выше. Еще раз подчеркнем, так как это очень важно, что метатэги, по возможности уникальные, следует применять в каждом документе.
Существует ряд простых правил, которых стоит придерживаться, если вы хотите, чтобы поисковые системы находили ваш ресурс.
На входных страницах сайта обязательно должен быть текст. Если вся информация представлена в виде графических файлов, весьма велика вероятность того, что ни одна поисковая система не найдет сайт. Правда, большинство поисковых машин индексирует текст, содержащийся в тэге ALT и в метатэгах, а также текст комментариев (<!– … ->), но не надо забывать о системах, которые этого не делают.
При этом намеренное злоупотребление ключевыми словами в заголовках, комментариях и тексте самого документа может быть расценено поисковой системой как попытка регистрации ресурса с несоответствующим содержанием. В качестве защитной меры система попросту не станет индексировать ваши страницы.
Кроме того, довольно трудно применить выбранное ключевое слово многократно в самом документе, не превратив его в нечто громоздкое и неуклюжее.
Очень важная часть страницы – заголовок, то есть ее титул, который расположен между тэгами <TITLE> и </TITLE>. Лучше сделать его информативным и внести в него ключевые слова. Возможно, имеет смысл использовать в заголовках, даже для полностью русскоязычных документов, английский язык. Оптимальная длина заголовка – не более 50 символов.
Очевидно, что заголовок следующего содержания, размещенный на странице index.htm, является неинформативным для поиска:
<TITLE>www.inotec.ru</TITLE>
Целесообразнее заменить его, например, таким:
<TITLE>Программы для бухгалтерского и складского учета</TITLE>
Заметим кстати, что текст этого заголовка, гораздо более наглядный, чем предыдущий вариант, будет оставаться и в закладках посетителей.
Многие поисковые системы для индексирования и построения списка ключевых слов используют первые по положению в документе 200–300 слов из текстов страниц Web-узла.
Чем длиннее документ, тем менее заметны в нем слова, заданные в запросе, и, следовательно, тем ниже будет ваша страница в результатах поиска. Поэтому старайтесь разбивать длинные документы на несколько коротких.
Индекс цитированияИзначально индекс цитирования (CI, Citation Index) – это принятый в научном мире «показатель значимости» трудов какого-либо ученого. Величина индекса определяется количеством ссылок на этот труд (или автора) в работах других ученых.
Популярность сайта в Internet определяется числом ссылок на него. Таким образом, индекс цитирования здесь – это число внешних ссылок в сети Internet, которые ведут на сайт. Так, если 205 страниц с других доменов содержат ссылки на страницы вашего сайта, то ваш индекс цитирования – именно 205. В англоязычных источниках данному термину соответствуют названия Link popularity (Популярность ссылки), PageRank (Ранг страниц) – торговая марка Google.
Применительно к WWW индекс цитирования – это показатель популярности Web-страницы или Web-сайта среди создателей аналогичных «творений», то есть среди «писателей». Этим он принципиально отличается от счетчиков и рейтингов посещений Web-страниц или Web-сайтов, являющихся, по сути, показателями популярности среди «читателей».
Попутно отметим, что одна из проблем рейтингов – положительная обратная связь. Чем выше ресурс в рейтинге, тем больше посетителей обращаются к нему, и, соответственно, тем выше он поднимается в рейтинге.
Идея, оправдывающая применение индекса цитирования, проста: как правило, люди, создающие свой сайт в Internet, со вниманием и ответственностью относятся к его содержанию, а также к содержанию того, на что они ссылаются, и что тем самым рекомендуют своим посетителям.
Индекс цитирования не может быть увеличен ни за счет внутренних (с одних страниц ресурса на другие), ни за счет внешних ссылок, когда один и тот же ресурс имеет их несколько.
Разработчики поисковой машины Яndex ввели показатель индекса цитирования в свой каталог ресурсов (http://yaca.yandex.ru/), что было призвано обеспечить авторитетность расположения ресурсов в рубриках этой поисковой системы.
При определении величины индекса цитирования Яndex учитывает ссылки только с тех ресурсов, которые Яndex проиндексировал и которые содержатся в его поисковой базе, то есть только «русский» Internet. Это означает, что ссылки на русские ресурсы, например, из каталога Yahoo! не могут быть учтены при установке индекса цитирования Яndex.
С другой стороны, этот показатель можно определить для всех ресурсов, на которые кто-либо ссылался с сайтов, просканированных поисковой машиной Яndex, даже если это произошло всего один раз. Поэтому для каталога Yahoo! индекс цитирования Яndex определить можно, несмотря на то, что Yahoo! не проиндексирован в Яndex. Кстати, он для каталога Yahoo! довольно высок (на 23 октября 2004 года – 6300), поскольку Yahoo! весьма популярен в русской части Internet.
В индекс цитирования включаются все ресурсы, ссылки на которые Яndex нашел в русском Internet, при условии, что значение индекса цитирования для них не меньше 10.
Чтобы выяснить число ссылок на сайт из русскоязычного сектора сети, можно воспользоваться также средствами, предоставляемыми ресурсом, расположенным по адресу http://www.registratura.ru/service/. Форма, имеющаяся на странице по указанному адресу, представлена на рис. 1.6.
Рис. 1.6. Форма для определения индекса цитирования
В поле URL введите адрес ресурса. Отметьте системы, которые будут использованы для подсчета: Яndex, Апорт, Rambler, AltaVista или рейтинг Rambler Top 100.
Список в поле Ссылки предназначен для настройки поиска следующим образом. Пункт Чужие используется для поиска ресурсов, ссылающихся на данный (возможно только в поисковой машине Яndex). Свои – для собственных страниц, ссылающихся на данный ресурс, Все – для поиска как собственных, так и чужих страниц.
Индексы цитирования каждого ресурса в разных поисковых системах отличаются друг от друга, поскольку эти системы имеют неодинаковые базы данных. Величина Link popularity легко проверяется, например, с помощью сервиса Link Popularity Checker, расположенного по адресу http://www.webmaster-toolkit.com/link-popularity-checker.shtml. Его страница показана на рис. 1.7.
Рис. 1.7. Страница сервиса Link Popularity Check
С помощью данного сервиса вы быстро узнаете Link popularity вашего сайта в пяти основных поисковых системах – Google, AltaVista, MSN, All the Web и Yahoo.
В поле Your URL (Ваш URL-адрес) введите адрес проверяемого сайта и щелкните по кнопке Check Popularity (Проверить популярность). Результаты проверки будут представлены в таблице, изображенной на рис. 1.8. Здесь величина Link popularity указана в колонке Number of Links (Количество ссылок).
Рис. 1.8. Таблица с результатами проверки
В чем смысл увеличения числа ссылок на ваш сайт в Internet, то есть увеличения показателя Link popularity?
Во-первых, чем больше ссылок на ваши страницы, тем больше посетителей вы можете ожидать на своем сайте. Переходы по ссылкам так же популярны, как и использование поисковых систем. Удачно расположенные ссылки на ваш сайт могут быть хорошими «генераторами» притока пользователей.
Во-вторых, чем выше величина Link popularity, тем выше ранг ваших страниц в основных поисковых машинах, что, конечно же, обеспечит вам дополнительную клиентуру.
В-третьих, чем больше ссылок на сайт, тем больше открывается входов на ваш ресурс для роботов поисковых систем. Поэтому ваши страницы чаще включаются в очередь на индексацию.
Таким образом, можно рекомендовать следующую стратегию увеличения Link popularity:
• количество ссылок на ваш сайт должно постоянно расти;
• поскольку некоторые поисковые системы при определении рейтинга положительно оценивают ссылки с популярных сайтов, следует обеспечить их наличие;
• необходимо чаще использовать ключевые слова, которым при определении ранга сайта поисковые системы отдают предпочтение.
Возникает вопрос: чему соответствует величина Link popularity – числу ссылок на домен или на определенную страницу в домене? Есть основания утверждать, что скорее на первое, чем на второе, – хотя поисковые системы, кажется, делают исключение из этого правила для доменов, обеспечивающих так называемый бесплатный хостинг, то есть размещение сайтов в рекламных целях в бесчисленных подкаталогах своего сервера. Например, домен www.geocities.com имеет чрезвычайно высокую величину Link popularity. Однако наличие сайта в каталоге www.geocities.com/mywebsite/ не поможет извлечь из этого выгоду. Иначе вы видели бы в результатах поиска гораздо больше сайтов, расположенных на подобных серверах. Ведь известно, что в некоторых поисковых машинах при прочих равных условиях многие бесплатные сайты или сайты, совместно использующие одно доменное имя, ранжированы ниже ресурсов с уникальным доменным именем. Видимо, поисковые системы имеют список доменов, согласно которому следует либо полностью исключать Link popularity, либо игнорировать этот показатель для любого адреса, который включает подкаталог. Поэтому собственное доменное имя может дать определенные преимущества при поиске.
Контроль наличия документов в индексе поисковых машинРегулярно проверять наличие документов в индексе поисковых машин необходимо хотя бы потому, что временами из них исчезают отдельные страницы. Обычно поисковые системы позволяют узнать, какие документы на данный момент находятся в индексе и сколько их. Вот как это делается.
Для проверки статуса URL следует набрать в строке запроса следующую строку:
host: www.inotec.ru
В окно браузера будут выданы все проиндексированные страницы сайта. Таким образом, мы узнаем, есть ли в индексе AltaVista файлы указанного домена.
В поисковой машине Go.com для проверки статуса URL используется следующая команда:
site: abcnews.com
Здесь указывается доменное имя сайта или часть имени.
В поисковой машине HotBot статус URL проверяется по-другому. С помощью ссылки Advanced Search (Расширенный поиск) перейдите на соответствующую страницу. В ваш браузер загрузится форма, фрагмент которой показан на рис. 1.9. В поле запроса введите адрес (например, www.inotec.ru) и, кроме того, наберите его же в поле Include (Включая) раздела Domain/Site (Домен/Сайт).
Рис. 1.9. Фрагмент формы расширенного поиска поисковой системы HotBot
Строки, аналогичные приведенным выше для других поисковых машин, также воспринимаются системой нормально: site: www.inotec.ru
А вот если в форме расширенного поиска в разделе Domain/Site поле Include оставить незаполненным, а в поле Exclude (Исключая) указать то же имя, что и в строке поиска, то в результате получим величину Link popularity со ссылками на сайты, указывающими на наш сайт.
В поисковой машине Lycos статус URL проверяется со страницы расширенного поиска (http://search.lycos.com/adv.asp), на которую можно перейти по ссылке Advanced Search (Расширенный поиск).
В строке запроса введите адрес (например, www.inotec.ru) и, кроме того, наберите его же в поле Only Include (Только включая) раздела URL/SITE (URL-адрес/Сайт). Если в форме расширенного поиска поле Only Include оставить незаполненным, а в поле Exclude (Исключая) указать то же имя, что и в строке поиска, то в результате получим величину Link popularity со ссылками на сайты, указывающими на наш сайт.
Строки, аналогичные приведенным выше для других поисковых машин, также работают в Lycos:
site: www.inotec.ru
В поисковой машине Google статус URL проверяется, как и в Lycos, со страницы расширенного поиска.
В поле Домен введите адрес ресурса (например, www.inotec.ru), а из раскрывающегося списка выберите Только. В строке запроса укажите тот же ресурс. Подобный поиск можно осуществить и с основной страницы системы. Для этого следует набрать запрос следующего вида:
site: www.inotec.ru
Для поиска ссылающихся сайтов в форме расширенного поиска выберите из раскрывающегося списка вместо слова Только слово Не.
В поисковой машине Яndex статус URL можно проверить двумя способами:
1. В поле запроса наберите строку вида #url="www.inotec.ru";
2. Воспользуйтесь формой на странице Расширенный поиск и в разделе Страницы введите требуемый адрес в поле Находятся на сайте.
Для поиска ссылающихся сайтов в форме расширенного поиска в разделе Страницы введите требуемый адрес в поле Содержат ссылку.
Для проверки статуса URL в поисковой машине Апорт представлен специальный запрос следующего вида:
url=www.inotec.ru/*
Чтобы проверить статус URL в поисковой машине Rambler, в обычном поле запроса наберите строку типа $URL:www.inotec.ru.
В поисковой машине Поиск@MaiLRu статус URL можно проверить со страницы расширенного поиска. Для этого укажите в поле раздела Принадлежность к доменам то же доменное имя, что и в разделе Найти результаты. При этом в раскрывающемся списке первого раздела выберите значение Показать.
Для поиска ссылающихся сайтов введите требуемый адрес в поле Ссылающиеся страницы раздела Поиск по странице.
Регистрация в каталогах
Каталог – это, как правило, база данных, в которой хранится ссылка на ресурс (адрес) и его описание. Обычно каталоги имеют иерархическую структуру, а их содержимое классифицировано по темам; при этом тексты – описания включенных в каталоги ресурсов – позволяют осуществлять их поиск. Классификацию выполняют либо авторы каталога, либо авторы ресурсов. Несмотря на то, что в первом случае этот процесс занимает определенное время, он гарантирует правильное размещение ссылки в соответствующем тематическом разделе, что не всегда происходит во втором случае, когда ответственность за точность рубрикации ложится на самого автора ресурса. Описание сайта также выполняется либо составителями каталога (как на Yahoo!), либо принимается от того, кто хочет включить ресурс в каталог (как на dmoz.org). Каталоги ресурсов представляют собой солидные собрания ссылок, организованных по определенному принципу. В отличие от поисковых систем каталоги заполняют информацией вручную. Это осуществляют составители или ведущие каталогов либо, если это предусмотрено, сами владельцы сайтов при заполнении ими специальных форм в соответствии со структурой каталога. Владелец сайта вводит данные в регистрационную форму, отсылает ее, а персонал, поддерживающий каталог, решает, в какую категорию внести ссылку на заявленный сайт.
Вследствие такой технологии поиск в каталогах часто приводит к лучшим результатам, чем поиск с помощью автоматических поисковых систем.
Каталоги традиционно предлагают удобный и понятный интерфейс для поиска ресурсов. Источником их пополнения может быть работа экспертов и самостоятельная регистрация пользователей. Приглашение к регистрации можно быстро найти на главной странице каталога по ссылкам типа Add URL, Добавить или аналогичным. В самом простом случае в предлагаемую форму требуется ввести URL-адрес главной страницы вашего сайта и дополнительные сведения (ключевые слова, краткую аннотацию и информацию для контактов с человеком, сопровождающим ресурс).
В некоторых случаях материалы необходимо представить на двух языках: на английском и на языке региона, который имеет отношение к каталогу.
Поскольку пополнение каталогов часто происходит не автоматически, а требует работы сотрудников, число записей здесь, как правило, уступает количеству ресурсов, проиндексированных поисковыми машинами. Несмотря на явный проигрыш в количестве записей, каталоги достаточно успешно конкурируют с поисковыми системами на информационном рынке. Причина их популярности не только в простоте эксплуатации. Так, небезызвестный каталог Yahoo! побил все рекорды по частоте цитирования в книжной литературе об Internet. Одна из причин такого успеха – четкая и достаточно стабильная классификационная схема, которая позволяет авторам ссылаться на существующие годами разделы (категории) каталога Yahoo!.
Хотя регистрация в Yahoo! и предполагает длительную экспертизу со стороны сотрудников каталога, она не является гарантированной. Этот процесс уже оброс легендами, равно как и посредниками, предлагающими содействие в регистрации за круглые суммы.
Пытаясь отыскать свою нишу в информационном пространстве, многие разработчики каталогов и поисковых систем делают ставку на специализацию своего сервиса в какой-нибудь области, например, в бизнесе. Регистрация сервера компании в таких профильных каталогах бывает крайне полезной, если речь идет о каком-то популярном сервисе. Как же искать нужные каталоги? Один из возможных способов таков: посмотрите, кто ссылается на узлы ваших конкурентов, и предложите им разместить ссылку на ваш сайт.
При поиске деловых связей часто бывает целесообразной регистрация узла в соответствующем региональном каталоге. Эксперты таких служб обычно принимают заявки лишь от компаний, которые имеют представительства на данной территории. Тем не менее, в каждом конкретном случае возможны и обходные пути.
Если ваш сайт имеет тематические разделы, есть смысл зарегистрировать их как отдельные ресурсы. В этом случае число посещений возрастет благодаря многократному размещению в каталоге ссылок на ресурс.
В глобальном масштабе Сети любая специализированная система, конечно, уступает по популярности поисковым сервисам общего назначения, таким как автоматические индексы AltaVista, HotBot, каталог Yahoo!. Выяснить популярность каталога можно с помощью специальных запросов к поисковым системам.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?