Автор книги: Алексей Гладкий
Жанр: Интернет, Компьютеры
сообщить о неприемлемом содержимом
Текущая страница: 6 (всего у книги 10 страниц)
Как быстро и эффективно искать данные в Интернете
То, что Интернет – это настоящий Клондайк самой разной информации, знают даже дети. Какой бы вопрос нас не заинтересовал – почти всегда мы сразу ищем ответ на него в Сети. Выбрать телевизор, поехать в отпуск, отправить ребенка в школу, купить автомобиль, написать реферат или диссертацию, сделать ремонт, найти спутника жизни или завести легкий роман, узнать прогноз погоды, посмотреть футбольный матч или послушать музыку – вот лишь малый перечень того, чем интересуется среднестатистический пользователь Интернета.
В Интернете есть все, надо только уметь искать. Далее мы расскажем о том, как правильно выполнять поиск интересующих сведений в Сети.
На чем базируется работа поисковиков?
Чтобы уметь быстро и точно искать интересующие сведения, нужно хотя бы в общих чертах понимать, по какому принципу функционируют современные поисковые системы.
Поисковая система – это в некотором роде программный комплекс, обеспечивающий поиск требуемых данных в Сети. Функционирование поисковой системы базируется на периодическом просмотре веб-ресурсов и автоматической регистрации обнаруженных на них изменений. Эти сведения являются своеобразным фундаментом, на котором формируется база данных со ссылками на веб-ресурсы. В процессе построения базы данных поисковая система фиксирует и ряд дополнительных компонентов, признаков и факторов – например, частота появления слова на странице, его оформление, какое количество ссылок на данный ресурс имеется на других веб-страницах, и т.п. Вся эта информация тем или иным образом принимается во внимание в процессе осуществления поиска.
Поскольку имеющиеся данные периодически следует обновлять, поисковые системы через определенные промежутки времени вновь просматривают посещенные ранее веб-ресурсы, и фиксируют все появившиеся изменения.
Для примера рассмотрим, как действует поисковой робот всемирно известной системы Google. Когда он просматривает веб-ресурс, то прежде всего он интересуется тем, какие слова и в каких местах веб-страницы ему попадаются. Затем перечень адресов и ключевых фраз, которые им соответствуют, поисковой робот сохраняет в своей базе данных.
Помимо этого, он также сохраняет сведения о частоте упоминаний слова на веб-ресурсе с применением условной величины, которую принято называть «вес слова». После анализа всех этих данных Google автоматически генерирует списки ссылок, данные в которых отсортированы по весу слов из поискового запроса, а также по месту их расположения (название веб-ресурса, гиперссылки, метатеги, т др.).
ПРИМЕЧАНИЕ
Не все пользователи знают, что каждая поисковая система имеет свой механизм для расчета веса ключевых слов при сканировании веб-страниц. Во многом именно поэтому разные поисковые машины на одни и те же запросы предлагают разные результаты поиска.
Чтобы найти интересующую информацию, пользователь самостоятельно формирует соответствующий поисковой запрос, и вводит его в поисковую систему. Как правило, результаты поиска ему выводятся в порядке релевантности, то есть по соответствию обнаруженных веб-ресурсов заданному поисковому запросу. В этом случае первые позиции списка результатов будут принадлежать ссылкам на веб-ресурсы, содержащие максимум ключевых слов из введенного запроса. Правда, в некоторых поисковых системах вы можете изменить порядок сортировки ссылок в результатах поиска – например, по дате (вначале – новые веб-ресурсы, затем – старые), по доменной принадлежности, по цене и т.п.
Стоит отметить, что разные поисковые системы, несмотря на внешнюю схожесть и почти одинаковый инструментарий, они имеют немало скрытых отличий. Это, например, порядок определения релевантности итогов поиска, размер и периодичность обновления баз данных, удобство в эксплуатации, оперативность обработки и вывода итогов поиска, и др. Кроме этого, поисковые системы могут различаться по поддержке языков запроса (одна система может работать с двумя-тремя языками, а другая – с десятком языков), расстановка приоритетов, области сканирования. Это также зачастую становится причиной получения разных результатов поиска у разных поисковых систем при вводе в них одного и того же запроса.
Таким образом, поисковая система автоматически генерирует перечень ссылок на веб-ресурсы на основании заданного пользователем запроса. Учтите, что если запрос сформулирован неточно или некорректно – трудно рассчитывать на получение удовлетворительного результата. Одним из главных условий формирования правильного поискового запроса является умение пользователя максимально сузить область поиска, а также правильно найти для запроса те ключевые фразы и слова, которые несут главную смысловую нагрузку. При этом стоит учитывать, что наибольшую эффективность среди всех ключевых слов имеют существительные, далее с большим отрывом следуют прилагательные, и в самом конце по эффективности находятся глаголы, причастия и деепричастия.
Любая поисковая система пользуется своей собственной методикой поиска, и от того, насколько она эффективна, в определяющей степени зависит популярность данной системы у пользователей. Эта методика тщательно охраняется от посторонних (конкурентов, недоброжелателей и просто любопытных), а также, опять же – с целью сохранения конфиденциальности, постоянно дорабатывается и совершенствуется. Одним из наиболее распространенных приемов (особенно это касается поисковых систем, поддерживающих русский язык) является механизм морфологического поиска. Сущность его заключается в том, что система ищет не просто введенное в строке запроса слово, но и любые его формы, падежи и синонимы.
В соответствии с общепринятой терминологией, все виды поиска можно разделить на три категории: простой, расширенный и сложный. Для решения большинства поисковых задач пользователи применяют простой поиск. Более того – именно этот вид поиска применяется большинством поисковых систем по умолчанию. Сущность его заключается в составлении поискового запроса и получения по результатам поиска списка ссылок на соответствующие веб-ресурсы. В данном случае ключевая роль отводится грамотному подбору слов для формирования запроса. Здесь важно помнить следующее: слова или фразы поискового запроса должны встречаться в отыскиваемых ресурсах, и отсутствовать – в тех ресурсах, которые интереса не представляют.
Утилита WebMultiSearcher – удобный инструмент для быстрого поиска
Одна из удобных утилит, предназначенных для поиска данных в Интернете, называется WebMultiSearcher. Одним из ее преимуществ является то, что она распространяется бесплатно, дистрибутив программы в виде zip-архива можно скачать по адресу http://www.vicscale.narod.ru/files/WebMultiSearcherSetup.zip. Интерфейс WebMultiSearcher не поддерживает русский язык и является англоязычным, но ввиду простоты и очевидности работа с программой не представляет собой никакой сложности – можно легко догадаться, для чего предназначена та или иная команда.
Чтобы установить программу на компьютер, распакуйте скачанный архив, запустите инсталляционный файл и далее следуйте указаниям Мастера установки. По окончании инсталляции в меню Пуск будет создана программная папка WebMultiSearcher, а на Рабочем столе появится ярлык запуска программы.
Пользовательский интерфейс WebMultiSearcher, который отображается на экране после ее запуска, показан на рис. 6.1.
Рис. 6.1. Программа WebMultiSearcher
В верхней части окна программы находится главное меню, команды которого предназначены для выбора режима работы и активизации соответствующих функций программы. Инструментальная панель, столь привычная пользователям традиционных Windows-приложений, отсутствует, но справедливости ради отметим, что особой надобности в ней и нет. Тем более что нажатием правой кнопки мыши вызывается контекстное меню, команды которого дублируют некоторые команды главного меню.
Перед тем как приступить к эксплуатации программы, рекомендуется просмотреть и, при необходимости – отредактировать параметры ее настройки, чтобы установить требуемые режимы поиска и вообще – максимально адаптировать ее к своим потребностям. Для этого нужно выполнить команду главного меню View ► Options – в результате на экране откроется окно, которое показано на рис. 6.2.
Рис. 6.2. Настройки программы WebMultiSearcher
Как видно на рисунке, данное окно состоит из трех вкладок. На этих вкладках в зависимости от функциональности и назначения собраны однотипные, сходные по назначению параметры настройки.
На вкладке Search Engines, содержимое которой показано на рис. 6.2, путем установки соответствующих флажков нужно выбрать поисковые системы, которые вы хотите задействовать для выполнения поиска. Возможности программы предусматривают использование четырех поисковых систем: Google, AllTheWeb, AltaVista и Lycos. По умолчанию установлены все флажки – в этом случае поиск будет вестись одновременно во всех перечисленных поисковиках. Причем при этом будет соблюдаться очередность использования поисковых систем: в каком порядке они представлены на данной вкладке – в таком порядке они будут задействованы в поиске. Чтобы изменить этот порядок, используйте кнопки со стрелками, расположенные слева от списка.
На вкладке History находится переключатель, с помощью которого вы можете установить режим сохранения истории поиска. По умолчанию предлагается сохранять историю постоянно (переключатель установлен в положение Always), но вы можете вообще отключить данный режим.
На вкладке Advanced можно настроить некоторые дополнительные параметры работы программы. В частности, здесь вы можете указать максимальное количество результатов поиска, выводимое на странице, ввести максимальное время ожидания отклика от сервера, и др.
Все изменения, выполненные в окне настройки параметров программы, вступают в силу после нажатия кнопки ОК или Apply. C помощью кнопки Cancel осуществляется выход из данного режима без сохранения выполненных изменений.
Чтобы выполнить поиск, введите текст поискового запроса в поле Search, которое находится сразу под главным меню (см. рис. 6.1), и нажмите кнопку Start Search, расположенную справа от данного поля (название кнопки отображается в виде всплывающей подсказки при подведении к ней указателя мыши). Если данный поисковой запрос уже использовался ранее, то вы можете выбрать его также из раскрывающегося списка.
Результаты поиска через некоторое время отобразятся в нижней части интерфейса. Чтобы воспользоваться результатом поиска, дважды щелкните мышью на соответствующей позиции списка.
Вы можете сохранить результаты поиска в отдельном файле – для последующего использования. Для этого нужно выполнить команду главного меню File ► Save search results, и в открывшемся окне по обычным правилам Windows указать путь для сохранения и имя файла (результаты сохраняются в файле с расширением *.msr). Чтобы впоследствии открыть и воспользоваться сохраненными ранее результатами поиска, выполните команду главного меню File ► Open search results, и открывшемся окне укажите путь к требуемому файлу.
Поиск на FTP-серверах
Одно дело – если вы хотите найти в Интернете список ссылок на веб-ресурсы, чтобы с их помощью выбрать нужный ресурс, и совсем другое – когда вам нужен конкретный объект: мультимедийный файл, электронная книга, программное обеспечение и т.п. Для решения этой задачи рекомендуется пользоваться специально предназначенными поисковыми системами, или соответствующими режимами обычных поисковых систем.
Например, поисковая система, расположенная по адресу http://www.filesearch.ru, очень эффективна для поиска файлов. Ее огромная база данных регулярно актуализируется, а поиск ведется среди почти всех российских и нескольких тысяч зарубежных FTP-серверов.
Характерной особенностью системы http://www.filesearch.ru является то, что она ведет поиск не на веб-серверах и веб-страницах среди имеющегося там контента (как это делает большинство стандартных поисковых машин), а по именам файлов и папок – на FTP-серверах. Хитрость здесь состоит в следующем: если вы, например, ищете приложение, то на обычном веб-сервере вы найдете лишь его описание (например, в составе обзорной статьи, и т.п.), а вот дистрибутив вам поможет найти именно http://www.filesearch.ru. Отметим, что данная система может искать файлы самых разных форматов: мультимедийные, графические, звуковые, текстовые, исполняемые, архивы и т.д. Общие правила работы с http://www.filesearch.ru во многом аналогичны действиям в других поисковых системах.
Еще один эффективный поисковой механизм находится по адресу www.metabot.ru. Он также предназначен для поиска файлов – мультимедийных, графических и др. Вам достаточно лишь с помощью соответствующего переключателя выбрать подходящий вид поиска, и с клавиатуры ввести требуемый запрос.
Еще один эффективный файловый поисковик, поддерживающий функции как простого, так и расширенного поиска, находится по адресу http://ftpsearch.rambler.ru/db/ftpsearch. Как нетрудно догадаться, автором и разработчиком данного продукта является известная компания Рамблер (www.rambler.ru). Возможности данной поисковой систему предусматривают поиск на FTP-серверах файлов самых разных форматов.
Поиск данных в зависимости от их типа
Кроме поиска данных на FTP-серверах, для тонкого и точного поиска можно использовать специальные режимы, которые предлагают многие популярные поисковые системы – например, www.google.ru, www.yandex.ru, www.mail.ru, www.rambler.ru и др. Смысл заключается в том, чтобы сразу искать требуемый объект (рисунок, видео, и др.) в соответствующем разделе поисковой системы.
Для этого перед началом поиска нужно щелчком мыши выбрать требуемый раздел. Например, для поиска графических объектов на www.google.ru предназначен раздел Картинки, для поиска видеофайлов – раздел Видео, и т.д. Особо следует отметить один из самых популярных у пользователей разделов, который называется Вопросы и ответы. Здесь вы можете получить перечень вопросов и ответов на интересующие вас темы, причем задавали вопросы, как и отвечали на них, сами посетители соответствующего ресурса. Например, если вы хотите подключить мобильный телефон к компьютеру, но не знаете, как это сделать – выберите на www.google.ru раздел Вопросы и ответы, и введите запрос: Как подключить телефон к компьютеру, или что-то в этом роде. Через некоторое время система выдаст вам большой перечень вопросов и ответов по данной теме. Если же вам не удалось найти требуемый ответ – зарегистрируйтесь в системе и задайте свой вопрос, и через некоторое время вам наверняка ответит кто-то ил более «продвинутых» в этом отношении пользователей.
Использование тематических разделов для поиска данных позволяет намного сузить область поиска, и, соответственно, повысить его эффективность.
Что такое блог и как его завести
Многие пользователи Интернета задаются вопросом: не завести ли свой блог? Ведь в последние годы блогосфера стала одним из самых популярных секторов Интернета, и иметь свой Интернет-дневник считается правилом хорошего тона. Многие проекты разрабатываются и внедряются специально для ведения блогов, а известные и популярные Интернет-порталы открывают у себя блог-сервисы.
Что же такое «блог», чем он удобен и интересен, и почему данный сервис пользуется такой популярностью у пользователей Интернета? Ответить на эти, а также на многие другие вопросы мы постараемся далее.
Термин «блог» своим происхождением обязан английскому слову «blog», которое, в свою очередь, произошло от слова «web-log» (дословно – «файл журнала»). Опытные пользователи компьютера знают, что файл журнала – это файл, содержащий сведения обо всех событиях, возникающих в процессе работы той или иной программы. Обычно он имеет расширение *.log или *.txt, и в него автоматически вносятся соответствующие записи при запуске программы, активизации функций, выборе режимов работы, завершении сеанса работы, и т.п.
Блог представляет собой нечто подобное: пользователь оставляет в нем записи, которые посчитает нужным. Это может быть, например, частное мнение по поводу какого-то общественно значимого события, личный взгляд на какие-то вещи, информация о своих планах, мировоззрении, намерениях, и т.д.
Первые блоги в современном понимании этого слова появились в 1996 году. Именно тогда для них в Интернете стали выделяться специальные площадки, а для упрощения работы с блогами появились специальные программные продукты.
Бурное развитие блогосферы привело к тому, что уже в 1999 году блоги стали серьезно теснить на рынке своих главных конкурентов, которыми являлись домашние веб-страницы. А уже в 2002 году блоги удостоились того, что их стали называть новым жанром сетевой литературы. После этого в некоторых американских (и не только) университетах стали обучать студентов искусству ведения блогов. С 2004 года свои блоги стали заводить известные люди: политики, актеры, певцы, спортсмены, крупные бизнесмены и др.
Как свидетельствуют результаты проведенных исследований, число блогов каждые полгода увеличивается практически в два раза. Правда, справедливости ради стоит отметить, что не все блоги обновляются регулярно.
Самыми популярными блог-ресурсами на сегодняшний день являются http://livejournal.com и https://www.blogger.com. Что касается Рунета, то свой блог можно завести на http://liveinternet.ru, http://li.ru, http://diary.ru, http://blog.ru, http://journals.ru, http://blog.gala.net, http://www.rambler.ru и http://www.mail.ru.
Знакомство с livejournal.comЗдесь мы расскажем о самом первом, и на сегодняшний момент – самым популярным блог-ресурсом – http://livejournal.com (рис. 6.3). Русскоязычные пользователи данного ресурса перевели и интерпретировали его название на русский лад – «Живой журнал», сокращенно – ЖЖ.
Рис. 6.3. Популярный блог-ресурс http://livejournal.com
История http://livejournal.com берет свое начало весной далекого 1999 года, когда американец Брэд Фицпатрик внес первую тестовую запись на данную страницу. Это имело весьма незатейливую цель, а именно – предоставить сведения о себе своим друзьям. Уже через короткое время доступ к http://livejournal.com был предоставлен и другим пользователям. Осенью этого же года на http://livejournal.com появилась первая запись на русском языке.
В целом http://livejournal.com предоставляет пользователям примерно такой же набор услуг, как и другие блогосервисы. Записи вносятся в хронологической последовательности, причем вверху страницы отображается последняя запись. При внесении новой записи все остальные сообщения автоматически перемещаются на одну позицию вниз.
Каждый блог, открытый на http://livejournal.com, имеет свой уникальный адрес, сформированный по следующему шаблону: http://www.имя_пользователя.livejournal.com. Свой уникальный адрес имеет также каждое сообщение блога. В системе реализована возможность пометки записей специальными категориями-тегами, благодаря чему можно отбирать для просмотра сообщения определенной тематики.
Для каждого пользователя имеется страница, которая называется Информация о пользователе, где содержатся все основные сведения о человеке: его имя, перечень друзей, дата рождения, контактные данные, и др.
Однако только ведением дневника функциональные возможности http://livejournal.com не исчерпываются. Вы также можете знакомиться с дневниками других пользователей ресурса, добавлять их в свой контакт-лист, просматривать их записи с помощью специального и удобного инструмента, который называется «лента друзей» (он находится по адресу http://www.имя_пользователя.livejournal.com/friends).
Каждую запись блога могут комментировать другие пользователи – при том условии, что хозяин дневника не заблокировал эту возможность. Причем можно комментировать не только сами записи, но и оставляемые к ним комментарии.
Одним из популярных сервисов ресурса http://livejournal.com является создание сообществ пользователей. Сущность данного механизма заключается в том, что группа пользователей, представляющая собой одно сообщество, ведет один общий дневник – по тем же правилам, что и обычные пользователи. Разница заключается лишь в том, что если пользователь может писать в дневнике все, что угодно, то члены сообщества могут вносить записи лишь определенной тематики (причем эти записи модерируются). Что касается направленности сообществ, то здесь все зависит от интересов и пожеланий их членов. Например, есть сообщества родителей, сообщества любителей кинематографа, определенной музыки, сообщества автолюбителей, и др. Кроме этого, сообщества могут формироваться по географическому принципу, что позволяет кооперироваться и общаться людям из одного региона (города или страны).
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.