Текст книги "Профессиональный поиск в Интернете"
Автор книги: Алексей Кутовенко
Жанр: Интернет, Компьютеры
сообщить о неприемлемом содержимом
Текущая страница: 3 (всего у книги 19 страниц) [доступный отрывок для чтения: 6 страниц]
Выводы и рекомендации
Для большинства пользователей универсальные поисковики являются основным, а зачастую и единственным средством интернет-поиска. Они предлагают хороший охват источников, а также набор инструментов, достаточный для решения основных поисковых задач.
Удобными особенностями интерфейса Google являются вынесенные на боковую панель страницы выдачи инструменты уточнения запроса, а также активное использование «универсального поиска» с равноправным ранжированием по релевантности результатов, полученных из его различных специализированных баз. Заслуживает внимания и удобный режим просмотра «Живой поиск».
В безусловном активе системы Яндекс – гибкий учет морфологии русского языка в ходе веб-поиска. Кроме того, данный поисковик предлагает достаточно удачную форму расширенного поиска, а также большой выбор поисковых операторов.
От знакомства с поисковиком Microsoft Bing в его современном состоянии остаются двойственные впечатления. С одной стороны, заметного изменения качества интернет-поиска не произошло и трудно давать прогнозы о возможных изменениях в данном направлении. К минусам отнесем также отсутствие в локализованных версиях Bing ряда дополнительных сервисов, теоретически способных привлечь пользователей. С другой стороны, с интерфейсом нового поисковика поработали серьезно и достаточно успешно. Кроме того, весьма неплох в Bing мультимедиа-поиск.
Поисковик Exalead демонстрирует хорошие результаты поиска ресурсов на европейских языках. Несложно самостоятельно убедиться, что, допустим, при поиске по одинаковому запросу на итальянском языке Exalead заметно выигрывает у Google как по широте охвата веб-ресурсов, так и по степени глубины их индексации. Тестовый поиск французских и немецких ресурсов не позволяет выявить однозначного лидера: в зависимости от запроса вперед может выйти и Exalead, и Google. В англоязычном поиске сильнее оказывался Google.
При выборе универсального поисковика важную роль играет качество находимых с его помощью ресурсов. Определить предпочтительный для конкретных задач поисковик можно «методом маркера». Суть его состоит в том, что вначале составляется некий тематический поисковый запрос, после чего опрашивается группа людей-экспертов в данной области на предмет выявления лучших, по их мнению, интернет-ресурсов по избранной теме. На основе данных опроса формируется список сайтов-маркеров, гарантированно релевантных запросу и содержащих качественную информацию. Затем запрос отправляется на тестируемые поисковики. Логика оценки проста: чем выше в результатах поиска будут расположены сайты-маркеры, тем лучше конкретный ресурс подходит для поиска информации по тестовой теме.
Эту схему вполне может применить и частный пользователь. Поскольку далеко не у всех под рукой имеется группа экспертов, основная проблема заключается в определении сайтов-маркеров. Для ее решения можно проанализировать разделы полезных ссылок, часто встречающиеся на тематических сайтах. Найдя действительно серьезный тематический ресурс по интересной вам теме, загляните в такой раздел – там вы найдете ссылки, отобранные энтузиастами своего дела, что позволит выявить сайты-маркеры, а приводимые в таких разделах описания ресурсов являются хорошими заготовками для конструирования тестового запроса.
Глава 2
Вертикальный поиск
Важным направлением развития современного интернет-поиска стало появление большого количества специализированных поисковиков, предназначенных для углубленного поиска определенного тематического контента. Такие интернет-машины часто называют «вертикальными». Среди таких проектов можно найти немало полезных ресурсов.
Вертикальные поисковики удачно дополняют универсальный интернет-поиск. Если вы интересуетесь какой-либо определенной тематикой и нашли соответствующий специализированный поисковик – можете принимать поздравления: эффективность поиска заметно возрастет. Улучшение качества поиска достигается за счет обращения в первую очередь к заранее отобранным тематическим ресурсам. Это позволяет значительно уменьшить количество информационного шума в списке выдачи Кроме того, сортировка результатов поиска зачастую производится с учетом особенностей тематического контента. Исключительно заметной разница универсального и вертикального вариантов поиска становится в ситуациях, когда у ключевых слов запроса есть синонимы в других областях. Простейший пример такого запроса – слово «библиотека», которое может иметь различное значение в зависимости от контекста. Это может быть и реальное учреждение, и сетевое собрание электронной литературы, и компонент компьютерного приложения. Многие вертикальные машины обладают дополнительными алгоритмами обработки запросов, учитывающими наличие сленга, аббревиатур и других тонкостей, так или иначе присущих конкретным тематическим областям.
Необходимо заметить, что вертикальные поисковики являются хорошей альтернативой тематическим порталам, снабженным собственными системами поиска. В популярных тематических нишах таких порталов немало, и для того чтобы составить полную информационную картину той или иной темы, пользователю приходится немало поработать. Рано или поздно возникает естественное желание получить некий общий поисковик, который позволил бы собрать в едином интерфейсе информацию с нескольких ценных ресурсов. Другими словами, мы опять приходим к идее вертикального поисковика.
В этой главе рассматриваются три группы вертикальных поисковиков. Это специализированные учебные и научные поисковики, особенно актуальные для читателей, получающих образование или повышающих квалификацию. Этим же читателям, надеемся, будут полезны сведения о системах поиска в сетевых электронных библиотеках. Дополняет картину рассказ о специализированных поисковиках компьютерных программ. Эта задача универсальна и время от времени возникает у большинства пользователей.
Научный интернет-поиск
Современные универсальные системы интернет-поиска не самым лучшим образом приспособлены для поиска научной информации. В результате поиск научных публикаций с их помощью становится достаточно сложной задачей. Решить ее с максимальной эффективностью помогут специализированные научные поисковики, которые являются разновидностью вертикальных машин интернет-поиска. Сейчас можно найти немало таких машин, в основном отраслевого характера. Кроме того, на современном информационном рынке встречается значительное количество коммерческих предложений баз данных научной информации, подписка на доступ к которым может быть весьма дорогостоящей. Мы же остановимся на многоотраслевых интернет-поисковиках, специализирующихся на свободно доступном научном и учебном контенте. В ходе научного интернет-поиска кроме специализированных проектов можно использовать и вертикальные сервисы универсальных поисковиков. Пожалуй, наиболее известным ресурсом такого плана является проект Академия Google.
Академия GoogleКогда же может потребоваться обращение к такому специализированному научному поиску? Типичные ситуации – подготовка рефератов, курсовых и других учебных работ. Представим себе студента, которому нужно подготовить такую письменную работу. Скачивать готовую курсовую – низкий класс, тем более что по узким темам готовых рефератов немного, соответственно, они хорошо известны всем, в том числе и преподавателям. Да и пользы от таких рефератов для самого студента – ноль, разве что время экономится. Итак, наш герой принимает правильное и максимально полезное для качества своего образования решение: работать самостоятельно. Первый этап подготовки любой учебной работы – поиск источников по теме. Вполне логично использовать для этих целей не только традиционные, но и интернет-источники. Однако при обращении к сетевым источникам возникает несколько проблем, главная из которых – проблема оценки качества найденных публикаций. Если искать обычными универсальными поисковиками, то отличить первоисточник от «перепева» или банального плагиата очень сложно. Кроме того, никто не дает гарантии, что приводимая информация не была искажена. Специализированный поисковик ограничит поиск только заранее отобранными ресурсами, содержащими качественную информацию. Проведем практический эксперимент и отправим одинаковые запросы в универсальном поисковике Google и в Академии Google. Тестовым ключевым словом выступит «абиогенез» – одна из концепций современной биологии, описывающая происхождение живой материи из неживой. Первые две страницы выдачи «обычного» поисковика Google будут заняты ссылками на краткие статьи словарей и энциклопедий с редкими вкраплениями предложений скачать рефераты по близким темам. Список выдачи Академии Google с первых же страниц полностью состоит из ссылок на научные и научно-популярные статьи, материалы конференций и разделы книг по теме запроса. Поскольку рядом с каждым материалом приводятся сведения о его цитируемости в других работах, это позволяет достаточно быстро найти основные работы, с которыми, по всей видимости, стоит ознакомиться в первую очередь.
Давайте подробнее познакомимся с возможностями и инструментами Академии Google. Бета-версия данного сервиса под оригинальным названием Google Scholar стартовала в октябре 2004 года. Академия Google индексирует ресурсы открытого доступа, интернет-сайты, а также издательские сервисы, предоставляющие доступ к публикациям на коммерческих условиях. Кроме того, научный поисковик Google развивает программу интеграции с электронными каталогами классических (офлайновых) научных библиотек. Данная программа предназначена для библиотек, располагающих онлайновыми электронными каталогами, поддерживающими формат OpenURL. Подключение библиотек к научному проекту Google свободное и бесплатное. В зависимости от настройки сервера библиотеки просмотр каталога может предоставляться как всем желающим, так и только зарегистрированным пользователям библиотеки. Русскоязычная версия Академии Google по умолчанию поддерживает поиск по электронному каталогу Государственной публичной научно-технический библиотеки (ГПНТБ). При настройке механизма поиска пользователь может добавить до трех собственных ссылок на онлайновые каталоги библиотек, поддерживающих названные технологии.
Интерфейс поисковика выдержан в строгом стиле и предлагает не так много дополнительных инструментов. К средствам быстрой фильтрации результатов отнесем, разве что, хронологическое меню, позволяющее переходить к просмотру публикаций определенного года выхода. Если публикация была найдена на нескольких ресурсах, то в результатах поиска появится ссылка для просмотра полного списка копий такого материала. При оценке релевантности той или иной ссылки, влияющей на ее позицию в списке выдачи поисковика, учитывается индекс цитирования публикации и ее автора, а также известность интернет-источника или издания, опубликовавшего статью (рис. 2.1).
Рис. 2.1. Страница результатов поиска сервиса Академия Google
Режим расширенного поиска. Академии Google, кроме стандартного набора инструментов формирования запроса (поиск по фразе, на включение и исключение указанных слов), предлагает поиск по именам авторов и по публикациям определенных журналов, а также позволяет указать диапазон дат публикации нужных материалов.
Каждая ссылка на странице выдачи снабжается кратким библиографическим описанием источника, счетчиком индекса цитирования данной публикации, а также ссылкой для поиска похожих материалов. При настройке системы доступен инструмент. Библиографический менеджер, позволяющий получить корректное библиографическое описание источника, которое можно использовать в списке литературы к своим работам. К сожалению, предусмотрены только зарубежные стандарты описания ресурсов, форматы наших библиографических. ГОСТов здесь не поддерживаются, что определенно смазывает впечатление от этой полезной функции.
К достоинствам. Академии Google отнесем простоту освоения, высокую скорость работы, а также функцию поиска в каталогах крупных «офлайновых» научных библиотек. Недостатками проекта является небольшой выбор дополнительных инструментов управления поиском, а также информационный шум в результатах для пользователя, ориентирующегося на источники свободного доступа. В списке выдачи этого поисковика много ссылок на коммерческие ресурсы, что означает прямую доступность только аннотаций или кратких выдержек из текста публикаций.
Scholar.ruСистема Scholar.ru специализируется на русскоязычном учебном и научном контенте. Поисковик индексирует различные виды документов: статьи, монографии, а также авторефераты диссертаций, представленные в широко распространенных форматах электронных книг: HTML, PDF и DjVu (рис. 2.2).
Рис. 2.2. Страница результатов поиска сервиса Scholar.ru
Пополнение индекса ведется в комбинированном режиме. Основным источником данных служат результаты автоматической индексации нескольких крупных онлайновых проектов, в том числе сети SciPeople, собирающих электронные версии научных публикаций и предлагающих их в общем доступе. Кроме того, материал может быть добавлен в поиск самим автором. Соответствующая форма предлагается на страницах проекта. Следствием такого подхода стало, с одной стороны, практически полное отсутствие информационного шума в результатах, а с другой – сравнительно небольшой объем базы проекта. На данный момент в ней порядка 80 тысяч публикаций.
Работать с сервисом Scholar.ru можно в режимах простого и расширенного поиска. Последний дает возможность использовать в запросе ряд фильтров. С их помощью можно точно указать тематический раздел базы Scholar ru для поиска, дату публикации, название журнала или адрес сайта, на котором был опубликован материал. Кроме того, можно искать работы конкретного автора или же работы, выполненные в определенном учреждении.
Страница выдачи результатов поиска содержит простой текстовый список ссылок на найденные публикации. Каждый пункт этого списка включает полный заголовок статьи, имя автора, сведения об издании, в котором была опубликована статья, а также первые фразы ее аннотации. Приведенные данные сопровождаются значками доступных для скачивания версий статьи в различных форматах и списком тематических тегов. Некоторые результаты снабжаются также примером библиографического описания найденного материала, который можно использовать в списках литературы. Кроме ссылки на саму статью предлагается и ссылка на страницу ее обсуждения на проекте SciPeople.
Данный сервис представляет собой гибрид поисковика и веб-каталога. Получить доступ к каталогу можно на вкладке-разделе Каталог научных публикаций. Предлагаемый каталог состоит из двадцати пяти основных разделов, отражающих широкий спектр наук как естественного, так и гуманитарного профиля. К сожалению, количество пустых разделов здесь достаточно велико, что не способствует эффективной работе. Разработчики предупреждают, что в каталог попадают не все статьи проекта, поэтому если важен максимальный охват доступного материала, лучше использовать не каталог, а систему поиска.
Вкладка Авторефераты и диссертации предлагает доступ к каталогу соответствующих видов документов, проиндексированных Scholar ru. Каких-либо специфических инструментов поиска или сортировки в нем не предусмотрено.
Раздел Научные области предлагает облако тегов, с помощью которого можно найти нужный материал. Любопытно, что страница выдачи при поиске в этом разделе сопровождается вспомогательной боковой панелью с перечнем тематически близких научных тематик.
Раздел Аспирантура носит справочный характер, напрямую к поиску не относится и содержит паспорта научных специальностей.
Поиск на научных сайтах с использованием платформы Flexum «Поиск по научным сайтам»Тема научного поиска не прошла мимо разработчиков персональных поисковиков. Подробному рассказу о возможностях таких поисковых систем посвящена отдельная глава нашей книги (см. главу 6). Сейчас же мы остановимся на одном из примеров таких ресурсов – тематической системе научного поиска, созданной с помощью платформы Flexum. В индексе проекта на сегодняшний день несколько тысяч сайтов. Данный проект по этому показателю, кстати, является крупнейшей системой на платформе Flexum. В индексе проекта представлены тематические научные интернет-ресурсы, сайты учебных заведений, научных организаций и научных журналов.
Интерфейс поиска на научных сайтах предлагает стандартные для поисковиков на базе Flexum возможности. Стартовая страница содержит не только инструменты составления запроса, но и каталог включенных в систему сайтов. Он автоматически выстраивается на основе тегов, присвоенных сайтам автором поисковика. Всего на данном поисковике выделено несколько десятков категорий. Среди них как тематические разделы, посвященные отдельным научным дисциплинам, так и разделы, выделенные по типам интернет-ресурсов. К таким разделам относятся Форумы и блоги, а также Электронные библиотеки.
В системе научного поиска на базе Flexum доступен только режим простого поиска. Найденные веб-страницы могут выводиться единым списком с сортировкой по релевантности или группироваться по сайтам, на которых они были найдены. Рядом с каждой ссылкой в списке выдачи находится кнопка вызова формы поиска с помощью Flexum на найденном сайте. Расположенная рядом со списком выдачи панель тегов-закладок позволяет быстро переходить к поиску только на сайтах, помеченных соответствующими тегами, что повышает точность поиска.
Главное достоинство данного ресурса – хороший охват научных интернет-ресурсов на русском языке. К недостаткам отнесем отсутствие дополнительных возможностей составления сложных запросов, а также наличие информационного шума в результатах поиска. Справедливости ради отметим, что эти недостатки свойственны многим персональным поисковикам.
ScirusЛюбой серьезный специалист не может развиваться в профессиональном плане, не получая качественной информации о сфере своей деятельности. О студенте, который пишет курсовую, мы уже говорили. Давайте теперь вспомним про его научного руководителя. Современная наука многонациональна, оставаться на гребне волны, не интересуясь зарубежными публикациями, сейчас, пожалуй, просто невозможно. Однако здесь начинаются проблемы. В мире выходит огромное количество книжных и периодических изданий научной тематики. Получить доступ к таким «бумажным» версиям зачастую сложно, иногда не помогают и библиотеки: относительно малое количество людей, интересующихся специфическими узкими темами, помноженное на традиционно высокую стоимость научной литературы не способствует полноте комплектования таких библиотек. В этой ситуации на помощь опять же приходит интернет. Даже исторически глобальная компьютерная сеть связана с академической наукой – это было, пожалуй, первое применение интернета в «мирной» жизни за пределами сферы интересов военных. Сохраняется это значение интернета и в наши дни. В. Сети находится значительное количество архивов и баз данных научной тематики. Правда, при попытке ими воспользоваться возникают новые проблемы. Во-первых, никуда не пропадает проблема оценки качества и достоверности информации. Более того, критерии качества источников в научной и профессиональной деятельности значительно повышаются. Во-вторых, сетевые базы могут быть как открытыми, бесплатными, так и коммерческими, цены на доступ к которым не отличаются демократичностью. Разделить их в списке выдачи универсальных интернет-поисковиков сложно. Справиться с новыми вызовами помогают специализированные интернет-поисковики.
Система Scirus предназначена для поиска научной информации в сферах естественных наук, компьютерных технологий, экологии, экономики, менеджмента и лингвистики. Индексная база Scirus рассчитана на специалистов и исследователей В настоящее время в нее входит порядка трехсот семидесяти миллионов документов. Это именно научные публикации, взятые из солидных источников. Если говорить о доступных видах документов, то это не только журнальные статьи и монографии, но и научные рефераты, препринты, материалы конференций, патенты. Кроме того, ведется поиск на официальных сайтах научных организаций и учреждений. К сожалению, среди источников Scirus нет русскоязычных ресурсов, поэтому для эффективной работы с найденным контентом требуется знание иностранных языков.
Замечательное качество данного поисковика состоит в том, что любая найденная ссылка обязательно ведет к полному тексту найденной публикации. Это значит, что пользуясь Scirus, вы, в отличие от многих других подобных поисковиков, не попадете в результате на страницу платной базы, где вам покажут один-два абзаца текста и ненавязчиво попросят за просмотр остального несколько десятков евро. В то же время Scirus может работать и с коммерческими источниками. Для этого предусмотрена устанавливаемая при настройке поисковика опция показа результатов, полученных, в том числе, и из коммерческих баз.
Возможности составления запросов предусматривают режимы простого и расширенного поиска. В режиме расширенного поиска можно пользоваться стандартными логическими операторами, фильтровать список выдачи по видам документов и форматам файлов. Доступен поиск введенных ключевых слов в определенных полях описания документов (автор, заглавие, ISSN и другие). Кроме того, в форме расширенного поиска присутствует несколько специфических для научной сферы фильтров. Например, можно ограничить выдачу только электронными материалами «печатных» журналов или же результатами, полученными со страниц веб-проектов, причем допускается детальный выбор используемых при поиске источников. Интересен фильтр Subject Areas. Как известно, значительный процент современных исследований проводится на стыках нескольких дисциплин. С помощью данного фильтра можно четко обозначить сферу науки, к которой должны относиться ожидаемые результаты поиска. Это позволяет гибко выделять в результатах поиска как узкие исследования, так и публикации междисциплинарного характера (рис. 2.3).
Рис. 2.3. Система Scirus предлагает поиск среди 370 млн научных публикаций
Интерфейс страницы поисковой выдачи Scirus разделен на несколько панелей. Основная часть экрана отдана списку выдачи, который можно сортировать по релевантности и по дате публикаций. Возле всех ссылок находятся флажки, с помощью которых можно отобрать нужное подмножество записей и одним щелчком мыши отправить их по электронной почте, сохранить для дальнейшей работы (не более 25 ссылок, причем для этого понадобится включить в браузере режим сохранения куки-файлов) или же экспортировать в виде списка. Раздел Refine your Search демонстрирует список дополнительных ключевых слов, автоматически найденных в результатах поиска и позволяющих быстро уточнить свой запрос. Доступны инструменты фильтрации найденного контента по признаку источника.
Возможности дополнительной настройки поисковика Scirus достаточно скромны. Можно задать количество ссылок на странице выдачи, включить режим вывода ссылок на документы из фондов библиотек-партнеров Scirus, а также управлять группировкой ссылок на странице выдачи.
Scirus предлагает несколько вспомогательных дополнений для браузеров Это стандартный простой поисковый плагин и довольно удобная панель инструментов Scirus Toolbar. У веб-мастеров есть возможность установить на своем сайте поисковую форму Scirus. Соответствующий код доступен на странице Downloads – останется только разместить его в коде своего проекта, как любой другой JavaScript-виджет.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?