Автоматизированные информационно-поисковые системы

Автор работы: Пользователь скрыл имя, 15 Июня 2011 в 16:54, контрольная работа

Описание

В данной работе рассматриваются теоретические основы информационного поиска, классификация и разновидности информационно поисковых систем. Представлен материал по применяемым в настоящее время информационно – поисковым каталогом полнотекстовыми и гипертекстовым поисковым системам.

Содержание

ВВЕДЕНИЕ………………………………………………………………… 3


1. ИНФОРМАЦИОННЫЕ СИСТЕМЫ…………………………………... 4

1.1 Структура информационной системы………………………… 4

1.2 Классификация информационных систем……………………. 5


2. ИНФОРМАЦИОННЫЕ ПОИСКОВЫЕ СИСТЕМЫ……………….... 7

2.1 Понятие информационных поисковых систем………….……. 7

2.2 Особенности поисковых систем………………………….……. 7

2.3 Структура сети………………………………………………….. 9

2.4 Структура работы поисковых систем…………………………. 11


ЗАКЛЮЧЕНИЕ……………………………………………………………. 16


Список использованной литературы………………………. 17

Работа состоит из  1 файл

Автоматизированные информационно-поисковые системы.doc

— 85.00 Кб (Скачать документ)

Содержание

                           стр. 

ВВЕДЕНИЕ………………………………………………………………… 3 

1. ИНФОРМАЦИОННЫЕ СИСТЕМЫ…………………………………... 4

      1.1 Структура информационной системы………………………… 4

      1.2 Классификация информационных систем……………………. 5 

2. ИНФОРМАЦИОННЫЕ  ПОИСКОВЫЕ СИСТЕМЫ……………….... 7

      2.1 Понятие информационных поисковых систем………….……. 7

      2.2 Особенности поисковых систем………………………….……. 7

      2.3 Структура сети………………………………………………….. 9

      2.4 Структура работы поисковых систем…………………………. 11 

ЗАКЛЮЧЕНИЕ……………………………………………………………. 16 

Список  использованной литературы………………………. 17 
 

 

ВВЕДЕНИЕ

      Современный этап развития цивилизации характеризуется  переходом наиболее развитой части  человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети.

      Под Информационная системой понимается организованная совокупность программно – технических  и других вспомогательных средств, технологических процессов и  функционально – определенных групп  работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений необходимых для удовлетворения информационных потребностей пользователей. Информационных системы являются основным средством, инструментарием решения задач информационного обеспечения различных видов деятельности и наиболее бурно развивающейся отраслью индустрии информационных технологий.

        В данной работе рассматриваются  теоретические основы информационного  поиска, классификация и разновидности информационно поисковых систем. Представлен материал по применяемым в настоящее время информационно – поисковым каталогом полнотекстовыми и гипертекстовым поисковым системам.

      При появлении сети Интернет проблема поиска становилась более актуальной. Интернет – всемирная компьютерная сеть, представляющая собой единую информационную среду и позволяющая получить информацию в любое время. Но с другой стороны в Интернете храниться очень много полезной информации, но для поиска её требуется затрачивать много времени. Эта проблема послужила поводом к появлению поисковых машин. В данной работе будут рассмотрены поисковые машины в Интернете.

 

1. ИНФОРМАЦИОННЫЕ СИСТЕМЫ

      1.1 Структура информационной системы

      В составе информационной системы  можно выделить три подсистемы:

      1.Организационно  – технологическая подсистема  сбора информации обеспечивает  информационную систему и включает  совокупность источников информации, организационно – технологической  цепочки отбора информации для  накопления в системе. Без правильного организованной подсистемы сбора информации невозможна эффективная организация функционирования все информационной системы в целом.

      2. Подсистема предоставления и  обработки информации составляет  ядро информационной системы  и является отражением представления разработчиками и абонентами системы структуры и картины предметной области, сведения о которой должна отражать информационная система. Подсистема представления и обработки информации является одним из наиболее сложных компонентов при разработке информационной системы.

      3. Нормативно – функциональная  подсистема выдачи информации  определяет пользователей, или  иначе абонентов системы, реализует  целевой аспект назначения и  выполнения задач информационной  системы.

      Основой всех поисковых систем составляют базы данных – совокупность данных организованных по предельным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимо от прикладных программ.

      Можно выделить следующие элементы функционирования информационных систем:

      1) Сбор информации – организованный в специальном порядке процесс сбора и отображения информации:

            - получение информации

            - оценка относимости информации

            - порядок отбора и фиксации информации.

      2) Комплектование – процесс сложения информации из множества частей в единое целое и доведения её до пользователя.

      3) Поиск и выдача информации – установление специального технологического порядка удовлетворения информационных потребностей абонентов информационной системы в управленческой деятельности и технологических процессах.

      4) Поддержание целостности и сохранения информации – пересмотр, ревизия и отсеивание утратившей актуальность информации являются неотъемлемой функцией информационных подразделений. Сохранность информации осуществляется с помощью нормативно – инструктивных документов. 

      1.2 Классификация информационных систем

      По  характеру предоставления  логической организации хранимой информации разделяются  на фактографические, документальные и геоинформационные.

      Фактографические  накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому – либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области.

      В документальных единичным элементом  информации является нерасчлененный на более мелкие элементы документ и  информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции – дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов – соподчиненность по смысловому содержанию.

      В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей  электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент.

      Другим  критерием классификации поисковых  систем являются функции или решаемые задачи.

      Справочные  являются наиболее распространенным типом  функций информационных систем, и  заключается в предоставлении абонентам  системы возможностей получения  установочных данных на определённые классы объектов.

      Поисковые являются наиболее распространённым классом информационных систем. В общем, виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно – логического описания предметной области.

      Расчетные заключается в обработке информации , находящейся в системе, по определённым расчётным алгоритмам для различных целей.

      Технологические функции информационных систем заключаются  в автоматизации всего технологического цикла или отдельных его компонентов, производственной или организационной  структуры.

 

2. ИНФОРМАЦИОННЫЕ ПОИСКОВЫЕ СИСТЕМЫ

      2.1 Понятие информационных поисковых систем

      Автоматизированная  поисковая система – система, состоящая из персонала и комплекса  средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций.

      Опыт  и практика создания систем в различных  сферах деятельности позволяет дать более широкое и универсальное  определение, которое  полнее отражает все аспекты их сущности.

      Под информационной системой в дальнейшем понимается – организованная совокупность программно – технических и других вспомогательных средств, технологических процессов и функционально – определённых групп работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений, необходимых для удовлетворения информационных потребностей установленного контингента пользователей – абонентов системы. 

      2.2 Особенности поисковых систем

      В работе поисковый процесс представлен  четырьмя стадиями: формулировка (происходит до начала поиска); действие (начинающийся поиск); обзор результатов (результат, который пользователь видит после поиска); и усовершенствование (после обзора результатов и перед возвращением к поиску с иной формулировкой той же потребности). Более удобная нелинейная схема поиска информации  состоит из следующих этапов:

    1. Фиксация информационной потребности на естественном языке;
    2. Выбор поисковых сервисов сети и формализация записи информационной потребности на конкретных информационно-поисковых языках (ИПЯ);
    3. Выполнение созданных запросов;
    4. Предварительная обработка полученных списков ссылок на документы;
    5. Обращение по выбранным адресам за искомыми документами;
    6. Предварительный просмотр содержимого найденных документов;
    7. Сохранение релевантных документов для последующего изучения;
    8. Извлечение из релевантных документов ссылок для расширения запроса;
    9. Изучение всего массива сохраненных документов;
    10. Если информационная потребность не полностью удовлетворена, то возврат к первому этапу.

      Процесс поиска имеет чрезвычайно глубокий дидактический аспект – так, установлено что применение диалоговых информационных систем приводит к формированию у рядовых пользователей такого стиля информационно-поисковой деятельности, который обычно свойственен наиболее выдающимся ученым.

      В большинстве случаев информационная потребность возникает после  изучения какой-либо новой информации, полученной пользователем. Часто возникает  ситуация, когда пользователь уже  обладает некоторым массивом документов по искомой тематике. Предлагается использовать эти документы для автоматизированного составления поискового запроса с помощью специализированной системы управления документами (СУД) [6] (система находится в стадии разработки).

      Система должна осуществлять индексацию всех документов пользователя. В процессе индексации все слова, содержащиеся в документах, разбиваются по следующим семантическим классам: стоп-слова; наиболее частотные слова бытового (разговорного) языка; общекультурная терминология; общенаучная терминология; известные системе термины предметной области; неизвестные слова. Разбиение осуществляется на основе соответствующих словарей, которые должны быть составной частью системы. К неизвестным словам будут отнесены в первую очередь многие специальные слова предметной области. Туда же попадут новообразованные термины и слова, содержащие ошибки.

      На  основе индекса осуществляется построение векторного представления документов, после чего СУД производит иерархическую  кластеризацию множества документов, в результате чего получается разбиение этого множества на тематические группы. В ходе диалога с пользователем происходит выбор одного или нескольких наиболее релевантных кластеров документов и задание характеристик поискового процесса.

      Поисковый запрос следует строить на основе вектора центроида выбранного кластера. Оптимальный размер запроса составляет от 8-12 до 25-30 терминов. Последняя подготовительная операция, осуществляемая СУД заключается в записи запроса на ИПЯ.  

      2.3 Структура сети

      Как известно, наиболее простой способ расширения информационного поиска в сети Интернет применен в метапоисковых системах и заключается в увеличении количества используемых первичных ИПС. Этот механизм должен быть реализован в любой разрабатываемой системе. Задача распределения ресурсов поисковой системы по различным ИПС глобальной сети должна решаться адаптивно, на основании учета доли ссылок признанных релевантными во время предыдущих сеансов поиска.

Информация о работе Автоматизированные информационно-поисковые системы