Текстовые редакторы и программы распознавания образов

Автор работы: Пользователь скрыл имя, 20 Сентября 2011 в 16:22, курсовая работа

Описание

Для достижения поставленной перед собой задачи, я изучу литературу по строению и работе наиболее массовых и востребованных периферийных устройств ввода, а так же литературу по описанию функциональных возможностей наиболее известных программных пакетов по работе с документами. Даже выполнение этой курсовой работы не обошлось без использования одной из этих программ, а именно Microsoft Word 2007, что лишний раз показывает, насколько важна эта тема для современного человека.

Содержание

Введение 3

Глава 1. Аппаратное и программное обеспечение ввода текстовой и графической информации 4

1.1 Назначение и классификация устройств ввода 4

1.2 Виды и характеристики сканеров 7

1.3 Виды текстовых редакторов 10

Глава 2. Текстовые редакторы и программы распознавания образов 13

2.1 Блокнот 13

2.2 Microsoft Word 15

2.3 Adobe Acrobat/Reader 19

2.4 FineReader 20

Выводы и предложения 24

Список использованной литературы 25

Работа состоит из  1 файл

Организация ввода текстовой и графической информации.docx

— 468.42 Кб (Скачать документ)

     - данный текст отображен полужирным начертанием (“Ctrl+B”);

     - данный текст отображен курсивным начертанием (“Ctrl+I”);

     - данный текст отображен с подчеркиванием (“Ctrl+U”).

     При вводе текста часто существует необходимость  ввода специальных символов, не имеющих  соответствующей клавиши в раскладе клавиатуры, а также произвольных символов, раскладка для которых  неизвестна.

     Основным  средством для ввода символов, а также для закрепления их за избранными клавишами является диалоговое окно “Символ” (Вставка→Символ). В том же окне имеются кнопки “Автозамена” и “Клавиша”, позволяющие либо выполнять ввод специальных символов обычными символами и автоматически производить замену, либо закрепить специальный символ за избранной комбинацией клавиш.

     В текстовых документах часто используют списки – перечисления разных типов оформления. При создании списков каждый абзац считается отдельным элементом списка, и ему присваивается соответствующий номер или маркировка. Таким образом, способ оформления списка – это параметр форматирования абзаца.

     Нумерация абзацев списка производится автоматически, а при его редактировании, в случае изменения местоположения абзаца, происходит его автоматическая перенумерация.

     Различают следующие виды списков:

    - нумерованные – элементы списка (абзацы) нумеруются по порядку;

    - маркированные – элементы списка маркируются, каким-либо специально назначенным символом;

    - многоуровневый список – элементы списка нумеруются с отображением их уровня.

2.3 Adobe Acrobat/Reader

     Если  разговор заходит о формате PDF, то практически каждый пользователь сразу  же вспоминает программу Adobe Reader. Это  не удивительно – Adobe Reader создана  разработчиками данного формата  и поэтому позволяет работать с файлами любой сложности, а  также поддерживает все его спецификации. Кроме того, данная программа абсолютно  бесплатна.

     Однако  нельзя забывать, что у компании Adobe есть еще одно известное ПО – Adobe Acrobat. Это уже коммерческий продукт, за право использования которого нужно платить.

     Adobe Reader позволяет осуществлять с документами PDF только два действия – просматривать и распечатывать. Естественно, при этом можно использовать все функциональные возможности – масштабировать листы при просмотре, осуществлять поиск информации или предпросмотр перед печатью (если создатель не отключил подобные возможности при создании PDF) и т.п. Кроме того, в Adobe Reader 9 реализована поддержка технологии Adobe Flash. Еще эта программа может использоваться для создания, хранения и рассылки документов при помощи сайта Acrobat.com.

     В некоторых случаях пользователи Adobe Reader могут рецензировать документы PDF при помощи привычных средств  комментирования, заполнять и сохранять  вложенные в них формы, а также  работать с цифровой подписью файлов. Однако эти возможности доступны только в том случае, если в документе  их предварительно активировали в программе Adobe Acrobat. Таким образом, можно сделать  следующий вывод. Программа Adobe Reader – удобное средство для чтения документов PDF в электронном или  печатном виде. Однако в том случае, если пользователь сталкивается с необходимостью решить какую-либо иную задачу, без Adobe Acrobat'а ему уже не обойтись.

     Adobe Acrobat можно назвать продуктом полного цикла. С его помощью пользователь может осуществлять весь спектр действий с документами PDF, начиная с их создания и заканчивая конвертированием в другие форматы. Таким образом, он является универсальным средством для решения любых задач, связанных с PDF и выходящих за рамки простого просмотра или распечатки файлов. Рассмотрим кратко возможности этой программы, отсутствующие в Adobe Reader'е.

     Одним из основных отличий Acrobat'а является возможность создания документов PDF. Для этого в данном продукте реализован целый ряд функций. Во-первых, он интегрируется со многими приложениями (Microsoft Word, Excel, PowerPoint, Visio, AutoCAD и т.д.), в результате чего “превратить” документы  из этих программ в PDF можно буквально  нажатием на одну кнопку. То же самое  можно делать с почтовыми сообщениями  и веб-страницами. Благодаря Acrobat'у  они очень просто и быстро конвертируются в PDF. Кроме того, в состав рассматриваемого продукта входит специальный виртуальный принтер. Он также предназначен для создания файлов PDF, причем с его помощью документы можно конвертировать практически из любого другого формата. Для этого пользователь лишь должен иметь возможность открыть файл в какой-либо программе и “распечатать” его на виртуальном принтере. Отдельного упоминания заслуживает функция перевода бумажных документов в PDF. Реализована она путем сканирования исходных листов, распознания текста с помощью технологии OCR и генерации файла нужного формата.

     В процессе создания документа PDF пользователь может пользоваться широким спектром дополнительных возможностей. К ним  относится, например, функция объединения  нескольких файлов в один документ PDF. Примечательно, что исходные объекты  могут быть разных типов. Это позволяет  объединять в одном документе, например, текст, наглядные графики, диаграммы. Кроме того, в последних версиях Adobe Acrobat появилась возможность вставлять  в файлы PDF медиа-объекты, флэшь-ролики, карты, трехмерные объекты и т.п.

     Еще одной важной особенностью программы Adobe Acrobat является использование всех средств защиты информации, существующих в спецификациях формата PDF. Применять  их можно как при создании документов, так и в будущем в процессе их редактирования. К средствам защиты относятся ограничения на печать, копирование и изменение файлов, надежное шифрование с ключом 256 бит, цифровая подпись и сертификация на основе цифровых удостоверений.

     Преимущества Adobe Acrobat проявляются не только в  процессе создания документов PDF, но и  при их просмотре. Хотя, слово “просмотр” здесь не совсем уместно. Adobe Acrobat, в  отличие от Reader'а, обеспечивает полноценную  работу с существующими документами PDF. В частности, их можно рецензировать (делать заметки, отмечать текст маркером и т.п.), комментировать, изменять и  т.д. И делать это не только в одиночку, но и в групповом режиме, когда  каждый участник может просматривать  комментарии других пользователей. Причем Adobe Acrobat позволяет организовать совместный доступ к одному файлу  с его синхронизацией в режиме реального времени и ведением общего чата.

     Adobe Acrobat позволяет не только создавать  и работать с документами PDF, но и преобразовывать их в  формат Microsoft Word. При этом сохраняется  весь “внешний вид” файла:  макет, шрифты, правила форматирования  и даже таблицы. Эта возможность  позволяет создать из документа  PDF файл, который можно отредактировать  с помощью привычных всем офисных  средств. Данная функция, конечно,  нужна не всем пользователям.  Тем не менее, в некоторых  ситуациях она оказывается просто-напросто  незаменимой.

2.4 FineReader

     FineReader – система оптического распознавания символов, разработанная российской компанией ABBYY, это профессиональное приложение для конвертирования отсканированных изображений, фотографий, документов или PDF-файлов в редактируемые электронные форматы, такие как Microsoft Word, Microsoft Excel, Microsoft Powerpoint, Rich Text Format, HTML, PDF/A, searchable PDF, CSV и текстовые (plain text) файлы.

     Поддерживает  распознавание текста на 186 языках и  имеет встроенную проверку орфографии для 39 из них.

     Существует несколько версий продукта, которые отличаются своими возможностями и политикой лицензирования:

  1. Home Edition только для домашнего использования, обладает основными возможностями;
  2. Professional Edition – для индивидуального использования дома и в офисе;
  3. Corporate Edition – для малого и среднего бизнеса, которому необходимы гибкая система лицензирования и возможность совместной работы с документами в локальной сети;
  4. Site License Edition – для крупных организаций и государственных учреждений, которым необходима индивидуальная политика лицензирования.

     Интеллектуальная  система оптического распознавания (OCR) ABBYY FineReader полностью сохраняет  оформление документа: иллюстрации, картинки, списки и т. д. Полученные результаты можно редактировать в программах Microsoft Office, сохранять в разных форматах, отправлять по электронной почте  и публиковать в Интернете.

     Благодаря технологии адаптивного распознавания ADRT2.0 (Adaptive Document Recognition Technology) программа  точно распознает документы со сложным  форматированием.

     FineReader анализирует документ как единое  целое, при этом полностью сохраняя  его логическую структуру:

     - разноуровневые заголовки;

     - оглавление;

     - нижние и верхние колонтитулы;

     - номера страниц;

     - сноски;

     - стили шрифтов и заголовков;

     - подписи к картинкам/таблицам/диаграммам и т.д.

     Так же программа умеет находить в тексте ссылки на веб-сайты, адреса электронной почты, файлы, ftp-серверы и воспроизводить их в выходных документах. Еще есть возможность автоматического сохранения глав книги в отдельные HTML-файлы и восстановления ссылок в содержании на соответствующие главы книги. Благодаря этому пользователи смогут самостоятельно и легко создавать книги, оптимизированные под электронные книги.

     FineReader работает со всеми популярными  моделями сканеров и многофункциональных  устройств, а также корректно  распознает фотографии текстов,  сделанных с помощью цифрового  фотоаппарата или фотокамеры  мобильного телефона.

     Функции автоматической предобработки:

     - устранение перекосов и искажения строк;

     - разделение двойных страниц;

     - устранение искажений;

     - определение положения страницы;

     - исправление 3D искажений.

     Ручные  инструменты обработки изображений:

     - разделение на несколько страниц;

     - поворот (90°, 180°, 270°);

     - исправление трапециевидных искажений;

     - инвертирование;

     - обрезка изображения;

     - устранение шумов и нечеткости изображения.

     ABBYY FineReader имеет простой и интуитивно понятный в использовании интерфейс (рис.4).

     Основные  сценарии по распознаванию документов вынесены в отдельное окно, что  позволяет начать работу с программой даже самому неопытному пользователю. 

     

Рис.4 Окно выбора сценария сканирования документа

     Программу можно запустить напрямую из самых  популярных приложений (Microsoft Word, Excel и т.д.) и вставить распознанный текст в место расположения курсора в уже открытый или новый документ.

     Данный  программный продукт умеет открывать и переводить в редактируемый формат файлы PDF. Программа распознает любые типы PDF-файлов, будь то PDF с текстовым слоем или PDF, содержащий только изображение. При создании PDF-файла можно ограничить доступ к файлу, например, защитить его паролем, установить запрет на открытие файла или извлечение из него текста и графики. При открытии подобных файлов ABBYY FineReader будет запрашивать пароль, чтобы обеспечить защиту авторских прав. 

 

     

Выводы  и предложения

     В данной курсовой работе я рассмотрел наиболее востребованные устройства ввода  информации в ПК. Естественно, список таких устройств значительно  шире, и в рамках данной работы невозможно провести обзор по всей созданной  “периферии”. Существуют тысячи таких устройств, но, как правило, они используются для ввода специализированной информации (различные физические величины в исследовательских лабораториях или показания цифровых датчиков на автоматизированных предприятиях).

     Благодаря выполненному обзору, я значительно  лучше стал понимать механизм взаимодействия человека и вычислительной машины, мне стали понятны основные этапы  процесса ввода информации в компьютер. Это наиболее ясно видно по всем типам изученных сканеров, среди которых были рассмотрены модели, существенно различающиеся по устройству светового датчика, источника света, интерфейсам для связи с ПК и т.д.

     Разработка  периферийных устройств ввода информации не остановилась на достигнутых рубежах, такие устройства постоянно совершенствуются, и в будущем нас ждет еще  большее их многообразие. Скорее всего, появятся изделия, которые будут  основаны на совершенно иных физических принципах передачи сигналов, что  упростит и ускорит взаимодействие человека с вычислительной машиной. Уже в настоящее время появились  аппаратно-программные комплексы  ввода текста, основанные на анализе  человеческой речи, что позволяет  вводить текст, просто произнося  его вслух.

Информация о работе Текстовые редакторы и программы распознавания образов