Текстовые редакторы и программы распознавания образов

Автор работы: Пользователь скрыл имя, 20 Сентября 2011 в 16:22, курсовая работа

Описание

Для достижения поставленной перед собой задачи, я изучу литературу по строению и работе наиболее массовых и востребованных периферийных устройств ввода, а так же литературу по описанию функциональных возможностей наиболее известных программных пакетов по работе с документами. Даже выполнение этой курсовой работы не обошлось без использования одной из этих программ, а именно Microsoft Word 2007, что лишний раз показывает, насколько важна эта тема для современного человека.

Содержание

Введение 3

Глава 1. Аппаратное и программное обеспечение ввода текстовой и графической информации 4

1.1 Назначение и классификация устройств ввода 4

1.2 Виды и характеристики сканеров 7

1.3 Виды текстовых редакторов 10

Глава 2. Текстовые редакторы и программы распознавания образов 13

2.1 Блокнот 13

2.2 Microsoft Word 15

2.3 Adobe Acrobat/Reader 19

2.4 FineReader 20

Выводы и предложения 24

Список использованной литературы 25

Скачать (453.36 Кб) Сколько стоит заказать работу?

Работа состоит из 1 файл

Организация ввода текстовой и графической информации.docx

— 468.42 Кб (Скачать документ)

- данный текст отображен полужирным начертанием (“Ctrl+B”);

- данный текст отображен курсивным начертанием (“Ctrl+I”);

- данный текст отображен с подчеркиванием (“Ctrl+U”).

При вводе текста часто существует необходимость ввода специальных символов, не имеющих соответствующей клавиши в раскладе клавиатуры, а также произвольных символов, раскладка для которых неизвестна.

Основным средством для ввода символов, а также для закрепления их за избранными клавишами является диалоговое окно “Символ” (Вставка→Символ). В том же окне имеются кнопки “Автозамена” и “Клавиша”, позволяющие либо выполнять ввод специальных символов обычными символами и автоматически производить замену, либо закрепить специальный символ за избранной комбинацией клавиш.

В текстовых документах часто используют списки – перечисления разных типов оформления. При создании списков каждый абзац считается отдельным элементом списка, и ему присваивается соответствующий номер или маркировка. Таким образом, способ оформления списка – это параметр форматирования абзаца.

Нумерация абзацев списка производится автоматически, а при его редактировании, в случае изменения местоположения абзаца, происходит его автоматическая перенумерация.

Различают следующие виды списков:

- нумерованные – элементы списка (абзацы) нумеруются по порядку;

- маркированные – элементы списка маркируются, каким-либо специально назначенным символом;

- многоуровневый список – элементы списка нумеруются с отображением их уровня.

2.3 Adobe Acrobat/Reader

Если разговор заходит о формате PDF, то практически каждый пользователь сразу же вспоминает программу Adobe Reader. Это не удивительно – Adobe Reader создана разработчиками данного формата и поэтому позволяет работать с файлами любой сложности, а также поддерживает все его спецификации. Кроме того, данная программа абсолютно бесплатна.

Однако нельзя забывать, что у компании Adobe есть еще одно известное ПО – Adobe Acrobat. Это уже коммерческий продукт, за право использования которого нужно платить.

Adobe Reader позволяет осуществлять с документами PDF только два действия – просматривать и распечатывать. Естественно, при этом можно использовать все функциональные возможности – масштабировать листы при просмотре, осуществлять поиск информации или предпросмотр перед печатью (если создатель не отключил подобные возможности при создании PDF) и т.п. Кроме того, в Adobe Reader 9 реализована поддержка технологии Adobe Flash. Еще эта программа может использоваться для создания, хранения и рассылки документов при помощи сайта Acrobat.com.

В некоторых случаях пользователи Adobe Reader могут рецензировать документы PDF при помощи привычных средств комментирования, заполнять и сохранять вложенные в них формы, а также работать с цифровой подписью файлов. Однако эти возможности доступны только в том случае, если в документе их предварительно активировали в программе Adobe Acrobat. Таким образом, можно сделать следующий вывод. Программа Adobe Reader – удобное средство для чтения документов PDF в электронном или печатном виде. Однако в том случае, если пользователь сталкивается с необходимостью решить какую-либо иную задачу, без Adobe Acrobat'а ему уже не обойтись.

Adobe Acrobat можно назвать продуктом полного цикла. С его помощью пользователь может осуществлять весь спектр действий с документами PDF, начиная с их создания и заканчивая конвертированием в другие форматы. Таким образом, он является универсальным средством для решения любых задач, связанных с PDF и выходящих за рамки простого просмотра или распечатки файлов. Рассмотрим кратко возможности этой программы, отсутствующие в Adobe Reader'е.

Одним из основных отличий Acrobat'а является возможность создания документов PDF. Для этого в данном продукте реализован целый ряд функций. Во-первых, он интегрируется со многими приложениями (Microsoft Word, Excel, PowerPoint, Visio, AutoCAD и т.д.), в результате чего “превратить” документы из этих программ в PDF можно буквально нажатием на одну кнопку. То же самое можно делать с почтовыми сообщениями и веб-страницами. Благодаря Acrobat'у они очень просто и быстро конвертируются в PDF. Кроме того, в состав рассматриваемого продукта входит специальный виртуальный принтер. Он также предназначен для создания файлов PDF, причем с его помощью документы можно конвертировать практически из любого другого формата. Для этого пользователь лишь должен иметь возможность открыть файл в какой-либо программе и “распечатать” его на виртуальном принтере. Отдельного упоминания заслуживает функция перевода бумажных документов в PDF. Реализована она путем сканирования исходных листов, распознания текста с помощью технологии OCR и генерации файла нужного формата.

В процессе создания документа PDF пользователь может пользоваться широким спектром дополнительных возможностей. К ним относится, например, функция объединения нескольких файлов в один документ PDF. Примечательно, что исходные объекты могут быть разных типов. Это позволяет объединять в одном документе, например, текст, наглядные графики, диаграммы. Кроме того, в последних версиях Adobe Acrobat появилась возможность вставлять в файлы PDF медиа-объекты, флэшь-ролики, карты, трехмерные объекты и т.п.

Еще одной важной особенностью программы Adobe Acrobat является использование всех средств защиты информации, существующих в спецификациях формата PDF. Применять их можно как при создании документов, так и в будущем в процессе их редактирования. К средствам защиты относятся ограничения на печать, копирование и изменение файлов, надежное шифрование с ключом 256 бит, цифровая подпись и сертификация на основе цифровых удостоверений.

Преимущества Adobe Acrobat проявляются не только в процессе создания документов PDF, но и при их просмотре. Хотя, слово “просмотр” здесь не совсем уместно. Adobe Acrobat, в отличие от Reader'а, обеспечивает полноценную работу с существующими документами PDF. В частности, их можно рецензировать (делать заметки, отмечать текст маркером и т.п.), комментировать, изменять и т.д. И делать это не только в одиночку, но и в групповом режиме, когда каждый участник может просматривать комментарии других пользователей. Причем Adobe Acrobat позволяет организовать совместный доступ к одному файлу с его синхронизацией в режиме реального времени и ведением общего чата.

Adobe Acrobat позволяет не только создавать и работать с документами PDF, но и преобразовывать их в формат Microsoft Word. При этом сохраняется весь “внешний вид” файла: макет, шрифты, правила форматирования и даже таблицы. Эта возможность позволяет создать из документа PDF файл, который можно отредактировать с помощью привычных всем офисных средств. Данная функция, конечно, нужна не всем пользователям. Тем не менее, в некоторых ситуациях она оказывается просто-напросто незаменимой.

2.4 FineReader

FineReader – система оптического распознавания символов, разработанная российской компанией ABBYY, это профессиональное приложение для конвертирования отсканированных изображений, фотографий, документов или PDF-файлов в редактируемые электронные форматы, такие как Microsoft Word, Microsoft Excel, Microsoft Powerpoint, Rich Text Format, HTML, PDF/A, searchable PDF, CSV и текстовые (plain text) файлы.

Поддерживает распознавание текста на 186 языках и имеет встроенную проверку орфографии для 39 из них.

Существует несколько версий продукта, которые отличаются своими возможностями и политикой лицензирования:

Home Edition – только для домашнего использования, обладает основными возможностями;
Professional Edition – для индивидуального использования дома и в офисе;
Corporate Edition – для малого и среднего бизнеса, которому необходимы гибкая система лицензирования и возможность совместной работы с документами в локальной сети;
Site License Edition – для крупных организаций и государственных учреждений, которым необходима индивидуальная политика лицензирования.

Интеллектуальная система оптического распознавания (OCR) ABBYY FineReader полностью сохраняет оформление документа: иллюстрации, картинки, списки и т. д. Полученные результаты можно редактировать в программах Microsoft Office, сохранять в разных форматах, отправлять по электронной почте и публиковать в Интернете.

Благодаря технологии адаптивного распознавания ADRT2.0 (Adaptive Document Recognition Technology) программа точно распознает документы со сложным форматированием.

FineReader анализирует документ как единое целое, при этом полностью сохраняя его логическую структуру:

- разноуровневые заголовки;

- оглавление;

- нижние и верхние колонтитулы;

- номера страниц;

- сноски;

- стили шрифтов и заголовков;

- подписи к картинкам/таблицам/диаграммам и т.д.

Так же программа умеет находить в тексте ссылки на веб-сайты, адреса электронной почты, файлы, ftp-серверы и воспроизводить их в выходных документах. Еще есть возможность автоматического сохранения глав книги в отдельные HTML-файлы и восстановления ссылок в содержании на соответствующие главы книги. Благодаря этому пользователи смогут самостоятельно и легко создавать книги, оптимизированные под электронные книги.

FineReader работает со всеми популярными моделями сканеров и многофункциональных устройств, а также корректно распознает фотографии текстов, сделанных с помощью цифрового фотоаппарата или фотокамеры мобильного телефона.

Функции автоматической предобработки:

- устранение перекосов и искажения строк;

- разделение двойных страниц;

- устранение искажений;

- определение положения страницы;

- исправление 3D искажений.

Ручные инструменты обработки изображений:

- разделение на несколько страниц;

- поворот (90°, 180°, 270°);

- исправление трапециевидных искажений;

- инвертирование;

- обрезка изображения;

- устранение шумов и нечеткости изображения.

ABBYY FineReader имеет простой и интуитивно понятный в использовании интерфейс (рис.4).

Основные сценарии по распознаванию документов вынесены в отдельное окно, что позволяет начать работу с программой даже самому неопытному пользователю.

Рис.4 Окно выбора сценария сканирования документа

Программу можно запустить напрямую из самых популярных приложений (Microsoft Word, Excel и т.д.) и вставить распознанный текст в место расположения курсора в уже открытый или новый документ.

Данный программный продукт умеет открывать и переводить в редактируемый формат файлы PDF. Программа распознает любые типы PDF-файлов, будь то PDF с текстовым слоем или PDF, содержащий только изображение. При создании PDF-файла можно ограничить доступ к файлу, например, защитить его паролем, установить запрет на открытие файла или извлечение из него текста и графики. При открытии подобных файлов ABBYY FineReader будет запрашивать пароль, чтобы обеспечить защиту авторских прав.

Выводы и предложения

В данной курсовой работе я рассмотрел наиболее востребованные устройства ввода информации в ПК. Естественно, список таких устройств значительно шире, и в рамках данной работы невозможно провести обзор по всей созданной “периферии”. Существуют тысячи таких устройств, но, как правило, они используются для ввода специализированной информации (различные физические величины в исследовательских лабораториях или показания цифровых датчиков на автоматизированных предприятиях).

Благодаря выполненному обзору, я значительно лучше стал понимать механизм взаимодействия человека и вычислительной машины, мне стали понятны основные этапы процесса ввода информации в компьютер. Это наиболее ясно видно по всем типам изученных сканеров, среди которых были рассмотрены модели, существенно различающиеся по устройству светового датчика, источника света, интерфейсам для связи с ПК и т.д.

Разработка периферийных устройств ввода информации не остановилась на достигнутых рубежах, такие устройства постоянно совершенствуются, и в будущем нас ждет еще большее их многообразие. Скорее всего, появятся изделия, которые будут основаны на совершенно иных физических принципах передачи сигналов, что упростит и ускорит взаимодействие человека с вычислительной машиной. Уже в настоящее время появились аппаратно-программные комплексы ввода текста, основанные на анализе человеческой речи, что позволяет вводить текст, просто произнося его вслух.

Информация о работе Текстовые редакторы и программы распознавания образов