Страница: 25/25
Наиболее предпочтительным является использование сканера совместно с программами систем распознавания образов, например типа OCR (Optical Character Recognition). Система OCR распознает считанные сканером с документа битовые (мозаичные) контуры символов (букв и цифр) и кодирует их ASCII-кодами, переводя в удобный для текстовых редакторов векторный формат.
Некоторые системы OCR предварительно нужно обучить распознаванию - ввести в память сканера шаблоны и прототипы распознаваемых символов и соответствующие им коды. Сложности возникают при распознавании букв, совпадающих по начертанию в разных алфавитах (например, в латинском (английском) и в русском - кириллица), и разных гарнитур (способов начертания) шрифтов. Но большинство систем не требуют обучения: в их памяти уже заранее помещены распознаваемые символы. Так, одна из лучших OCR - программный пакет TIGER 2.0 содержит прототипы 30 различных гарнитур, а для распознавания английских и русских букв использует встроенные электронные словари.
В последние годы появились интеллектуальные программы распознавания образов типа Omnifont, которые опознают символы не по точкам, а по характерной для каждого из них индивидуальной топологии. При наличии системы распознавания образов текст записывается в память ПК уже не в виде битовой карты, а в виде кодов, и его можно редактировать обычными текстовыми редакторами.
Сканер подключается к параллельному порту ПК. Для работы со сканером ПК должен иметь специальный драйвер, желательно драйвер, соответствующий стандарту TWAIN. В последнем случае возможна работа с большим числом TWAIN-совместимых сканеров и обработка файлов поддерживающими стандарт TWAIN программами, например распространенными графическими редакторами Corel Draw, Max Mate, Picture Publisher, Adobe PhotoShop, Photo Finish. Распознавание текста FineReader. Большинство драйверов ориентированы на работу с локальным компьютерным интерфейсом SCSI.
Реферат опубликован: 16/11/2007