musings.ru

Двусторонний сканер для потокового сканирования. Понятия Документный, Поточный, Протяжной, Промышленный в отношении к сканерам: Документные сканеры

Процесс сканирования, как это ни банально, начинается со сканера. Выбор сканера, а зачастую нескольких сканеров, которые будут участвовать в проекте по созданию электронного архива документов – задача не тривиальная. Поэтому остановимся по подробнее на этом вопросе.

Поточный (протяжной) сканер

Протяжные сканеры часто еще называют документными или поточными. Это обусловлено тем, что устройства данного типа могут сканировать только расшитые документы, отдельные листы бумаги, которые с помощью системы автоматической подачи протягиваются перед неподвижной сканирующей головкой.

Информация об изображении на поверхности листа преобразуется в цифровой вид и передается в компьютер для последующей обработки. В связи с тем, что скорость обработки документов в таких сканерах довольно высока (модели верхнего уровня способны сканировать до 150 страниц в минуту), процесс сканирования превращается в поток. Отсюда и название - поточные.

Исходя из вышесказанного можно сделать вывод: назначение протяжных сканеров – это работа в офисах, где важной составляющей бизнес-процессов является процесс ввода документов с бумажных носителей.

Эти сканеры позволяют автоматизировать процесс сканирования больших объемов офисной документации. Ролики системы автоматической подачи листов протягивают сканируемый оригинал перед неподвижной фотосчитывающей системой, которая преобразует отраженный от поверхности оригинала свет в последовательность электронных сигналов.

К сожалению, этот тип не предназначен для сканирования скрепленных листов, поэтому зачастую такие сканеры имеют встроенное планшетное устройство сканирования, либо присоединяемый планшет, приобретаемый отдельно. В такой связке документный сканер легко справится со сшитыми документами, книгой или журналом. Такой комбинированный тип сканера называют планшетно-протяжной.

Выбор сканера


Сегодня на рынке поточных сканеров представлено несколько ведущих игроков: во-первых так называемая «большая тройка» - Canon, Kodak (новое название Kodak Alaris), Fujitsu. Продукция данных компаний, как правило, высококачественные изделия их собственной разработки. Так же данную продукцию, но в меньшем ассортименте, предлагают такие маститые производители электроники как Panasonic, HP, Epson. Сканеры, продающиеся розничным покупателям под данными брендами, – как правило, продукция, изготовленная OEM-способом, то есть получаемая путём сборки типовых комплектующих в типовую конфигурацию. Компанию, которая занимается сборкой конечного продукта, называют OEM-производителем, а компанию, которая поставляет типовые комплектующие, – OEM-поставщиком. OEM-компонентами называется продукт, использующийся как составная часть завершенного продуктового решения. На сегодняшний день некоторые компании OEM-поставщики выводят свою продукцию на розничный рынок под своими собственными марками. Яркий пример – Avision, Microtek. Продукция под данными марками обладает схожими характеристиками с моделями известных брендов при этом имея более низкую стоимостью.

Для того чтобы среди многообразия документных сканеров выбрать модель, которая оптимально подойдет для решения поставленных заказчиком задач, необходимо объективно и четко определить и описать бизнес-потребности, связанные с вводом и обработкой документов.

Вот несколько вопросов, ответы на которые помогут существенно сузить круг рассматриваемой продукции и сделать в итоге правильный выбор:

  • Каков ежедневный объём документов, которые должны быть отсканированы?
  • Должны ли документы сканироваться в цветном или в чёрно-белом режиме?
  • Являются документы одно- или двухсторонними?
  • Каков максимальный формат оригиналов?
  • Необходимо ли улучшение качества изображения в процессе сканирования?
  • Какие дополнительные возможности необходимы:
– сканирование по сети, отправка по электронной почте,
– надпечатки на отсканированных документах,
– распознавание штрих кодов,
– сканирование сброшюрованных, сшитых, либо ветхих документов?
Все документные сканеры можно условно разделить на четыре категории в зависимости от производительности и рекомендуемой ежедневной нагрузки.
  • Сканеры малой производительности: скорость – до 30 л./мин., рекомендуемая нагрузка – до 2000 л./день.
  • Сканеры средней производительности: скорость – до 60 л./мин., рекомендуемая нагрузка – до 8000 л./день.
  • Высокопроизводительные сканеры: скорость – до 90 л./мин., рекомендуемая нагрузка – до 50000 л/день.
  • Сканеры для массового ввода документов: скорость – до 120 л./мин., рекомендуемая нагрузка – 50000 и более л./день.

Для того чтобы приблизительно определить, какую скорость должен иметь сканер для решения поставленной задачи, нужно разделить объём работы на срок, за который её нужно выполнить. Таким образом, Вы сначала сужаете свой выбор до конкретной группы, а затем в зависимости от остальных требований делаете окончательный выбор.

Теперь, когда мы определили необходимую нам группу сканеров по скорости и нагрузке, пройдемся по другим характеристикам, которыми обладает сканер и которые так же могут повлиять на окончательный выбор.

Основные характеристики сканеров

рекомендованная производителем сканера нагрузка, при которой оборудование обеспечивает бесперебойную работу в течение заявленного количества часов. Время от времени допускается превышение этой нагрузки в пределах 30% – так называемая пиковая нагрузка.

Скорость сканирования. Указывая скорость, производители имеют в виду количество листов, обрабатываемых сканером в единицу времени. При этом, если речь идёт о двухстороннем сканировании, то это число умножается на два, поскольку в результате получается в 2 раза больше изображений. Скорость сканирования зависит от следующих параметров:

  • формат оригинала – оригинал формата А4 будет отсканирован быстрее, чем А3;
  • ориентация бумаги – при горизонтальной (Landscape) загрузке бумаги скорость сканирования выше, чем при вертикальной (Portrait);
  • разрешение – чем выше выбранное разрешение, тем ниже скорость сканирования;
  • режим сканирования (цветной, чёрно-белый, оттенки серого) – скорость работы в чёрно-белом режиме, как правило, выше, чем при работе в цвете или в оттенках серого; многие современные модели сканеров обрабатывают документы с одинаковой скоростью, независимо от выбранного режима.

Максимальный формат оригинала. Максимальный линейный размер исходного документа, подаваемого в сканер. сканер может работать также со всеми форматами меньше максимального, начиная, как правило, с А8.

Максимальное оптическое разрешение. Современные сканеры сканирую как правило с разрешением 600 точек на дюйм (dots per inch, dpi). Есть варианты с разрешением 1200dpi. Выбор одного основных рабочих значений разрешения при сканировании (150, 200, 300, 400 dpi) как правило, реализован в драйвере сканера и устанавливается в диалоге сканирования.

Наличие дуплекса означает наличие одной или двух оптических систем и, соответственно, возможности одновременного сканирования обеих сторон документа. Современные модели сканеров, за редким исключением – двухсторонние.

Сканирование в цвете. Цветные модели позволяют обрабатывать документы в цветном режиме, в то время, как чёрно-белые – только в монохромном режиме и в оттенках серого. Сейчас все производители сканеров выпускают цветные модели, поскольку именно они дают пользователям максимум возможностей при работе с изображениями.

Наличие планшета. Отличительной чертой документных сканеров является наличие автоподатчика – лотка для пакетной подачи бумаги. В то же время некоторые модели сканеров помимо автоподатчика оснащены планшетом для сканирования нерасшитых (сброшюрованных) или ветхих документов, требующих бережного отношения. Для некоторых моделей сканеров производители поставляют опциональные планшеты, что позволяет подключать и использовать планшет только тогда, когда он действительно необходим для сканирования книг, журналов, сброшюрованных документов, а затем легко снимать его, освобождая пространство на рабочем месте.

Емкость автоподатчика (ADF) варьируется в пределах от 50 листов у моделей малой производительности и до 500 у сканеров для массового ввода документов. При этом, как правило, ёмкость указывается для листов плотностью 80 г/м2 (стандартная офисная бумага). Емкость ADF может играть немаловажную роль при обработке больших объемов документов, т.к. возможность загрузить единовременно большее количество листов может стать ключевым преимуществом в скорости обработки.

Тип интерфейса. Способ (стандарт) подключения сканера к персональному компьютеру. Как правило это высокоскоростной USB порт. Возможно наличие у сканера нескольких интерфейсов подключения. Дополнительно сканер может быть оснащен сетевым интерфейсом или модулем беспроводного соединения.

Мы рассмотрели так называемые «железные» характеристики сканера, то есть параметры, определяемые конструктивной, аппаратной реализацией. Помимо данных характеристик, важно понимать свойства и функционал, которые добавляет сканеру программное обеспечение, прежде всего – драйвер сканера.

Драйвер сканера. Что это?

В комплект поставки любого сканера входит пакет программного обеспечения, ответственного за правильное распознавание устройства при подключении к персональному компьютеру, а так же обеспечивающего его правильную работу. Данное специализированное ПО называется драйвер. Набор драйверов может различаться в зависимости от модели, но, существуют и универсальные интерфейсы, необходимые для взаимодействия сканера с операционной системой компьютера. В частности, нередко в описаниях сканера можно встретить такие аббревиатуры как TWAIN, WIA и ISIS-драйверы (стандарты, протоколы). Попробуем разобраться, что обозначает каждое название, и какие функции выполняет каждый из драйверов.

TWAIN

На самом деле, TWAIN – это не аббревиатура, а слово, которое в переводе с английского означает «пара» или «двойка» . Под «парой» здесь подразумевается тандем компьютер – сканер. Другими словами, TWAIN-совместимый драйвер необходим для того, чтобы операционная система компьютера могла взаимодействовать с устройствами создания и обработки изображений, в том числе и со сканерами. TWAIN драйвер сканера обычно выполнен в виде программного приложения с интуитивным пользовательским интерфейсом. Основная его функция – это передача информации от сканера к компьютерному приложению, через которое выполняются команды сканирования. Именно с его помощью производятся такие действия как предпросмотр изображений, предварительное сканирование, корректировка параметров (цвет, насыщенность и т.д.). И именно благодаря наличию TWAIN-драйвера, вы можете осуществлять сканирование из любой программы, где есть команда Scan.

WIA

Поскольку WIA расшифровывается как Windows Imaging Architecture, несложно догадаться, что этот стандарт создан специально для ОС Windows, и разработан он был компанией Microsoft. Он предназначен для более удобного управления сканером посредством стандартных и привычных для пользователей инструментов Windows. Например, именно благодаря драйверу WIA сканер отображается в диспетчере устройств компьютера при подключении, а мы можем привычным способом просмотреть его свойства и содержимое. Такой компонент драйвера как Scanner Wizard позволяет работать с изображениями с помощью стандартного интерфейса в виде окон. Данный интерфейс предлагает ряд возможностей для управления изображениями – предпросмотр, настройка разрешения, яркости, цвета, масштабирование и прочие. Таким образом, независимо от модели сканера пользователь может пользоваться привычными и понятными инструментами при работе с документами и изображениями.

ISIS

Интерфейс ISIS (Image and Scanner Interface Specification), так же, как и Twain создан для взаимодействия сканера и компьютера, но способен выполнять более сложные задачи. Он представляет собой совокупность модулей, каждый из которых выполняет определенную функцию (сканирование, конвертация, компрессия). Эти модули могут объединяться, образуя конвейеры для выполнения сложных, многоэтапных задач. ISIS предлагает разработчикам ПО надежный и стабильный интерфейс для интеграции задач, связанных со сканированием, в приложения. Поскольку ISIS является промышленным стандартом, пользователь сканера с ISIS-драйвером может быть уверен, что купленный им аппарат совместим со всеми приложениями операционной системы, разработанными с учетом данного стандарта.

Функционал современного драйвера сканера не ограничивается только сопряжением сканера с компьютером и обеспечением правильного распознавания и работоспособность данного устройства. Драйвер нагружен большим количеством опций, позволяющих влиять на качество выходного изображения в процессе сканирования. Как правило, в драйвере присутствует предустановленный набор профилей сканирования : набор выбранных опций и значений, сохраненных под определенным именем. Зачастую есть возможность сделать собственный набор установок и сохранить его в виде отдельного профиля. Оперирование профилями позволяет пользователю сканера быстро переключать набор настроек в зависимости от типа обрабатываемых документов.

Приведем основные функции корректировки изображения, которые содержат драйверы большинства современных сканеров:

  • устранение перекоса – определяется либо по геометрии страницы, либо по содержимому страницы (горизонтальные линии, текст и т.п.);
  • подрезка – удаление внешних (черных) контуров изображения, которые могут появиться из-за неверного определения размера оригинала, либо в результате устранения перекоса;
  • очистка углов – в случае обнаружения загнутого угла программа пытается заполнить угол цветом фона;
  • автояркость – автоматический подбор параметра яркости у продвинутых моделей; многие сканеры имеют ручные установки яркости;
  • удаление пятен – как правило, по заданному значению размера пятна;
  • автоориентация (авто-поворот) – у продвинутых моделей, способных распознавать текст; определяется по ориентации текста;
  • четкость (резкость) – у продвинутых моделей, способных распознавать текст; позволяет сделать текст на изображении более четким;
  • заполнение отверстий от дырокола – функция работает как правило при сканировании в цвете;
  • автообнаружение цвета – способность определять цветные области (например фотографии) и сканировать данные области в цвете, а оставшиеся части – в ч/б режиме; позволяет существенно уменьшить размер файла выходного изображения при сохранении высокого качества и цвета там, где он есть;
  • подавление цвета – позволяет вычесть цвет фона; удобно использовать при сканировании не белой бумаги;
  • обнаружение пустой страницы – на основе заданного порогового значения наполненности страницы, программа может определить пустую страницу и пропустить ее;
  • распознавание штрих кодов – продвинутые модели умеют распознать штрих коды на изображении непосредственно при помощи драйвера и считывать их значение (только несколько типов ШК).

Данный набор функций приведен для примера и, конечно же, варьируется в зависимости от производителя и модели сканера.

Помимо драйвера, поставляемого в комплекте, существуют разработки, направленные специально на повышение качества изображения при сканировании. Решение представляет из себя некую надстройку над драйвером, значительно расширяющую функционал драйвера по корректировке изображения. Пример такого решения – технология Virtual ReScan (VRS) от компании Kofax. Базовое решение Kofax VRS некоторые производители поставляют в комплекте со своими сканерами, что выводит его на уровень промышленных стандартов качества сканирования. Работает по стандарту драйвера ISIS.

В комплект поставки протяжного сканера, помимо драйверов, как правило, включается диск с программным обеспечением для Windows и MacOS. Программное обеспечение идущее в комплекте, позволяет сканировать, сохранять, обрабатывать и выводить на печать полученное изображение. Обычно этот софт является специфическим для каждого типа протяжных сканеров. Кроме того, на рынке программного 11 обеспечения для сканирования, извлечения и обработки данных, существует много серьезных игроков, готовых предложить широчайший спектр программных и аппаратных решений под конкретные бизнес-задачи в дополнение к оборудованию для сканирования.

Типы сканируемых документов

В зависимости от модели, протяжный сканер может сканировать фотографии, письма, бланки, визитки и даже квитанции и чеки. Важное значение имеет лишь максимальный допустимый формат оригинала, а так же его плотность. Программное обеспечение большинства моделей дает возможность настраивать профили для различных типов сканируемых оригиналов. Это позволяет получать наилучшие результаты. К сожалению, протяжные сканеры не предназначены для обработки сшитой документации, журналов, книг и т.д. Для этих целей разработаны комбинированные модели со встроенным планшетом, либо производитель предлагает опциональный подключаемый планшетный модуль.

Оптическое распознавание символов

В своем большинстве, протяжные сканеры, используя программное обеспечение, довольно успешно сканируют и конвертируют печатные в редактируемые текстовые документы. Это позволяет при необходимости сразу после сканирования редактировать документ с помощью Microsoft World или другого текстового редактора. Либо создавать в результате сканирования файл в формате PDF с текстовым слоем (так называемый, PDF+text или searchable PDF), PDF файл с возможностью полнотекстового поиска. Данный тип файлов широко применяется для хранения в различных электронных системах и архивах.

В связи с тем, что в данном цикле статей мы как раз изучаем процесс создания электронного архива, рассмотрим программное обеспечение, наиболее подходящее для решения задачи сканирования, обработки документов и сохранения их в формате PDF с текстовым слоем, а так же в специально разработанном стандарте PDF для архивов (PDF-A).

В данной статье выше уже было упомянуто программное обеспечение компании Kofax Inc., мирового лидера в разработке программного обеспечения для ввода и обработки документов. Разработки Kofax – это широкий набор программ и модулей, обеспечивающих функционал любого уровня сложности и высокую экономическую эффективность. Основное назначение - преобразование документов в информацию посредством: улучшения качества изображения сканируемых документов; классификации документов и форм; извлечения данных; проверки результатов на полноту и корректность. Линейка программных продуктов Kofax включает в себя как приложения настольного уровня, так и системы автоматизации бизнес-процессов уровня предприятия.

Для задачи сканирования в электронный архив оптимально подходит программное обеспечение Kofax Express, которое разработчик позиционирует как Scan to Archive Solution , то есть именно решение для сканирования в архив.

Рассмотрим подробнее возможности данного ПО.

Обзор возможностей ПО Kofax Express

Kofax Express – передовое и эффективное решение, предназначенное для поточного сканирования пачки документов, разделения её на документы, извлечения данных, проверки данных на корректность и последующего экспорта файлов и данных в файловую систему, а так же в любую систему электронного документооборота (СЭД), базу данных или электронный архив.

Сфера возможного применения данного приложения весьма широка: это могут быть банки, страховые организации, транспортные компании, государственные учреждения и многие другие области деятельности, связанные с вводом и обработкой документов, где важна оперативность обработки, качество получаемых изображений и высокий уровень автоматизации процесса.

Решение обеспечивает быструю обработку как малых, так и больших пакетов документов. Решение экономически выгодно, т.к. схема лицензирования не предусматривает каких- либо ограничений по объему отсканированных листов. Простое и доступное даже новичкам решение располагает мощными функциями, ориентированными на профессионалов.

Kofax Express разработан как единое приложение, включающее все функции для использования на одном рабочем месте (автономная установка), когда вы планируете выполнять все операции администрирования, сканирования, индексирования, распознавания и экспорта на одном компьютере. Возможна так же установка Kofax Express в конфигурации клиент-сервер: применяется в случаях, когда сканирование, индексирование и экспорт должны выполняться на нескольких рабочих станциях, при этом сервер обычно используется для выполнения централизованных задач по управлению заданиями, пачками и профилями сканирования, а на клиентских рабочих станциях выполняются операции сканирования, индексирования и экспорта.

В случае объединения в сеть нескольких рабочих станций появляется возможность распределения обработки больших объёмов отсканированных документов среди нескольких сотрудников организации (операторы сканирования и операторы индексирования), что увеличивает скорость и эффективность всего процесса ввода документов и данных. При этом задача экспорта документов может быть реализована в виде службы (Windows service) и выполняться в фоновом режиме.

В приложении Kofax Express используется фирменная технология Kofax VRS, которая представлена в виде полноценного компонента. Все возможности Kofax VRS доступны непосредственно из пользовательского интерфейса программы.

Основные преимущества ПО Kofax Express

Вот неполный список возможностей ПО Kofax Express. Весьма внушительно для решения, которое разработчик позиционирует как решение начального уровня. Учитывая, что разработчик оказывает техническую поддержку данного программного обеспечения, постоянно совершенствуя его, данное решение можно смело рекомендовать к приобретению в целях сканирования в электронный архив.

Разъяснения по любым вопросам о поставках сканеров и программного обеспечения для создания электронного архива можно получить в Департаменте документных сканеров компании ПИРИТ :

117218, Москва

Нахимовский проспект, д. 36, корп. 1, 2-й этаж

телефон: +7 495 785-5554 (многоканальный)

cайт: docscan.ru
e-mail: [email protected]

Смирнов А.В.

специалист по системам документооборота

Опция «Поточное сканирование» компании «Электронные Офисные Системы» помогает легко и быстро перевести в электронный вид большой объем бумажных документов. Эффективная организация поточного сканирования позволяет значительно сократить время массового перевода документов в электронный вид. Высокая скорость достигается благодаря автоматизации процесса сканирования и применению технологии параллельных вычислений при распознавании текста. Опция «Поточное сканирование» - это коробочное решение. Продукт можно использовать совместно с любой системой электронного документооборота.

Документы загружаются в сканер одной пачкой. В процессе сканирования каждый документ из нее автоматически идентифицируется по штрих-коду. Таким образом, все операции, начиная с загрузки документов в сканер, выполняются автоматически, без участия оператора. Штрих-код для документа может быть сгенерирован системой и распечатан на документе или на отдельном листе бумаги. Если на страницы документов уже нанесены штрих-коды стандартного формата, то они также могут быть использованы для идентификации.

Система поддерживает работу с сетевым сканером - достаточно загрузить в него документы и нажать кнопку сканирования на самом устройстве. Полученные результаты будут автоматически сохраняться и отправляться на дальнейшую обработку. Таким образом, управление сканированием сводиться к нажатию одной кнопки. А значит, не требуется ни специальных программ для управления сканером, ни отдельного рабочего места для управления сканированием, благодаря чему достигается существенная экономия времени.

Процедура регистрации сканируемых документов практически не отличается от стандартной. Опция «Поточное сканирование» запускается непосредственно из используемой системы документооборота.

При покупке системы лицензируется только параметр «количество обрабатываемых страниц в месяц». А дополнительно, для выполнения задач OCR-распознавания текста, в комплект могут быть включены лицензии на использование одного или нескольких экземпляров продукта ABBYY FineReader Engine.

На этапе запуска системы в эксплуатацию предусмотрена возможность вручную управлять работой системы. Это позволяет установить наиболее подходящие параметры настроек и подобрать оптимальное качество сканируемых документов.

Для работы опции «Поточное сканирование» рекомендуется использовать ОС Windows Server 2003 или Windows Server 2008.

Описание технологического процесса обработки документов

Принцип поточного сканирования основан на том, что на документ при регистрации наносится штрих-код. Потом помеченные штрих-кодом документы сканируются и автоматически (по штрих-коду) связываются с регистрационной карточкой соответствующего документа. Если на сканируемые документы уже нанесен штрих-код стандартного формата, то он также может быть использован для идентификации. Структурная схема работы системы представлена на рисунке.

В процессе сканирования предусмотрены как опция сохранения непосредственно графического образа документа, так и возможность последующего распознавания и сохранения в текстовом формате. Это существенно облегчает дальнейшую работу с документом и расширяет возможности использования поиска. Распознавание и перевод в текстовый формат реализуются с помощью ABBYY FineReader Engine.

Многоязычные документы

Опция «Поточное сканирование» позволяет обрабатывать документы на всех поддерживаемых ABBYY FineReader языках, включая русский, английский, немецкий, французский, испанский, итальянский, шведский, финский, болгарский, венгерский, словацкий, чешский, башкирский, белорусский, казахский, украинский.

Интеграция произвольной СЭД с опцией

Интеграция с опцией «Поточное сканирование» предполагает реализацию со стороны произвольной СЭД только двух функций:

    Формирование и отправка в опцию «Поточное сканирование» заявки на сканирование - cо стороны СЭД передается запрос, содержащий требования на обработку документа. Опция регистрирует заявку и возвращает в СЭД ее уникальный идентификатор. На данном этапе осуществляется связка уникального идентификатора заявки на сканирование с штрих-кодом, уже существующем на документе, либо вновь сгенерированным.

    Выполнение приема и сохранение итоговых результатов, сформированных опцией «Поточное сканирование» - при этом сопоставляются результатов выполнения сканирования с объектами СЭД. Причем данное действие, осуществляющееся на основе уникального идентификатора заявки на сканирование и может быть расширено любой бизнес - логикой СЭД.

Регистрация и сканирование документов

Регистрация документа, т.е. создание регистрационной карточки, выполняется по обычным правилам используемой системы электронного документооборота. Далее, при обращении к опции «Поточное сканирование» , происходят регистрация заявки на сканирование, а также генерация штрих-кода и указание параметров заявки (расположение штрих-кода, требуемые форматы, необходимость распознавания). После того как регистрационная карточка документа будет записана в базу данных, на его первую страницу или на отдельный лист бумаги с помощью принтера наносится штрих-код. Он содержит уникальный идентификационный номер документа и устанавливает правила его обработки. Печать полученного изображения штрих-кода осуществляется средствами системы документооборота. Затем пакет зарегистрированных документов помещается в устройство подачи бумаги сканера, после чего их обработка производится автоматически.

Применение штрих-кода

В процессе сканирования, нанесенный штрих-код используется как признак окончания текущего документа и начала следующего, а содержащаяся в штрих-коде дополнительная информация применяется для дальнейшей идентификации обрабатываемого документа.

Результаты сканирования

При сохранении графического образа документов система обеспечивает возможность конвертации изображений сканируемых документов в следующие форматы:

    BMP (Windows or OS/2 bitmap);

    PNG (Portable Network Graphics);

    TIFF (Tagged Image Format);

    JPEG (Joint Photographic Experts Group);

Для каждого из них предусмотрена возможность указывать размеры изображения и дополнительные атрибуты (глубина цвета, тип сжатия и т.п.). Если размер требуемого формата отличается от текущего графического представления, то конвертация может быть выполнена с использованием заданных параметров.

Текстовые документы

В случае применения технологии распознавания текста, предусмотрена возможность сохранения в большинстве наиболее распространенных форматах файлов*:

    Текстовый файл (.txt);

    Rich Text Format (.rtf);

    Microsoft Excel, Microsoft Excel 2007 (.xls, .xlsx);

    Microsoft Word 2007 (.docx);

  • PDF (Portable Document Format).

Для каждого из них предусмотрена возможность указывать дополнительные атрибуты (размер страницы, кодировка и т.п.). В режиме сохранения в виде PDF-файла возможна как запись в виде изображения, так и в виде распознанного текста.

Таким образом, опция «Поточное сканирование» реализует эффективную технологию преобразования бумажных документов в электронный вид и позволяет в сжатые сроки осуществить переход к работе с их электронными образами. Продуманные настройки, гибкие механизмы управления и подробная документация для разработчиков делают работу с системой удобной и результативной.

*Список поддерживаемых текстовых форматов зависит от возможностей используемой системы распознавания и может изменяться.

Специализированные устройства с каждым годом кажутся все менее заметными на фоне растущей популярности многофункционального оборудования. Недооценивать значение техники, способной выполнять сразу несколько различных задач, довольно сложно. Но когда универсальное устройство не требуется, то в целях оптимизации процесса и экономии есть смысл приобретать аппараты, рассчитанные на те или иные конкретные нужды. К таким устройствам относится и поточный сканер. Он позволяет обрабатывать огромное количество документов различного рода. Основная особенность данного типа сканирующей техники состоит в оптимальном сочетании точности и скорости. Все ресурсы устройства ориентированы на выполнение сканирования. По этой причине поточные модели в большинстве своем лишены возможности печати.

Выбор поточного сканера: основные критерии

Основной характеристикой, на которую следует обращать внимание при выборе сканера, является производительность или проще говоря скорость обработки листов. В среднем модели начального уровня позволяют обрабатывать до тысячи страниц. В средней ценовой категории представлены поточные сканеры, которые способны выдавать около 6-7 тысяч страниц. Устройства с более высоким уровнем производительности уже относятся к профессиональному оборудованию. Важной характеристикой поточного сканера также является поддержка работы с документами различных форматов. Концепция такого оборудования рассчитана на большие объемы автоматической работы. Логично, что каждый производитель заинтересован в том, чтобы ориентировать свое устройство на поддержку наиболее распространенных форматов бумаги. Это могут быть буклеты, анкетные бланки, пластиковые карточки и тому подобные материалы. Особое значение в данном случае играет толщина листа. Как правило, она не превышает 1,5 мм.

Одно и двухсторонние устройства

Известно, что возможность двухстороннего сканирования документов значительно повышает уровень производительности и при этом не уменьшает качество. Это означает, что лист можно одновременно сканировать с двух сторон вместо того, чтобы сканировать каждую страницу по отдельности. По этой причине в тех случаях, когда требуется оперативная обработка больших объемов документов, лучше отдавать предпочтение поточным двухсторонним сканерам. Это существенно облегчит работу оператора. Однако перед покупкой важно также учесть преимущества, которые имеют односторонние модели. Сегодня практически не встречаются аппараты, на которых присутствует исключительно одностороннее сканирование, однако некоторые производители продолжают выпускать их. Все дело в том, что двухсторонняя обработка документа сильно увеличивает размеры сканирующего оборудования, а также сказывается на стоимости такого устройства. По этой причине выбирать односторонний поточный сканер выгодно в тех случаях, когда требуется компактность и надежность оборудования, но при этом не нужна высокая производительность.

Поточные сканеры Epson: отзывы

Традиционно устройства от компании Epson ассоциируются с высоким уровнем качества. Однако в условиях высокой конкуренции даже хорошо зарекомендовавший себя производитель должен постоянно повышать планку. Если судить по отзывам пользователей, у данного производителя это прекрасно получается. Владельцы сканеров от Epson говорят о высокой скорости сканирования, большом количестве поддерживаемых форматов, а также о точности перевода информации в цифровой вид. На рынке поточные сканеры от компании Epson представлены несколькими линейками устройств. Здесь можно найти как компактные модели для небольших офисов, так и высокопроизводительные устройства для крупных предприятий. Вне зависимости от принадлежности к той или иной серии, оборудование от компании Epson вызывает у пользователей только положительные эмоции. Это связано с продуманной эргономикой устройств, их надежностью и точностью.

Поточные сканеры от Canon: отзывы

Для продукции данного бренда характерен уклон в сторону технологичности, а также повышения точности сканирования. Это подтверждает и практика эксплуатации подобных устройств. Так, например, многие пользователи отмечают неплохой эффект от использования функции улучшения обработки, которой снабжаются поточные сканеры, принадлежащие к серии DR. Разработчики также подключают средства для автоматической коррекции текста с целью повышения качества сканов. Подобные инновации хорошо принимают пользователи, ведь именно им в итоге приходится иметь дело с результатом сканирования. В последних моделях используются устройства, которые могут значительно оптимизировать процесс подачи материалов. Для многих аппаратов довольно распространенной проблемой является нарушение приемки документа. Компания Canon предлагает поточный сканер с функцией автоматической подачи, дополненной возможностью ультразвукового определения двойной приемки.

Поточные сканеры Fujitsu: отзывы

Компания Fujitsu является еще одним крупным японским производителем, который производит достойное внимания сканирующее оборудование. В линейке данной компании предусмотрены как серии для домашнего использования, так и устройства для офиса. Владельцы такой техники отмечают высокое качество обработки и надежность, причем относится это и к небольшим устройствам. Двусторонний сканер данной марки ценится за высокую производительность и компактные размеры. Однако стоимость моделей от компании Fujitsu является довольно высокой.

Дополнительные функции

Возможности поточного сканера с точки зрения взаимодействия с персональным компьютером могут быть существенно расширены за счет наличия в конструкции интерфейса USB. Это довольно важное дополнение, особенно когда требуется не только быстрая обработка большого объема документов, но и отправка через сеть оцифрованных материалов. Последние модели поточных сканеров также обеспечиваются Wi-Fi модулем.

Рассмотрим модель бизнес процесса потокового сканирования текста для организации электронного архива документов

Назначение:


– Предварительное формирование штрих-кодов

– Формирование сканированного образа документа

– Формирование электронной учётной карточки, содержащей электронный образ отсканированного документа

– Передачу корректно отсканированного электронного образа документа в БД

Возможно осуществление потокового сканирования в пакетном режиме.

При этом каждый пакет документов для сканирования может идентифицироваться по:

– Количеству указанных страниц

– Пустым страницам-разделителям

– Штрих-кодам

Возможный вариант идентификации пакета сканирования определяется настройками сканирования.

Преимущества использования потокового сканирования для организации электронного архива документов:

– Снижение трудозатрат на ввод информации в базы данных

– Возможность замены бумажного документооборота и бумажных архивов электронной системой документооборота

– Повышение эффективности управления документами

– Снижение временных затрат на поиск документов

Электронный архив документов. Жизненный цикл сканированных документов

  1. Сканирование документов
  2. Распознавание информации
  3. Верификация данных
  4. Коррекция данных
  5. Экспорт данных

Подробнее по этапам.

Этап «Сканирование» может также интерпретироваться как «Импорт документов», т.к. системы потокового сканирования могут осуществлять считывание изображений не только со станций сканирования, но и из локальных, сетевых ресурсов, а также осуществлять считывание из электронной почты.

Но в рамках данной статьи мы рассматриваем конкретно потоковое сканирование, и как следствие, 1 этап – сканирование документов. Под системой потокового сканирования подразумеваются программные комплексы, предназначенные для потоковой обработки данных.

Поточные сканеры в большинстве своем оснащены системой автоматической подачи документов, что позволяет достигнуть скорости оцифровки до 200 изображений в минуту на один сканер.

Для выделения отдельных документов из потока в начале сканируемого документа должна быть нанесена штамп-метка/маркер/штрих-код, либо документы потока должны быть разделены чистыми листами.

Если же при этом требуется определение типа и вида документа, то метка должна сопровождаться кодом сканирования, на основании которого будет проводиться сопоставление бумажного и электронного документов.

Если документ является многостраничным, метка и код сканирования наносятся только на первый лист документа, и в дальнейшем при вводе массива документов они служат признаком конца текущего документа и началом нового.

Место нанесения метки и кода сканирования может находиться в любой свободной от текста части документа. При отсутствии на лицевой стороне документа свободного места их можно нанести с обратной стороны листа.

Итого, мы можем выделить следующие подэтапы для первого этапа:

Формирование штамп-метки/маркера/штрих-кода специализированной программой

  • Одномерные штрих-коды
  • Двухмерные штрих -коды

Распечатка штамп-метки/маркера/штрих-кода

Подготовка комплекта документов для сканирования, нанесение штамп-метки/маркера/штрих-кода

Сканирование пакетов документов :

  • Исправление перекосов, искажений, удаление частей изображений и др.
  • Сборка документов по типам, видам
  • Корректировка качества сканирования

Сканирование документов можно осуществлять в рамках локальной сети, удаленно по средствам http, а также с использованием интерфейсов TWAIN, WIA и ISIS.

Результат выполнения этапа: отсканированный документ в формате PDF, TIFF, JPEG, JPEG2000, BMP, PNG, PCX, DCX, DjVu, JBIG2.

Системы, поддерживающие распознавание текста, позволяют:

  • Осуществлять распознавание печатного текста на разных языках , таких как: латинский, греческий, тайский, армянский, японский, корейский, китайский и др. Перечень поддерживаемых языков зависит от возможностей конкретной программы.
  • Осуществлять распознавание документов, содержащих текст сразу на разных языках . При этом, система сама распознает какой текст к какому языку относится.
  • Распознавать текст различного типа : типографская печать, печатная машинка, матричный принтер, MICR (E13B), OCR-A, OCR-B.
  • Распознавать штрих коды.

В качестве настроек обычно можно указывать максимальное количество неуверенно распознанных символов на страницы для дальнейшей корректировки содержания на этапе Верификации.

Результат выполнения этапа: отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Распознавание штрих-кодов: Контроль качества распознавания: Преобразование PDF-файлов Этап 3. Верификация данных

Этап верификации включает:

  • Проверка на неуверенно распознанные символы
  • Проверку полученной от сканирования информации на ожидаемые типы данных
  • Проверку полученной от сканирования информации на присутствие значений
  • Редактирование распознанного текста
  • Формирование учетной карточки документа
  • Заполнение атрибутов карточки отсканированного документа
    • Автоматически
    • Вручную

На этом этапе, в случае обнаружения ошибок при сканировании и всех неточностей, информация помечается специальными маркеровками для дальнейшего исправления на этапе Коррекции. При необходимости, этап Верификации можно проводить повторно.

Результат выполнения этапа: заполненная учетная карточка документа и отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Этап 4. Коррекция данных

Оператор обрабатывает информацию, полученную на стадии верификации данных, вносит изменения в результирующую запись вручную (ввод с клавиатуры, выбор из списка заранее заданных ответов). В некоторых случаях может объединяться с предыдущим этапом верификации данных.

Результат выполнения этапа: заполненная отредактированная учетная карточка документа и отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Этап 5. Экспорт данных

Оцифрованные структурированные данные выгружаются в необходимом формате для дальнейшего анализа результатов сканирования.

При этом экспорт данных может осуществляться:

  • В локальную или сетевую папку
  • В корпоративный портал
  • В систему электронного документооборота/электронный архив

Результат выполнения этапа: размещение/отправка итогового документа на требуемом ресурсе.

————
Используемые ресурсы:
Приложение «Потоковое сканирование»
ABBYY

Назначение: предназначено для автоматизации перевода бумажных документов в электронный вид, создание электронного документооборота и электронного архива документов.

Функции потокового сканирования включают:

– Предварительное формирование штрих-кодов

– Формирование сканированного образа документа

– Формирование электронной учётной карточки, содержащей электронный образ отсканированного документа

– Передачукорректно отсканированного электронногообраза документа в БД

Возможно осуществление потокового сканирования в пакетном режиме. При этомкаждый пакет документов для сканирования может идентифицироваться по:

– Количеству указанных страниц

– Пустым страницам-разделителям

– Штрих-кодам

Возможный вариант идентификации пакета сканирования определяется настройками сканирования.

Преимущества использования потокового сканирования:

– Снижение трудозатрат на ввод информации в базы данных

– Возможность замены бумажного документооборота и бумажных архивов электронной системой документооборота

– Повышение эффективности управления документами

– Снижение временных затрат на поиск документов

Жизненный цикл сканированных документов

Документы в процессе сканирования проходят определенные этапы, совокупность которых мы обозначим как жизненный цикл сканированных документов (ЖЦ сканирования).

Основной процесс сканирования включает общие этапы:

Этапы ЖЦ сканирования включают:

1. Сканирование документов

2. Распознавание информации

3. Верификация данных

4. Коррекция данных

5. Экспорт данных

Роли пользователям выделяются в соответствии с их участием в ЖЦ сканирования.

Подробнее по этапам.

Этап 1. Сканирование документов

Этап «Сканирование» может также интерпретироваться как «Импорт документов», т.к. системы потокового сканирования могут осуществлять считывание изображений не только со станций сканирования, но и из локальных, сетевых ресурсов, а также осуществлять считывание из электронной почты.Но в рамках данной статьи мы рассматриваем конкретно потоковое сканирование, и как следствие, 1 этап – сканирование документов. Под системой потокового сканирования подразумеваются программные комплексы, предназначенные для потоковой обработки данных.

Поточные сканеры в большинстве своем оснащены системой автоматической подачи документов, что позволяет достигнуть скорости оцифровки до 200 изображений в минуту на один сканер.

Для выделения отдельных документов из потока в начале сканируемого документа должна быть нанесена штамп-метка/маркер/штрих-код, либо документы потока должны быть разделены чистыми листами. Если же при этом требуется определение типа и вида документа, то метка должна сопровождаться кодом сканирования, на основании которого будет проводиться сопоставление бумажногои электронного документов. Если документ является многостраничным, метка и код сканирования наносятся только на первый лист документа, и в дальнейшем при вводе массива документов они служат признаком конца текущего документа и началом нового.

Место нанесения метки и кода сканирования может находиться в любой свободной от текста части документа. При отсутствии на лицевой стороне документа свободного места их можно нанести с обратной стороны листа.

Итого, мы можем выделить следующие подэтапы для первого этапа:

– Формирование штамп-метки/маркера/штрих-кода специализированной программой

o Одномерные штрих-коды

o Двухмерные штрих -коды

– Распечатка штамп-метки/маркера/штрих-кода

– Подготовка комплекта документов для сканирования, нанесение штамп-метки/маркера/штрих-кода

– Сканирование пакетов документов:

o Исправление перекосов, искажений, удаление частей изображений идр.

o Сборка документов по типам, видам

o Корректировка качества сканирования

Сканирование документов можно осуществлять в рамках локальной сети, удаленно по средствам http , а также с использованием интерфейсов TWAIN, WIA и ISIS.

Результат выполнения этапа: отсканированный документ в формате PDF, TIFF, JPEG, JPEG2000, BMP, PNG, PCX, DCX, DjVu, JBIG2.

Этап 2. Распознавание информации

На этапе распознавания используются программные OCR компоненты.

Системы, поддерживающие распознавание текста, позволяют:

o Осуществлять распознавание печатного текста на разных языках, таких как: латинский, греческий, тайский, армянский, японский, корейский, китайский и др. Перечень поддерживаемых языков зависит от возможностей конкретной программы.

o Осуществлять распознавание документов, содержащих текст сразу на разных языках. При этом, система сама распознает какой текст к какому языку относится.

o Распознавать текст различного типа: типографская печать, печатная машинка, матричный принтер, MICR (E13B), OCR-A, OCR-B.

o Распознавать штрих коды.

В качестве настроек обычно можно указывать максимальное количество неуверенно распознанных символов на страницы для дальнейшей корректировки содержания на этапе Верификации.

Результатвыполнения этапа: отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Высокое качество распознавания и восстановления оформления документа:

  • Поддержка 191 языка распознавания печатного текста, включая языки на основе латинского, греческого, тайского, армянского и кириллического алфавитов, а также японский, корейский, китайский и тайский языки.
  • Распознавание многоязычных документов.
  • Режим быстрого распознавания увеличивает скорость обработки изображений хорошего качества в 2-2,5 раза.
  • Поддержано распознавание различных типов текста: типографская печать, печатная машинка, матричный принтер, MICR (E13B), OCR-A, OCR-B.

Распознавание штрих-кодов:

  • Поддержано распознавание наиболее популярных одномерных и двумерных штрих-кодов.
  • Автоматически идентифицируются и распознаются штрих-коды, расположенные на странице под любым углом к горизонтали.

Контроль качества распознавания:

  • Установка порога качества распознавания изображений, основанная на допустимом количестве неуверенно распознанных символов на страницу.

Преобразование PDF-файлов

  • Определение текстового слоя и его целостность дляообеспечения более быстрого и качественного преобразования PDF-файлов.
  • В создаваемых PDF-файлах сохраняются метаданные документа (название, автор, тема, ключевые слова) и восстанавливаются гиперссылки внутри документа.
  • Поддержаны алгоритмы шифрования и другие средства разграничения доступа: сохранение результатов распознавания в PDF-файл, защищённый паролем.

Этап 3. Верификация данных

Этап верификации включает:

o Проверка на неуверенно распознанные символы

o Проверку полученной от сканирования информации на ожидаемые типы данных

o Проверку полученной от сканирования информации на присутствие значений

o Редактирование распознанного текста

o Формирование учетной карточки документа

o Заполнение атрибутов карточки отсканированного документа

§ Автоматически

§ Вручную

На этом этапе, в случае обнаружения ошибок при сканировании и всех неточностей, информация помечается специальными маркеровками для дальнейшего исправления на этапе Коррекции. При необходимости, этап Верификации можно проводить повторно.

Станция верификации позволяет оператору проверять, правильно ли была проанализирована страница, создавать и редактировать блоки, проверять неуверенно распознанные символы, а также редактировать распознанный текст.

После верификации и устранения ошибок, страница будет отправлена на дальнейшую обработку или проэкспортирована. При неудовлетворительных результатах распознавания, оператор станции верификации может отправить страницу на повторную обработку.

Результатвыполнения этапа: заполненная учетная карточка документа и отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Этап 4. Коррекция данных

Оператор обрабатывает информацию, полученную на стадии верификации данных, вносит изменения в результирующую запись вручную (ввод с клавиатуры, выбор из списка заранее заданных ответов). В некоторых случаях может объединяться с предыдущим этапом верификации данных.

Результатвыполнения этапа: заполненная отредактированная учетная карточка документа и отсканированный документ в формате Microsoft Word, HTML, PDF и др.

Этап 5. Экспорт данных

Оцифрованные структурированные данные выгружаются в необходимом формате для дальнейшего анализа результатов сканирования. При этом экспорт данных может осуществляться:

o В локальную или сетевую папку

o В корпоративный портал

o В систему электронного документооборота/электронный архив

Результат выполнения этапа: размещение/отправка итогового документа на требуемом ресурсе.

www.abbyy.ru

Рожкова Елена

GD Star Rating
a WordPress rating system

Организация электронного архива документов.Потоковое сканирование , 5.0 out of 5 based on 1 rating

Этапы процесса

Сканирование бумажных документов

Эффективность данного этапа определяется в большей степени качеством используемого оборудования.

Современные поточные сканеры оснащены системой автоматической подачи документов, что позволяет сократить ручной труд и достигнуть скорости оцифровки до 200 изображений в минуту на один сканер.

Распознавание информации

На этапе распознавания используются программные OCR компоненты. Качество результирующих записей зависит от степени готовности анкеты к машинному чтению и тщательности предварительной настройки программного обеспечения.

Верификация данных

Производится автоматическая верификация полученных после распознавания данных. Наиболее частые проверки - проверка на ожидаемый тип данных (число/чекбокс/строка), проверка на присутствие значений. Все проблемные места, отмеченные на данном этапе маркируются для передачи на стадию коррекции.

Коррекция данных

Оператор обрабатывает информацию полученную на стадии верификации данных и вносит изменения в результирующую запись вручную (ввод с клавиатуры, выбор из списка заранее заданных ответов). На данном этапе повторно производится «обучение» программного комплекса. Все накопленные правки анализируются алгоритмами и применяются для дальнейшей работы с данным набором анкет.

Экспорт данных

Оцифрованные структурированные данные выгружаются в необходимом формате для дальнейшего анализа результатов анкетирования.

Производительность систем ввода анкет

На этапах сканирования и распознавания анкет важную роль играет применяемая техника. Использование профессиональных промышленных сканеров и мощных станций распознавания позволит добиться максимальной скорости оцифровки (около 96000 анкет за 1 рабочий день для 1 сканера). Узким местом на пути получения готовой базы данных является этап коррекции данных. Для обеспечения минимального количества ошибок операторы вручную обрабатывают информацию помеченную на этапе верификации данных. Процедура занимает много времени и требует серьёзного специализированного обучения сотрудников.


Wikimedia Foundation . 2010 .

  • Счастлива
  • Потпорань

Смотреть что такое "Поточное сканирование документов" в других словарях:

    Оцифровка книг - Сверхпроизводительный сканер APT BookScan Оцифровка книг это процесс перевода бумажных книг в электронны … Википедия

Загрузка...