Технология листающего сканирования
20 мая 2009 года в Москве проходила юбилейная выставка DOCFLOW – внимание участников привлек необычный сканер, аналогов которому не было на российском рынке информационных технологий. В основе оборудования — технология листающего сканирования. Что это такое, тогда знали единицы.
Выставочный образец с названием ЭЛАРобот удивил алгоритмом и скоростью работы. Сканирование осуществлялось полностью в автоматическом режиме – без участия оператора. Прибор самостоятельно перелистывал книги и за 10 минут отсканировал 400 листов. Рабочая скорость, заявленная производителем, составляла 2500 страниц в час.
Особенности
Листающее сканирование – современная технология, суть которой заключается в объединении перелистывания и оцифровке исходного материала в единый процесс. Преимущество такого подхода – скорость, которая в десятки раз выше, чем у оператора. Участие человека не требуется.
Второй плюс – возможность оцифровать библиотеки с сотнями тысяч томов, включая старинные книги и издания, представляющие художественную ценность без риска их повредить. Книгу даже не придется полностью открывать – угла в 60 градусов достаточно для точного распознавания и переноса текста на электронный носитель.
При традиционных способах сканирования инфракрасное или ультрафиолетовое излучение воздействуют на печатные издания, пусть и кратковременно. В новой технологии используется светодиодное излучение на оригинал – оно занимает миллисекунды.
После листающего сканирования пользователь получает электронные образцы высокого качества, идеально подходящие для архивации и репринта.
А как у них?
За рубежом информация о технологии листающего сканирования появилась несколькими годами раньше. В феврале 2006 года американская компания Atiz открыла прием предзаказов на сканер BookDrive.
Разработчики заявили, что их аппарат – единственный в мире, умеет автоматически перелистывать книжные страницы. К компьютеру он подключается через USB-порт, и совместим с ОС Windows ХР.
Все, что требуется от пользователя — включить сканер и задать интересующее количество страниц. Специальный механизм самостоятельно перевернет их, а программное обеспечение автоматически снизит уровень шума, повернет изображение при необходимости и обрежет его края. Создатели анонсировали мощность устройства 500 листов в час.
Стоимость инновации они оценили в 35 тысяч долларов – явно не для рядового пользователя. Сканер BookDrive разрабатывался для нужд крупных библиотек, университетов и издательств, заинтересованных в оцифровке сотен тысяч или миллионов изданий из библиотечных фондов.
Японцы отстали от американских коллег на 4 года – они презентовали прототип листающего сканера лишь в 2010 году. Автоматическое устройство разработала группа ученых из университета Токио под руководством профессора Исикавы.
Токийскому сканеру требовалось 0,3 секунды, чтобы отсканировать страницу текста. Он, как и предшественники, не деформировал переплет, не рвал бумагу и отлично справлялся с задачей при обычном дневном освещении. Японцы встроили в устройство специальный лазер, безошибочно определявший момент, когда страница удобно развернута. В эту секунду камера сканировала ее и передавала изображение на компьютер. В итоге получались четкие страницы разрешением 1280х1024 пикселей.
У устройства единственный недостаток – габариты. Разработчики продолжают работу – команда японских инженеров хочет его уменьшить до размеров планшета или смартфона с функцией высокоскоростного сканирования.
Google Books
Новаторскими идеями одних вдохновляются другие энтузиасты, но авторское право на систему автоматического сканирования книг принадлежит компании Google.
Проект Google Books датируется 2002 годом – он стал первым амбициозным замыслом, который реализовала компания. Поисковый гигант предложил пользователям специальное приложение для массового непрерывного сканирования. Суть предложенной технологии листающего сканирования ничем не отличалась от последователей: система все делала автоматически, без участия пользователя.
В устройствах поисковый гигант использовал 2 камеры и ИК-свет, чтобы корректно считывать неровные страницы.
Деликатный и умный робот
Технический прогресс не стоит на месте. Разработчики ЭЛАРобота усовершенствовали его за годы, прошедшие с момента презентации. Сегодня сканер больше похож на умного и деликатного робота, который умеет:
- Распознавать размер книги.
- Обрабатывать изображения.
- Сканировать текст и графику в цветном и черно-белом форматах.
- Автоматически перелистывать страницы.
- Подбирать освещение в зависимости от исходных условий.
- Работать с любыми видами переплетов – от спиральных до клеевых.
Лаконичный дизайн и простота настроек упрощают взаимодействие с конструкцией. Удобно и то, что программное обеспечение распространяется вместе со сканерами, а корректорам больше не нужно вычитывать оцифрованный текст и исправлять ошибки. Система распознает его максимально точно.