Вопрос очень хороший и у меня есть богатый опыт по нему. Поэтому сразу к делу.
Ответ, да, очень вполне даже реально делать скан книг для сапы фотоаппаратом. Причем скан фотоаппаратом в разы быстрее.
Самые большие подводные камни:
1. Книги имеют свойство загибаться ближе к середине. Это самое зло — с этим я боролся и одну из 4-х книжек я до сканировал только до середины.
2. Распознавать только последним FineReader. По причине того что фотографии несколько хуже по качеству чем скан. А такие программы как CuneiForm приспособлены только для сканеров. ФР отлично распознает сильно мутные и двигающиеся буквы.
3. Фотоаппарат конечно можно использовать очень простой, но желательно чтобы руками тоже можно было фокус выбирать. Kodak мне понравились больше чем canon. подойдет любой наверное от 5т.р.
4. Пакетная обработка прошла очень просто в ФР, однако он же не сайт генерит, а текстовики например, поэтому уж тут надо подумать как их всех прикрутить а про картинки я вообще молчу. Их я обрабатывал отдельно, зачем ? Потому что у меня был белый сайт и картинки были нужны все же.
Как проходил процесс скана ?
Как все сразу распознать, все 200 листов ?
Готовые фотографии кладу в компьютер
Finereader указываю что взять эти картинки и преобразовать в текст сюда
Нажимаю ок и все готово
Как текстовые файлы положить на сайт ?
Честно я не мучился и написал php скрипт для анализа папки сколько там файлов, генерировал ссылки на каждый по имени — номер циферки.
Какой получился сайт из скана ?
Скан был не основным текстом для сайта, это были УВ2 и УВ3. Они прекрасно сели в индекс и никто им не мешает там, даже сам иногда почитываю и радуюсь что теперь другие могут это почитать. Кстати написал небольшую подсветку для текста чтобы приятнее было.