Реально ли делать скан фотоаппаратом для sape ?

21st Август 2010 ;)
Твитнуть

Вопрос очень хороший и у меня есть богатый опыт по нему. Поэтому сразу к делу.
Ответ, да, очень вполне даже реально делать скан книг для сапы фотоаппаратом. Причем скан фотоаппаратом в разы быстрее.

image


Самые большие подводные камни:
1. Книги имеют свойство загибаться ближе к середине. Это самое зло – с этим я боролся и одну из 4-х книжек я до сканировал только до середины.
2. Распознавать только последним FineReader. По причине того что фотографии несколько хуже по качеству чем скан. А такие программы как CuneiForm приспособлены только для сканеров. ФР отлично распознает сильно мутные и двигающиеся буквы.
3. Фотоаппарат конечно можно использовать очень простой, но желательно чтобы руками тоже можно было фокус выбирать. Kodak мне понравились больше чем canon. подойдет любой наверное от 5т.р.
4. Пакетная обработка прошла очень просто в ФР, однако он же не сайт генерит, а текстовики например, поэтому уж тут надо подумать как их всех прикрутить а про картинки я вообще молчу. Их я обрабатывал отдельно, зачем ? Потому что у меня был белый сайт и картинки были нужны все же.

Как проходил процесс скана ?

  • Книга у окна
  • В правой руке настроенный фотоаппарат и готовым пальцем нажать на курок.
  • Левой рукой перелистываю лист книги
  • Кладу на края утяжелители
  • Выравниваю
  • Выбираю на экране фотоаппарата чтобы текст был вписан во все края ровно
  • Спускаю курок
  • Иногда проверяю чего получилось
  • Перелистываю

Как все сразу распознать, все 200 листов ?

Готовые фотографии кладу в компьютер
Finereader указываю что взять эти картинки и преобразовать в текст сюда
Нажимаю ок и все готово
Как текстовые файлы положить на сайт ?
Честно я не мучился и написал php скрипт для анализа папки сколько там файлов, генерировал ссылки на каждый по имени – номер циферки.

Какой получился сайт из скана ?
Скан был не основным текстом для сайта, это были УВ2 и УВ3. Они прекрасно сели в индекс и никто им не мешает там, даже сам иногда почитываю и радуюсь что теперь другие могут это почитать. Кстати написал небольшую подсветку для текста чтобы приятнее было.

Еще:

  • IE8 vs Chrome и отображение шрифтов
  • Куча демок на JavaScript размером в 1кб
  • Финстрип Студента
  • GoGetLinks.net разрешает SAPE
  • Идея для TopSape.ru

Подписаться на обновления блога

Вам понравился наш блог, хотите следить за обновлениями? Подпишитесь на RSS рассылку или рассылку по электронной почте. Так же вы можете следить за нами в Twitter.
Введите Ваш E-mail:

Твитнуть

This website uses IntenseDebate comments, but they are not currently loaded because either your browser doesn't support JavaScript, or they didn't load fast enough.

Комментарии читателей

  1. vinter_cool | 25 Авг 2011 at 10:04

    0 8 =5 AB>8B 701K20BL > 2>7@0AB5 :=83. 5

  2. Вася | 25 Авг 2011 at 10:06

    А так же не забудьте о авторских правах, поэтому стоит выбирать старые книги.

  3. jkeks | 25 Авг 2011 at 11:10

    Чего-то я забросил скан, хотя тема не умрет никогда.

  4. jkeks | 25 Авг 2011 at 11:10

    Было дело даже товарищь сканил какие-то журнал бумажные, часть материала была не в паблике и материал отлично живет все еще

GoGetLinks - Я зарабатываю тут
Онлайн Антивирус - Моя разработка
Онлайн Желания - Мой микросервис
Иногда проще Купить сайт
Лучшие материалы
Top WebMoney

КОД

Рубрики

  • Личное (927)
  • Новости (409)

Сайт делает jkeks Яндекс.Метрика