Тяжелый случай: Обработка (улучшение читаемости) снятого на мобильный телефон текста

Всего 14 сообщ. | Показаны 1 - 14
Тяжелый случай: Обработка (улучшение читаемости) снятого на мобильный телефон текста
Вопрос маньякам Фотошопа.
Жизненная ситуация - поход в библиотеку и пересъемка книги \ работы на камеру мобильного телефона.
В результате качество снимков "зашкаливает".
Прошу совета, как простыми, желательно автоматизируемыми методами существенно улучшить качество картинки.
Т.е., чего хочу добиться:
1. Полностью убрать фон - т.е. все что не буквы было белое или почти белое.
2. При этом буквы контрастны и существенно не потеряны детали (как оно выходит если просто играться уровнями либо контрастностью - яркостью).

Ну и конечно, предложения взять ластик и отфидошопить весь шум и мусор, переснять на норм.фотоаппарат, взять и отсканить книгу нежелательны.

Пример необработанного снимка приложен.



Заранее спасибо за помощь!
Re[Мирослав Кравченко]:
фильтр High Pass в помощь
блин видел же где-то урок, как раз с такой же проблемой
найду - свистну

попробуйте пока Image - Adjustments - Treshold ползунки подергать

кстати, черноту по краям все равно придеццо ручками отрезать :D
Re[Xuman]:
Спасибо.
Кропать конечно же буду вручную.

Treshold очень хорошо выполняет п.1, но вот п.2 он проваливает - теряется много существенных деталей текста. Причина - неравномерное освещение страницы, к примеру нижняя часть страницы выглядит нормально, на верхней же буквы истончены и "съедены".

Как использовать High Pass в данном случае к сожалению не знаю (вероятно как-то изгаляться со слоями, масками), если найдется урок буду благодарен за ссылку. Гугл мне пока не помог в поиске урока.
Re[Мирослав Кравченко]:
Последние версии FineReader прекрасно справляются с распознаванием такого текста, может быть проще распознать и поправить единичные опечатки, чем вычищать? :)
Re[Ктулху Фхтагн]:
До этого я распознавал последним Файнридером существенно лучше отснятый текст - замучился править ошибки. Как вариант возможность распознавания не отбрасываю.

Однако все же хотелось бы довести текст до нормального состояния посредством Фотошоп. Да и в данном конкретном случае распознавать текст не требуется, просто необходимо улучшить текст для печати.
Re[Мирослав Кравченко]:
Цитата:

от:Мирослав Кравченко
До этого я распознавал последним Файнридером существенно лучше отснятый текст - замучился править ошибки. Как вариант возможность распознавания не отбрасываю.

Однако все же хотелось бы довести текст до нормального состояния посредством Фотошоп. Да и в данном конкретном случае распознавать текст не требуется, просто необходимо улучшить текст для печати.

Подробнее


Ну тогда последовательно - TopazDenoise, контрастим левелами или кривыми, темный фон высветляем Dodge Tool в режиме highlights - тогда черный текст не меняется.
После этого попробовать распознать :)

Вообще странно, у меня последний FR прекрасно распознает даже такие пересъемки.
Re[Ктулху Фхтагн]:
С Доджем лучше, но не айс. Додж в этом режиме также жрет мелкие детали в буквах (чтобы так не происходило, необходимо посильней отконтрастить, но если посильней отконтрастить получается утемнение фона текста в хуже освещенной части страницы и если потом доджем обрабатывать этот еще более утемненный фон получается полная кака). Да и целостной белизны фона не выходит.
Re[Мирослав Кравченко]:
Цитата:

от:Мирослав Кравченко
С Доджем лучше, но не айс. Додж в этом режиме также жрет мелкие детали в буквах (чтобы так не происходило, необходимо посильней отконтрастить, но если посильней отконтрастить получается утемнение фона текста в хуже освещенной части страницы и если потом доджем обрабатывать этот еще более утемненный фон получается полная кака). Да и целостной белизны фона не выходит.

Подробнее


Чтобы сгладить фон - surface blur попробуйте.

Но все же, ИМХО, проще распознать и выправить опечатки за 5 минут, чем полчаса вычищать растр.
Re[Мирослав Кравченко]:
Я подобной фигней занимался. Яркость-контрастность помогала, но оставались уголки с легким оттенком. Лучше всего делать кривыми.

Нужно сделать картинку настолько бледной, насколько возможно без ухудшения читаемости (сжать динамический диапазон) Затем вырезать света и вернуть контрастность в нормальное значение. Если очнь много времени, можно блики и пятна высветилить и затемнить. На будущее снимайте так, чтобы лист был освещен равномерно. Вспышку использовать нельзя, под лампочкой фотографировать нельзя. Идеал - рассеяный солнечный свет в тени.

Автоматически такое не выправить. По крайней мере, нужен плагин, который замеряет яркость фона в нескольких точках картинки, а потом приводит все к единому знаменателю.

Даже вручную такое делать сложновато.
Re[Мирослав Кравченко]:
ржунемогу ... есть maximum/minimum для етого...
пофиг равномрнсть главноечтоб в худьшем месте читалсь

типа так.. подстрть окончтельно по фкусу

http://l4m3r.pochta.ru/flashcard/text.ATN


кстти для ПЕЧАТИ ненадо доводить до 2 градационного битмапа а оттенки надо оставить.

я непонимаю как распазновалки работают с битмапом помоему они просто шыбанулись битмап нечитаем в принципе

Re[Мирослав Кравченко]:
нашел статейку
http://www.publish.ru/publish/2008/04/5176959/
Re[Мирослав Кравченко]:
Цитата:
от: Мирослав Кравченко
Прошу совета, как простыми, желательно автоматизируемыми методами существенно улучшить качество картинки.
Т.е., чего хочу добиться:


Пока в теме не увидел ответа на ключевой вопрос. А какова цель этого улучшения картинки? Если нужно для читабельности текста, так он вроде бы и без этих телодвижений читается хорошо. Распознавание, вы сказали, вам не нужно. А для чего еще корректировать это, у меня фантазии не хватает. :)
Re[Ктулху Фхтагн]:
у меня распознался без проблем!!

ОТЛИЧНЫЙ СОВЕТ
Обратная связь
Re[rean]:
Дело в том, что фотографировал не я, а мой отец в библиотеке, где нельзя переснимать, поэтому вопрос освещения отходил на второй план.
А по поводу невозможности автоматически такое поправить - см. экшн L4m3r и статью Xuman. Все можно!

Re[L4m3r]:
Я знал, что все дело в профессионализме!
Это то, что я искал. Лучшее решение! Спасибо!
Полностью согласен, что для печати нужны оттенки.

Re[Xuman]:
Хорошая статья, спасибо. Результат весьма неплох и удовлетворяет обеим пунктам.

Re[bc----]:
Цель - подготовить фото для последующей печати. С распечатками уже будет работать отец - готовит методичку.

Re[motoro]:
Распознавание было запасным вариантом. Все же для него нужно больше времени, нежели обработка экшеном.

Итак:
Платиновая медаль присуждается L4m3rу!
Золотая - Xumanу!

Спасибо всем.

P.S. К сообщению приложены 2 файла обработанные предложенными алгоритмами, сравните результат.

Xuman -

L4m3r -
Вы не авторизованы

Пожалуйста, авторизуйтесь, чтоб иметь доступ к полному функционалу сайта