Попробуйте прочитать это и не только это


Программа предназначена для ввода текстовой информации с графических устройств: таких как сканер и фотокамера. И позволяет распознавать образы даже очень низкого разрешения и очень низкого качества, при этом качество распознавания в несколько раз лучше, чем у программы Fine Reader, и может превосходить точность распознавания человеком, а по скорости распознавания значительно опережает его.Для просмотра необходимо запустить файл demo_ocr.exe. После старта автоматически загружается первый тест и распознается. В результатах приводиться информация: распознанная текстовая строка, информация о том с какой точностью был распознан каждый символ и проверка правильности распознавания теста. Для распознавания следующего теста достаточно нажать кнопку (Следующий файл).

В файлах BMP приведен пример реальной фотографии номера на вагоне с которой производилась деформация различными фильтрами в программе Photoshop, и это еще не предел возможностей программы, вы сами можете попробовать изменить параметры распознавания и тестовые файлы. Отзывы присылайте по адресу E-Mail: grigorlukashenko@mail.ru

Для алгоритма совершенно нет никакой разницы какие символы распознавать: цифры, буквы или любой другой язык. Для наглядности сравнения можете попытаться распознать прилагаемые тесты с помощью программы Fine Reader 4 и прочувствуйте разницу.

Если вам не поверится что программа действительно распознает образы, а просто реагирует на нажатие клавиш, то можете отредактировать тестовые файлы. При нажатии на кнопку (Распознать образ) программа распознает загруженный файл. Вы можете изменить показатель точность распознавания от 1 до 200%, который задает с какой точностью программа должна распознать символ, если символ распознан с меньшей точностью, то он будет пропущен. В данном примере последние цифры распознаются с меньшей точностью, и если заданная точность будет высокой, то эти символы будут пропущены.


Некоторые комментарии и дополнения:


Иногда приходят письма от людей которые пробовали подставлять свои файлы для распознавания в программе, но у них ничего не получилось:

	S> Привет Григорий.

	S>     Честно признаюсь я не поверил Вашим заявлениям, особенно сомневался что программа способна 
	   распознать БитМап под
	S> номером 20. Зря распознала. Решил удостоверится в её крутизне. Прорисовал ряд
	S> цифр в поинте и о чудо : не распознала. Странно. Опять же по заверениям она должна распознавать 
	   даже те образы
	S> которые человек не может распознать а тут всего на всего четкие цифры на черном фоне.
	S> Может я не прав но у меня сложилось 100% отношение что это чистой воды подлог. А вместо 
           распознавания подставляются
	S> числа с помощью random.

	S> С уважением, Дмитрий.

Да, мне понятны вашы сомнения. Конечно для большей ясности в данном вопросе, требуется комментарий. Программа распознавания не делает ничего сверхъестественного, она сравнивает эталон образа с тем что видит и пытается определить что это такое. Возможности программ такого класса определяют не только алгоритм но и эталоны которые хранятся в памяти.

Для того чтобы программа работала ее необходимо предварительно обучить. В данном случае я обучил программу на базе первого образа, а дальше после применения различных фильтров, исказил исходную фотографию и сохранил в фотографиях с последующими номерами. Алгоритм пытается найти исходные образы в искаженной фотографии на базе имеющихся эталонов. Функция обучения в демонстрационной версии отключена и вы не сможете проверить ее работу, а только работу OCR алгоритма.

Проблема распознавания образов дополняется и тем, что кроме разных образов есть различные классы образов, например на фотографии 256 оттенков серого и черно-белой фотографиях, похожие символы для человека будут совершенно различными для компьютера. И если вы попытаетесь распознать чорнобелый образ, с помощью программы, которая была предварительно обучена на базе образов 256 оттенков серого, то программа выдаст неадекватный ответ. Но даже если вы попытаетесь распознать образы в формате 256 цветов, скорее всего у вас программа будет часто ошибаться. Дело в том что на класс образа влияет и оборудование с помощью которого производилась съемка и условия освещения и другие многочисленные факторы. Кроме того программа не идеальна и находится в стадии разработки. Демонстрационной версии программы уже более 2-х лет с тех времен значительно улучшилась технология распознавания и оптимизирован алгоритм по скорости и качеству, но у меня нет пока времени, чтобы собрать в кучу новую версию. Кроме того пока и старой версии есть, что показать. В демонстрационной версии я просто хотел показать, что умеет программа и ни о каком жульничестве не было и мысли, просто сложности процесса распознавания образов требуют более детального подхода для успешного понимания.

Если посмотреть на фотографию с номером 20, то программу для распознавание такого образа я не планировал делать, и с другой стороны невозможно распознать уверенно такую фотографию, просто она демонстрирует предельные возможности программы где она начинает ошибаться. После проведения первых испытаний я увидел работоспособность моего алгоритма, которая поразила даже меня.

Не пытайтесь распознавать образы созданные в графическом редакторе программа их не распознает, если вы сомневаетесь, что программа действительно распознает файлы по содержимому а не по названию, вы можете отредактировать тестовые файлы применяя различные фильтры к существующим фотографиям, но не пытайтесь рисовать цифры или печатать их разными шрифтами, текущие эталоны не рассчитаны на распознавание образов созданных на компьютере, они были отсканированы с фотографии и могут работать только с образами данного класса.

Надеюсь этот комментарий хоть немного изменит вашу точку зрения.

Скачать демо версию 160 Кбайт


http://www.ocrai.narod.ru E-Mail: grigorlukashenko@mail.ru последнее обновление: 11;12;2001



Psend kept free because of these great sponsors.a..

Other Sponsors

electrical connectors, Mangosteen Juice, real estate short sale, Jupiter FL real estate,

Furniture Markdown

Great Deals on furniture - Free Shipping!
Discount Furniture
Daybeds
Metal Beds
Platform Beds
Futons

Y-Net Wireless Internet

Denver area high speed wireless privider.
Colorado High Speed Internet, Wireless Internet Denver, VOIP Denver CO, T1 provider Denver, Denver Wireless ISP , Denver Internet Access,

Dog House Technologies

Doghouse Techonologies is located in Tampa Bay FL and offer professional web design, ecommerce development and custom application design for the internet.
Tampa Bay Web Design, E-Commerce Web Design, Tampa Bay Search Engine Marketing, Tampa Web Hosting, Florida Web Design, Custom Application Development, Search Engine Optimization,

hosting.asp">Tampa Web Hosting and Florida Web Design This site hosted curtosy of Psend.com's Free Web Hosting. Psend is a division of Telos Online, Inc. Psend kept free because of these great sponsors.a..

Other Sponsors

electrical connectors, Mangosteen Juice, real estate short sale, Jupiter FL real estate,

Furniture Markdown

Great Deals on furniture - Free Shipping!
Discount Furniture
Daybeds
Metal Beds
Platform Beds
Futons

Y-Net Wireless Internet

Denver area high speed wireless privider.
Colorado High Speed Internet, Wireless Internet Denver, VOIP Denver CO, T1 provider Denver, Denver Wireless ISP , Denver Internet Access,

Dog House Technologies

Doghouse Techonologies is located in Tampa Bay FL and offer professional web design, ecommerce development and custom application design for the internet.
Tampa Bay Web Design, E-Commerce Web Design, Tampa Bay Search Engine Marketing, Tampa Web Hosting, Florida Web Design, Custom Application Development, Search Engine Optimization,