Программа распознает нарисованные объекты

18Сентября2012
Автор: Становой Сергей
E-mail

Программа распознает нарисованные от руки объекты

Команда программистов из Университета Брауна в Род-Айленде и Технического университета Берлина создали программу, которая распознает нарисованные от руки объекты и сопоставляет их с фотографиями реальных объектов. При этом не обязательно иметь навыки рисования.

Ранее уже были попытки разработки подобных программных продуктов, но для их нормальной и правильной работы нужно было быть в буквальном смысле этого слова художником. То есть интерпретированный нарисованный объект должен был максимально близко быть похож на его реальное изображение, записанное в базе данных. Новая же программа способна распознавать и интерпретировать даже те рисунки, которые лишь схематически напоминают реальный объект.

Для разработки своего продукта программисты создали базу фотографий реальных объектов, которая была разбита на 250 категорий. Затем они пригласили обычных людей, не имеющих художественных навыков, и попросили их набросать эскизы, хранящихся в базе изображений. В результате получилось в общей сложности 20 тыс. рисунков. Затем эти рисунки подвергли машинной обработке, то есть с помощью существующих алгоритмов попытались их интерпретировать и распределить по существующим категориям.

Потом в процессе разработки собственного алгоритма инженеры «научили» машину определять схожие формы, которые могут быть нарисованы с некоторыми отличиями, но иметь какие-то общие очертания. Программа сравнивала эти формы и относила их к той или иной категории, а уже внутри категории производила точное распознавание. Затем в программу включили функцию распознавания изображения, нарисованного при помощи стилуса.

В будущем программисты надеяться включить нарисованные от руки изображениям в поисковые системы Интернета. Если вы, к примеру, во время отпуска увидели какой-то таинственный объект или предмет, ранее не встречавшийся вам, вы с легкостью сможете нарисовать его по памяти на сенсорном экране, а новая программа интерпретирует его или же отправит в алгоритм поиска одной из поисковых систем всемирной информационной сети. Кроме этого новый программный продукт снимает языковой барьер. Находясь в чужой стране, пользователь с легкостью сможет искать нужную ему информацию просто рисуя ее интерпретацию на сенсорном экране. И при этом не обязательно быть хорошим художником – компьютер и так поймет, что вы от него хотите.