Category: производство

Category was added automatically. Read all entries about "производство".

любопытно

Pattern recognition

Смотрим.
На входе двумерная визуальная информация. Это исходные зашумленные данные (фото, например, или кадр с камеры, или сканированный лист). Дано пространство моделей (априорно заданных возможных расшифровок), каждая из которых описывается малым объемом данных. Например, "заглавная буква А, сдвинутая на (-2, 2) и повернутая на 8 градусов по часовой стрелке". Или, для другой задачи, "двухполосное асфальтовое шоссе, поворот влево через 200 метров, закатное солнце под углом 30 градусов к горизонту, светит прямо в объектив". Каждую ситуацию умеем "рендерить", после чего проверять, насколько хорошо "рендер" совпадает с исходным изображением. Дальше, пользуясь моделью зашумленного канала, выясняем, что же на самом деле у нас на входе.
Если решать задачу распознавания в такой постановке, получается очень много, просто чудовищно много вычислений, даже в самых простых случаях (одна буква, маленькое разрешение). Поэтому все(?) делают наоборот: вычисляют какие-то агрегированные фичи исходного изображения (особые точки, контуры всякие) и строят модель по этим фичам. Рендера никакого нет.

Есть ощущение, что второй подход из первого делается полуавтоматически. Неправильное слово. В общем, примерно как компилятор из формального описания грамматики: не автоматически, конечно, но сильно проще, чем без оного. Кое-какие достаточно нетривиальные шаги автоматизируются "на халяву", оптимизированный backend может быть один и тот же для нескольких совершенно разных моделей и т.п. Подробнее пока не готов, когда буду готов, сделаю на досуге мототерминатора, буду дфмн богат красив и знаменит.

Кто что скажет?
Если такое уже есть в сколько-нибудь промышленном качестве, кто покажет пальцем?