Вокорд. Системы видеонаблюдения, распознавания лиц, фотофиксации нарушений ПДД, аудиорегистрации

Камеры для задач распознавания: как получить контрастное изображение в плохих условиях

Четкость и контраст: базовые определения

Под контрастом понимается отношение яркостей самой светлой и самой темной точек изображения – чем оно больше, тем выше контраст. Четкость изображения зависит от правильно подобранного объектива и настройки фокуса, иными словами, от грамотности инженера, который внедряет систему распознавания. В то же время обеспечение контраста остается целиком на совести камеры. Давайте разберемся, что должна уметь камера, чтобы успешно справляться с задачами распознавания образов.Одна из ключевых задач, которые стоят перед камерой распознавания лиц или автомобильных номеров – передача четкого и контрастного изображения. Четкость изображения подразумевает резкие и неразмытые границы: для задач распознавания очень важно, чтобы границы объекта, с которым мы работаем, были именно такими.

Четкое и нечеткое изображения

 1.jpg


Видеокамера и распознавание

Во-первых, нужно учитывать, что на настройки камеры для распознавания накладываются довольно жесткие ограничения. Например, ее диафрагма не должна быть открыта слишком сильно, так как открытая диафрагма уменьшает глубину резкости – ту область, в которой объекты остаются в фокусе, то есть четкими. Во-вторых, время экспозиции не должно быть слишком длительным, так как увеличение времени экспозиции ведет к “смазыванию” быстро движущихся объектов. В хорошую солнечную погоду эти требования легко выполнить и получить высококачественные снимки, например, номеров машин. Но что делать в сумерки? При наступлении темноты прикрытая диафрагма и небольшое время экспозиции на видеокамере приводят к ожидаемому результату – темному изображению, которое к тому же имеет низкий контраст. Если для систем распознавания номеров проблема встает исключительно в темное время суток, то для систем распознавания лиц, зачастую расположенных в недостаточно освещенных помещениях, она существует всегда. Решить эту проблему можно с помощью коррекции яркости на этапе обработки сформированного изображения.

Яркое высококонтрастное изображение: на гистограмме много светлых точек, большое расстояние между самой темной и самой светлой точкой

2.jpg 
 Темное низкоконтрастное изображение: ни гистограмме много темных точек, расстояние между самой темной и самой светлой точкой мало 

3.jpg

Как улучшить изображение: коррекция яркости

Существует два этапа, во время которых возможна коррекция яркости: это этап формирования изображения и этап обработки уже сформированного изображения. Во время первого этапа происходит управление двумя параметрами: временем экспозиции и степенью открытости диафрагмы – на основе полученной гистограммы камера анализирует необходимость повышения или понижения яркости и подает команду на изменение параметров. Функция изменения степени открытости диафрагмы (автоуправление диафрагмой) обязательна для камеры, которая используется в системах распознавания номеров и фотофиксации ПДД. Существуют две основные технологии для автоуправления диафрагмой: DC-Iris и P-Iris. Основное отличие между ними состоит в том, что более продвинутая технология P-Iris позволяет задать точное значение для положения диафрагмы, в то время как DC-Iris позволяет управлять только относительным изменением величины диафрагмы при закрытии или открытии. Стоит отметить, что автоуправление диафрагмой должно поддерживаться как камерой, так объективом.

Если после первого этапа получившееся изображение все еще не удовлетворяет требованиям (не хватает яркости или контраста из-за недостатка освещения или плохих погодных условий), возможна коррекция изображения на втором этапе: обработка уже сформированного изображения на процессоре камеры.

Самой простое, что может сделать камера – осветление темного снимка. Для этого левая часть гистограммы “растягивается” вправо на весь диапазон. Таким образом, черные точки на изображении остаются черными, а серые становятся белыми. Подобную обработку картинки можно произвести вручную, например, в программе Adobe Photoshop. Камеры же делают это в автоматическом режиме. Такая функция осветления встроена в большинство камер видеонаблюдения. Но в этом случае есть одна проблема: повышение яркости и контраста может приводить к потере информации. После «растягивания» на гистограмме появляются разрывы, которые выглядят на изображении как резкие неприятные для глаза переходы между оттенками. Но самое главное то, что мы видим на картинке выше: из-за потери информации номер становится нечитаемым и следовательно, непригодным для распознавания системой. Почему же это происходит? Дело в том, что преобразование проводится на картинке разрядностью 8 бит. Большинство видеокамер обзорного видеонаблюдения умеют формировать изображение только с такой разрядностью. Но когда нам нужно что-то распознавать в автоматическом режиме, оказывается, что 8-ми битного изображения для этого недостаточно.


 Осветление снимка – вместе с яркостью повышается и контраст

 4.jpg
 


Что такое разрядность и зачем ее преобразовывать

Под разрядностью цифрового изображения понимается количество бит, используемых для кодирования яркости одного пикселя. Разрядность определяет количество оттенков на изображении – чем она больше, тем более плавными будут переходы между оттенками.

Разрядность 1 бит позволяет закодировать два оттенка - черный и белый, разрядность 2 бит (22) - четыре оттенка. То есть повышение разрядности на 1 увеличивает количество возможных оттенков вдвое

 5.jpg

Разрядность 8 бит – стандарт для высококачественных цифровых изображений. Для человеческого глаза 8-битное изображение выглядит реалистично, поэтому дальнейшее повышение количества оттенков будет избыточным – глаз не сможет их распознать. Однако, как видно на примере, приведенном выше, обработка 8-битного изображения может привести к невосполнимой потере информации. Мы видим, что при осветлении первые 40-50 градаций яркости были “растянуты” на всю длину гистограммы - 256 градаций. Между сохранившимися оттенками появились большие разрывы, заметные как на гистограмме, так и на самом изображении. Такое изображение не подойдет ни для человеческого глаза, ни для системы распознавания. Поэтому в случаях, когда мы не можем гарантировать неизменные условия освещенности, использование в системах распознавания номеров или лиц стандартных камер, которые умеют формировать только 8-битное изображения – это выбор в пользу цены с ущербом для качества работы системы.

Решить эту проблему помогут камеры, которые умеют формировать изображение с разрядностью до 12 бит. Для человеческого глаза разница между 8-битным и 12-битным изображением не видна. Но для камеры дополнительные 4096 градаций яркости (в целых 16 раз больше, чем в 8-битном формате!) позволяют производить любые преобразования яркости без потери полезной информации. При осветлении 12-битного изображения происходит то же самое, что и при осветлении 8-битного. Около 800-1000 градаций из левой части гистограммы растягиваются на всю ширину - 4096 градаций. Как и в случае с 8-битным изображением, часть информации при этом теряется. Но в этом случае теряется избыточная информация, невидимая для человеческого глаза и не значимая для системы распознавания. После растягивания 800-1000 градаций проводится преобразование разрядности – из 12 бит в 8 бит – избыточные градации отбрасываются, и на исходной гистограмме видны оставшиеся 256 градаций яркости.

 

Осветление изображения в камере для распознавания номеров VOCORD NetСam4

 
 6.jpg

Такая коррекция не приводит к потере информации: изображение хорошо выглядит для человеческого глаза, и номер остается читаемым. Работать в 12-битном диапазоне и выше умеют только специализированные камеры и камеры «машинного зрения», которые разработаны для научных или промышленных задач, например, для биологических или космических исследований. Среди наиболее известных разработчиков, выпускающих такие камеры, - международные компании Allied Vision и Basler, российские Вокорд и Лептон, японская Jai и другие.

Шаг вперед: адаптивное преобразование яркости

Осветление - простая операция, которая в определенных условиях повышает пригодность темного изображения к распознаванию. Но простого осветления недостаточно для решения всех возможных проблем, которые возникают в системах распознавания: ярких автомобильных фар, быстро меняющегося освещения, контровой засветки, отражения фонарей на мокрой дороге и так далее. Для борьбы с этими проблемами появляются более сложные алгоритмы, например, адаптивное преобразование яркости, которое встроено в видеокамеры VOCORD NetCam4.

 

Пример 1: контровая засветка (темное лицо на фоне яркого окна). Слева необработанное изображение, непригодное для распознавания. Справа изображение после включения адаптивного преобразования яркости

 7.jpg

Пример 2: осветление в условиях недостаточной освещенности. Слева необработанное темное изображение, номер не виден. Проблему могло бы решить повышение времени экспозиции или приоткрытие диафрагмы, но это невозможно, так как приведет к “смазыванию” движущихся объектов и уменьшению глубины резкости. Справа изображение после включения адаптивного преобразования яркости

8.jpg

Алгоритм адаптивного преобразования яркости позволяет камере передавать в систему распознавания изображение с максимальным количеством информации об интересующих областях, уменьшая при этом количество ненужной информации. В зависимости от задачи, интересующими будут разные области видеокадра. Например, для систем распознавания такой областью, скорее всего, будет лицо или номер. А если, например, мы ведем видеонаблюдение на КПП, то это могут быть силуэты машин или фигуры людей. Адаптивный алгоритм “выбирает” на входной гистограмме те градации яркости, которые будут перенесены в выходную гистограмму, и “отрезает” ненужные. Таким образом, можно регулировать яркость и усиливать контрастность более темных или более светлых участков изображения. Адаптивность заключается в способности алгоритма реагировать на изменения сцены - уменьшение или увеличение освещенности, появление дополнительного источника света, глубокой тени или засветки интересующего объекта. Так как анализ гистограммы происходит на каждом кадре, адаптивное преобразование яркости обеспечивает быструю реакцию на быстрые изменения освещенности сцены. 

Пример 3: реакция на появление солнца и засветку номера в системе VOCORD Traffic (в составе системы используются видеокамеры VOCORD NetCam4). Слева изображение в момент появления солнца, номер не виден. Справа изображение после изменения экспозиции и адаптивного преобразования яркости

 9.jpg

Это важно в случае наблюдения за движущимися объектами - в основном, за машинами в задаче распознавания номеров на скоростных участках или перекрестках. Данный алгоритм можно использовать не только для задач распознавания, но и для задач охранного видеонаблюдения, где алгоритм будет «оптимизировать» изображение для глаз и минимизировать раздражающие «скачки» яркости, что существенно облегчит работу оператора системы видеонаблюдения.

Выводы

Значительно повысить достоверность распознавания и, следовательно, эффективность систем распознавания лиц и номеров может использование камер с 12-битным сенсором и применение алгоритмов преобразования разрядности. В то же время использование подобных алгоритмов на 8-битном изображении только ухудшает картинку и делает ее непригодной для задач распознавания. Имея это в виду, следует уделять особое внимание подбору камер для систем распознавания, так как результаты работы системы могут существенно отличаться в зависимости от правильно или неправильно подобранной камеры. Дополнительный плюс специализированных камер для задач распознавания, например, таких как VOCORD NetCam4, заключается в том, что алгоритмы обработки изображения встроены в саму камеру и не отнимают вычислительные ресурсы компьютера – камера справляется с задачей улучшения изображения сама.

Добавить комментарий

CAPTCHA