Разработка алгоритма и реализация библиотеки предобработки и сегментации машиночитаемых бланков

Золтуев, Владислав Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Работа посвящена реализации этапа автоматизированной предварительной обработки машиночитаемых (с рукописным заполнением полей) бланков процедур массового тестирования выпускников общеобразовательных организаций и подготовки полей к распознаванию.

ВВЕДЕНИЕ ………………………………………………………………………………………………………………………….. 15
1. Обзор алгоритмов предобработки и сегментации ……………………………………………………………. 17
1.1. Предварительная обработка…………………………………………………………………………………….. 17
1.2. Препроцессинг ……………………………………………………………………………………………………….. 17
1.3. Выделение региона интереса …………………………………………………………………………………… 17
1.4. Сегментация изображения ………………………………………………………………………………………. 18
1.5. Алгоритмы сегментации …………………………………………………………………………………………. 19
1.6. Анализ алгоритмов сегментации………………………………………………………………………………….. 22
2. Проектирование и реализация ………………………………………………………………………………………… 26
2.1. Блоки обработки входного бланка и эталонных ответов …………………………………………… 26
2.2. Реализация программного обеспечения …………………………………………………………………… 31
3. Финансовый менеджмент, ресурсоэффективность и ресурсосбережение …………………………. 35
3.1. Предпроектный анализ ……………………………………………………………………………………………. 35
3.1.1. Потенциальные потребители результатов исследования……………………………………. 35
3.1.2. Анализ конкурентных технических решений ……………………………………………………. 36
3.1.3. QuaD-анализ ……………………………………………………………………………………………………. 37
3.1.4. SWOT-анализ ………………………………………………………………………………………………….. 39
3.2. Определение возможных альтернатив разработки ……………………………………………………. 40
3.3. Планирование научно-исследовательских работ………………………………………………………. 41
3.3.1. Структура работ в рамках проекта ……………………………………………………………………. 41
3.3.2. Определение трудоемкости выполнения работ …………………………………………………. 42
3.4. Бюджет научно-технического исследования ……………………………………………………………. 46
3.4.1. Расчет материальных затрат …………………………………………………………………………….. 46
3.4.2. Расчет основной заработной платы исполнителей системы……………………………….. 46
3.4.3. Расчет затрат по дополнительной заработной плате ………………………………………….. 47
3.4.4. Расчет отчислений во внебюджетные фонды ……………………………………………………. 47
3.4.5. Расчет накладных расходов ……………………………………………………………………………… 48
3.4.6. Формирование бюджета затрат проекта ……………………………………………………………. 48
3.5. Вывод …………………………………………………………………………………………………………………….. 51
4. Социальная ответственность ………………………………………………………………………………………….. 53
4.1. Производственная безопасность ……………………………………………………………………………… 53
4.1.1. Повышенная или пониженная температура воздуха рабочей среды …………………… 54
4.1.2 Недостаточная освещенность рабочей зоны ……………………………………………………………. 55
4.1.3 Опасность поражения электрическим током …………………………………………………………… 56
4.1.4 Опасность возникновения пожара ………………………………………………………………………….. 57
4.1.5 Мероприятия и рекомендации по устранению и минимизации ………………………………… 58
4.2. Экологическая безопасность ……………………………………………………………………………………….. 60
4.3 Безопасность в чрезвычайных ситуациях………………………………………………………………………. 61
4.4 Правовые и организационные вопросы обеспечения безопасности. ……………………………….. 61
4.4.1 Организационные мероприятия обеспечения безопасности рабочей зоны ……………….. 62
ЗАКЛЮЧЕНИЕ …………………………………………………………………………………………………………………….. 63
СПИСОК ЛИТЕРАТУРЫ ……………………………………………………………………………………………………… 64
ПРИЛОЖЕНИЕ А …………………………………………………………………………………………………………………. 65
ПРИЛОЖЕНИЕ Б …………………………………………………………………………………………………………………. 72

В настоящее время существует различные направления науки и техники,
ориентированные на развитие систем, анализирующих информацию,
представленную в цифровом виде. Одними из важнейших задач являются
предобработка и распознавание изображений.
Целью данной работы является разработка алгоритма и реализация
библиотеки предобработки и сегментации машиночитаемых бланках.
Для достижения поставленной цели необходимо решить ряд задач:
− изучение и анализ предметной области;
− выявление и документирование требований к разрабатываемой
библиотеке предобработки;
− разработка алгоритма сегментации;
− реализация программного обеспечения.
Сегментация содержимого машиночитаемого бланка реализуется на
основе подхода «сверху-вниз». На вход поступает бланк, пропускается через
сканирующее устройство. Благодаря, заданным на нем маркерам,
содержимое бланка обрабатывается не под углом, в следствии чего строки
ровные. Дальнейшая сегментация строк происходит по методу отталкивания-
притягивания. Далее производится сегментация каждого символа слева на
право.
В работе был проведен анализ методов сегментирования текста и
строк. В результате анализа были выбраны наиболее подходящие для
поставленной задачи – обработки машиночитаемых бланков. Вследствие,
было принято решение разработки алгоритма сегментации, позволяющий
упростить процесс распознавания рукописных символов с машиночитаемых
бланков.
Объектом исследования в данной работе являются алгоритмы
сегментации объектов – рукописных символов.
Предметом исследования выступает разработка программного
продукта, содержащего в себе алгоритм сегментации и распознавания на
основе сверточной нейросети.
1. Обзор алгоритмов предобработки и сегментации
В литературе [1, 2, 3] доступна информация об основных методах
цифровой обработки изображений, с целью повышения эффективности
последующей сегментации. В источниках [7, 8], приводится обзор основных
алгоритмов сегментации для разных типов изображений и способы их
реализации.
1.1. Предварительная обработка
Основные задачи предварительной обработки заключаются в:
1. Улучшение качества изображения, зачёт методов обработки
изображений. В качестве таких методов могут выступать шумоподавление или
фильтрация;
2. Выделение области на изображении. Включает в себя методы анализа
изображений. Так же имеет цель избавления от пятен, помарок;
1.2. Препроцессинг
Данный этап заключается в фильтрация изображения от недочетов
сканирования. Фильтрация реализуется, с помощью методов обработки
изображений. Для шумоподавления применяется фильтр Гаусса [24].
Следующим пунктом этого этапа является пороговая бинаризация, которая
переводит изображение из оттенков серого в чёрно-белый формат. После чего
становится возможным разделение символов и фона, что так же избавляет от
помех и облегчает использование алгоритмов. Области тёмных пикселей,
соответствует символам, области светлых, соответствует фону изображения.
Поиск порогового значения яркости заключается в нахождении приемлемого
значения между двумя пиками.

Распознавание рукописного текста является одной из важнейших задач
при обработке машиночитаемых бланков. В качестве метода сегментирования
текста был выбран подход «сверху-вниз», для сегментирования строк выбран
метод отталкивания-притягивания.
В данной работе был проведен сравнительный анализ использования
различным методов сегментации. В результате проведенных исследований
было установлено, что использования метода отталкивания-притягивания
будет наиболее оптимальным для сегментации рукописного текста.
Преимуществом данного метода является меньшее количество настраиваемых
параметров, высокая скорость и точность сегментирования машиночитаемого
бланка.
Итогом проделанной работы является разработка библиотеки,
включающая в себя основные классы и функции необходимые для реализации
предобработки и сегментирования машиночитаемых бланков. Точность
распознавания рукописных символов составила 96,43%.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    [telegram]

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Андрей С. Тверской государственный университет 2011, математический...
    4.7 (82 отзыва)
    Учился на мат.факе ТвГУ. Любовь к математике там привили на столько, что я, похоже, никогда не перестану этим заниматься! Сейчас работаю в IT и пытаюсь найти время на... Читать все
    Учился на мат.факе ТвГУ. Любовь к математике там привили на столько, что я, похоже, никогда не перестану этим заниматься! Сейчас работаю в IT и пытаюсь найти время на продолжение диссертационной работы... Всегда готов помочь! ;)
    #Кандидатские #Магистерские
    164 Выполненных работы
    Евгений А. доктор, профессор
    5 (154 отзыва)
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - ... Читать все
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - по социальной работе.
    #Кандидатские #Магистерские
    260 Выполненных работ
    Катерина В. преподаватель, кандидат наук
    4.6 (30 отзывов)
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации... Читать все
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации. Опыт работы 7 лет. Всегда на связи и готова прийти на помощь. Вместе удовлетворим самого требовательного научного руководителя. Возможно полное сопровождение: от статуса студента до получения научной степени.
    #Кандидатские #Магистерские
    47 Выполненных работ
    Александр О. Спб государственный университет 1972, мат - мех, преподав...
    4.9 (66 отзывов)
    Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальн... Читать все
    Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальных уравнений. Умею быстро и четко выполнять сложные вычислительные работ
    #Кандидатские #Магистерские
    117 Выполненных работ
    Анна Н. Государственный университет управления 2021, Экономика и ...
    0 (13 отзывов)
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уни... Читать все
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уникальности с нуля. Все работы оформляю в соответствии с ГОСТ.
    #Кандидатские #Магистерские
    0 Выполненных работ
    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ
    Екатерина С. кандидат наук, доцент
    4.6 (522 отзыва)
    Практически всегда онлайн, доработки делаю бесплатно. Дипломные работы и Магистерские диссертации сопровождаю до защиты.
    Практически всегда онлайн, доработки делаю бесплатно. Дипломные работы и Магистерские диссертации сопровождаю до защиты.
    #Кандидатские #Магистерские
    1077 Выполненных работ
    Катерина М. кандидат наук, доцент
    4.9 (522 отзыва)
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    #Кандидатские #Магистерские
    836 Выполненных работ
    Александр Р. ВоГТУ 2003, Экономический, преподаватель, кандидат наук
    4.5 (80 отзывов)
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфин... Читать все
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфинансы (Казначейство). Работаю в финансовой сфере более 10 лет. Банки,риски
    #Кандидатские #Магистерские
    123 Выполненных работы

    Другие учебные работы по предмету

    Модернизация системы автоматизации АСУ ТП АО «Farg’onaazot»
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Интеграционный сервис передачи данных между АСУ ТП и MES
    📅 2018год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Методы сегментации новообразований головного мозга
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)