На сегодняшний день автоматизации подверглась практически каждая деталь, которая играет в жизни человека не последнюю роль. Раньше, многие дела человек без проблем выполнял сам, сегодня благодаря высоким технологиям, такую работу за нас выполняет современная техника, что существенно облегчает жизнь. Автоматизация — это важная инженерная наука, охватывающая технические методы, концепции и средства регулирования и управления автоматизированным производством [1].
Каждая организация, в том числе и высшие учебные заведения, имеет требования, которые являются нормативными документами, устанавливающими общие требования к построению, изложению и оформлению документов. Нормоконтроль — это контроль оформления учебной документации в соответствии с нормами, требованиями и правилами, установленными нормативными документами. Его проводят с целью обеспечения однозначности применения учебной документации и установленных в ней требований.
Каждый студент проходит процедуру нормоконтроля на соответствие работы требованиям по оформлению выпускных квалификационных работ [2]. На данную процедуру отводится определенное количество часов, но на деле времени тратится намного больше, так как каждую работу приходится проверять неоднократно. Цель, которую преследует нормоконтроль, — это обеспечить строгое соблюдение студентами, выполнившими научно-исследовательские работы, требований и норм, предусмотренными нормативно-техническими документами.
Автоматизированный процесс проверки дипломных работ на нормоконтроль позволяет сократить время проверки выпускных работ, а также повышает качество проверки за счет исключения человеческого фактора. Нормоконтролер может не заметить, например, шрифт размером 13 кегель при требовании в 14 или абзацный отступ 7 мм вместо положенных 8, а компьютерная программа не пропустит подобных ошибок.
Сложность реализации автоматизированной проверки дипломных работ на соответствие техническим нормам заключается в том, что требования к пояснительной записке, разработанные для печатного документа, формализованные. Эти требования основываются на чисто визуальных показателях, не учитывая ни среду набора документа, ни ее программную структуру. Разработка программы, универсальной для всех операционных систем и видов текстовых редакторов, является чрезвычайно сложной задачей. На данный момент в среде MS Word под Windows оформляется подавляющее большинство текстовых документов. Поэтому достаточно чтобы разрабатываемая программа проверяла документы с расширением doc или docx [3].
Но даже ограничившись данными форматами, задача разбора документа остается чрезвычайно сложной, так как требования остаются слишком формальными, не привязанными к объектной модели документа Word. Например, оглавление (содержание) документа может быть создано как в ручную, так и автоматически. При этом, при полном зрительном совпадении двух документов, внутреннее, программное содержание, их совершенно различно. Кроме того, сама программа MS Word постоянно развивается и внутреннее устройство документов, набранных в различных версиях, и даже просто пересохраненные в другой версии, могут различаться. Конечно, сама программа MS Word имеет механизмы и алгоритмы распознавания версий и преобразований совместимости, но эти особенности не имеют широко распространенной документации. В результате чего в работе по разбору документа разработчик вынужден опираться только на самые общие принципы модели Word, которые остаются неизменными для всех версий продукта.
Еще одной сложностью реализации является объектная модель документа MS Word. Если для человека наиболее понятным было бы позиционирование по страницам и строкам, то для MS Word это не основные понятия, а вычисляемые по косвенным признакам. Например, номер страницы может быть как физическим, по реальной позиции курсора, так и относительным, привязанным к организованной нумерации. С учетом того, что MS Word позволяет создавать множество несвязанных разделов нумерации, то ориентироваться на него становится сложно. Поэтому нумерация страниц в программе ведется в привязке к физическим номерам страниц, которые скорее всего не совпадут с их визуальной нумерацией.
Следующей проблемой является то, что любая пустая строка, организованная переводом каретки, считается абзацем и хранит всевозможные настройки текста: размер и наименование шрифта, отступы, межстрочное расстояние и т. п. Эти настройки пустых абзацев зрительно не проявляют себя до внесения в себя текстовой информации, но не позволяют определить параметры всего текстового документа. Из-за этого алгоритм проверки документа организован циклами проверок по абзацам. В этом есть и положительный момент: мы можем указать на место ошибки с точностью до абзаца на странице. Только нужно при этом учитывать, что абзацем считается пустая строка с переводом каретки.
Автоматические ссылки на литературу тоже необходимо учитывать, поскольку существует как минимум четыре способа организации работы с ссылками в документах MS Word и предусмотреть их все очень трудоемко. Однако, если автоматические ссылки в документе созданы, то вероятность в ошибках практически равна нулю. Достаточно обновить поля, нажатием клавиш Shift+F9. Чего нельзя сказать о ссылках, указанных в документе в ручную, т. е. когда пользователь сам ставит в квадратные скобки номер источника из приложенного списка использованной литературы.
Работа над программой автоматическим-контролером подтверждает перспективность разработок в данной области. Постоянная отладка, работа над документами и совершенствование алгоритмов позволит ускорить проверку документов, увеличить подробность и достоверность проверок, сократить время рутинной проверки работ преподавателем и наглядно помочь студентам в устранении ошибок. В перспективе возможно написание программы, работающей с несколькими типами проверяемых документов.
Работа над разбором настроек документа позволила выявить недостатки самих требований к оформлению документов. Требования, описанные в методических указаниях [2] и на основе которых проходят процедуру нормоконтроля студенты Карагандинского государственного университета имени академика Е. А. Букетова, предъявляют только визуальные требования к документу, которые тяжело реализуются программно без четких алгоритмических указаний. При наличии точных указаний требований к оформлению документов (однозначно соответствующему программному методу создания данного эффекта в MS Word), возможно написание более простой и быстрой программы, которая с большей точностью и однозначностью проверит все особенности оформления. Кроме того, такие требования позволят написать программу-помощника, автоматически выполняющую форматирование текста на основе требований.
Литература:
- http://www.learningandteaching.info/learning/experience.htm.
- Методические указания по выполнению дипломной работы (проекта) / Сост. С. Т. Каргин, С. В. Гаголина, С. А. Смаилова, К. Ж. Садвокасова, Н. К. Сыздыкова. — Караганда Изд-во КарГУ, 2009. — 25 с.
- Пестриков В. М., Маслобоев А. Н. Основы программирования в MicrosoftWord на VisualBasicforApplications: учебное пособие/ ГОУВПО Спб ГТУ РП. — Спб., 2010.