180
Ctrl

В. Д. Присяжный

Из статьи «О предпосылках автоматизации издательских процессов»

1973

Развитие науки и техники невозможно без научно-технической литературы, выпуск которой с каждым годом увеличивается. В связи с этим возникает проблема ускорения процесса редактирования при подготовке изданий к печати. Один из конкретных путей к решению этой проблемы — автоматизация некоторых элементов работы редактора, т. е. выполнение части редакторской работы над рукописью ЭВМ.

Использование вычислительной электронной техники обусловлено также отставанием редактирования, которое выполняется теми же способами, что и много лет назад, от наборных процессов, большинство которых скоро будет автоматизировано. Автоматизация, естественно, повысила бы и качество редакторской работы.

Последнее время все более злободневной становится проблема стандартизации научно-технического текста в связи с автоматизацией информационно-поисковых систем. Ведутся работы над автоматическим реферированием и аннотированием текста. Важным фактором является также то, что эффективность работы ЭВМ возможна только при полной загруженности. Вот и пришло время задуматься и об автоматическом редактировании (АР).

В научных работах по кибернетике (в большинстве по машинному переводу) можно встретить кое-какие намеки о возможности АР. Так, Д. Ю. Панов в своей книге «Автоматический перевод» пишет о том, что АР кажется невозможным только на первый взгляд, потому что обработка текста может быть автоматизирована по тем же алгоритмическим схемам, что используются для анализа и синтеза при автоматическом переводе. Разница лишь в том, что эти схемы найдут применение в границах одного языка. «Образно можно сказать, — пишет Д. Ю. Панов, — что при этой операции „не совсем правильная“ русская речь будет переводиться на „целиком правильную“». <...>

Создание машинных словников синонимов и специализированных правил, которые учитывали бы особенности построения выражений и однозначно устанавливали значение отдельных слов и их взаимоотношение в тексте, обусловило бы разработку правил АР, которые дали бы возможность при пунктуальном их выдерживании выполнять некоторые процессы редактирования с помощью машины. Разработка точных правил АР наиболее возможна для такого стиля языка, в котором существует четкая нормированность, ясность и лаконичность в выражении мысли. Всем этим условиям отвечают общие речевые черты научного стиля.

В целом АР можно поделить на четыре этапа: 1) введение в машину неотредактированного текста; 2) анализ текста; 3) синтез текста; 4) вывод из машины отредактированного текста. Итак, наиболее важными этапами АР должны быть анализ и синтез текста, который требуется отредактировать.

Назначение анализа состоит в том, чтобы в зависимости от написания слов, их места в предложении и наличия других слов, а также по грамматическим признакам обозначить (определить) грамматическую форму слов и их место в предложении. Процесс анализа можно разделить на три этапа: семантический, морфолого-синтагматический и синтаксический.

Синтез — процесс, противоположный анализу, есть носитель той самой совокупности правил, которая необходима для построения отредактированной фразы. Так что синтез — применение на практике выведенных в теории правил. Необходимо отметить важность разработки алгоритма синтеза для АР, ибо именно в нем сосредоточена суть построения грамотной фразы. И. Е. Бельская в книге «Язык человека и машина» определяет задачу АР как «синтез эквивалентного предложения на том же языке, удовлетворяющего заданным стилистическим и грамматическим требованиям».

Функции синтеза могут быть сведены к таким операциям: 1) формо- и словообразование; 2) перестановка слов согласно с правилами грамматики; 3) размещение знаков препинания; 4) единообразие фразеологических оборотов и унификация терминов; 5) замена арготизмов, диалектизмов, экспрессивных и эмоциональных элементов языка синонимичными словами или оборотами; 6) унификация сокращенных обозначений слов и словосочетаний; 7) работа над стилистическими ошибками, особенно над стилистической сочетаемостью; 8) контроль за соблюдением синтаксических способов выразительности языка, которые помогают логично членить текст (параллелизмы, анафора, эпифора), перестройка (вопросно-ответная форма, антитеза, повторы и т. д.).

Кроме правки языково-стилистических ошибок, редактор выполняет такие операции, как оценка научного содержания произведения, выбора и разработки темы, проверка фактического материала, устранение композиционных недоделок, целесообразность использования цитат и их проверка, правильность выбора названия (заглавия), редактирование таблиц и иллюстраций, работа над аппаратом книги. Автоматизация большинства этих процессов также может быть выполнена для научно-технической литературы.

Так, оценка выбора темы может выполняться путем анализа ключевых слов, наиболее важные из которых должны быть выделены сопоставлением с ключевыми словами, запрограммированными в ЭВМ. Правильность выбора названия может быть определена согласно частотности употребления ключевых слов, приняв за правило, что наиболее употребляемое есть наиболее характерное и соответствующее тем, что выражают суть произведения. Во время автоматизации устранения композиционных недоделок необходим анализ каждого абзаца и выведение опять-таки ключевых слов, которые при синтезе обязаны размещаться только в определенной последовательности. Проверка фактического материала (цифры, даты, имена, географические названия и т. д.) также целиком может быть выполнена, если будут созданы машинные словники энциклопедического характера. Целесообразность использования цитат может определяться теми же алгоритмическими схемами, которые будут производить правку-сокращение. Автоматизация редактирования таблиц и иллюстраций заслуживает отдельного рассмотрения, потому что в основу процесса их редактирования не входит работа со словом. Работа над автоматизацией прикнижного аннотирования проводится целиком самостоятельно.

Таким образом, большинство этапов работы редактора над текстом имеет все предпосылки для автоматизации. Однако необходимым фактором обработки текста является языково-стилистическая правка, которая требует определенных навыков и допускает наибольшую вероятность ошибок. Поэтому вопрос ее автоматизации требуется решить в первую очередь.

<...>

...Можно надеяться, что АР станет важным фактором в усовершенствовании издательских процессов, предметом интересных научных задач для теории и практики редактирования, местом экспериментальной проверки лингвистических теорий.