The article deals with the relatively new sphere of lexicography-computer lexicography, the basic object of which is the electronic dictionary. The article dwells upon the advantages of such type of a dictionary in comparison with an ordinary “paper” dictionary and gives a short outlook on some electronic dictionaries.
Key words: electronic dictionary, computer lexicolography, Internet-encyclopaedia.
Современная лексикография существенно расширила и усилила свой инструментарий компьютерными технологиями создания и эксплуатации словарей. Это направление прикладной лингвистики получило название компьютерной лексикографии. Центр ее интереса - способы организации словарной статьи, устройство словарей и технология их создания. Компьютерная лексикография является дисциплиной переходного периода - перехода от существовавшей в течение многих столетий традиционно ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям. Она представлена совокупностью методов и программных средств обработки текстовой информации для создания словарей. [9, c. 45] Центральным объектом компьютерной лексикографии является компьютерный словарь, под которым понимается любое лексикографическое произведение на машинных носителях, снабженное программами автоматической обработки и наполнения. [2, с. 36]
Идея создания компьютерных словарей возникла в результате исследований «по определению вида и количества ошибок, совершаемых переводчиком при переводе текстов различной трудности, и по подсчету времени, которое затрачивает переводчик на поиск в словарях и справочниках незнакомых ему слов». [3, 3-16] Г.М. Мандрикова предлагает назвать компьютерным словарем «любое лексикографическое произведение на машинных носителях».[4] В литературе по данной теме обнаруживается целый ряд вариантов названия этого типа словарей: автоматический (Л.Н. Беляева, А.С. Герд, Ю.Н. Марчук), машинный (Л.Л. Нелюбин), компьютерный (Г.М. Мандрикова), электронный (В.П. Берков, О.М. Карпова), современный вариант - цифровой словарь. Учитывая тот факт, что до настоящего времени компьютерная лексикография не выработала единого названия для своего продукта, все выше перечисленные варианты можно рассматривать как равнозначные. [5, с. 14]
В. П. Селегей, директор по лингвистическим исследованиям компании ABBYY, полагает, что электронный словарь-это особый лексикографический объект, в котором могут быть реализованы и введены в обращение многие продуктивные идеи, не востребованные по разным причинам в бумажных словарях. [11]
Появление электронных словарей вызвано объективными обстоятельствами, с их помощью можно решить проблему объема словаря, быстрого поиска необходимой информации в словаре, соответствия содержания текущему моменту. По мнению В.П.Беркова словарь XXI века должен обладать следующими чертами:
1. Колоссальность по своему объему.
2. Обеспечение поступенчатого извлечения информации в зависимости от потребностей пользователя.
3. Возможность словаря быть звуковым.
4. Возможность предоставления полной грамматической информации о словах входного и выходного языков, обширного материала по именам собственным с программами по транскрибированию.
5. Возможность включения графического иллюстративного материала.[1, c. 15-35]
Всем этим потребностям отвечают электронные словари.
К общепринятому делению словарей на энциклопедические и лингвистические в настоящее время прибавилось противопоставление электронный/печатный словарь. Вслед за Г.М. Мандриковой будем рассматривать их отличия друг от друга по следующим характеристикам:
- гибкость, как комплекс лингвистических и программных приемов, упрощающих обращение к словарю и расширяющих возможности пользователя при работе с ним, т.е. это удобство и легкость, с которыми пользователь может входить в словарь и в пределах кроткого времени получать необходимую информацию;
-многоязычие, как возможность независимого описания лексических единиц для каждого языка средствами и по законам этого языка;
- обратимость, как возможность использования любого из включенных в компьютерный словарь языков в качестве входного;
- динамичность, как возможность постоянного пополнения, коррекции, изъятия устаревших данных. Подобная переменность способность воспринимать изменения в течение периода создания и эксплуатации словаря является принципиальным отличием электронного словаря от обычного. [9, c. 47]
Кроме вышеозначенного к новым возможностям электронного словаря относятся:
- Существенно большие возможности показа содержания словарной статьи, включая возможность показа по различным критериям, использование разнообразных графических средств, которые не используются в обычных словарях.
2. Использование для доступа к содержанию различных лингвистических технологий, таких как морфологический и синтаксический анализ, полнотекстовый поиск, распознавание и синтез звука. Пользователь хотел бы, чтобы словарь максимально локализовал релевантную информацию. Специфика словарного ответа в том, что он дает весьма разнообразную информацию о слове или словосочетании, а не просто переводное соответствие, предполагает активный выбор из нескольких возможных хорошо обоснованных альтернатив.
- «Бумажные» словари - неизбежно словари устаревшие. Особенно это характерно для разговорной лексики.
4. Для массовых программных продуктов, каковыми являются электронные словари, характерна частая смена версий и наличие постоянной обратной связи с тысячами пользователей. Поэтому электронная лексикография - это актуальная лексикография.
- Объем (информация хранится на плоских, небольших носителях — компакт-дисках, дискетах или жестком диске); информативная наполненность; ощутимое сокращение временных затрат на поиск необходимых данных; простота использования, обеспеченная с помощью диалогового способа взаимодействия с компьютером, удобных и понятных интерфейсов программ (подсказки, «меню», «помощь») и т. д.
6. Благодаря электронным банкам языковых данных словники современных словарей включают богатый материал. Электронный формат позволяет вмещать в корпусе большое количество информации. Словари в Интернете обладают способностью постоянно обновляться, а поисковые стратегии пользователя, работающего с электронными справочниками, отличаются большей креативностью по сравнению с возможностями, предоставляемыми печатными продуктами. [3;5]
7. Электронные словари можно классифицировать по роду выполняемых задач (например, словари для формального определения рода и падежа существительного), по характеру лексических единиц, включенных в словарь (сюда относятся словари словоформ, состоящие из списка всех словоформ подъязыка, или словари основ, состоящие из списка основ и окончаний), по способу организации словников (алфавитные, тезаурусы, где словарные единица сгруппированы по понятийным группам). [9, c. 33]
В настоящий момент выпущено довольно большое количество электронных словарей. Для примера возьмем один из самых известных: МультиЛекс, разработанный фирмой МедиаЛингва. Компания МедиаЛингва придерживается при создании словарей МультиЛекс довольно простой стратегии. Она создает цифровую копию известных книжных изданий. На сайте фирмы можно найти формулировку этого принципа: "В основу электронных словарей заложены словарные базы книжных изданий, уже завоевавших популярность и признание среди переводчиков, преподавателей иностранных языков, студентов и школьников». С точки зрения МедиаЛингва, задача электронной лексикографии - как можно точнее перевести традиционный словарь в электронную форму. В МультиЛекс встроен синтезатор звука и произносятся все слова. Однако полностью доверять такому подходу, не контролируя его по транскрипции, опасно. Синтезатор может неправильно поставить ударение или вообще исказить произношение слова. За основу словаря Мультилекс взят "Новый большой англо-русский словарь" под редакцией А.Д. Апресяна. Есть и расширенная версия, где к основному словарю добавлены экономико-финансовый, юридический, строительный, политехнический словари и словарь по полиграфии и издательскому делу. Конечно, словарь Апресяна - заметное достижение лексикографии, но подход МедиаЛингва имеет и недостатки. Во-первых, традиционные словари довольно серьезно отстают от языковой реальности. Обычно это не менее десяти лет. Электронные словари можно пополнять чуть ли не ежедневно. Во-вторых, словари, содержащие сотни тысяч словарных статей, какими бы квалифицированными лексикографами они не составлялись, всегда содержат ошибки и неточности, не говоря уже о возникновении дополнительных значений слов. Жесткая привязка к бумажному прототипу не дает возможности исправлять и дополнять электронный, тем более изменять структуру построения словарной статьи. С осторожностью нужно относиться к электронным словарям типа Wikipedia, где зачастую приводятся непроверенные данные, а одна и та же статья на разных языках несет различную информацию. На главной странице сайта создатели говорят о своем словаре как о свободной энциклопедии, которую может создавать каждый. Основными объектами критики являются: открытая природа проекта, приводящая к неавторитетности и ненадёжности информации. В Wikipedia признают, что её не следует использовать как первоисточник в серьёзной научной работе. [14]
Поскольку английский язык - это базовый язык Интернета, преобладающее большинство справочников составляют лингвистические англоязычные словари, представленные одноязычными, двуязычными и\или многоязычными справочниками. Источники можно найти в каталогах электронных словарей по многим адресам, среди которых наиболее надежными считаются:
http://www.oz.net/~mev/wg/dictionary
http://www.internetoracle.com/dictiona.htm;
http://home.talkcity.com/AcademyDr/kaleialoha/encyclo.html;
http://www.councillsales.com/lists/dictionaries.html;
http://www.brown.edu/Department/Cog/Ling/Sci/lingdir/dictionary.html. [12]
Интересно отметить, что многие исследователи выделяют в числе приоритетных в Интернете специальные словари, регистрирующие и обрабатывающие отдельные группы лексики: диалектные словари (Dictionary of American Regional Terms); терминологические словари или словари подъязыков (Tropical Medicine Glossary, Management and Technology Dictionary). [11]
Интернет-энциклопедии представлены как общими (Encyclopedia Britannica), так и специальными видами (Financial Encyclopedia), а также проектом энциклопедии Global Encyclopedia, составляемой самими пользователями системы. Кроме того, в последнее время популярными стали «новые энциклопедии», в которых пользователь может найти ответы на часто задаваемые вопросы (в первую очередь, это энциклопедия Encarta). Таким образом, очевидно, что электронная лексикографическая продукция активно и успешно завоевывает позиции.
Тем не менее, следует отметить, что электронная лексикография находится лишь в стадии становления, и дать ей оценку сегодня в полной мере представляется невозможным. Оперативность, постоянная обновляемость киберсловарей определяет их ненадежность, поскольку лексикография выполняет функцию нормализации языка, а для этого нужна значительная степень консервативности. Кроме того, каждый традиционный словарь, переиздаваемый с внесением в язык раз в 10-15 лет, фиксирует определенный исторический срез языка, в то время как online словари не позволяют этого сделать.
Итак, создание электронных словарей - это перспективное, активно развивающееся направление практической лексикографии. Электронный словарь сокращает время поиска, обладает возможностью включения неограниченного объема информации, обеспечивает одновременный поиск не только по названию словарной статьи, но и по всему огромному объему словарей, что нереально в бумажном варианте, озвучивает слова и словарные статьи, прост в использовании. Как отмечает В. Селегей, главное преимущество хороших электронных словарей - создание многомерного портрета слова, когда становятся явными языковые законы. [12]
Библиографический список
1. Берков В.П. Двуязычная лексикография. - СПб.: СПУ, 1996. - 248 стр.
2. Герд А.С. Основы научно-технической лексикографии. - Л.: ЛГУ, 1986. -72 с.
3. Карпова О.М. Словари издательства HarperCollins: находки и решения // Language and Communication. Issue I. Rostov-on Don. 2001. -57 с.
4. Карпова О.М. Библиографический указатель «Словари современного английского языка». Спб., 2002. -24 с.
5. Карпова О.М. Учебные словари серии Collins COBUILD // Гуманитарное измерение меняющегося мира. Иваново, 2002. -34 с.
6. Карпова О.М. Лексикографические портреты словарей современного английского языка. – Иваново: Иван. гос. ун-т, 2004. – 192 с.
7. Марчук Ю.Н. Компьютерная лингвистика.- АСТ, Восток-Запад, 2007.-165 с.
8. Савина А.С., Типикина Т.А. Что внутри электронного словаря? // Наука и жизнь.- №10, 1999 г.- 63с.
9. Тузлукова В.И. Типология педагогических лексикографических источников в международной педагогической лексикографии // Сборник трудов Второй Международной научно-практической конференции
10. Шишлова А.В. Электронные словари на компакт-дисках // Наука и жизнь.- №10, 1999 г.- 63 с.
11. http://www.lingvo-plus.ru/leksikografiya/
12. http://www.lingvoda.ru/forum/actualthread.aspx?tid=12
13. www.lingvo.ru/
14. en.wikipedia.org