Нижегородский государственный лингвистический университет им. Н.А. Добролюбова
дипломная работа на тему
Электронные словари
и их применимость
для традиционного
машинного перевода
Выполнил: студент гр. 503А Тараскин А.А.
Научный руководитель: к.ф.н. доц. Яржемский А.Н.
Нижний Новгород, 2003 г.
Содержание:
Введение 3
Глава I. Место лексикографии среди
лингвистических дисциплин. 5 a. Лексикография как одна из наук о языке. 6 b. Типы словарей. 8 c. Составление словарей. 22
Глава II. Электронные словари. 24 a. Электронные словари "МультиЛекс". 24 b. Электронные словари "Lingvo". 25 c. Преимущества электронных словарей. 26 d. Новые мехи требуют нового вина. 29 e. Читатели и писатели. 30 f. Проблема актуальности. 31 g. Соответствие уровню достижений
лингвистической науки. 31
Глава III. Машинный перевод. 33 a. Немного истории. 33 b. Классификация систем машинного перевода
по Лари Чайлду. 34 i. Полностью автоматизированный МП. 34 ii. Автоматизированный МП
при участии человека. 35 iii. Перевод, осуществляемый человеком
с помощью компьютера. 35 c. Системы машинного перевода. 37 iv. Система МП Retrans Vista. 40 v. Система МП PROMT XT. 43
Глава IV. Практическая часть. 49
Заключение 54
Библиография 56
Введение.
В настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации. В этой связи компьютерные словари являются очень удобным подручным средством в целях экономии времени и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас имеются программы-переводчики, которые могут производить более или менее адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей. Данная работа посвящается изучению указанных проблем, а также анализу некоторых лингвистических программных продуктов, направленных на автоматизацию процесса перевода.
Настоящую тему исследования можно считать вполне современной, поскольку
история развития и внедрения в повседневную жизнь персональных компьютеров
(а тем более таких, каким было бы 'под силу' осуществлять более или менее
современные программы машинного перевода) насчитывает едва ли более
пятнадцати лет. Особую актуальность эта тема приобретает, если учесть тот
факт, что именно в настоящее время Россия все более интегрируется в
международное сообщество и что, наряду с экономическими и политическими
барьерами, препятствуют этому во многом барьеры языковые. Вместе с тем,
профессиональных переводчиков, способных и желающих осуществлять подобный
процесс коммуникации сообществ во всех сферах науки и культуры, не так
много, следствием чего является тот факт, что услуги их недешевы. Поэтому
именно сейчас особенно актуален поиск путей максимально автоматизировать
процесс перевода, осуществляемого человеком, чтобы, с одной стороны,
максимально облегчить нелегкий труд человека-переводчика, а с другой -
сделать этот труд максимально эффективным. Осуществить подобное можно, лишь
максимально интегрировав усилия специалистов в областях кибернетики,
программирования, психологии, а главное - лингвистики.
Цель данной работы - определение того, насколько можно использовать современные программные продукты для осуществления перевода, а также выявление наиболее перспективных, на наш взгляд, направлений исследований в области его автоматизации.
В соответствии с поставленной целью, задачами исследования являются:
- уяснение местоположения компьютерной лексикографии среди лингвистических наук;
- уяснение различий между электронными и традиционными бумажными словарями;
- определение максимально эффективного способа организации электронных словарей;
- уяснение различий между разнообразными системами МП и классификации последних;
- анализ работы систем машинного перевода на примере перевода, произведенного программой PROMT XT, и сравнение образцов перевода с переводом, сделанным человеком. Анализ причин несоответствия.
Глава I. МЕСТО ЛЕКСИКОГРАФИИ СРЕДИ
ЛИНГВИСТИЧЕСКИХ ДИСЦИПЛИН
Слово «лексикография» греческого происхождения, lexikos — относящийся к
слову, словарный и grapho — пишу. Следовательно, лексикография означает:
«пишу слова» или «пишу словари». В современном значении лексикография — это
теория и практика составления словарей, главным образом языковых,
лингвистических, в отличие от неязыковых, энциклопедических.
Лексикография как научный термин появилась в широком обиходе
сравнительно недавно. Например, в энциклопедическом словаре Брокгауза и
Ефрона (1896 г.) нет статьи на слово «лексикография», однако есть статья на
слово «лексикология». Справедливости ради следует отметить, что в статье
«словарь» этого же справочника имеется слово «лексикография», где оно
является синонимом словосочетания «словарная техника».
В энциклопедическом словаре братьев А. и И. Гранат (1916 г.) уже есть статья на слово «лексикография», которая определяется как «научные способы обработки словесного материала языка для составления лексикона». Отметим в этом определении акцент на «научные способы обработки».
В первом издании «Большой советской энциклопедии» (1938 г.) в статье на
слово «лексикография» дано: «Лексикография (греч.), работа по составлению
словарей». И только во втором (1953 г.) и третьем (1973 г.) изданиях этот
термин толкуется достаточно современно: «Лексикография — раздел
языкознания, занимающийся практикой и теорией составления словарей». (БСЭ,
3-е изд. 1973, т. 14).
С другой стороны, статьи на слово «лексикография» нет ни в энциклопедии
«Британика», ни в энциклопедии «Американа», хотя в обеих есть статьи на
слово «словарь». Отсутствие термина «лексикография» в таких солидных
современных справочниках, как британская и американская энциклопедии,
отнюдь не случайно. Это объясняется, во-первых, молодостью лексикографии
как науки и, во-вторых, тем, что даже среди самих языковедов до сих пор еще
идет спор, является ли лексикография наукой, точнее, частью науки о языке,
или же она просто техника составления словарей, в лучшем случае, искусство
их составления.
Видный испанский лексикограф X. Касарес в своей широко известной книге
«Введение в современную лексикографию» (которая переведена на русский язык)
утверждает, что лексикография — это техника и искусство составления
словарей. (Вспомним определение «лексикографии» в первом издании БСЭ:
«работа по составлению словарей».)
Известный английский лексикограф, автор знаменитых справочников по английскому и американскому сленгу Эрик Патридж, посвятивший всю свою жизнь составлению словарей, не случайно назвал свою последнюю книгу, плод многолетних разысканий в области словарного дела, так: «Благородное искусство лексикографии как объект занятий и опыт страстного его приверженца».
Даже Ф. Гоув, главный редактор третьего издания словари Уэбстера (1461 г.), крупнейшего лексикографического предприятия нашего времени, пишет в программной статье «Успехи лингвистики и лексикография»: «Лексикография еще не наука. По-видимому, они никогда не будет наукой. Однако это сложное, топкое и порой всепоглощающее искусство, требующее субъективного анализа, произвольных решений и интуитивных доказательств".
Лексикография как одна из наук о языке
Существует, однако, другая точка зрения на лексикографию. Ее сторонники считают, что лексикография — это не просто техника, не просто практическая деятельность по составлению словарей и даже не искусство, а самостоятельная научная дисциплина, имеющая свой предмет изучения (словари различных типов), свои научные и методологические принципы, свою собственную теоретическую проблематику, свое место в ряду других наук о языке.
Впервые эту точку зрения на лексикографию со всей определенностью высказал известный советский языковед академик Л. В. Щерба. В предисловии к русско-французскому словарю (1936 г.) он писал: «Я считаю крайне неправильным то пренебрежительное отношение наших квалифицированных лингвистов к словарной работе, благодаря которому почти никто из них никогда ею не занимался (в старые времена это за гроши делали случайные любители, не имевшие решительно никакой специальной подготовки) и благодаря которому она получила такое нелепое название «составление» словарей. И действительно, наши лингвисты, а тем более наши «составители» словарей просмотрели, что работа эта должна иметь научный характер и никак не состоять в механическом сопоставлении каких-то готовых элементов».
Развивая выдвинутые в 1936 г. положения, Л.В. Щерба публикует в 1940 г. статью (ставшую потом широко известной и за рубежом), в которой на большом фактическом материале начинает разрабатывать основные теоретические вопросы лексикографии. Л.В. Щерба мыслил написать несколько статей (этюдов, как он их называл) по общей теории лексикографии, в которых намеревался обсудить такие важные проблемы, как основные типы словарей, природа слова, значение и употребление слова, построение словарной статьи в связи с семантическим, грамматическим и стилистическим анализом слова и др. Однако преждевременная смерть помешала осуществлению этого замысла. Л.В. Щербой был написан лишь первый этюд «Основные типы словарей», который начинался следующим хорошо известным сейчас положением: «Одним из первых вопросов лексикографии является, конечно, вопрос о различных типах словарей. В основе его лежит ряд теоретических противоположений, которые и необходимо вскрыть». С тех пор тезис о том, что лексикография — это не только практика составления словарей, но и теоретическая научная дисциплина, прочно вошел в ряд отправных положений советской лексикографической школы.
Здесь, однако, можно задать вопрос: такое ли большое точение имеет антиномия «наука или искусство» для лексикографии? Ведь ясно, что в том и другом случае составлением словарей следует заниматься, ибо они нужны; нужно много хороших и разных словарей. На это со всей определенностью следует ответить, что данный вопрос имеет принципиальное значение, и вот почему.
Что такое наука вообще? Каковы ее важнейшие черты? Основными и важнейшими чертами науки, любой научной дисциплины являются следующие: наличие системы знаний и необходимость их объективного исследования. Эти две существенные черты взаимосвязаны, тесно переплетены, ибо только тогда можно строить адекватную действительности систему знаний, когда эта действительность будет объективно изучена. В применении к лексикографии это выглядит следующим образом.
Если принять тезис о том, что лексикография есть искусство, то тогда
открываются двери субъективному пониманию задач и предмета лексикографии,
приемов и методов ее исследования, субъективному решению ее проблем. Вряд
ли такой подход будет плодотворен и уж никак не научно объективен. Если же
принять тезис о том, что лексикография есть просто техника составления
словарей, некий вид сугубо практической деятельности, то тогда придется
передать другим наукам (лексикологии, семантике, стилистике, этимологии и
т. п.) решение всех теоретических вопросов, и лексикография должна будет
использовать лишь готовые решения этих наук. Вряд ли это будет плодотворно,
ибо другие науки о языке недостаточно хорошо знакомы с положением дел в
лексикографии. Они, следовательно, будут решать вопросы лексикографии со
своих позиций, со своих точек зрения, а потому ущербно для лексикографии.
Таким образом, тезис о том, что лексикография есть наука, является
единственно правильным и наиболее плодотворным. Из этого следует, что
лексикография как наука имеет свой собственный предмет исследования, свои
специальные методы исследования, свою структуру, свое место в ряду других
лингвистических дисциплин.
Как и всякая наука, лексикография имеет две стороны: научно- теоретическую и практически-прикладную. Первая (теоретическая лексикография) ставит общие теоретические проблемы и работает над их решением. Вторая (практическая лексикография) занимается непосредственно составлением словарей различных типов на базе теоретических решений основных проблем. Конечно, деление лексикографии на две части в высшей степени условно. Эти две стороны лексикографии идут всегда вместе, они взаимосвязаны: лексикограф-теоретик не может заниматься голым теоретизированием без работы над конкретным материалом, без участия в какой- то практической лексикографической работе; и, наоборот, никакой лексикограф- практик не может окунуться только в свою чисто эмпирическую работу, не зная новейшей проблематики лексикографии как науки. Тем не менее, принципиальное разграничение двух сторон лексикографии чрезвычайно важно.
Из изложенного выше можно заключить, что термин «лексикография» имеет в настоящее время три значения: 1) наука, точнее, особая область языкознания, изучающая принципы составления словарей разных типов; 2) сама практика словарного дела, т.е. составление словарей; 3) совокупность словарей данного языка.
Являясь частью науки о языке, лексикография тесным образом связана с такими лингвистическими дисциплинами, как лексикология, семантика, стилистика, этимология, фонология и т. п. С этими дисциплинами лексикография имеет общую проблематику. Порой она использует результаты их исследований, а часто и опережает их в решении некоторых проблем.
Таким образом, постепенно, шаг за шагом, лексикография оформляется и самостоятельную лингвистическую дисциплину, становясь равноправной среди других языковедческих наук.
Типы словарей.
Существующие типы словарей разнообразны. Это разнообразие объясняется, прежде всего, сложностью и многоаспектностью самого объекта лексикографического описания, т. е. языка. Кроме того, многочисленные потребности общества в получении самой различной информации о языке также усложняют и расширяют репертуар словарей. Практически нет никакой возможности дать в одном словаре всю в той или иной мере исчерпывающую информацию о языке, которая удовлетворила бы в равной степени все общество в целом и отдельные его слои и частности. Именно поэтому в любой национальной лексикографии мы находим десятки, а то и сотни словарей самых разных типов.
Деление словарей на типы происходит, как говорят классификаторы, по
различным основаниям: в зависимости от цели словаря, его объема, порядка
расположения в нем слов, объекта описания и т. д. Многие из указанных
моментов налагаются друг на друга, объединяясь в словаре одного и того же
типа, другие стоят особняком, служа основанием для словарей совершенно
отличного типа. Существуют переводные, толковые, диалектные и региональные
словари, словари сленга, исторические, неологизмов, этимологические,
крылатых выражений и много других. Необходимо отметить, что в науке о языке
пока еще нет сколько-нибудь общепринятой типологии словарей, хотя попытки
создать таковую предпринимались многими лингвистами, в частности Л. В.
Щербой, П. Н. Денисовым, Б. Кемадой, Я. Малкилом, Л. Згустой и др.
Прежде всего, приходится различать словари лингвистические и нелингвистические. Первые собирают и описывают под тем или иным углом зрения лексические единицы языка (слова и фразеологизмы). Особый подтип лингвистических словарей составляют так называемые идеографические словари, идущие от понятия (идеи) к выражению этого понятия в слове или словосочетании. В нелингвистических словарях лексические единицы (в частности — термины, однословные и составные, и собственные имена) служат лишь отправной точкой для сообщения тех или иных сведений о предметах и явлениях внеязыковой действительности. Встречаются и промежуточные разновидности словарей. Кроме того, всякий словарь может быть отнесен либо к «общим», либо к «специальным».
Примерами общих лингвистических словарей могут служить обычные толковые
и переводные словари, охватывающие с той или иной степенью полноты всю
лексику, бытующую в общенародном употреблении. Специальный лингвистический
словарь разрабатывает какую-то одну область лексики, иногда достаточно
широкую (например, фразеологический словарь, словарь иностранных слов),
иногда же довольно узкую (например, словарь личных имен, даваемых
новорожденным). Общий нелингвистический словарь — это общая энциклопедия
(например, БСЭ—Большая Советская Энциклопедия). Специальный
нелингвистический словарь — это специальная (отраслевая) энциклопедия
(медицинская, юридическая и т. д.) или же краткий словарь той или иной
(обычно — более узкой) области знания, или биографический словарь деятелей
той или иной отрасли (писателей, художников и т.д.), или же той или иной
страны (словарь-справочник типа «Who is who»).
Толковые словари. Толковым словарем называют такой словарь, главной
задачей которого является толкование значений слов (и фразеологизмов)
какого-либо языка средствами самого этого языка. Толкование дается с
помощью логического определения концептуального значения (например,
накалиться — нагреться до очень высокой температуры; рекордсмен —
спортсмен, установивший рекорд), посредством подбора синонимов (назойливый
— надоедливый, навязчивый) или в форме указания на грамматическое отношение
к другому слову (прикрывание—действие по значению глаголов прикрывать и
прикрываться). В некоторых толковых словарях значения слов раскрываются в
нужных случаях с помощью рисунков. Эмоциональные, экспрессивные и
стилистические коннотации указываются посредством специальных помет
(«неодобр.», «презр.», «шутл.», «ирон.», «книжн.», «разг.» и т. п.).
Отдельные значения по мере надобности и возможности (в зависимости от
объема словаря) иллюстрируются примерами — типичными сочетаниями, в которых
участвует данное слово (например, утюг накалился, атмосфера накалилась —
где глагол выступает уже в переносном значении: “стала напряженной”), или
же (особенно в словарях большего объема) цитатами авторитетных писателей.
Как правило, толковые словари дают также грамматическую характеристику
слова, указывая с помощью специальных помет на часть речи, грамматический
род имени существительного, вид глагола и т. д. и приводя в нужных случаях
кроме «представительной», или «словарной», и некоторые другие
грамматические формы данного слова. В той или иной мере указывается и
произношение слова (например, в русских толковых словарях — ударение),
иногда сообщаются и разные другие, добавочные сведения.
Обычно толковые словари являются словарями современного литературного
языка. Некоторые из них носят строго нормативный характер, т. е. отбирают
только факты, полностью соответствующие литературной норме, рекомендуют эти
факты как единственно «правильные» и отсекают все, что хотя бы немного
отклоняется в сторону просторечья. Типичным примером может служить
академический словарь французского языка (Dictionnaire de I'Academie
Franзaise). Для многих других толковых словарей характерно более широкое
понимание литературного языка и, соответственно, включение в словарь
разговорной и даже просторечной лексики (кроме лишь узко-областных,
диалектных, узкопрофессиональных и сугубо арготических элементов). К этому
типу относятся академические словари русского языка — 17-томный «Словарь
современного русского литературного языка» Академии наук СССР (1950—1965) и
4-томный «Словарь русского языка» (1957—1961), а также однотомный «Словарь
русского языка» С. И. Ожегова (9-е испр. и доп. издание под ред. Н. Ю.
Шведовой 1972 г.), который очень полезен для практических целей, и более
ранний «Толковый словарь русского языка» коллектива авторов под ред. Д. Н.
Ушакова (4 тома, 1935—1940). Особое значение для русской лексикографии
имеет, конечно, 17-томный академический «Словарь современного русского
литературного языка». Он включает более 120 тыс. слов. В 1970 г. он отмечен
Ленинской премией.
Иной характер носит знаменитый, не раз переиздававшийся «Толковый
словарь живого великорусского языка» В. И. Даля (4 тома, первое изд.
1863—1866 гг.), в изобилии включающий областную и диалектную лексику
середины 19 века и в отношении полноты охвата этой лексики и обилия
народных выражений до сих пор непревзойденный. Он включает около 200 тыс.
слов литературного языка и диалектов. С 1965 г. начал выходить «Словарь
русских народных говоров» под редакцией Ф. П. Филина, в котором
представлены диалектная лексика и фразеология всех русских говоров 19-20
веков.
Главная задача толкового словаря – истолковать значение слов и их применение в речи, отграничить правильное от неправильного, показать связь слов со стилями языка, дать читателю сведения об особенностях падежных, родовых, залоговых, видовых и иных грамматических форм слова; попутно указывается, как слова пишутся и произносятся.
Толковые словари, как правило (но не всегда), оказываются и
нормативными, т.е. объясняющими слова в соответствии с требованиями
литературно-языковых норм (норма применительно к языку – это выработанное
при участии литературы и принятое обществом в качестве обязательного
правило, регулирующее применение слова в речи, его написание, произношение
и ударение). Так, все перечисленные толковые словари русского языка –
нормативные, за исключением «Толкового словаря живого великорусского языка»
В.И. Даля.
Переводные словари. Толковым словарям противостоят переводные, чаще
всего двуязычные (скажем, русско-английский и англо-русский), а иногда
многоязычные. В переводных словарях вместо толкования значений на том же
языке даются переводы этих значений на другой язык, например, накалиться -
become heated, назойливый – importunate, troublesome. В зависимости от
того, предназначен ли словарь как пособие при чтении (слушании) текста на
чужом языке, или как пособие при переводе с родного языка на чужой, его
желательно строить по-разному. Так, русско-английский словарь для англичан
может давать меньше сведений в «правой» (т. е. английской) части, чем их
дает русско-английский словарь, предназначенный для русских. Например,
переводя русское обращение, словарь для англичан может просто перечислить
все возможные английские эквиваленты (address, appeal; conversion;
treatment, circulation и т. д.), так как англичанину известны смысловые
различия между этими английскими словами; в словаре же для русских придется
указать, что address и appeal это ‘обращение к ...’, причем appeal это
‘обращение’ в смысле’призыв’; что conversion это ‘обращение в веру’ и т.
п., что treatment это ‘обращение с...’, ‘обхождение с кем-либо’, a
circulation ‘обращение товаров, денег и т. п.’; кроме того, придется
указать, с какими предлогами употребляются эти английские существительные,
даже указать место ударения, т. е. снабдить английские эквиваленты многими
разъяснениями, которые помогут правильно употребить их, переводя текст со
словом обращение с родного русского языка на иностранный английский. Ясно,
что в англо-русском словаре картина соответственно изменится. В словаре,
рассчитанном на русских, русская часть будет менее подробной, но в словаре,
предназначенном для англичан, придется подробно указывать различия в
значениях и в употреблении русских эквивалентов, снабжать их
грамматическими пометами, указывать ударение и т. д. Хороший переводный
словарь должен содержать также стилистические пометы и особо отмечать
случаи, когда переводящий эквивалент является неточным в стилистическом
отношении. Перевод слов всегда представляет большую трудность, т.к. объем
значения слова в разных языках часто не совпадает, переносные значения в
каждом языке развивается по-своему. Так, в русском сон означает и «сон»
(состояние сна) и «сновидение», а в чешском первому соответствует spanek, а
второму – sen, аналогично в английском различают sleep и dream, slumber; в
немецком Schlaf и Traum. Наоборот, важное для русского языка различие
глаголов идти и ехать не получит отражения в переводе на болгарский язык,
где будет общий глагол ида, идвам, и французский, где arriver – и идти, и
ехать и т.п.
Переводные словари могут быть двуязычными (русско-французский, англо-
русский и т.п.) и многоязычными. К последним относится составленный А. и В.
Поповыми «Словарь на семи языках (французско-немецко-английско-итальянско-
испанско-португальско-голладско-русский)», вышедший в свет в 1902 г.
Теоретическое и практическое значение подобных словарей весьма невелико.
Значительно важнее многоязычные специальные словари, дающие перевод какой-
либо отраслевой терминологии на ряд языков, например, выпущенный в России в
1881 г. «Карманный русско-английско-французско-итальянско-датский и
норвежско-латышский морской словарь». В последнее время довольно широкое
распространение получили краткие многоязычные словари с подбором наиболее
употребительных слов и выражений. Примером может быть «Славянский
разговорник», выпущенный в Софии в 1961 г.. В нем приведены приветствия
(«Здравствуйте!» и т.п..), предостережения («Берегитесь!» и т.п.), слова
для беседы на бытовые темы в гостях, в магазине, на почте и т.д. на
русском, сербохорватском, болгарском, польском и чешском языках.
Многоязычные словари могут иметь различную целевую установку. Так, в 18 и
начале 19 века были распространены «каталоги языков», где к данному слову
подбирались все известные переводы на любые языки; позднее этот тип стал
более узким и практическим, объединяя переводы либо на группу родственных
языков, либо на группу языков одной географической местности в помощь
туризму и путешествиям.
К общим словарям мы отнесем также словари, рассматривающие (в принципе)
всю лексику, но под каким-либо специфическим углом зрения. Таковы, в
частности, словообразовательные (деривационные) словари, указывающие
членение слов на составляющие их элементы, т.е. дают справки о
морфологическом составе слова. Примером может служить «Школьный
словообразовательный словарь» З.А. Потихи (1964г.). Далее этимологические
словари (одного языка или группы родственных языков), содержащие сведения о
происхождении и первоначальной мотивировке слов. Краткие этимологические
словари обыкновенно ограничиваются приведением для каждого слова одной
этимологии, представляющейся автору словаря наиболее вероятной. В более
крупных и солидных словарях, как правило, приводятся соответствия в
родственных языках и излагаются «контроверзы», т. е. споры ученых,
касающиеся этимологии тех или иных слов, даются краткие сводки предложенных
гипотез и их критическая оценка. В этимологические словари принято включать
и слова, этимология которых остается неясной (в этих случаях так и
указывают: «неясно»). Производные и сложные слова, мотивировка которых
очевидна, либо вовсе не включаются в этимологический словарь, либо основные
из них перечисляются для иллюстрации словообразовательной активности
производящего слова, или в тех случаях, когда в производных отражены связи
с какими-то более старыми значениями, утраченными производящим словом.
Примером этимологических словарей могут служить «Этимологический словарь
русского языка» А. Преображенского, «Russisches etymologisches Wцrterbuch»
М. Фасмера, который с 1966 г. начал выходить в русском переводе. Для
практических целей может быть полезен вышедший в 1961 г. «Краткий
этимологический словарь русского языка» Н.М. Шанского, В.В. Иванова и Т.В.
Шанской.
От этимологических словарей следует отличать исторические словари, которые, в свою очередь, представлены двумя разновидностями. В некоторых из них ставится цель — проследить эволюцию каждого слова и его отдельных значений на протяжении письменно засвидетельствованной истории соответствующего языка, обычно вплоть до современности (или какого-то отрезка этой истории, тоже вплоть до современности). Примерами словарей этого типа могут служить «большой Оксфордский словарь» английского языка, немецкие словари — начатый братьями Гримм и словарь Г. Пауля, большой словарь Шведской академии и некоторые другие. Ко второй разновидности исторических словарей следует отнести словари древних периодов истории соответствующего языка, например «Материалы для словаря древнерусского языка» (в трех томах) филолога и этнографа Изм. Ив. Срезневского, изданный в 1893-1903гг., а дополнения к нему в 1912 г., а также словари отдельных писателей прошлого (в том числе и недавнего прошлого) или даже отдельных памятников.
Предшественниками исторических словарей были азбуковники, лексиконы и так называемые притекстовые словари: они помещались прямо при текстах и в них объяснялись слова только конкретного данного текста. Сущность исторического словаря Л. В. Щерба в свое время охарактеризовал следующим образом: «Историческим в полном смысле этого термина был бы такой словарь, который давал бы историю всех слов на протяжении определенного времени, причем указывалось бы не только возникновение новых слов и новых значений, но и их отмирание, а также их видоизменение».
Знакомство с историческими (как и с этимологическими) словарями
позволяет выяснить историю слов и выражений современного языка, заглянуть в
их «биографию». Так, например, открыв словарь И. И. Срезневского, можно
узнать, что такие однокорневые и близкие по значению современные слова, как
работник, рабочий, рабочая (о лице), восходят к слову раб, претерпев
длительную эволюцию в своих значениях. Теперь прежняя связь со словом раб
этих и других однокорневых слов никем непосредственно не осознается,
например: работа – рабство, неволя... (т. 3, с. 2 указанного словаря);
работати, работаю – находиться в рабстве, в неволе... (т. 3, с. 4);
работъникъ – раб, невольник... (т. 3, с. 5); работъница – служанка,
раба...; работъный – относящийся к рабству...; рабъ – слуга, невольник...
(т. 3, с. 5) и т. д. Эти и другие слова с таким же корнем снабжены
примерами из древних памятников письменности.
Другая разновидность исторического словаря – это словарь писателя.
Словарь писателя или отдельного памятника должен быть исчерпывающим, т. е.
должен а) включать абсолютно все слова, употребленные в сочинениях (также в
сохранившихся письмах и т. д.) данного писателя и б) указывать все
встретившиеся формы этих слов. Обычно такой словарь не только иллюстрирует
цитатами из текста все выделенные значения и оттенки значений, но и дает
«адреса» всех случаев употребления слова (например, том, страницу, строку
для каждого случая употребления). Если подобным образом строится словарь не
одного писателя, а целого периода в истории языка, такой словарь
оказывается исчерпывающим для этого периода, или так называемым
«тезаурусом». Хорошим примером словаря писателя может служить «Словарь
языка Пушкина» (т.1-4, АН СССР, М, 1956-1961), за рубежом созданы словари
Шекспира, Гете и других больших литераторов. Такие словари нужны науке для
того, чтобы можно было полнее и правильнее понять, как развивается так
называемый язык художественной литературы, т.е. тот стиль общего
литературного языка, который обслуживает художественное творчество,
словесное искусство. Прежде всего, составляются словари по произведениям
наиболее крупных писателей и поэтов, имеющих национальное значение в
развитии культуры.
Особое место занимают диалектологические, или диалектные словари.
Диалектный словарь может быть дифференциальным, т. е. содержащим только
диалектную лексику, отличающуюся от общенародной, либо полным, охватывающим
в принципе всю лексику, бытующую в диалектной речи — как специфическую для
данного диалекта, так и совпадающую с лексикой общенародного языка. Кроме
того, он может быть либо словарем одного говора (даже говора одной
деревни), либо словарем целой группы близких говоров, рассматриваемых как
один диалект, либо, наконец, сравнительным словарем многих или даже всех
территориальных диалектов какого-либо языка. К диалектологическим (в
широком смысле) относятся словари слэнга и арго. Примерами словарей,
включающих лексику одного диалекта, могут быть некоторые старые диалектные
словари, такие, как «Материалы для объяснительного областного словаря
вятского говора» Н. Васнецова (1908 г.), «Смоленский областной словарь» В.
Добровольского (1914 г.), и новые: «Словарь современного русского народного
говора» под ред. И.А. Оссовецкого, в котором дана лексическая система
одного из говоров (дер. Деулино) Рязанской области, «Псковский областной
словарь с историческими данными», который начал выходить с 1967 г.;
«Словарь русских старожильческих говоров средней части бассейна р. Оби» и
подобные. Словари, включающие разные диалекты языка, представлены «Опытом
областного великорусского словаря» Академии наук (1852 г.), «Толковым
словарем живого великорусского языка» В. Даля, «Словарем русских народных
говоров» и подобными.
Интересный и сравнительно новый тип словарей — частотные словари. Их
задача — показать сравнительную частоту употребления слов языка в речи, что
практически значит в некотором массиве текстов. Примерами частотных
словарей являются «The Russian Word Count» (Detroit, 1953) Йоссельсона,
составленный на основе данных статистического анализа употребления около
одного миллиона слов, и «Частотный словарь современного русского
литературного языка», составленный Э. А. Штейнфельдт и изданный в Таллине в
1963 г. Словарь содержит 2500 наиболее употребительных слов, выбранных из
современных текстов (художественной литературы для детей и взрослых, пьес,
радиопередач, газет) общим объемом в 400 тысяч словоупотреблений.
Важнейшими частями словаря являются: 1) общий список слов, расположенных в
порядке убывания частоты, с указанием при каждом слове абсолютного
количества встретившихся случаев его употребления; 2) список по частям речи
с указанием (правда, не для всех частей речи) частоты отдельных
грамматических форм (например, слово год встретилось 810 раз, в т. ч. 684
раза в ед. и 126 раз во мн. числе, 111 раз в именит., 244 раза в родит, п.
и т. д.); 3) общий список слов по алфавиту с указанием частоты (для
омонимов — раздельно по частям речи; например, союз а встретился 3442 раза,
частица а — 578 раз, междометие а — 54 раза). Кроме названных выше словарей
существуют и другие. Например, "Подсчет русских слов" Х. Джоссельсона,
«Частотный словарь немецкого языка» Ф. Кэдинга, «Сравнительный частотный
список первой тысячи слов английского, французского, немецкого и испанского
языков» Х. Итона. Частотные словари позволяют делать очень интересные
выводы о функционировании в речи слов и грамматических категорий языка. Они
имеют также большое практическое значение, в частности для рационального
отбора лексики на разных этапах обучения данному языку тех, для кого он не
является родным. Таким образом, развитие математических, прежде всего
статистических методов изучения языка породило частотные словари, слова в
которых получают числовой, статистический показатель, т.е. цифровые
сведения о том, как часто применяется то или иное слово в языке.
Чисто практические цели преследуют орфографические и орфоэпические
словари, указывающие «правильное» (т. е. отвечающее принятой норме)
написание слов и их форм или, соответственно, их «правильное» произношение.
Наибольшее распространение получили орфографические словари, дающие
сведения о правильном написании слов. Орфоэпические словари указывают
правильное произношение слов. Например, словарь-справочник «Русское
литературное произношение и ударение» Р.И. Аванесова и С.И. Ожегова.
Среди специальных лингвистических словарей большой интерес представляют
различные фразеологические словари. Они бывают переводными (например, англо-
русский фразеологический словарь А. В. Кунина) и одноязычными, дающими
толкование значений фразеологизмов средствами того же самого языка. К этому
последнему типу принадлежит, в частности, «Фразеологический словарь
русского языка» под ред. А. И. Молоткова (М., 1967), включающий 4000
словарных статей, а также более старый, но не потерявший своей ценности
словарь М. И. Михельсона, широко дающий и иноязычные параллели к русским
фразеологизмам, а также справки о происхождении фразеологизмов, об их
первоначальной мотивировке и т. д.. Материалом фразеологических словарей
являются не слова, а фразеологические обороты. Такие словари есть во всех
языках. В русском наиболее распространены: «Крылатые слова» С.В. Максимова
(ряд изданий) и Н.С. и М.Г. Ашукиных (М., 1960) и ранее упоминавшийся
«Фразеологический с