Что означает сорок сороков
Что означает сорок сороков
Что означает выражение «сорок сороков»?
Отвечает Иеромонах Иов (Гумеров):
Все храмы Москвы по решению Стоглавого собора (1551 г.) были распределены на старо́ства или благочиния, которые назывались «сорока́ми» (см. ст.: Сорок // Даль В.И. Словарь живого великорусского языка). Название происходит от древнерусской меры сорокъ, означавшей мешок, вмещающий четыре десятка соболиных шкурок (часто встречается в грамотах ХIV–ХV вв.). Во главе каждого сорока́ был «поповский староста». Стоглавый собор определил для Москвы семь поповских старост. «В царствующем же граде Москве достоит быти седми старостам поповским и седми сбором по уложению царскому, да к ним избирати десятцких – добрых же священников, искусных житием, непорочных же» (Стоглав. Гл. 6).
Еще в конце XVII века в Москве было шесть сороков: Китайский, Пречистенский, Никитский, Сретенский, Ивановский и Замоскворецкий. Постепенно число их росло. В начале XX века было уже 40 сороко́в. Реально соро́к не включал в свой состав 40 церквей. Их было меньше. Сорок сороков предполагает наличие 1600 церквей (40×40 = 1600). Но по статистике в начале XX столетия храмов в Москве было около 800.
Иногда встречается утверждение, что надо брать число престолов, потому что в каждом храме имелось их несколько – всего 1620. Получается более сорока сороков. Однако этот подсчет достаточно искусственный, потому что выражение «сорок сороков» предполагает именно число храмов. Это видно из литературы. Так, в рассказе М. Булгакова «Сорок сороков» (1923) читаем: «На самую высшую точку в центре Москвы я поднялся в серый апрельский день. Это была высшая точка – верхняя платформа на плоской крыше дома бывшего Нирензее, а ныне Дома Советов в Гнездниковском переулке. Москва лежала, до самых краев видная, внизу. Не то дым, не то туман стлался над ней, но сквозь дымку глядели бесчисленные кровли, фабричные трубы и маковки сорока сороков». Писатель смотрел на Москву с крыши самого высокого в те годы здания – 10-этажного дома, построенного в 1912 году.
Сорок сороков
Со́рок сороко́в — устаревший фразеологизм, обозначающий неопределённо большое количество чего-либо. «Сорок раз по сорок» — указывает не точное число предметов, а их великое, «неисчислимое» множество.
Содержание
Происхождение
Существует две версии происхождения устойчивого словосочетания «сорок сороков» — как нестандартно образованной единицы счёта и как результата слияния числительного 40 и существительного «сорок», обозначавшего церковное объединение.
Происхождение числительного «сорок» в русском языке
По этой версии считается, что русское числительное «сорок», не образованное по правилам других количественных числительных (два+дцать, три+дцать и т. д.), использовалось восточными славянами для обозначения мешка или рубахи (предполагается также, что «сорок» — это мужской род от слова «сорочка» в смысле «исподняя рубашка»), в котором содержалось сорок (древнее «четыре десяте») шкурок соболя, куницы и др. Один сорок — мешок с четырьмя десятками шкурок. Позже слово «сорок» вытеснило первоначальное «четыре десяте» и стало использоваться, как самостоятельная счётная единица в так называемом счёте «по сорокам». Например, существовали и широко применялись сорокавёдерные бочки, 1/40 часть ведра именовалась «сороко́вка». В итоге сформировалось выражение «сорок сороков», которое образно указывало на большое, несчётное количество чего-либо.
См. также этимологию этого слова в Викисловаре.
Церковный термин
Выражение «сорок сороков» могло возникнуть именно в ту пору, когда проводился всемосковский крестный ход, на который собиралось огромное число людей — всё городское духовенство с прихожанами согласно приписке к благочинию — со́року.
Само число «сорок» уже несёт в себе дополнительное значение со смыслом «большое количество», «неопределенное множество чего-либо». Отдельно оно несколько раз фигурировало, например, в библейских сюжетах, указывая не на точное число повторений, а, скорее, на длительность события: дождь всемирного потопа продолжался 40 дней и 40 ночей; Иисус провёл 40 дней в пустыне, Моисей 40 лет водил евреев по пустыне и др. Насекомое сороконожка получило название не по точному количеству ног, а по их «бессчётности».
Словосочетание «сорок сороков» подчёркивает большое множество, «неисчислимость» самого предмета и в этом смысле соседствует с выражением тьма тьмущая.
Употребление
Оборот считается устаревшим и в современной разговорной речи практически не встречается, однако можно найти его в литературе XX и XIX вв, например:
Откуда есть пошло «сорок сороков»: ещё немного о числе 40.
Число 40 стоит особняком в русском языке: по законам образования других числительных ему следовало быть «четырдцать» или «четырьдесят», однако мы говорим «сорок».
Буквально вчера я узнал, что среди людей ходит такая версия происхождения этого «сакрального» числа: дескать, число «сорок» происходит от слова «срок», а слово «срок» означает 40 недель беременности.
Особое положение слова «сорок» давно известно, и конечно же, не составляет секрета и правдивое его происхождение. Я посвятил ему один из своих обзоров, где довольно подробно проследил его сквозь эпохи в славянских языках. Сегодня углубляться в словари не буду, перескажу основные моменты.
Наряду с тем, что в древнерусских памятниках присутствуют формы «четыредесяте» и «четыридесяти», довольно давно появляются формы «сорокъ» и «сорочекъ» для обозначения счётной единицы в 40 штук товара, преимущественно пушнины, а также непосредственно число 40. (Словарь русского языка XI-XVII вв.)
Подведу итог: от названия мешка с 40 шкурками слово перешло на само число 40.
Та же закономерность прослеживается и в других славянских языках, например, в словацком языке число сорок — meru, что созвучно со словом «мера» и с венгерским mérő «мешок».
А слово «срок» не имеет общих корней ни со словом «сорок», ни со словом «сорока», от которого тоже некоторые лингвофрики (не будем упоминать в приличном обществе, какие именно) пытаются его вывести. «Срок» происходит от древнерусского съреку «условливаюсь, договариваюсь», того же корня, что и речь, реку, изрекать.
Так что версия с происхождением названия числа 40 от срока в сорок недель беременности оказалась неверной.
Наука | Научпоп
6.1K поста 69K подписчика
Правила сообщества
ВНИМАНИЕ! В связи с новой волной пандемии и шумом вокруг вакцинации агрессивные антивакцинаторы банятся без предупреждения, а их особенно мракобесные комментарии — скрываются.
Основные условия публикации
— Посты должны иметь отношение к науке, актуальным открытиям или жизни научного сообщества и содержать ссылки на авторитетный источник.
— Посты должны по возможности избегать кликбейта и броских фраз, вводящих в заблуждение.
— Научные статьи должны сопровождаться описанием исследования, доступным на популярном уровне. Слишком профессиональный материал может быть отклонён.
— Видеоматериалы должны иметь описание.
— Названия должны отражать суть исследования.
— Если пост содержит материал, оригинал которого написан или снят на иностранном языке, русская версия должна содержать все основные положения.
Не принимаются к публикации
— Точные или урезанные копии журнальных и газетных статей. Посты о последних достижениях науки должны содержать ваш разъясняющий комментарий или представлять обзоры нескольких статей.
— Юмористические посты, представляющие также точные и урезанные копии из популярных источников, цитаты сборников. Научный юмор приветствуется, но должен публиковаться большими порциями, а не набивать рейтинг единичными цитатами огромного сборника.
— Посты с вопросами околонаучного, но базового уровня, просьбы о помощи в решении задач и проведении исследований отправляются в общую ленту. По возможности модерация сообщества даст свой ответ.
— Оскорбления, выраженные лично пользователю или категории пользователей.
— Попытки использовать сообщество для рекламы.
— Многократные попытки публикации материалов, не удовлетворяющих правилам.
— Нарушение правил сайта в целом.
Окончательное решение по соответствию поста или комментария правилам принимается модерацией сообщества. Просьбы о разбане и жалобы на модерацию принимает администратор сообщества. Жалобы на администратора принимает @SupportComunity и общество пикабу.
Об отношении к заимствованиям
Мои ученики обычно очень радуются, встречая такие слова как «vestibule» («вестибюль»), «optimiste» («оптимист»), «rôle» («роль»), или «maquillage» («макияж»). Добрую половину лексики французского языка нам можно даже специально не запоминать.
Сегодня эти пара тысяч слов, так называемых галлицизмов, воспринимаются более чем естественно, не правда ли? А есть ли для них исконно-русские аналоги?
Когда-то филолог и адмирал А.С. Шишков назвал процесс заимствования «лишающею всякого рассудка страстию к францускому языку».
В своём «Рассуждении о старом и новом слоге российского языка» он пишет:
Вот выдержка оттуда же с конкретными примерами:
. безобразят язык свой введением в него иностранных слов, таковых например как: моральный, эстетический, эпоха, сцена, гармония, акция, энтузиязм, катастрофа.
Наверное, эта терпимость к греческому и неприятие французского похожи на то, как легко воспринимаются сегодня те же вестибюли и роли, но встречаются в штыки английские заимствования.
Критикует Шишков и калькирование, например, о слове «влияние» он пишет, что нельзя его использовать с предлогом «на», как скопировали с французского («influence sur»). Дело в том, что слово это происходит от глагола «лить, течь» (лат. «fluere») с приставкой «в» («in»), то есть означает «вливание» (то же чередование, как «излияние» и «изливание»). Так вот, а в русском языке после слова «вливать» требуется предлог «в», значит нужно было бы говорить «влиять во что-то», а не «влиять на что-то».
А вот что писал Шишков о детях и подростках:
Какое знание можем мы иметь в природном языке своем, когда дети знатнейших бояр и дворян наших от самых юных ногтей своих находятся на руках у французов, прилепляются к их нравам, научаются презирать свои обычаи, нечувствительно покупают весь образ мыслей их и понятий, говорят языком их свободнее нежели своим, и даже до того заражаются к ним пристрастием, что не токмо в языке своем никогда не упражняются, не токмо не стыдятся не знать оного, но еще многие из них сим постыднейшим из всех невежеством, как бы некоторым украшающим их достоинством, хвастают и величаются?
Думаю, это некоторым образом похоже на то, что иногда нет-нет да и пронесется в мыслях о множестве английских словечек, употребляемых в молодежном сленге, а также, местами, о столь уважаемой ими американской культуре (или любой другой, не_русской).
Мало кто оценил идеи Шишкова в то время, да и мы с вами видим, что все необходимые слова язык в себе оставил.
А ненужные постепенно уходят в прошлое. Например, заимствованное слово «оказия» воспринимается уже намного более устаревшим, чем наше (на самом деле более древнее) «случай». «Адюльтер» тоже вряд ли сейчас услышишь, всё больше исконная «измена». Вряд ли кто-то сейчас на полном серьёзе употребит и такие слова как «дебош», «ридикюль», «саквояж», или «вакация» («отпуск»).
В общем, наверное, не стоит быть Шишковыми, но и не стоит слишком уж увлекаться заимствованиями. Всё хорошо в меру, как всегда, а истина посередине.
А вы когда-нибудь видели згу?
Думаю, фразу «ни зги не видно» мы, если и не употребляем активно сами, то точно все знаем с детства.
Первое разочарование нас настигнет, если мы откроем словарь древнерусского языка. Там никакой «зги» нет. Возможно, именно поэтому у нас до сих пор нет точного ответа на данный вопрос, и мы вынуждены разбирать многочисленные версии маститых лингвистов.
Первой версией обычно считается следующая: слово «зга» происходит от «стега», что значит «дорога». Самым известным однокоренным словом «стеги», наверное, является слово для обозначения пути, избранного человеком («стезя»).
Полагают, что слово «стега» раньше выглядело как «стьга». В таком случае её развитие пошло по двум путям: в одном случае «ь» превратилась в «е», и «стьга» стала «стегой», а в другом исчезла, и стала «згой». Второй случай вполне реален, например, когда-то слово «истьба» так же стало «избой».
Тогда выражение «ни зги не видно» приобретает следующий смысл: так темно, что не видно дороги. Логично? Логично.
К тому же, в этимологическом словаре Николая Горяева, изданном в 1896 году, утверждается, что существует диалектный вариант «стеги не видно», вместо «ни зги». Потебня упоминает и белорусский вариант: «сьцегi не вiдно».
Однако не смотря на то, что по фонетическим законам слово «стега» прекрасно превращается в «згу», Д.К. Зеленин в своих «Этимологических заметках» (1903) писал:
Сам Д.К. Зеленин разработал другую версию. Он предполагал, что слово «зга» означает «искра», и приводил в доказательство региональное «згинка» («искорка»), а также редкий глагол «пазгать» (в т.ч. «ярко гореть, пылать»).
Эта версия подтверждается тем, что иногда встречающийся вариант «зги божьей не видно» можно сопоставить с расхожим «свету божьего не видать».
Что же это может быть?
На этот вопрос ответа не было даже у самого русского народа во времена Даля. В его словаре можно встретить множество самых разных объяснений.
Давайте попробуем сопоставить факты, которые выяснили к этому моменту.
Для начала, вспомним, что с точки зрения фонетических законов, слово «стьга» легко превращается в «зга» (если смотреть только на форму слова).
Также вспомним о существовании глагола «пазгать», который значит «сечь», и происходит от «пастьгать», а значит родственен и глаголу «стегать» (коня, например).
Добавим сюда то, что в региональных вариантах существует слово «стёжка» в значении «плеть», и слово «стёг» в значении «палка».
Так что «стегой» вполне могли называть не только дорогу, но и предмет, которым погоняли коня. А если ночная тьма была особенно непроглядной, то даже этот предмет в своей собственной руке было не видно.
Та же логика присутствует и в хорватском выражении «ни прст се пред оком не види» («и пальца перед глазами не видно»). То есть предмет опять же находится на расстоянии вытянутой руки, и даже является рукой.
Такой версии придерживается, в частности, Г.И. Магнер, рекомендую к прочтению его подробную статью.
А вам какая из версий больше нравится?
Этимология дней недели
Как получилось слово «неделя»? Вот такой вот детский вопрос.
А вот слово «неделя» происходит от глагола «делать», а точнее «не делать». И назывался так сначала только первый день семидневного периода, когда не нужно было работать. Так он называется и сегодня в украинском («неділя»), белорусском («нядзеля») и в других славянских языках.
В русском языке этот день начали называть воскресеньем после принятия христианства, и по всей видимости уже после разделения восточно-славянских языков на русский, украинский и белорусский. Большинство статей на эту тему дают XVI либо XVII век, однако единичные случаи такого наименования (например, в Остромировом Евангелии) встречаются уже с XI века.
После того, как «неделю» заменили на «воскресенье», «седмицу» стали называть «неделей». Скорее всего, этот переход связан с тем, что изначально семидневные периоды считали «от недели до недели» (то есть от первого дня одного периода до первого дня следующего), а когда сам этот день стали называть иначе, то весь период перенял на себя название «неделя».
Если судить по Национальному Корпусу Русского Языка, одним из последних в светском тексте упомянул слово «седмица» Татищев в записке Екатерине Первой (1726):
«. иттить в яму есть велик страх, ибо редкая седмица, чтоб где не обрушилось. «
— то есть не проходило и недели без обвала (речь идёт о добыче руды в Швеции).
О том, что и в русском языке «неделей» когда-то называли выходной день, говорит нам название «понедельник», то есть «день после недели», первый день после воскресенья.
Создаётся впечатление, что мы считали дни с понедельника, но, хотя он и был первым, но всё же именно первым после «недели», а сама седмица считалась именно с воскресенья, как и во всём христианском мире.
Это подтверждает «среда», которая происходит от слова «середина». Чтобы среда была в середине недели, считать нужно с воскресенья.
Почему среду не назвали каким-нибудь «третником»? Вероятно, потому же, почему и средний палец так называется, и почему «сердце» названо по слову «середина». Середине (сердцевине) всегда и во всём придавалось большое значение, поэтому и называть предметы следовало в первую очередь по ней, а уж потом, что осталось, по порядку.
Как же первым днем недели стал понедельник?
И только после войны была окончательно возвращена семидневка, а первым днём был назначен понедельник. Последние календари, где в начале стоит воскресенье, были изданы в 1949 году.
Французская «semaine» дословно повторяет нашу «седмицу», потому что происходит от латинского слова «septimanus», от «septem» («семь»).
А в названиях дней недели в этих языках нашли отражение древние языческие традиции:
Мускулатура, подмышки и мыши: этимология
Периодически у почтенной публики возникают вопросы, касающиеся такой интимной части тела, как подмышка.
Во-первых, слитно или раздельно она пишется?
Во-вторых, при чём тут вообще мыши?
Начнём от Адама, то есть с этимологии, и ответим сначала на второй вопрос.
Слово «мышка» (под которой подмышка) действительно происходит от слова «мышь». А ещё от слова мышь происходит слово «мышца» (в древнерусском произносилось как «мышица», а писалось до падения редуцированных «мъшьца»).
Дело в том, что перекатывающиеся под кожей бугорки когда-то напомнили нашим предкам бегающих зверьков, и их назвали мышками. Соответственно, то, что находилось под мышкой, живущей в плече, назвали «подмышкой».
Существительное отвечает на вопрос «что?» и его производные, в этом случае пишем слитно:
чесать (что?) подмышку
гладкие (что?) подмышки
аромат исходит (от чего?) от подмышек
жмёт (в чём?) в подмышках
А наречие отвечает на вопросы «где?», «куда?» и пишется раздельно:
чесать (где?) под мышкой
приятно пахнет (где?) под мышками
сунула пакет (куда?) под мышку
Маасковское произношение: найди его у себя в речи
С точки зрения лингвистики (хотя и не только) наша страна необычайно централизована. Однако центров у неё всегда было два. И если тысячу лет назад это были Киев и Новгород, то в последние столетия, конечно, это Москва и Петербург.
Литературная норма сегодня включает в себя черты и московские, и петербургские.
Давайте посмотрим на черты старомосковского произношения, и, может быть, узнаем в них что-то, что говорят сегодня по всей стране, а может быть и то, что вы слышали крайне редко, и что уже непривычно для уха.
Этот говор сформировался и достиг золотого века во время belle époque, на рубеже веков, и до сих пор поддерживается некоторыми в творческой среде. Однако начал закладываться он ещё в славянском племени кривичей (территория современных Белоруссии и Смоленской области).
Таким образом мы понимаем, что он тяготел к северному произношению.
Московское наречие не токмо для важности столичного города, но и для своей отменной красоты прочим справедливо предпочитается, а особливо выговор буквы «о» без ударения, как «а», много приятнее…
Икание. Не от слова «икáть», а от буквы «и»: москвичи произносили безударную «е» точно так же, как «и». В отличие от Петербуржцев, у которых слова «леса» и «лиса» немного отличались на слух. Сегодня и в Петербурге тяготеют к иканию, но я вот всё ещё слышу разницу. Напишите, как у вас, если вы тоже из Петербурга 🙂
Чт и чн. Не всегда, но часто произносились через «ш»: пустя[шн]ый, було[шн]ая, моло[шн]ый, сливо[шн]ый, огуре[шн]ый, ябло[шн]ый.
Ша/жа/ца. В первом предударном слоге в этих сочетаниях «а» произносилось как «ы»: [Шы]ляпин «Шаляпин», [шы]мпанское «шампанское», [шы]ги «шаги», [жы]ра «жара».
Неужели прямо так и говорили, спросите вы. А вы сейчас скажите, например, «лошадей», «ржаной», «двадцати», «жалеть». Что там получается? 🙂 Остатки старомосковского!
Смягчение [р]. Думаю, все не раз слышали такое исполнение: ве[р’]х, четве[р’]г, це[р’]ковь. Последнее слово у меня так даже некоторые родственники говорили, хотя не москвичи ни разу.
Твёрдые «сь» и «ся». Что всё смягчение да смягчение? Вот отвердение. Думаю, даже в фильмах все слышали такие слова как «боюс», «лечус».
Произношение «це» как «ца». До последнего держалось в словах «танцевать» («танцавать») и «поцелуй» («поцалуй»).
Белеет парус одинокий (-кой)
В тумане моря голубом.
Что ищет он в стране далекой?
Что кинул он в краю родном.
Изучив эти несколько особенностей произношения, можно смело садиться в машину времени, выгружаться где-нибудь на Тверской-Ямской, вступать в конверсации с прохожими, отужинать в ресторане «Яръ» съ шампанскимъ, а апосля, на извозчике отбыть въ театръ, где изъ ложи рассматривать въ лорнетъ хорошенькихъ мадемуазелекъ.
Одеть, надеть и ещё несколько их родственников
Кто никогда не путал в беглой речи глаголы «одеть» и «надеть», пускай бросит первый камень. Правда, бросать не в кого, можно бросить в пустоту, метафорически.
Так уж вышло, что в этих двух словах сошлись противоречивые тенденции.
С одной стороны, они очень похожи, да что там, почти одинаковы: обозначают процесс облачения, и большого смысла разграничивать их, вроде как, нет.
С другой стороны, у них разные приставки, у приставок этих абсолютно разное значение, и если ты один раз осознал это, то скорее всего будешь раздражаться на неверное употребление, что тоже неконструктивно.
Оба слова родственны глаголу «деть», который значит «куда-то что-то помещать». Без приставок мы его чаще употребляем в разговорной речи, выражая недовольство («Да куда ж я телефон-то дел?»). А вот с приставками он существует во множестве ипостасей. И каждая приставка придаёт ему новые значения, добавляющиеся к основному, значению размещения в пространстве.
Бес в них как раз и есть, в мелочах, то есть в приставках.
Есть ещё «поддеть», с семантикой положения снизу, что означает «зацепить с нижней стороны». И «задеть», которое возникло так же, как «зацепить», «затронуть».
Вообще, предлоги и приставки частенько совпадают, поэтому «по полю пойду», «от тебя отойду» и «на тебя надену». Так что если после вашей потенциальной фразы можно добавить «на кого-то», то нужно употреблять глагол «надеть».
А «надеться» мы сказать не можем, если речь не идёт о том, что кого-то казнил Дракула. Да, пожалуй, это единственный прецедент, когда глагол «надеть» можно было употребить про человека.
Почему евреи – жиды
Продолжаю цикл постов об этимологии этнонимов. Сегодня поговорим о слове жид.
Начать следует с того, что в русском языке это слово довольно долго было нейтральным. Только в XVIII-XIX веках оно начинает восприниматься как негативное и постепенно перестаёт употребляться в качестве основного обозначения евреев. Еще в XIX веке название оперы Галеви ‘La Juive’ было переведено как «Жидовка».
В древнерусском слово жидъ было главным обозначением евреев. Пример из Повести временных лет:
моисѣи же събравъ люди жидовьскыꙗ поиде ѿ землѧ егупетъскыꙗ
В части других славянских языков это по-прежнему основное слово. Например, в польском (Żyd), чешском (Žid) и словенском (Žid). Есть, конечно, и нюансы. Так, в польском żyd может использоваться и как оскорбление («скупердяй»).
То, что это слово присутствует во всех трёх группах славянских языков (восточной, западной и южной) даёт основания задуматься о его праславянской древности. Праформу можно восстановить как *židъ (где ž = ж, а ъ – особый гласный).
С романскими языками славяне столкнулись, когда стали заселять Балканы (с VI века). Местное романоязычное население они постепенно ассимилировали (последними были носители далматинского языка аж в XIX веке), заимствовав ряд слов. Некоторые заимствования «сделали карьеру» и от южных славян попали в западно- и восточнославянские языки. Как показывает история слова король, такое было возможно ещё даже в VIII-IX веках.
Итальянское giudeo, как и, например, французское Juif /жўиф/, является потомком латинского Iudaeus /йȳдáэус/ «иудей, еврей» (здесь и далее макрон над гласным обозначает его долготу). Римляне же заимствовали это слово из греческого Ἰουδαῖος /иȳдáйос/ «иудей». Наконец в греческий оно попало непосредственно из иврита: יְהוּדִי /йǝхȳдӣ/ «еврейский, иудейский», יְהוּדָה /йǝхȳдā́/ «Иудея».
По библейской легенде Иудея – это земля Иуды, четвёртого сына Иакова. Происхождение имени также даётся в Библии:
И еще зачала и родила сына, и сказала: теперь-то я восхвалю Господа. Посему нарекла ему имя Иуда. И перестала рождать. (Бытие 29:35)
Польский семитолог Эдвард Липиньский предложил взамен этимологию научную. Он сравнил йǝхȳдā́ с арабским словом وَهْدة /ўахда/ «ущелье, овраг». На первый взгляд сходство невелико. Однако следует помнить, что в иврите начальный ў- перешёл в й-. Приведу несколько примеров:
Далее нужно знать, что в семитских языках смысловую нагрузку в корне несут согласные (чаще всего корни состоят из трёх согласных), а вот для словоизменения и словообразования используются гласные, стоящие между этими согласными. В частности, существует модель образования причастий и прилагательных qatūl (от арабского قَتُول «смертельный»). Как видно из названия, берём трёхсогласный корень C-C-C и вставляем между согласными гласные -а-ȳ-, получая причастие или прилагательное. Например, первый глагол из таблицы выше, יָרַד /йāрад/ «спускаться», даёт нам прилагательное יָרוּד /йāрȳд/ «низкий, плохой». По этой модели, кстати, образовано имя Барух (בָּרוּךְ «благословенный»).
Если у нас есть корень й-х-д, то по этой модели мы получаем формы прилагательного йāхȳд «ущелистый» и йǝхȳдā «ущелистая». В таком случае словосочетание אֶרֶץ יְהוּדָה /’эрэċ йǝхȳдā/ (Второзаконие 34:2) следует понимать не как «земля Иуды», а как «ущелистая земля». Это очень хорошо согласуется с тем, что Иудея – регион гористый.
Поскольку со временем корень й-х-д исчез из языка, слово йǝхȳдā перестало быть прозрачным, его первоначальный смысл забылся, и оно стало уже только именем собственным – Иудея. После этого возникла классическая топонимическая легенда, выводящая название страны от имени мифического прародителя по имени Иуда (в результате это имя вошло в обиход, и его носил самый знаменитый предатель в истории человечества). Аналогичным образом, вопреки легенде, у поляков никогда не было праотца Леха.
Вот по такому маршруту к нам добралось слово жид. Однако после крещения Руси оно пришло к нам из греческого снова. На этот раз книжным путём, через старославянское посредство. Первоначально как июдѣи, затем с большей ориентацией на греческое произношение – иоудѣи (= современное иудей).
Правда, словенцы нас в этом отношении переплюнули. К ним это слово попало трижды. Первый раз как Žid. Второй раз из немецкого – Jud /юд/. В третий раз как čifut /чи́фут/ из сербохорватского Čifut, которое было заимствовано из турецкого Çıfıt /чыфыт/, которое было заимствовано из персидского جهود /джухȳд/, которое было заимствовано из иврита. В словенском эти три слова распределились стилистически. Čifut – это явное оскорбление, Žid в последнее время стало восприниматься как негативно окрашенное и уступать Jud, которое считается более нейтральным. В словенском переводе «Мауса», из которого взята первая картинка в посте, немцы и поляки используют слово Žid, а сами евреи Jud.
Теперь сведём это всё в упрощённую схему:
Boček V. Studie k nejstarším romanismům ve slovanských jazycích. Praha, 2010. S. 113-119.
Ernout A., Meillet A. Dictionnaire étymologique de la langue latine. Paris, 2001. P. 326.
Lipiński E. L’étymologie de «Juda» // Vetus Testamentum, 23 (3), 1973. P. 380–381.
Snoj M. Slovenski etimološki slovar. Ljubljana, 2016. S. 111-112.
Предыдущие посты цикла:
Сноха и сношаться: этимологический комментарий
Попросили меня недавно прокомментировать вот такой пост:
Сразу скажу, что интуиция подвела @vika.dark. Во-первых, всегда надо помнить, что внешне похожие друг на друга слова не обязательно родственны, сходство может быть и случайным (см. отдельный пост об этом). Во-вторых, нельзя рассматривать языковые факты изолированно, системный подход – это наше всё.
Что это значит на практике? Для начала то, что если учёный хочет установить этимологию русского слова, он обязательно проверит, как оно выглядит в древнерусском и в диалектах, а также то, есть ли у этого слова родственники в других славянских языках.
Сразу выясняется, что в древнейших русских памятниках мы находим форму снъха. Например, в надписи №307 (1170-1180 гг.) из киевского Софийского собора:
Напомню, что буква ъ в раннем древнерусском в отличие от современного русского обозначала особый гласный звук, который в одних позициях исчез, а в других перешёл в о. Например, сънъ > сон, мъхъ > мох.
Теперь заглянем в другие славянские языки. Родственники нашей снохи там вполне представлены: словенское snaha, сербохорватское снаха, польское диалектное sneszka /снэшка/ с закономерным отражением *ъ (ср. слвн. mah, схр. мах, пол. mech /мэх/ «мох»). Это даёт нам основания восстанавливать праславянскую форму *snъxa.
На первый взгляд, проблематичны болгарская и чешская формы: снаха и snacha /снáха/ соответственно. Ведь в этих языках мы бы ожидали снъха и snecha /снэха/. Объясняется это тем, что в обоих языках это заимствования из сербохорватского. В болгарских диалектах мы находим закономерное снъха, а в чешский snacha попало лишь в XIX веке, когда будители чешского народа активно тянули лексику из других славянских языков (о заимствованиях из русского я делал отдельный пост).
Уже на этом этапе мы можем попрощаться с мыслью о родстве снохи и сношать. Первое – потомок праславянского *snъxa. Второе явно родственно носить (праславянское *nositi), на что напрямую указывает глагол сноситься «входить в сношения, переговоры, устанавливать связь», и законы историческое фонетики не позволяют считать сноху и сношать родственными.
Также я должен напомнить, что «сексуальное» значение у сношаться и сношения – вещь поздняя, совсем недавняя. Первоначально сношение – это «связь, общение», чаще всего дипломатическое. Первые примеры известны с XVIII века:
И, едучи Полшею, чтоб король ни с кем сношения с поляками не имел, також бы полякам обид никаких не чинил и все потребное покупали б от поляков за свои деньги. [А. М. Макаров (ред.). Гистория Свейской войны (Поденная записка Петра Великого) (1698-1721)]
Хотя так знатной город Оренбург строить начат, токмо без всякого архитектурнаго порядка, того ради сим императорской Академии наук почтенно представляю, чтоб химика по сношению с Медицинскою коллегиею, живописца и архитектора искусных благоволила приискать, а между тем хороших на немецком языке архитектурных книг, купя, прислать. [В. Н. Татищев. Письмо в Академию наук (1737)]
И всего каких-то сто лет назад М.М. Бахтин употреблял слово сношаться безо всякого сексуального подтекста:
Ибо наружность должна обымать и содержать в себе и завершать целое души ― единой эмоционально-волевой познавательно-этической установки моей в мире, ― эту функцию несет наружность для меня только в другом: почувствовать себя самого в своей наружности, объятым и выраженным ею, я не могу, мои эмоционально-волевые реакции прикреплены к предметам и не сношаются во внешне законченный образ меня самого. [М. М. Бахтин. Автор и герой в эстетической деятельности (1920-1924)]
Но вернёмся к снохе. Какова этимология праславянской формы *snъxa? Идём тем же путём: проверим, есть ли родственные слова в других индоевропейских языках. И они есть: санскритское snuṣā́ /снушáа/, латинское nurus, древнегреческое νυός /нюóс/, армянское устаревшее նու /ну/, немецкое устаревшее Schnur /шнур/ и другие. На первый взгляд они на нашу сноху не очень похожи, но здесь опять же надо знать законы исторической фонетики.
Так, нам известно, что праславянский звук *ъ продолжает более старый *u, а *x – из *s в определённых условиях. Это значит, что в раннем праславянском наш корень звучал как *snus-.
Во многих словах, в которых древние произносили s, позже стали произносить r: foedesum – foederum «союзов», plusima – plurima «величайшая», meliosem – meliorem «лучшего», asenam – arenam «песок».
Это значит, что nurus вполне может быть из *nusus. Идём дальше. Звук s- исчезал в латыни и греческом в начале слова перед рядом согласных, включая n. Пара примеров:
Получается, что мы можем продолжить ряд: nurus *snъxa > сноха. И лишь распад традиционной модели семьи привёл к тому, что это слово постепенно стало уходить из нашего обихода. По сравнению с этой древностью слово сношаться появилось будто вчера.
Реконструкция праиндоевропейских терминов родства (Mallory J.P., Adams D.Q. The Oxford Introduction to Proto-Indo-European and the Indo-European World. Oxford, 2006. P. 217):
Но можно ли пойти дальше, и найти дальнейшую этимологию праиндоевропейского *snusós? С этим уже сложнее: родственников этого слова на более глубоком уровне мы не знаем. Было сделано несколько попыток связать его с другими праиндоевропейскими корнями, но они скорее гадательны. Наиболее любопытных отсылаю к следующим источникам:
Трубачёв О.Н. История славянских терминов родства и некоторых древнейших терминов общественного строя. М., 2009. С. 131-133.
Wodtko D.S., Irslinger B., Schneider C. Nomina im Indogermanischen Lexikon. Heidelberg, 2008. S. 625-626.
1. Сноха и сношать никак не родственны. Сходство случайно.
2. На самом деле русское слово сноха является потомком праславянского *snъxa (ъ – особый гласный), а то – праиндоевропейского *snusós.
3. Сношаться и сноситься образованы от носить. Первоначально эти глаголы не имели «сексуального» значения, его они приобрели сравнительно недавно.
Но что же делать человеку, который просто размышлял об этимологии того или иного слова, и его внезапно осенило? Во-первых, помнить об эффекте Даннинга-Крюгера. Во-вторых, осознавать, что уже двести лет специально обученные люди в поте лица двигают вперёд индоевропейскую и славянскую этимологию. Поэтому пришедшую вам в голову идею следует сверить, скажем, со словарём Фасмера. Сошлось? Отлично! Не сошлось? Ничего страшного, этимология – это не столь лёгкое занятие, как кажется на первый взгляд.
Как звучала латынь, на каком языке европейцы говорили до пирамиды Хеопса, и откуда мы это знаем
Привет. Там в комментариях спрашивали, откуда мы вообще знаем, что латынь звучала иначе, и что римляне говорили «Кикеро» и «Кайсар» вместо «Цицерон» и «Цезарь». Ведь, как известно, все аудиозаписи с речью древних римлян были безвозвратно утрачены при падении Рима.
Тема интересна многим, поэтому решил репостнуть пару своих комментариев оттуда как отдельный пост.
Вот нашли мы письменные источники. Как мы вообще можем узнать, что произношение было другим?
1. Грянул апокалипсис, через тысячу лет прилетели инопланетяне и начали исследовать нашу цивилизацию. Как они могли бы узнать, что молоко произносилось «малако»? Например, по записям первоклассников, которые пишут малако и карова.
Спорим, первоклассники из о-кающих областей России не ошибаются в этих словах?
Кстати, кажется, какая-то такая история была с Помпеями – их произношение латыни слегка отличалось от обычного, и так мы об этом узнали.
2. А как мы можем узнать, что во времена Пушкина у какого-то слова было другое ударение? А просто с нашим ударением стихотворение перестает рифмоваться. И это не в единственном стихотворении так, а во всей поэзии той эпохи.
3. По учебникам и записям о произношении. В британских учебниках английского 300 лет назад написано про моду не произносить r после гласного, поэтому мы знаем, что уже тогда car и computer в Британии произносились как /ka:/ и /kəmˈpjuːtə/.
У латыни тоже остались письменные источники, включая произношение.
4. По общелингвистическим закономерностям и логике вообще.
И тем не менее. Как мы узнали, что у них отличались звуки p, pʰ, b и bʰ? То, что они были, куда вероятнее в свете существующих языков, чем то, что они появились с нуля, потому что механизмы появления куда сложнее.
А есть ещё вариант, что были только p, b и bʰ, но с ним спорят, потому что он встречается в языках крайне-крайне редко (примерно в одном что ли), и статистически менее вероятен.
А как мы узнали, что праиндоевропейцы жили где-то возможно в горах, были знакомы с лесными зверями, уже приручали коней и пчёл, ели мед и варили медовуху, да и вообще знаем примерное место проживания? Неплохо так для народа, который первый одомашнил лошадь, жил за 2000 лет до пирамиды Хеопса и за 3000 лет до появления письменности?
А просто у них были все слова для их образа жизни, лол.
Если у нас есть мёд, а по-английски медовуха mead, и это не заимствование, значит, оно дошло до нас из того времени, когда мы говорили на одном языке. А ещё:
— mit и maddu в вымерших (но с письменностью) тохарском и хеттском.
А тохарцы активно взаимодействовали с китайцами, поскольку жили рядом, ну и поэтому в китайском мандарине оно теперь тоже ми (источник: https://www.reddit.com/r/todayilearned/comments/dyuzi0/til_the_mandarin_word_for_honey_蜜_mì_is_a_cognate/).
Ну а дальше выстраиваем по словам образ жизни и привлекаем историю и археологию, чтобы понять, где так можно жить. Чтоб и п(бъ)челы были, и медведи, и на конях можно.
. ещё забыл про ларингальную теорию рассказать, кстати.
Однажды лингвисты обратили внимание, что определённые слова сильно различаются в разных языках, и это сложно объяснить. Вот представим, что мёд читалось бы в русском через и, в немецком через о, в хинди через а, а в латыни через ы. При этом мы точно знаем, что в общем случае е не превращается во всех этих языках в и, о, а и ы, но в некоторых словах да.
Вот примерно такое они и нашли, только чуть сложнее (мой пример максимально неточный, но зато наглядный).
Лингвисты предположили, что в праиндоевропейском были звуки, из-за которых соседние звуки произносились по-другому, но они исчезли во всех языках-потомках, оставив после себя только измененные гласные.
Насчитали три таких, назвали h1, h2, h3.
Или вот бывает передняя а и задняя а, два разных звука. Мы их не отличаем особо, но в некоторых языках это разные звуки, и разница важна. У нас а передняя почти всегда, но из-за свойств нашей л (она же dark l) перед ней произносится задняя. Бал, зал. А вот в английском a: всегда задняя. Father, dark.
Или вот пример, упомянутый чуть выше: когда мы произносим поп, тот, кот, последняя согласная звучит как придыхательная. В русском мы никогда не отличали придыхательную от непридыхательной, поэтому этого даже не замечаем.
А вот в английском наоборот: p, t, k придыхательные почти всегда (кроме некоторых случаев, например, после s). P в слове pig с придыханием, speak без, а в play опять с придыханием, причём l из-за этого становится шумной.
Так вот, возвращаясь к h1, h2, h3, они так влияют на окружающие согласные, что мы можем догадаться, что это за звуки. Сейчас есть три что ли варианта, это всё похожие на х звуки (например, велярное х как в русском, глоттальное h как в английском и фрикативное г, как в украинском).
Клёво, но в целом звучит не то чтобы убедительно, да ведь? Если мы посмотрим на слово sugar и при этом мы знаем, что сью переходит в шью в английском, несложно догадаться, что недавно оно могло произноситься как сьюга:. Но праиндоевропейский это, чёрт возьми, 6000 лет назад, когда речь ещё на буквы делить не придумали. Он тысячу раз восстановленный, оспариваемый и гипотетический. А тут ещё и гипотетические звуки, которые во всех языках исчезли.
А потом открыли хеттский язык и оказалось, что эти звуки там остались.
Хорошо, но именно про латынь откуда мы знаем?
Как минимум, 1 пункт в посте: если c и k произносились одинаково, значит, регулярно кто-нибудь ошибался и писал kaesar вместо caesar например.
Но ещё проще взглянуть на заимствования. Открываем https://en.wikipedia.org/wiki/Caesar_(title) и видим, что в греческом Καῖσᾰρ. Буква Κ в древнегреческом не произносилась как ц никогда. Собственно, Καῖσᾰρ и произносится примерно как Кайсар.
Кстати, точно такая же история с древнегреческим – в нём ρ (звучит как русская р) в начале слова произносилась придыхательно. Давайте вспомним парочку английских слов, которые начинаются на R и пришли из древнегреческого. Rhythm, Rhodes (название острова). Английский заимствовал их из латыни, а она заимствовала их из древнегреческого. Древние греки произносили ρ с придыханием, потому логичные римляне и записали древнегреческое слово с rh.
Кроме того, обычно чем меньше письменность похожа на речь, тем она старше. Например, русское милиция и белорусское мiлiцыя. Белорусская письменность очень молодая, и там нет артефактов типа ци, которая произносится как цы. А вот французская письменность очень старая, и уже обросла непроизносимыми согласными со всех сторон.
Почему? Потому что придумывая алфавит, мы бы придумывали разные буквы для разных звуков. Потому что никому бы не пришло в голову записывать цы как ци. Никому бы не пришло в голову, что о можно записывать как haut или eau. Так и римляне, будь у них звук ц, придумали бы для него отдельную букву, а не правила типа «вот давайте ц и к будем обозначать одной буквой c«. Это же тупо.
Это потом люди начинают произносить иначе, а писать так же. По-другому писать неграмотно ведь.
Но это всё про логические выводы. А вот комментарий от человека больше в теме, PhD лингвистики с 20-ю языками: https://www.quora.com/How-did-latin-philologists-come-to-the.
Множество миров Фонтенеля
Продолжаю посты, посвященные истории популяризации науки.
Вслед за итальянским астрономом Галилеем и английскими джентльменами из Оксфорда на эту стезю вступили и французы, у которых с середины XVII века появилась своя Академия наук (учрежденная Людовиком XIV по предложению Жан-Батиста Кольбера). А раз есть наука, возникает потребность в разъяснении ее пользы для власти и общества, чем собственно и занимаются популяризаторы научного знания век от века.
Бернар Ле Бовье де Фонтенель родился в 1657 году в Руане, в семье адвоката нормандского парламента и Марты Корнель, сестры сразу двух известных французских драматургов – Пьера и Тома Корнелей. Проведя детство в иезуитском колледже (где он весьма радовал своих наставников успехами в учебе) семнадцатилетний Бернар добился разрешения уехать к дядям в Париж. Там он сначала попробовал, по примеру отца, сделать карьеру юриста (неудачно), потом, по примеру дядей, написал несколько пьес (тоже не имевших успеха у публики). Но литературу не бросил, писал стихи и прозу с переменным успехом. Так, в 1683 году «Диалогах мертвых» он придумал собрать вместе древних и новых авторов. Поэтесса Сафо беседовала у него с Лаурой Петрарки, Сократ с Монтенем, Анна Бретонская с Марией Французской. Книга имела успех. А несколько следующих – напротив, подверглись резкой критике.
В 1686 году Фонтенель снова экспериментирует с жанрами – пишет книгу-рассуждение «Разговоры о множестве миров». Само название в то время звучало достаточно провокационно, ведь христианство учит, что мир один и он создан Творцом. По сути книга была популярным изложением сформулированной ранее гелиоцентрической модели мироздания и связанных с ней космологических представлений.
Сам Фонтенель не привнес никаких новых научных знаний в эту область, он не был первым, кто попытался вывести тему гелиоцентризма за пределы довольно узкого круга ученых мужей, но, надо признать, что его попытка стала первой из по-настоящему удавшихся.
Произошло это потому, что Фонтенель, имевший богатый опыт на литературном поприще, умел писать интересно и понятно для широкой публики. Потому и форма была выбрана нарочито простая: автор предлагает записи бесед, в которых он, якобы, преподавал азы космологии молодой и очаровательной маркизе де ла Мезанжер.
Книга состоит из нескольких таких бесед. В первый вечер он объявляет маркизе, что Земля — это планета, вращающаяся вокруг своей оси и вокруг Солнца. В этой беседе он, кстати, дает интересный прогноз: поскольку Земля вращается вокруг своей оси, то наблюдатель, расположенный на каком-нибудь объекте над планетой, увидит проплывающих поочередно перед его глазами диких ирокезов, французских маркиз и прекрасных черкешенок. Космонавты с МКС передают привет французскому автору.
Во второй вечер автор доказывает, что Луна — обитаемая земля. Маркиза спорит – Луна совсем не похожа на Землю и Фонтенель соглашается с ней, на Луне не видно облаков, да и моря, может, вовсе и не моря. Ну так, и жители Луны, скорее всего, не похожи на людей, парирует он, ведь будь они людьми, должны были произойти от Адама, а это невозможно.
Третий и четвертый вечера посвящены Марсу и Венере, которые, по словам Фонтенеля тоже обитаемы. А чтобы объяснить, как планеты движутся по солнечной орбите и даже сами имеют спутники, он излагает маркизе сложную теорию вихрей Декарта. На пятый вечер он еще дальше раздвигает границы мира: неподвижные звезды, говорит маркизе автор, это такие же солнца. И у каждой, возможно, есть свои планеты.
Книга Фонтенеля имела огромный успех, она переведена почти на все европейские языки и выдержала множество изданий. По сути, он прервал многовековую паузу после появления поэмы Лукреция «О природе вещей», вернул к жизни литературный жанр, в котором научно-философское содержание сочеталось с занимательностью изложения.
Сам автор с каждым годом все больше и больше увлекался именно наукой, а не литературным творчеством. И в 1691 году он становится действительным членом той самой Французской академии наук, о которой говорилось в начале. Его «Рассуждения о множественности миров» стали одной из работ, давших основания для этого. Фонтенель носил звание академика ни много ни мало как 66 лет (он дожил до столетнего юбилея), причем свыше 40 лет был непременным секретарем Академии. Написал ряд работ по философии, математике, истории и стал, по сути, родоначальником жанра научной биографии. Он выступил с инициативой публикации в академическом журнале после смерти того или иного выдающегося ученого, так называемого «похвальное слово» о жизни и научной деятельности покойного. Такие «похвальные слова» были больше, чем просто некролог, это были художественные, развернутые жизнеописания. Большинство из них Фонтенель написал сам.
В июне 1717 года, при посещении академии Петром 1, Фонтенель играл немалую роль в устроенном московскому гостю торжественном приеме, годом позже известил Петра об избрании его в члены Французской академии. А после смерти первого русского императора написал «похвальное слово» и о нем, которое позже было переведено на русский язык.
Закончив перевод в 1730 году, Кантемир решил прибегнуть к посредничеству российской Академии Наук для того, чтобы издать русский вариант книги. Он обратился к своему наставнику –академику Гроссу, который тогда жил в Москве в качестве домашнего учителя в доме влиятельнейшего сановника – Андрея Остермана. В силу своего положения Гросс пользовался большим уважением в глазах Шумахера, через руки которого проходили все издания Академии. Осенью 1731 года Гросс пишет Шумахеру письмо, где предлагает рукопись Кантемира к изданию. Шумахер ответил: «Если князю Кантемиру будет угодно переслать мне свой перевод книги Фонтенеля De la pluralite des mondes, то я тотчас же озабочусь о печатании. Только я бы предварительно желал знать, одобрил ли это его графское сиятельство (граф Остерман), а также его преосвященство архиепископ (Феофан Прокопович), потому что книга такого содержания, что её нельзя печатать без министерского разрешения».
Пока Шумахер перестраховывался, согласовывая издание с высшими сановниками, Кантемир уехал в Лондон по дипломатической линии. В итоге, его перевод пролежал невостребованным еще семь лет. Вернувшись в Россию, Кантемир вновь обратился к Шумахеру с просьбой о русском издании Фонтенеля. Сверхосторожный немец выдвинул новое условие: заменить заголовок книги на что-то менее крамольное. Кантемир предлагает назвать «Разговоры астрономические, в которых той науки нужнейшие знания кратко и разуминительно к общества понятию изъяснены», но Шумахер счел новый вариант еще менее благопристойным.
В итоге книга была напечатана только в 1740 году под названием ««Разговоры о множестве миров господина Фонтенелла парижской академии наук секретаря. С французского перевел и потребными примечаниями изъяснил князь Антиох Кантемир в Москве в 1730 году».
Один из экземпляров был подарен императрице Анне Иоановне. Этот экземпляр с дарственной надписью сохранился до наших дней. Остальным повезло меньше, в 1756 году решением Синода книга была признана «смущающей», большая часть тиража была изъята и уничтожена. Но через пять лет Ломоносов осуществил второе издание книги, ни на букву не изменив текст. После этого попыток запретить книгу в Российской империи больше не предпринималось.
Перевод, сделанный Кантемиром, имеет значение не столько с точки зрения популяризации гелиоцентризма, сколько для развития русского языка. Его научно-литературный словарный запас был в то время в зачаточном состоянии, для обозначения многих понятий банально не хватало слов, и Кантемиру пришлось придумать их, поскольку он изначально делал текст для широкой публики, а не околоакадемического сообщества, которое прекрасно читало французские тексты на языке оригинала.
Подводя итог, можно сказать, что перевод Кантемира сам по себе стал литературным событием, положившим начало светской научно-популярной литературе в нашей стране. И книга Фонтенеля нам интересна еще и с этой точки зрения.
Магия против науки — сравнение книг о Гарри Поттере и диссертаций
Продолжаем анализировать русский язык при помощи математики! Предыдущие посты:
В комментариях под прошлым постом предложили сравнить очень интересный материал — магистерскую и докторскую диссертации, написанные на одной кафедре. Этим мы сегодня и займёмся! А чтобы читать пост было интересно всем, сравним их с первой и последней книгами из серии о Гарри Поттере
Волшебник из книг Джоан Роулинг рос вместе с нами. Первая книга «Гарри Поттер и философский камень» написана простым языком, понятным и детям. В последней книге серии — «Гарри Поттер и дары смерти» герои взрослее, а проблемы серьёзнее
В науке исследования, как правило, ведутся в узком направлении. Но каждая работа должна быть уникальной, а магистерская и докторская диссертации отличаются по сложности. Итак, что по вашему мнению будет больше похоже: первая и последняя книги о Гарри Поттере или магистерская и докторская диссертации, написанные на одной кафедре? Ставки приняты, начнём анализ!
Тексты о волшебстве
Начнём с анализа книг о Гарри Поттере. Сперва, по традиции, посмотрим на топ 15 самых частых слов в книгах:
Да уж, нет никаких сомнений в том, кто главный герой серии. Забавно, что Гермиона обогнала Рона по частоте упоминаний в последней книге, хотя в первой уступала даже Хагриду. А ещё в серии неожиданно часто встречаются руки
Кстати, в этот раз я улучшил предобработку: теперь стоп-слова, наподобие частиц и предлогов, выбрасываются из текста, а остальные слова приводятся к одинаковой форме. Например, и «ответил», и «ответила» превращаются в «ответить», а «Рона», «Рону» и «Рон» считаются как одно слово. Это называется лемматизацией
Это делается автоматически и иногда приводит к казусам. Например «Малфой» превратился в слово «Малфа», а «Снегг» в «Снегга». Любители фанфиков, наверняка, останутся довольны
Вот визуализация топ 150 слов в текстах. Чем больше слово, тем чаще оно упоминается в книге:
В первой книге очень много имён, ведь она знакомит нас с новым миром. В последней речь больше идёт о главных героях и их действиях
Для анализа использовались две работы с кафедры электротехнологий, электрооборудования и автоматизированных производств Чувашского Государственного Университета. Большое спасибо за этот материал Фёдору Иванову (@fedor0804)
1. Магистерская диссертация «Индукционная установка для сквозного нагрева заготовок» Фёдора Иванова
2. Докторская диссертация «Исследование особенностей характеристик электротехнологических дуг в дуговых печах» Дениса Михадарова
Топ слов, конечно, совсем не похож на книги о Гарри Поттере. Главные герои здесь индуктор и дуга, а в тексте часто встречаются числа и специальные символы. Их, к сожалению, не удалось правильно обработать и на графиках они выглядят как прямоугольники. Скорее всего, это греческие буквы, например, β
Сравнение магии и науки
Итак, у нас есть 4 огромных текста. Как понять, насколько они похожи друг на друга? Для этого можно посчитать косинус угла между текстами или даже сам угол. Давайте разберёмся, как это работает
Представим два текста поменьше: по одному предложению в каждом. Первый текст — «Еле-еле ели». Второй текст совсем лаконичный — из одного слова «Едим». После лемматизации у нас будут уже такие тексты:
Теперь подсчитаем количество слов в них:
Мы можем нарисовать простой график, где по одной оси будет отложено количество слова «еле» в тексте, а по другой — количество слова «есть». Изобразим наши предложения на этом графике
Теперь не проблема посчитать угол между текстами! Можно, конечно, взять транспортир. Но для того, чтобы решить эту задачу для текстов с тысячами слов, это не поможет. Если конечно, вы не живёте в тысячемерном мире и у вас полно тысячемерных транспортиров
Мы представили тексты в виде векторов. В школе вы считали скалярное произведение между векторами и находили через него угол. Здесь можно сделать то же самое — и неважно, сколько всего уникальных слов в текстах – два или тысячи. Для текстов из примера — косинус будет равен примерно 0.44, а угол — 63 градуса
Чем меньше угол между текстами, тем больше они похожи. Если же угол равен 90 градусам, то тексты перпендикулярны — совсем разные. Например, такой угол был бы между текстами на русском и китайском языках — у них нет общих слов. Надеюсь, вы только что стали немного умнее 🙂
Вернёмся к нашим текстам. Больше всего оказались похожи книги о Гарри Поттере. Угол между ними — всего 26 градусов
Между магистерской диссертацией и книгами о Гарри Поттере оба угла составили 87 градусов. Эти тексты очень разные. Ещё менее похожими на книги Джоан Роулинг оказалась докторская диссертация — у неё получился угол 88 градусов с первой книгой и 89 градусов с седьмой
Что забавно, научные работы тоже оказались довольно разными. Угол между диссертациями — целый 71 градус
Так что, последняя книга о Мальчике, который выжил — почти то же самое, что и первая, но немного под другим углом. А читая научные работы, даже с одной кафедры, вы каждый раз изучаете новый труд
Заглядывайте в комментарии – там есть небольшой бонус. Пишите, анализ, каких текстов вам ещё бы хотелось увидеть
Лев Толстой против Пикабу — статистика русского языка
Недавно я делал пост о частоте букв в русском языке. Из него вы узнали, что «О» встречается чаще, чем 14 самых редких букв вместе взятые, 50% языка написана всего 7 буквами, а «Ё» пора переносить из букваря в Красную книгу
Сегодня мы пойдём ещё дальше! Проанализируем не только буквы, но также их сочетания и целые слова. Для анализа возьмём 4 тома произведения «Война и мир» одного небезызвестного Льва. А для того, чтобы понять, насколько достояние культуры похоже на современный русский язык, сравним его с одним из самых популярных постов на Пикабу 2020 года. У него достаточно много комментариев, в которых люди говорят на разнообразные темы. Это отлично подходит для анализа языка. Вот содержание поста:
Кажется, что язык в комментариях под такой картинкой будет совсем не таким, как в художественном произведении 19 века. Но достаточно длинные тексты становятся похожими друг на друга и подчиняются общим закономерностям. Например, сравним частоты букв:
Они почти идентичны! Единственное, что явно выделяется — частота буквы «Т» в комментариях Пикабу. Предположу, что это связано с тем, что в посте обсуждают Билла Гейтса
Кстати, в комментариях получилось 83 тысячи слов, а в книге — 465 тысяч
Теперь посмотрим на статистику поинтереснее! И самое популярное слово… «И». «И» — самое популярное слово. В обоих текстах
«Топ 15» слов удивительно похожи! Настолько, что первые 4 слова полностью совпадают. Забавляют и суммарные количества слов. Читая «Войну и Мир», вам придётся больше 20 тысяч раз встретить слово «И». Предположим, что на его прочтение уходит одна десятая секунды. Тогда после завершения всех четырёх томов, вы суммарно потратите пол часа только на чтение слова «И»
Вы можете возразить, что эти слова необходимы для связывания текста, поэтому неудивительно, что они так часто встречаются. Можно удалить все предлоги, союзы, частицы и прочие «стоп-слова». Тогда тексты снова приобретают свою индивидуальность. По графику можно сказать, о чём в них шла речь и кто именно главный герой:
Тогда в топ «Войны и мир» попадает 2 французских «стоп-слова» — «de» и «a», что тоже забавно. А у Пьера Безухова и князя Болконского идёт нешуточная борьба за первое место
Ещё правильнее было бы привести слова к одинаковой форме (например, считать «Пьера» и «Пьер» или «Деньги» и «Денег» как одно и то же слово). Могу сделать это в следующих постах 🙂 Пишите, анализ каких текстов вам ещё хотелось бы увидеть или если у вас есть идеи для более интересного анализа
График частоты букв в русском языке
На первом месте – «О», она встречается в русскоязычных текстах чаще, чем 14 самых редких букв в сумме! Самая распространённая согласная – «Н», что для меня было неожиданно. А мягкий знак далеко не такой редкий, как я думал – он встречается чаще, чем целых 15 букв
На последнем месте грустит «Ё». Её нещадно вытесняет из письменности «Е», чтобы удержать своё второе место
Если вы читаете достаточно длинный текст, то его 50% составляют всего 7 букв!
СТАРОМОСКОВСКОЕ ПРОИЗНОШЕНИЕ и что от него осталось
Було[шн]ая, Маяковск[ай], це[р’]ковь, до[щ’щ’], [д’в’]ерь и прч. — всё это черты старомосковского произношения. Из видео вы не только узнаете о разных старомосковских особенностях, но и услышите десятки примеров речи из старых фильмов, песен и спектаклей. К слову, я и сам в ролике говорю со старомосковским выговором.
Также есть мнение, что «в Маааскве все гавааарят вот так». Конечно, с т.з. современного москвича, это чушь страшная. Но как возник этот культурный миф: это дурное впечатление у «понаехавших» или же это былое свидетельство того, как в Москве действительно некогда говорили?
В конце же — разговор о том, насколько широко раньше было распространено это «мхатовское» произношение, этот русский received pronunciation и говорит ли на нём кто-нибудь сейчас. В довесок автор поделится своими личными впечатлениями от него: как никак, он его кропотливо изучил и даже снимал на нём ролики год назад.
Календурь
Лингвофрики любят выдумывать закономерности происхождения слов. Дай такому фрику волю, он любое слово любого языка из какого-то корня своего родного языка выведет.
Не секрет, что разные народы в разные времена пользовались разными календарями и отсчёт лет начинали с разных исторических моментов. Кто-то от сотворения мира, кто-то от прилёта Кетцалькоатля, а наши соотечественники с РА-дно-верческим присвистом стремятся всех обскакать и вывести свой собственный календарь, самый древний, самый точный, самый правильный и (что особенно ценится) самый соответствующий ритмам природы и человека.
Кому-то хочется «взять и поделить» и год лихо пилится на 16 частей (как, например, инглинги во главе с А.Хиневичем).
Шамбала + бытовуха = шаббат, т.е. сидеть и ничего не делать. Одно непонятно. Чем их среда-то не устроила?
Этот весь сумбур я набирал по их многочисленным разрозненным статьям и видеороликам на ютубе. Единой стройной системы они, кажется, так и не выработали и постоянно напускают туман.
Например, во всём у них виноваты немцы. Они и историю славян переписали на свой лад, и календарь свой навязали, и религию католическую-протестантскую притащили, и ещё много-много всего нехорошего русскому человеку сделали. По их, ИПРЯшному мнению, разумеется. Немцы ну просто «враги хуже египтян вкупе с римлянами».
Почему немцы взяли латинские названия? Да чтобы брата-славянина с панталыку сбить, вот почему!
И люди верят. Увы, падение образования в наше время столь глубоко, что люди уже не знают, почему и в честь кого месяцы так называются.
Впоследствии, в средние века, по поручению Папы (Римского) Григория XIII его реформировали, уточнив и приблизив к астрономическому. И этот уточнённый календарь называется григорианским. Мы им пользуемся и поныне.
Окунёмся немного в историю.
Первый римский календарь, согласно преданию, утвердил сам легендарный основатель Рима – Ромул. Это была адаптированная система лунного календаря древних греков. Год состоял из 304 дней, которые были разделены на десять месяцев. Оставшиеся 64 и 1/4 дня не учитывались, что приводило к серьёзным проблемам, выраженных в постоянных сдвигах сезонов.
Второй правитель Рима, Нума Помпилий, позаимствовал календарь этрусков, и ввёл дополнительные два месяца – январь и февраль, чтобы привести календарный год в соответствие с сезонами. Первым месяцем тогда был март, а последним – декабрь. Что примечательно, что вначале январь вставили перед первым месяцем, а февраль – после последнего.
Год этот не совпадал с естественным ритмом солнца, и поэтому раз в несколько лет вставляли дополнительный месяц – мерцедоний.
Когда и куда его вставлять, решал главный жрец. Это порождало ещё одну неприятность: так как некоторые важные должности в Риме были выборными, кому-то «перепадало» остаться у власти аж на месяц дольше.
И опять же, кому и когда этот месяц выделить, решал верховный жрец. Юлий же Цезарь это всё упразднил, введя «улучшенный и исправленный» египетский солнечный год. Исправления состояли в том, что начало года сдвинулось с марта на январь (первого января в должность вступали выборные консулы), а ещё каждый четвёртый год становился високосным.
И что же из этого получилось? Получились двенадцать месяцев, первым из которых идёт март (в честь бога Марса, отца Ромула и вообще прародителя римлян).
А дальше эту традицию решили не продолжать, и месяцы остались со своими порядковыми номерами-названиями. С седьмого по десятый.
Конечно, я понимаю, что это всё сухо и академично, и нет здесь ни Сотворения Мира во Звёздном Храме, ни деления часа на 144 части, а в одной части 1296 долей, в одной доле 72 мгновения, в одном мгновении 740 мигов, а в одном миге 160 сигов или тиков, а в одном сиге 14000 сантигов, и упаси Боже, я это не придумываю, это реальная цитата из комментария к ролику про названия месяцев!
Приведённые мной академичные названия месяцев и вообще история календаря не даёт, в отличии от РА-дно-верческих выдумок, поводов гордиться «своими славными предками». Но разве нам для гордости нужно, чтобы именно наши предки были первыми во всём на свете?
Я уже говорил, что своим «славным происхождением» гордятся только тогда, когда иных поводов для гордости нет. В девяностые было модно выводить свою фамилию от какого-нибудь древнего дворянского рода. И плодились, как блохи на больной собаке, конторки по рисованию родословных деревьев. Потом эта мода, к счастью, прошла.
Поэтому меня несказанно радует, что в комментариях к роликам начали появляться вот такие реплики:
И эти комментарии видны всем, а это означает, что у ИПРЯ уже не хватает людей и средств не то что на покупку хвалебных отзывов, но и даже на банальную модерацию. А значит, скоро и их век подойдёт к концу и они перестанут морочить людям головы. И будет нам счастье.
Котика всем, кто дочитал до конца.
В дебрях русской грамматики
В комментариях тут кто-то задал вопрос (и он даже попал потом в пост, но я не смогла его найти): «А как правильно: птиц не существует или птицы не существуют?». Этот вопрос меня зацепил, так как накануне я как раз познакомилась со статьей Ю.Д. Апресяна и потому решила (наконец-таки созрела) поделиться с вами некоторыми интересными фактами из грамматики русского языка.
В настоящее время лингвисты всё чаще говорят о том, что грамматика тоже несет какую-то (иногда очень важную!) часть смысла, который в других случаях может быть выражен лексически. Мы сталкиваемся с этим при переводе с одного языка на другой: чтобы перевести I’m writing на русский язык, мы скорее всего добавим слово сейчас, потому что у нас нет такой формы глагола, которая отвечала бы за настоящее продолженное время. Московская семантическая школа (МСШ), которую возглавляет Ю.Д. Апресян, как раз работает над интегральным описанием языка, то есть описанием в тесной связи лексики и грамматики.
Различными грамматическими тонкостями внутри своего языка носители владеют интуитивно, не осознавая выбор грамматических форм при построении высказывания. В отрицательной конструкции мы можем сказать птицы не существуют – существительное при глаголе стоит в именительном падеже, а можем сказать птиц не существует – здесь существительное стоит уже в родительном падеже. Можем ли мы объяснить, чем руководствуется человек при выборе падежа? В тех или иных случаях можем, если хорошенько подумаем. Но в естественной речи носитель языка и не задумывается об этом, он автоматически выбирает подходящую для него форму слова. Конечно, в речевом потоке можно и кучу ошибок совершить, но в идеальной ситуации грамотный носитель языка знает, что именно нужно употребить.
Интересно то, что разница в выборе падежа может зависеть (но не во всех случаях) от смысла, вкладываемого в высказывание. К примеру, можно сказать звуков не слышно и звуки не слышны. При прочих равных мы можем предположить, что в первом случае никаких звуков не слышно, т.е. их вообще нет, а во втором – звуки вообще где-то есть, но здесь их не слышно. Кроме того, с помощью именительного падежа чаще обозначаются конкретные объекты, а с помощью родительного – неопределенные. Например, на вопрос «Ты слышишь/тебе слышны какие-нибудь звуки?» мы скорее ответим «нет, никаких звуков не слышно», чем «нет, никакие звуки не слышны». Аналогичный пример мороз не чувствовался и мороза не чувствовалось. В первом примере мороз был, но я его не чувствовал, а во втором – его не было вообще. Конечно, это лишь нюансы значений, которые могут в общем-то и не улавливаться носителями языка в тех или иных случаях.
Но есть случаи типа не остается сомнений, но *не остаются сомнения; весна никак не начиналась, но *весны никак не начиналось. В этих примерах первый вариант будет корректным, а второй нет. В подобного рода высказываниях возникают ограничения на употребление того или иного падежа. Например, замечено, что к глаголам, допускающим оба падежа или только родительный, относятся глаголы существования, напр., быть (предупреждений не было), возникать (проблем не возникало), виден (дыма не видно) и т.д. Однако такими объяснениями всё не исчерпывается, эти вопросы требуют специальных исследований.
Кроме того, разные падежи могут употребляться при одном глаголе, но в разных условиях: не гремело победных маршей, но *не гремит поездов по рельсам (так сказать нельзя); утешения не наступало, но *марта ещё не наступило (так мы тоже не скажем). Выходит, что грамматические формы выбираются также в зависимости от контекста, что опять же работает на смысл высказывания в целом. Скажем, в последних примерах марши и утешение – это как бы пассивные участники ситуации, поэтому могут стоять в родительном падеже: марши кто-то производит, а утешается человек (подобная ситуация в выражениях типа мне не спится, мне не работается); а поезда и март – активные участники, поэтому они должны стоять только в именительном падеже (и правда, гремят скорее поезда, а не кто-то ими гремит, так же, как и март приходит сам). Носители языка интуитивно чувствуют эти тонкости, но описать их системно – задача не из легких. Проблема в том, как вычленить из языка такие едва уловимые закономерности.
В качестве примера с нагруженной в смысловом отношении грамматикой можно рассмотреть следующий: отца не было на море – отец не был на море. Любой носитель русского языка сходу поймёт разницу между этими двумя предложениями. Первый вариант мы употребляем в речи, говоря о каком-то конкретном море и каком-то конкретном моменте времени, а с помощью второго варианта как бы даем характеристику отцу: он никогда не был на море, – то есть мы говорим о ситуации вообще, без привязки к какому-либо времени и какому-либо морю. Чтобы лучше понять идею, можно провести параллель с английским языком, где для каждого случая будет использована своя форма глагола: для конкретной ситуации (актуальной) и для ситуации вообще (неактуальной). В русском языке разница в смысле этих высказываний передается как раз с помощью падежа. Мы также можем использовать уточняющие слова вроде сегодня (для конкретной, актуальной ситуации) или никогда (для неактуальной), которые будут усиливать эту идею, но делаем это далеко не всегда. Такое разведение по смыслу работает именно для глагола быть в значении ‘находиться.’
Что касается случая птиц не существует и птицы не существуют, то о правильности второго варианта можно и поспорить. Но если к ним, скажем, добавить фразу в природе и поменять птиц на единорогов, то высказывание в принципе можно считать правильным. А если придумать какой-нибудь подходящий контекст, допустим, «…но в реальности единороги птицы не существуют», то даже и неплохо звучит (с точки зрения языка, а не логики). Выходит, что в определенном контексте эти два варианта взаимозаменяемы. Однако, как верно заметил один из комментаторов в оригинальной ветке, в варианте птицы не существуют речь скорее пойдет о каких-то условно активных действиях птиц, а не о ситуации вообще, ведь когда мы добавляем, например, место, о котором говорим, то уже можно сказать «в этом месте птицы не существуют».
В связи с этой темой мне вспомнилась история о том, как в одной англоязычной стране с помощью языка было раскрыто преступление. При допросе подозреваемая четко и логично выстраивала свою версию событий, которая казалась безупречной, и придраться было не к чему. Тем не менее, ее всё-таки подловили на использовании времен глаголов (в английском языке, как известно, их аж 12). При даче показаний она неосознанно использовала формы глагола таким образом, что содержание стало противоречить грамматической оформленности речи, и её смогли уличить во лжи, а затем раскрыть дело. (Эту историю я читала, кажется, в книге Стивена Пинкера «Субстанция мышления. Язык как окно в человеческую природу».)
Настолько тесно связан наш язык с мышлением, что мы порой даже не можем отследить, когда и какие формы мы используем, и какие нюансы значений они передают. Извлечь эти знания на свет – дело по истине грандиозное.