Что значит написать на латинице пример
Юлия → Iuliia. Всё о транслитерации
Транслитерация — это запись кириллических слов латиницей (Анна → Anna, Самара → Samara). Её используют в загранпаспортах, водительских удостоверениях, трансграничной доставке, библиотечных каталогах и множестве других международных процессов.
Так вышло, что я недавно окунулся в эту тему, а в Википедии она раскрыта слабо. Поэтому расскажу, что к чему (спойлер — если вы думаете, что с транслитерацией всё плохо, то на самом деле всё ещё хуже).
И конечно, поскольку это Хабр — предложу open-source библиотеки для решения проблемы.
Кто виноват
Транслит — это хрестоматийная ситуация «у нас 14 плохих стандартов, давайте придумаем ещё один». Весь 20 век солидные, уважаемые люди придумывали всё новые и новые стандарты транслитерации.
Как приумножаются стандарты // xkcd
Получалось у них очень, очень плохо. Например, в загранпаспорте пишут Юлия → Iuliia не потому, что МИД хочет сделать вам больно, а потому что это международный стандарт ICAO Doc 9303 [1] — Machine Readable Travel Documents.
Такое ощущение, что все стандарты писались людьми, которые ненавидят русский язык. Если для англо-американского творчества это объяснимо, то что заставило советских учёных превратить Лёгкий в Ljogkijj (ГОСТ 16876-71 [2] ) — решительно непонятно.
Zato naši kosmičeskie korabli borozdili prostory vselennoj.
Yuliya, syesh yeshchyo etikh myagkikh frantsuzskikh bulok iz Yoshkar-Oly, da vypey altayskogo chayu.
Конечно, нельзя было делать совсем уж хорошо (а то кто тогда станет придумывать новые стандарты). Поэтому у Википедии ещё превращается в yeshchyo. Схема хорошо передаёт фонетику, а вот выглядит иногда не очень — оцените E → YE, Щ → SHCH и Ё → YO в этом примере.
Чтобы вы представляли масштаб бедствия. Я насчитал 20 схем транслитерации, некоторые из которых предусматривают альтернативные наборы правил (например, с диакритикой и без). Из них 14 считаются действующими. Четырнадцать действующих «стандартов», прямо как в комиксе xkcd.
Кстати, на Хабре тоже есть транслитерация — например, для генерации id заголовков из текста. И угадайте что? Ну да: она не следует ни одному из официальных стандартов.
Habr, chto ty delaesh, ahaha, prekrati
В качестве вишенки на торте в рунете несметное количество сервисов типа «транслитерация онлайн», которые мало того что перевирают существующие схемы, так ещё и придумывают собственные. Исходники у них закрыты, разумеется.
Есть ещё такая штука — «обратная транслитерация», когда вы восстанавливаете справедливость и превращаете Iuliia → Юлия. Тут ситуация даже хуже, чем в прямой транслитерации, потому что при записи латиницей никто никаких стандартов не соблюдает, и встречаются жуткие монстры.
Теперь несколько практических рекомендаций.
Как выбрать схему (быстрый вариант)
Если нужно обратимое преобразование (cyr–lat). Используйте ГОСТ 7.79-2000 (aka ISO 9:1995). Там есть вариант с диакритикой и без.
Если визуальная красота превыше всего. Используйте схему Мосметро, она сама лаконичная и приятная на вид.
В остальных случаях. Используйте схему Википедии. Она лучше всех по фонетике и лишь немного уступает Мосметро визуально.
Как выбрать схему (для дотошных)
Здесь же перечислю вкратце только актуальные схемы с моими комментариями.
ГОСТ 7.79-2000
Универсальная схема транслитерации, международный стандарт ISO 9:1995. Громоздкая, зато обратимая. Есть вариант с диакритикой.
ГОСТ Р 52290-2004
Стандарт для транслитерации имён собственных на дорожных знаках. Неплохая, с одинарными апострофами. Много внимания написанию Е и Ё.
ГОСТ Р 7.0.34-2014
Правила упрощенной транслитерации русского письма латинским алфавитом. Для библиотек и издательств. В меру приятная. Расслабленная: есть альтернативы для многих букв, можно без апострофов.
Телеграммы
Инструкция Минсвязи о порядке обработки международных телеграмм. Некрасивая, зато без апострофов.
ICAO DOC 9303
Стандарт Международной организации гражданской авиации. Используется МВД для ФИО в водительских удостоверениях, а МИД — в загранпаспортах. Подходит для гринкарты и вида на жительство. Используется некоторыми платёжными системами.
UNGEGN 1987 V/18
Схема транслитерации ООН для географических названий. Основана на ГОСТ 16876-71. Такая же страшная, но до сих пор не отменена.
BGN/PCGN
Древняя схема транслитерации ООН для географических названий. Почти без диакритики, но зачем-то оставила Ё с точками.
ALA-LC
Схема транслитерации американской Библиотеки Конгресса. Страшноватая. Есть варианты с диакритикой и без.
BS 2979:1958
Схема транслитерации Британской библиотеки. Используется издательством Oxford University Press. Изящно схлопывает окончания ИЙ и ЫЙ, в остальном так себе.
Научная
Великая праматерь всех схем. Используется в научных работах. Из неё вырос ГОСТ 16876-71. Достойна уважения за вклад в историю, но страшная.
Википедия
Схема транслитерации, которую использует Википедия. Сделана на основе BGN/PCGN со значительными модификациями. Самая продуманная, звучит лучше всех и выглядит приятнее большинства прочих схем.
Мосметро
Схема транслитерации, которую использует Московский метрополитен. Визуально самая приятная из всех, хотя уступает Википедии по фонетической точности. Придумана в Студии Лебедева, официально нигде не описана.
Яндекс.Деньги
Правила Яндекса для банковских карт. Простая и удобная схема.
Яндекс.Карты
Правила Яндекса для адресов. Слегка улучшенная версия Яндекс.Денег.
Как транслитерировать
Не пишите логику транслитерации с нуля — велик шанс ошибиться и получить очередную (N+1) схему транслитерации, «спасибо» за которую вам не скажут.
Не берите библиотеки с гитхаба без проверки. Все, что я смотрел — реализуют стандарт некорректно, если он чуть сложнее таблицы с однозначным соответствием.
Мы с mehanizm сделали аккуратные библиотеки с нормальными тестами для Python, JavaScript и Go. Но лучше дополнительно проверьте на паре примеров, а то вы ведь знаете этих программистов ツ
UPD Больше библиотек!
Пример использования (Python):
Схемы транслитерации описаны декларативно в JSON, лежат в отдельном репозитории. Если я какую-то пропустил — вы знаете, что делать ツ
И поделитесь в комментариях — приходилось вам сталкиваться с транслитерацией по работе или в жизни? Какие впечатления?
Латинские буквы (алфавит): происхождение, состав латиницы и языки использования
Здравствуйте, уважаемые читатели блога KtoNaNovenkogo.ru. Абсолютное большинство письменных языков, распространенных на территории современных Европы, Северной и Южной Америк, Австралии, отчасти Африки, постсоветских территорий Азии используют буквенную письменность, восходящую к двум основным алфавитам.
Это латиница и кириллица.
Латиница — это.
Кириллическими графемами пользуются носители восточно- и южнославянских языков, а также младописьменные народы. Весь остальной мир в ходе исторических событий перешел на латинские буквы, даже если изначально имел свои.
Такие переходы актуальны даже сейчас. К примеру, в Казахстане в 2017 году начали применять латинскую графику в качестве основной.
Итак, латинские буквы – это какие? Ответить на этот вопрос может любой, кто хоть раз сталкивался с английским, немецким, французским, испанским… Алфавиты этих и многих других языков классически построены на графемах латыни.
Латинские буквы
Современная латиница состоит из 26 графем. В некоторых европейских языках дополняется особыми знаками.
Например, умлауты в немецком всегда представлены после 26-ой графемы, но в основной алфавит при этом не входят. В латышский же диакритические знаки включены сразу.
Латинские буквы – это основа письменности большинства германских, романских, балтийских, отчасти славянских и других языков.
Актуальный состав латиницы представлен в таблице:
История латинского алфавита
Латиница была создана в середине первого тысячелетия до нашей эры, ориентировочно в 7 веке до н.э. Изначально это был алфавит древних римлян.
Он разрабатывался на основе этрусского, который, в свою очередь, восходит к одному из наиболее совершенных для Античной Европы набору графем – греческому. Позднее стал использоваться в Римской республике, а потом и Империи.
Благодаря успеху государства на мировой арене распространился на огромной территории.
Изначально в алфавите была только 21 графема. В I веке до н.э. добавили буквы G, Y, вернули временно исключенную Z. Буквы J, U, W появились значительно позже – уже в новое время.
Уже после развала Римской империи именно латинская письменность легла в основу так называемых народных языков. Они возникли во вновь образованных национальных государствах Европы. Уже как часть этих языков письмо древних римлян эмигрировало в страны Нового света.
Таким образом, со своей географической родины – Италии – латиница территориально была «расселена» практически по большей части суши.
Речь, конечно, идет только о графемах: их звуковое отражение в языках может заметно отличаться.
Распространение латиницы в наше время
Сегодня латиница – это самый распространенный алфавит в мире.
Она лежит в основе всех языков таких групп (в скобках указаны самые популярные лингвосистемы):
Также латиница используется как алфавит некоторых языков в южнославянской, финно-угорской, тюркской группах. Данные графемы применяются в отдельной выделенных албанском и вьетнамском языках.
География распространения представлена на карте:
Такое территориальное превалирование – несомненно, результат успешности Римского государства, а позднее – стран Европы, которые колонизировали обе Америки, Австралию, частично Океанию и Африку.
«Русская латиница»
В разное время отечественной истории латинский алфавит пробовали использовать и для передачи на письме русской речи.
Первые попытки соотносятся с XVI—XVIII веками, предприняты они были представителями Великого княжества Литовского, Речи Посполитой, которые владели территориями современной Украины. Соответственно, излагали на письме западнорусский вариант языка.
*при клике по картинке она откроется в полный размер в новом окне
Также русские слова латиницей записывали путешественники – носители французского, английского языков. Обычный для них рад графем дополнялся кириллическими буквами, которые нечем было заменить.
Отдельные проекты по серьезному введению латинского алфавита как основы русского правописания предлагались как в Российской империи, так и в Советском Союзе, но до практической реализации не дошло.
Новейшее аналогичное предложение поступило в 2017 году от депутата Владимира Петрова, который предложил сотрудникам РАН создать параллельную русскую азбуку, основанную на латинской графике. Ученые инициативу политика не поддержали.
Удачи вам! До скорых встреч на страницах блога KtoNaNovenkogo.ru
Эта статья относится к рубрикам:
Комментарии и отзывы (4)
Кириллическими графемами пользуются носители восточно- и южнославянских языков, а также младописьменные народы. Весь остальной мир в ходе исторических событий перешел на латинские буквы.
ребята, весь мир — это и арабские страны со своей графикой. И Израиль, и Греция, и Эфиопия, и Таиланд с Индией. Я уж не говорю про иероглифические системы письменности. Не упрощайте
неточности. Вы подаете, как пример, именно российскую кириллицу а не просто кириллицу. Потому что буквы там явно не все, какие в кириллице бывают.
«владели территориями современной Украины. Соответственно, излагали на письме западнорусский вариант языка»
то Украина, то западнорусский вариант языка (что это за язык такой? и куда подевался украинский, раз это происходило на землях с укр.населением). А на иллюстрации по-моему белорусский.
Что-то тут напутано слегка. Эти языки к тому времени уже были самостоятельными и имели свои особенности, не стоит их мешать в одну кучу.
Соглашусь с drevlianin, латиница используется только в тех странах, которые остаются колонией Запада.
Бесспорно, самый лучший алфавит! Простой, универсальный, удобоваримое произношение слов в большинстве языков.