Что относится к текстовой информации примеры

Учитель информатики

Сайт учителя информатики. Технологические карты уроков, Подготовка к ОГЭ и ЕГЭ, полезный материал и многое другое.

Текстовая информация

Здравствуйте, дорогие ребята. Начинаем наш урок. Текстовая информация. Начнем с определения что такое текст?

Текст — это любое словесное высказывание напечатанное, написанное или существующее в устной форме.

Информация, представленная в форме письменного текста, называют текстовой информацией.

Первыми носителями текстовой информации были:

В настоящее время все больше используются электронные носители.

Поговорим о текстовых документах.

Документ — любой текст, созданный с помощью текстового редактора. К текстовому документу можно отнести:

Созданных с помощью редакторов.

Вот несколько текстовых редакторов которые чаще всего используют на практике.

Блокнот (Notepad) — является стандартным приложением операционной системы Windows. В ней можно создавать самые простейшие текстовые документы.

Приложение WordPad — это тоже стандартный текстовый редактор с более расширенными возможностями.

Microsoft Word — это текстовый процессор, который является коммерческим продуктом от компании Microsoft.

Программа OpenOffice Writer по функциональности практически не отличается от Word, но является полностью бесплатной.

Гипертекст — это такой текст, который содержит ссылки для перехода в другие документы или части одного и того же документа. Ссылки могут быть оформлены в виде текста, картинок или баннеров. При наведении указателя мыши, указатель изменяет внешний вид. При нажатии происходит переход на новый документ.

Основные объекты текстового документа.

Самым наименьшим объектом является символ, который состоит из знаков (буквы, цифры, знаки препинания). Из символов образуются слова, слова объединяются в строки, между словами ставится знак пробела. Абзац начинается с отступа, между абзацами ставится небольшой интервал. Далее все фрагменты объединяются в страницы. Таким образом получаем текстовый документ.

Рассмотрим основные этапы подготовки документа.

Ввод текста — набираем с клавиатуры текст. Далее идет процесс редактирования текста, форматирования текста и печать.

Рассмотрим эти этапы подробнее.

При вводе текста нужно соблюдать правила. Перед вами предложения, которые написаны разными способами. Первые два примера являются не правильными, третий правильный.

Дело в том, что пробел нужно ставить после знаков препинания, но не до.

Короткое тире или знак минус ставят в арифметических выражениях пробелы не ставятся до и после минуса, длинное тире пробелы ставятся до и после тире.

Когда набираете текст избегайте двух и более пробелов между словами.

Для создания отступов в абзацах используйте клавишу Tab.

Для выравнивания текста по центру нельзя использовать пробелы, для этого применяют кнопку выравнивания.

Для перехода на новую строку нужно иметь в виду что обычно текст переходит автоматически на новую строку. Для принудительно перехода на новую строку используют клавишу Shift + Enter.

Если мы нажимаем просто на Enter, то переходим на начало нового абзаца.

Рассмотрим процесс редактирования текста.

Под редактированием текста понимают изменения содержания документа. Сюда относится замена слов на их синонимы.

Исправление синтаксических орфографических ошибок.

Удаление, копирование и вставка фрагментов теста.

Форматирование текста под ним понимают изменение внешнего вида документа и его отдельных частей. К операциям форматирования относятся выравнивание абзацев, форматирования шрифта.

Источник

Информатика

Именная карта банка для детей
с крутым дизайном, +200 бонусов

Закажи свою собственную карту банка и получи бонусы

План урока:

Понятие информации ее виды, свойства, способы получения

Информация — это сведения об объектах, событиях, явлениях природы, процессах. Люди получают информацию о температуре воздуха, цвете глаз, размере предмета, запахе духов, вкусе.

Способов получения информации человеком великое множество. Человек воспринимает информацию с помощью органов чувств: глаза (зрение), уши (слух), язык (вкус), кожа (осязание), нос (обоняние).

Выделяют следующие виды информации по способу ее восприятия:

Визуальной называют информацию, которая воспринимается человеком посредством глаз. Зрительной информации отведено 90%. Источником зрительной информации может быть книга, светофор, телевизор, рекламный щит и т.п.

Еще один вид информации по способу ее восприятия – звуковая или аудиальная информация. Звуковую информацию человек получает с помощью ушей. Звуковая информация передается посредством радио, телевизора, планшета, телефона и т.д. Животные также используют способ передачи информации в виде звуков: собака лает, когда хочет сообщить человеку об опасности; кошка мяукает, если просит поесть.

Нос помогает получать обонятельную информацию. Поднесите к носу ароматный кофе, пройдитесь в лесу после дождя или зайдите в пекарню. Нос уловит все ароматы. Благодаря обонятельной информации, человек делает выводы о том, нравится ему тот или иной запах.

Вкусовая информация воспринимается органами рта. Вкусовые рецепторы в ротовой полости помогают определить температуру и вкус объекта, который попадает в рот. Как правило, источником вкусовой информации служат продукты питания или медикаменты. Достаточно вспомнить кислый вкус аскорбиновой кислоты или горький привкус микстуры от кашля, которую дает мама.

Тактильная или осязательная информация – это вид информации, которую человек воспринимает кожей.

Источники тактильной информации:

Человек получает тактильную информацию посредством кожи о рельефе, фактуре, остроте, мягкости, упругости, жесткости, вибрации или температуре объекта.

Есть люди – инвалиды по зрению, которые не могут получать зрительную информацию. Для них был изобретен шрифт Брайля, рельефно-линейное письмо. В этом случае тактильная информация имеет ведущее значение.

К свойствам информации относятся:

Значение невербальных средств общения в передаче информации

Взаимодействие вербальных и невербальных средств передачи информации обеспечивает высокий процент передачи информации собеседнику.

Виды информации по форме представления

Какие виды информации бывают в информатике?

По форме представления различают следующие виды информации:

Комбинация символов (буквы, арифметические знаки, цифры и пробелы) относится к текстовому виду информации. Примерами числовой и текстовой информации являются сочинение школьника, список продуктов в чеке, рекламная вывеска и т.д.

Примером числовой информации может служить математический пример, таблица умножения, график показаний счетчика.

Графическая информация может быть представлена в виде диаграмм, фотографии, графиков, рисунков, чертежей, схем, таблиц, карт и т.п. Обработка графической информации включает изменение параметров (качество изображения, количество цветов, размер) или формата графических файлов (TIFF, GIF, PCX, JPEG и др.).

Формы представления графической информации используются на уроках физики, природоведения, информатики, черчения и т.д. Это могут быть конспекты, презентации, чертежи.

Ученые установили, что текстовая информация усваивается лишь на 70%. Обогащенный изображениями текст, позволяет усвоить материал на 95%.

Видеоинформация – это информация, включающая изображения, звук, анимацию. Она может храниться на магнитной ленте, кинопленке, оптическом диске или карте памяти. Примером видеоинформации может быть любимый мультфильм или телевизионная реклама.

Основные виды компьютерной анимации:

PowerPoint – программа для создания анимации. Презентация PowerPoint может состоять из изображений, видеофрагментов, звукового сопровождения и спецэффектов.

Информация может быть комбинированной. В этом случае она включает видеоинформацию, звуковое сопровождение и числовые данные.

В информатике виды информации по форме представления можно создавать или преобразовывать с применением компьютерных программ. Paint помогает в создании графических изображений, WordPad работает с текстовой информацией, Калькулятор совершает расчеты.

Действия с информацией. Какие типы действий человек выполняет с информацией?

Ежедневно человек совершает разные действия. Он ходит, общается, платит за проезд, делает покупки, читает, ест и т.д. Этому его научили другие люди своим примером или передачей информации.

Человек совершает действия с информацией при просмотре фильма, во время игры в шашки, при решении задач, при создании рецепта блюда.

Рассмотрим подробнее, какие действия можно выполнять с информацией.

Поиск информации. Способы поиска информации

Что такое поиск информации? Это действия, связанные с получением информации. Рассмотрим примеры поиска информации:

Перед началом любого действия необходимо найти информацию, которая понадобится для его выполнения, выбрать источники и средства ее получения.

Носители информации. Виды хранения информации

Для хранения информации (адреса знакомых и коллег, правила орфографии, формулы и время встречи) человек использует свою память, предметы для записи или цифровые устройства.

Речь идет о видах хранения информации и видах накопителей информации.

Какие виды носителей информации существуют?

Родоначальником бумаги и книг был Папирус (3000 лет до н.э.).

Для сохранения пейзажа художники рисовали живописные полотна на ткани.

Архитектурные сооружения архитекторов оставили память об исторической эпохе.

В 1839 году изобрели фотографию, а в 1896 году запустили киноиндустрию.

Так человек использует для хранения разного рода информации бумажный блокнот, магнитный диск, картины, кинопленку, фотографии и рисунки.

Сегодня появились новые виды электронных носителей информации. Это лёгкие накопители, вмещающие большой объем данных и позволяющие сохранить многовековые знания человечества:

Виды передачи информации

Передача информации осуществляется через газеты, телевидение, фотографии, видеосюжеты, социальные сети и т.д.

Виды информации по форме передачи характерны наличием источника и приемника информации.

Рассмотрим примеры видов и способов передачи информации на примерах.

Все реже человек получает информацию от природы. Чаще он использует приборы или современные виды каналов передачи информации: телефон, компьютерная сеть, телеграф, радио, интернет.

Выделяют виды источников информации и их характеристики:

Первичные источники – это исходная информация: результат опыта на уроке химии или исторический документ (Первый указ Петра 1, Манифест «О даровании вольности и свободы всему российскому дворянству»).

Вторичные источники – преобразованная информация после обработки: статья в газете о прошедшем событии на основе первичных источников и рассказа очевидцев.

Обработка информации. Устройства обработки информации

Примеры обработки информации:

Без обработки информации человек не смог бы выполнять множество задач. Когда человек стоит на регулируемом перекрестке, он оценивает данные, полученные от светофора. Человек обрабатывает эти сигналы и выдаёт телу сигнал к действию: «Стоять!» или «Двигаться!».

Выделяют два вида обработки информации:

Различают также осознанную и неосознанную обработку информации.

Осознанная обработка информации. Студент на лекциях изучил правила, формулы и алгоритмы решения и при выполнении домашнего задания пользуется этими знаниями.

Как называется устройство обработки информации?

Исполнителем может быть не только человек, но и специальное устройство. Компьютер-отличное средство обработки информации, позволяющее решать универсальные задачи. Использование компьютерной техники говорит об автоматизированной обработке информации. Благодаря мощности процессора и объему оперативной памяти можно обрабатывать большие объемы данных в короткие сроки.

Сверхбыстродействующий инструмент, суперкомпьютер, обладает производительностью свыше 100 МФЛОПС (МФЛОПС – сто миллионов операций в секунду).

Технология обработки информации включает знания об инструментах и средствах, которые способны изменять объекты (данные, изображение, видео и др.).

Технологический процесс обработки информации включает:

Методы обработки информации:

Что такое систематизация информации?

Систематизация информации – это обработка информации, которая приводит к определенному виду: план, список, таблица, диаграмма или схема. Систематизировать можно товары в магазине игрушек, список учеников в классе, адреса друзей в адресной книге и др.

Microsoft Excel–одна из программ для систематизации информации. Она позволяет структурировать информацию, осуществлять сортировку и фильтрацию, проводить вычисления по формулам, строить графики.

Сортировка может осуществляться по алфавиту, в хронологической последовательности, по номерам (в порядке возрастания или убывания), по дате и времени.

Источник

Информатика

Именная карта банка для детей
с крутым дизайном, +200 бонусов

Закажи свою собственную карту банка и получи бонусы

План урока:

Текст как форма представления информации

Примером текстовой информации может служить параграф школьного учебника, детская считалка, ремарка актера в пьесе, расписание уроков, магазинный чек и т.д.

Издавна люди пытались сохранить различного рода сведения на таких носителях, как камень, глина, береста, папирус, на смену которым пришла повсеместно используемая бумага.

Письменный текст записывали различными инструментами – острой костяной палочкой, перьевыми ручками, авторучками и с позапрошлого века стали печатать на пишущих машинках.

Причиной перехода к безбумажным технологиям во многих сферах деятельности человека является увеличение скорости и качества обработки информации, уменьшение себестоимости электронных носителей при росте цен на бумагу вследствие мирового экологического кризиса.

Представление текстовой информации в компьютере –это преобразование вводимых символов с помощью кодовой таблицы. Современная универсальная таблица кодировки Unicode позволяет охватить более 65 тысяч символов различных алфавитов, цифры, знаки препинания, математические и другие символы.

Фрагмент кодовой таблицы Unicode

Для каждого знака в памяти компьютера выделяется 2 байта или 16 бит двоичного кода. Таким образом, можно вычислить объем текстовой информации, легко перемножив количество символов (включая пробелы) на информационный вес одного символа. Для выражения крупных объемов информации используются такие единицы измерения, как килобайты, мегабайты и гигабайты.

Единицы измерения информации

Различают следующие виды текстовой информации:

Большинство текстов имеют сложную структуру, подразумевающую сочетание различных типов сведений: когнитивных, оперативных, эмоциональных и эстетических. Каждый из видов информации в тексте характеризуется своими особыми способами языкового выражения.

Текстовые документы

В целях упрощения работы с письменной информацией создали специальное программное обеспечение – текстовые редакторы (процессоры). Каждый текст, написанный в нем, будет называться текстовым документом. Это может быть и научная статья с формулами, и рассказ, и рекламное объявление.

Основные объекты текстового документа

Различают следующие основные структурные единицы текстового документа:

Страница в текстовом документе – это отрывок текста, помещающийся на листе определенного формата.

Компьютер – основной инструмент работы с текстом

В современном мире компьютер – уникальное устройство, в том числе и для работы с текстовой информацией. Элементарные программы для текстовых документов имеют возможность создания текстов, составленных из символов, печатаемых с клавиатуры, и небольшой комплект инструментов для оформления информации. Для подготовки наиболее сложных текстов с графиками, табличным представлением данных, надписями, схемами, картинками и фотографиями целесообразно использование сильных текстовых процессоров.

Среди множества программ, предназначенных для работы с текстовой информацией, выделяют следующие:

Основные стадии подготовки электронного текстового документа:

Ввод текста

При вводе текстовой информации следует придерживаться несложных правил:

Редактирование текста

Редактирование текста представляет собой процедуру внесения необходимых правок. Этот этап подготовки документа требует внимания и усидчивости.

В процессе редактирования текста изменяется содержание текста. В результате работы текст должен стать грамотным и понятным.

Основными функциями редактирования текста являются:

Редактирование текста осуществляется перемещением курсора в необходимое место с помощью мыши либо нажатием служебных клавиш (их комбинации).

Основные сочетания клавиш

Работать можно как с отдельными знаками, строками, абзацами,так и со всем текстом. Прежде всего нужный фрагмент следует выделить. Для этого нужно установить курсорную стрелку в начало элемента и, зажимая левую кнопку мышки, провести до его окончания.

Далее можно его скопировать, вырезать, удалить соответствующими кнопками или сочетаниями клавиш.

Microsoft Word – самая популярная программа для редактирования текста. Она обладает богатыми возможностями и удобным интерфейсом. Основные средства для редактирования текста в Word:

Форматирование текста

Следующий этап обработки текста заключается в его форматировании. Форматирование текста подразумевает изменение внешнего вида документа. Информация подвергается оформлению по необходимым критериям.

Форматирование текста представляет собой:

Вначале выбирается альбомная или книжная ориентация страницы (Разметка страницы → Ориентация).

Также в этой вкладке можно устанавливать различные параметры страницы (поля, размер, колонки и т.д.)

Нумерация страницы производится нажатием на кнопку Вставка → Номер страницы.

В процессе форматирования текста изменяется размер, начертание и цвет шрифта на Главной вкладке.

Оформление абзацев состоит в выравнивании текста относительно границ страницы (по левому или правому краю, центру или ширине).

Применение номерованных или маркированных списков позволит облегчить восприятие текстовой информации.

Подготовка документа заканчивается его распечатыванием. Для этой цели используют принтеры (устройства, переводящие электронную информацию на бумажный носитель) разного типа:

Лазерные принтеры обеспечивают самую качественную печать.

Источник

§ 3. Виды информации в современном мире

Что относится к текстовой информации примеры Что относится к текстовой информации примеры

Информатика, 6 класс (Кирись, Мулица, 2012)

Информация может быть представлена по-разно-му. Есть текстовая (алфавитно-цифровая) информация, графическая, звуковая, видеоинформация и смешанная информация.

К текстовой информации относятся тексты, числа, ноты. Примерами текстовой информации могут быть расписание уроков (рис. 24), книга, таблица умножения, чек в магазине.

Что относится к текстовой информации примеры

Фотография самосвала БелАЗ (рис. 25) — это пример графической информации. К графической информации относятся также рисунки, фотографии, картины, скульптуры (рис. 26).

Что относится к текстовой информации примеры

Всё то, что мы можем слышать: речь, музыка, звуковые сигналы, шум, — относится к звуковой информации. Например, рассказ друга о летних каникулах, звонок на урок, звук проезжающего поезда, журчание ручейка, шелест листьев, шум дождя, лай собаки. Источниками звуковой информации могут быть телефон, радио, телевизор.

Если мы посмотрим на карту Республики Беларусь (рис. 27), то увидим и графическую, и текстовую информацию одновременно.

Такая информация, в которой одновременно есть несколько видов информации, например графическая и текстовая, звуковая и графическая, называется смешанной.

Что относится к текстовой информации примеры

Одновременная передача звуковой и графической информации — это видеоинформация. Мы получаем её, когда смотрим мультфильм по телевизору или видеоролик на компьютере. Видеоинформация — пример смешанной информации.

Это интересно

Первый в мире телефон (рис. 28) изобрёл Александр Белл. В нём было много недостатков. Дальность связи была небольшой. Трубка служила как для передачи, так и для приёма речи. Особенностью телефона было отсутствие звонка. Сейчас это кажется смешным, но вызов происходил через трубку при помощи свистка.

Что относится к текстовой информации примеры

Сегодня многообразие телефонов не перестаёт удивлять. Дисковые, кнопочные, радиотелефоны. О моделях мобильных телефонов говорить можно бесконечно. Телефоны обеспечивают связь по всему миру, позволяют людям передавать информацию на расстоянии.

Коротко о главном

• Информация бывает текстовой, графической, звуковой, видеоинформацией.

2. К какому виду можно отнести информацию, которую мы получаем при прослушивании радиопередачи? В телефонном разговоре?

Упражнения

1. Определите, к какому виду относится информация, представленная в таблице.

Что относится к текстовой информации примеры

3. Посмотрите внимательно на рисунки 29—32. Назовите виды информации, которые получают люди.

Что относится к текстовой информации примеры

4. Вспомните, как выглядит ваше любимое животное. Нарисуйте его. По просьбе учителя расскажите об этом животном и покажите, какие звуки оно издаёт. Определите, к какому виду относится созданная вами информация.

5. Прочитайте текст.

Многие растения обладают лечебными свойствами. С помощью отвара из цветков кувшинки можно снизить темпера-туру, унять боль. Плоды шиповника используются для лечения простуды, болезней желудка, при переломах. Настойка из цветков ноготков помогает залечить мелкие раны, порезы, ожоги. Отвары и настойки из корней цикория усиливают аппетит, помогают работе сердца.

Какую информацию вы получили при чтении текста? Что помогло вам больше узнать о цикории, шиповнике, кувшинке и ноготках?

Какие ещё лекарственные растения вы знаете?

ГЛАВА 1. ПОНЯТИЕ ОБ ИНФОРМАЦИИ. СПОСОБЫ ПОЛУЧЕНИЯ И ОБРАБОТКИ ИНФОРМАЦИИ

ГЛАВА 2. ТЕХНИКА БЕЗОПАСНОСТИ ПРИ РАБОТЕ С ПЕРСОНАЛЬНЫМ КОМПЬЮТЕРОМ

ГЛАВА 3. ЗНАКОМСТВО С ПЕРСОНАЛЬНЫМ КОМПЬЮТЕРОМ

ГЛАВА 4. РАБОЧИЙ СТОЛ WINDOWS

ГЛАВА 5. МАНИПУЛЯТОР МЫШЬ. ПРИЁМЫ РАБОТЫ С МЫШЬЮ

ГЛАВА 6. КЛАВИАТУРА. НАЗНАЧЕНИЕ ГРУПП КЛАВИШ

ГЛАВА 7. МЕНЮ ПУСК. ОКНА WINDOWS

ГЛАВА 8. СТАНДАРТНЫЕ ПРИЛОЖЕНИЯ WINDOWS

Источник

Что относится к текстовой информации примеры

Юнико́д — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.
Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода». Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.
Стандарт состоит из двух основных разделов: универсальный набор символов и семейство кодировок. Универсальный набор символов задаёт однозначное соответствие символов кодам — элементам кодового пространства, представляющим неотрицательные целые числа. Семейство кодировок определяет машинное представление последовательности кодов UCS.
Коды в стандарте Юникод разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. Далее расположены области знаков различных письменностей, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем. Под символы кириллицы выделены области знаков с кодами от U+0400 до U+052F, от U+2DE0 до U+2DFF, от U+A640 до U+A69F (см. Кириллица в Юникоде).

Универсальная система кодирования (Юникод) представляет собой набор графических символов и способ их кодирования для компьютерной обработки текстовых данных.
Графические символы — это символы, имеющие видимое изображение. Графическим символам противопоставляются управляющие символы и символы форматирования. Графические символы включают в себя следующие группы: буквы, содержащиеся хотя бы в одном из обслуживаемых алфавитов; цифры; знаки пунктуации; специальные знаки (математические, технические, идеограммы и пр.); разделители.
Юникод — это система для линейного представления текста. Символы, имеющие дополнительные над- или подстрочные элементы, могут быть представлены в виде построенной по определённым правилам последовательности кодов (составной вариант, composite character) или в виде единого символа (монолитный вариант, precomposed character).

Модифицирующие символы
Графические символы в Юникоде подразделяются на протяжённые и непротяжённые (бесширинные). Непротяжённые символы при отображении не занимают места в строке. К ним относятся, в частности, знаки ударения и прочие диакритические знаки. Как протяжённые, так и непротяжённые символы имеют собственные коды. Протяжённые символы иначе называются базовыми, а непротяжённые — модифицирующими; причём последние не могут встречаться самостоятельно. Например, символ «á» может быть представлен как последовательность базового символа «a» (U+0061) и модифицирующего символа « ́» (U+0301) или как монолитный символ «á» (U+00C1).
Особый тип модифицирующих символов — селекторы варианта начертания. Они действуют только на те символы, для которых такие варианты определены. В версии 5.0 варианты начертания определены для ряда математических символов, для символов традиционного монгольского алфавита и для символов монгольского квадратного письма.

Термины «композиция» и «декомпозиция» понимают под собой соответственно соединение или разложение символов на составные части.

Примеры

Исходный текстNFDNFCNFKDNFKC
FrançaisFranc\u0327aisFran\xe7aisFranc\u0327aisFran\xe7ais
А, Ё, Й\u0410, \u0415\u0308, \u0418\u0306\u0410, \u0401, \u0419\u0410, \u0415\u0308, \u0418\u0306\u0410, \u0401, \u0419
\u304b\u3099\u304c\u304b\u3099\u304c
Henry IVHenry IVHenry IVHenry IVHenry IV
Henry ⅣHenry \u2163Henry \u2163Henry IVHenry IV

Юникод включает практически все современные письменности, в том числе:
арабскую, армянскую, бенгальскую, бирманскую, глаголицу, греческую, грузинскую, деванагари, еврейскую, кириллицу, китайскую (китайские иероглифы активно используются в японском языке, а также достаточно редко в корейском), коптскую, кхмерскую, латинскую, тамильскую, корейскую (хангыль), чероки, эфиопскую, японскую (которая включает в себя кроме китайских иероглифов ещё и слоговую азбуку),
и другие.

С академическими целями добавлены многие исторические письменности, в том числе: руны, древнегреческая, египетские иероглифы, клинопись, письменность майя, этрусский алфавит.

Способы представления
Юникод имеет несколько форм представления: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) и UTF-32 (UTF-32BE, UTF-32LE). Была разработана также форма представления UTF-7 для передачи по семибитным каналам, но из-за несовместимости с ASCII она не получила распространения и не включена в стандарт. 1 апреля 2005 годабыли предложены две шуточные формы представления: UTF-9 и UTF-18 (RFC 4042).
В Microsoft Windows NT и основанных на ней системах Windows 2000 и Windows XP в основном используется форма UTF-16LE. В UNIX-подобных операционных системах GNU/Linux,BSD и Mac OS X принята форма UTF-8 для файлов и UTF-32 или UTF-8 для обработки символов в оперативной памяти.

UTF-8
UTF-8 — представление Юникода, обеспечивающее наилучшую совместимость со старыми системами, использовавшими 8-битные символы. Текст, состоящий только из символов с номером меньше 128, при записи в UTF-8 превращается в обычный текст ASCII. И наоборот, в тексте UTF-8 любой байт со значением меньше 128 изображает символ ASCII с тем же кодом. Остальные символы Юникода изображаются последовательностями длиной от 2 до 6 байт (на деле, только до 4 байт, поскольку в Юникоде нет символов с кодом больше 10FFFF, и вводить их в будущем не планируется), в которых
первый байт всегда имеет вид 11xxxxxx, а остальные — 10xxxxxx.
Формат UTF-8 был изобретён 2 сентября 1992 года Кеном Томпсоном и Робом Пайком и реализован в Plan 9. Сейчас стандарт UTF-8 официально закреплён в документах RFC 3629 и ISO/IEC 10646 Annex D.
Символы UTF-8 получаются из Unicode следующим образом:

Порядок байтов
В потоке данных UTF-16 старший байт может записываться либо перед младшим, либо после младшего. Аналогично существует два варианта четырёхбайтной кодировки — UTF-32BE и UTF-32LE.
Для определения формата представления Юникода в начало текстового файла записывается сигнатура — символ U+FEFF (неразрывный пробел с нулевой шириной), также именуемыйметкой порядка байтов (англ. byte order mark, BOM). Это позволяет различать UTF-16LE и UTF-16BE, поскольку символа U+FFFE не существует. Также этот способ иногда применяется для обозначения формата UTF-8, хотя к этому формату и неприменимо понятие порядка байтов. Файлы, следующие этому соглашению, начинаются с таких последовательностей байтов:UTF-8 EF BB BFUTF-16BE FE FFUTF-16LE FF FEUTF-32BE 00 00 FE FFUTF-32LE FF FE 00 00
К сожалению, этот способ не позволяет надёжно различать UTF-16LE и UTF-32LE, поскольку символ U+0000 допускается Юникодом (хотя реальные тексты редко начинаются с него).
Файлы в кодировках UTF-16 и UTF-32, не содержащие BOM, должны иметь порядок байтов big-endian (unicode.org).

Юникод и традиционные кодировки
Внедрение Юникода привело к изменению подхода к традиционным 8-битным кодировкам. Если раньше кодировка задавалась шрифтом, то теперь она задаётся таблицей соответствия между данной кодировкой и Юникодом. Фактически 8-битные кодировки превратились в форму представления некоторого подмножества Юникода. Это намного упростило создание программ, которые должны работать с множеством разных кодировок: теперь, чтобы добавить поддержку ещё одной кодировки, надо всего лишь добавить ещё одну таблицу перекодировки в Юникод.
Кроме того, многие форматы данных позволяют вставлять любые символы Юникода, даже если документ записан в старой 8-битной кодировке. Например, в HTML можно использоватькоды с амперсандом.

Реализации
Большинство современных операционных систем в той или иной степени обеспечивают поддержку Юникода.
В операционных системах семейства Windows NT для внутреннего представления имён файлов и других системных строк используется двухбайтовая кодировка UTF-16LE. Системные вызовы, принимающие строковые параметры, существуют в однобайтном и двухбайтном вариантах. Подробнее см. в статье Юникод в операционных системах Microsoft.
UNIX-подобные операционные системы, в том числе GNU/Linux, BSD, Mac OS X, используют для представления Юникода кодировку UTF-8. Большинство программ могут работать с UTF-8 как с традиционными однобайтными кодировками, не обращая внимания на то, что символ представляется как несколько последовательных байт. Для работы с отдельными символами строки обычно перекодируются в UCS-4, так что каждому символу соответствует машинное слово.
Одной из первых успешных коммерческих реализаций Юникода стала среда программирования Java. В ней принципиально отказались от 8-битного представления символов в пользу 16-битного. Сейчас большинство языков программирования поддерживают строки Юникода, хотя их представление может различаться в зависимости от реализации.

Методы ввода
Поскольку ни одна раскладка клавиатуры не может позволить вводить все символы Юникода одновременно, от операционных систем и прикладных программ требуется поддержка альтернативных методов ввода произвольных символов Юникода.

Microsoft Windows
Начиная с Windows 2000, служебная программа «Таблица символов» (charmap.exe) показывает все символы в ОС и позволяет копировать их в буфер обмена. Похожая таблица есть, например, в Microsoft Word.
Иногда можно набрать шестнадцатеричный код, нажать Alt+X, и код будет заменён на соответствующий символ, например, в WordPad, Microsoft Word. В редакторах Alt+X выполняет и обратное преобразование.
Во многих программах MS Windows, чтобы получить символ Unicode, нужно при нажатой клавише Alt набрать десятичное значение кода символа на цифровой клавиатуре. Например, полезными при наборе кириллических текстов будут комбинации Alt+0171 («) и Alt+0187 (»). Интересны также комбинации Alt+0133 (…) и Alt+0151 (—).

Macintosh
В Mac OS 8.5 и более поздних версиях поддерживается метод ввода, называемый «Unicode Hex Input». При зажатой клавише Option требуется набрать четырёхзначный шестнадцатеричный код требуемого символа. Этот метод позволяет вводить символы с кодами, большими U+FFFF, используя пары суррогатов; такие пары операционной системой будут автоматически заменены на одиночные символы. Этот метод ввода перед использованием нужно активизировать в соответствующем разделе системных настроек и затем выбрать как текущий метод ввода в меню клавиатуры.
Начиная с Mac OS X 10.2, существует также приложение «Character Palette», позволяющее выбирать символы из таблицы, в которой можно выделять символы определённого блока или символы, поддерживаемые конкретным шрифтом.

GNU/Linux
В GNOME также есть утилита «Таблица символов», позволяющая отображать символы определённого блока или системы письма и предоставляющая возможность поиска по названию или описанию символа. Когда код нужного символа известен, его можно ввести в соответствии со стандартом ISO 14755: при зажатых клавишах Ctrl и Shift ввести шестнадцатеричный код (начиная с некоторой версии GTK+ ввод кода нужно предварить нажатием клавиши «U»). Вводимый шестнадцатеричный код может иметь до 32 бит в длину, позволяя вводить любые символы Юникода без использования суррогатных пар.
Все приложения X Window, включая GNOME и KDE, поддерживают ввод при помощи клавиши Compose. Для клавиатур, на которых нет отдельной клавиши Compose, для этой цели можно назначить любую клавишу — например, Caps Lock.
Консоль GNU/Linux также допускает ввод символа Юникода по его коду — для этого десятичный код символа нужно ввести цифрами расширенного блока клавиатуры при зажатой клавише Alt. Можно вводить символы и по их шестнадцатеричному коду: для этого нужно зажать клавишу AltGr, и для ввода цифр A—F использовать клавиши расширенного блока клавиатуры от NumLock до Enter (по часовой стрелке). Поддерживается также и ввод в соответствии с ISO 14755. Для того чтобы перечисленные способы могли работать, нужно включить в консоли режим Юникода вызовом unicode_start(1) и выбрать подходящий шрифт вызовом setfont(8).
Mozilla Firefox для Linux поддерживает ввод символов по ISO 14755.
источник

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *