Что называется минимальной единицей текстовой информации
Информатика. 7 класс
Конспект урока
Единицы измерения информации
Перечень вопросов, рассматриваемых в теме:
Каждый символ информационного сообщения несёт фиксированное количество информации.
Единицей измерения количества информации является бит – это наименьшаяединица.
1 Кб (килобайт) = 1024 байта= 2 10 байтов
1 Мб (мегабайт) = 1024 Кб = 2 10 Кб
1 Гб (гигабайт) = 1024 Мб = 2 10 Мб
1 Тб (терабайт) =1024 Гб = 2 10 Гб
Формулы, которые используются при решении типовых задач:
Информационный объём сообщения определяется по формуле:
I – объём информации в сообщении;
К – количество символов в сообщении;
i – информационный вес одного символа.
Теоретический материал для самостоятельного изучения.
Любое сообщение несёт некоторое количество информации. Как же его измерить?
Одним из способов измерения информации является алфавитный подход, который говорит о том, что каждый символ любого сообщения имеет определённый информационный вес, то есть несёт фиксированное количество информации.
Сегодня на уроке мы узнаем, чему равен информационный вес одного символа и научимся определять информационный объём сообщения.
Что же такое символ в компьютере? Символом в компьютере является любая буква, цифра, знак препинания, специальный символ и прочее, что можно ввести с помощью клавиатуры. Но компьютер не понимает человеческий язык, он каждый символ кодирует. Вся информация в компьютере представляется в виде нулей и единичек. И вот эти нули и единички называются битом.
Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется один бит.
Эту формулу можно применять для вычисления информационного веса одного символа любого произвольного алфавита.
Алфавит древнего племени содержит 16 символов. Определите информационный вес одного символа этого алфавита.
Составим краткую запись условия задачи и решим её:
Информационный вес одного символа этого алфавита составляет 4 бита.
Сообщение состоит из множества символов, каждый из которых имеет свой информационный вес. Поэтому, чтобы вычислить объём информации всего сообщения, нужно количество символов, имеющихся в сообщении, умножить на информационный вес одного символа.
Математически это произведение записывается так: I = К · i.
Например: сообщение, записанное буквами 32-символьного алфавита, содержит 180 символов. Какое количество информации оно несёт?
I = 180 · 5 = 900 бит.
Итак, информационный вес всего сообщения равен 900 бит.
В алфавитном подходе не учитывается содержание самого сообщения. Чтобы вычислить объём содержания в сообщении, нужно знать количество символов в сообщении, информационный вес одного символа и мощность алфавита. То есть, чтобы определить информационный вес сообщения: «сегодня хорошая погода», нужно сосчитать количество символов в этом сообщении и умножить это число на восемь.
I = 23 · 8 = 184 бита.
Значит, сообщение весит 184 бита.
Как и в математике, в информатике тоже есть кратные единицы измерения информации. Так, величина равная восьми битам, называется байтом.
Бит и байт – это мелкие единицы измерения. На практике для измерения информационных объёмов используют более крупные единицы: килобайт, мегабайт, гигабайт и другие.
1 Кб (килобайт) = 1024 байта= 2 10 байтов
1 Мб (мегабайт) = 1024 Кб = 2 10 Кб
1 Гб (гигабайт) = 1024 Мб = 2 10 Мб
1 Тб (терабайт) =1024 Гб = 2 10 Гб
Итак, сегодня мы узнали, что собой представляет алфавитный подход к измерению информации, выяснили, в каких единицах измеряется информация и научились определять информационный вес одного символа и информационный объём сообщения.
Материал для углубленного изучения темы.
Как текстовая информация выглядит в памяти компьютера.
Набирая текст на клавиатуре, мы видим привычные для нас знаки (цифры, буквы и т.д.). В оперативную память компьютера они попадают только в виде двоичного кода. Двоичный код каждого символа, выглядит восьмизначным числом, например 00111111. Теперь возникает вопрос, какой именно восьмизначный двоичный код поставить в соответствие каждому символу?
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код ‑ просто порядковый номер символа в двоичной системе счисления.
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.Таблица для кодировки – это «шпаргалка», в которой указаны символы алфавита в соответствии порядковому номеру. Для разных типов компьютеров используются различные таблицы кодировки.
Таблица ASCII (или Аски), стала международным стандартом для персональных компьютеров. Она имеет две части.
В этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.
Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:
01100110 01101001 01101100 01100101.
А теперь попробуем решить обратную задачу. Какое слово записано следующим двоичным кодом:
01100100 01101001 01110011 01101011?
В таблице 2 приведен один из вариантов второй половины кодовой таблицы АSСII, который называется альтернативной кодировкой. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования.
Вывод: все тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные для нас буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.
Из памяти же компьютера текст может быть выведен на экран или на печать в символьной форме.
Сейчас используют целых пять систем кодировок русского алфавита (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO). Из-за количества систем кодировок и отсутствия одного стандарта, очень часто возникают недоразумения с переносом русского текста в компьютерный его вид. Поэтому, всегда нужно уточнять, какая система кодирования установлена на компьютере.
Разбор решения заданий тренировочного модуля
№1. Определите информационный вес символа в сообщении, если мощность алфавита равна 32?
№2. Выразите в килобайтах 2 16 байтов.
2 6 = 64, а 2 10 байт – это 1 Кб. Значит, 64 · 1 = 64 Кб.
№3. Тип задания: выделение цветом
8 х = 32 Кб, найдите х.
Единицы измерения информации
За единицу измерения количества информации принимается такое количество информации, которое содержится в сообщении, уменьшающем неопределенность знания в 2 раза. Такая единица называется битом.
Минимальной единицей измерения количества информации является бит, а следующей по величине единицей – байт, причем
В международной системе СИ используют десятичные приставки «Кило» (103), «Мега» (106), «Гига» (109),… В компьютере информация кодируется с помощью двоичной знаковой системы, поэтому в кратных единицах измерения количества информации используется коэффициент 2n.
1 килобайт (Кбайт) = 210 байт = 1024 байт
1 мегабайт (Мбайт) = 210 Кбайт = 1024 Кбайт
1 гигабайт (Гбайт) = 210 Мбайт = 1024 Мбайт
1 терабайт (Тбайт) = 210 Гбайт = 1024 Гбайт
Терабайт – очень крупная единица измерения информации, поэтому применяется крайне редко. Всю информацию, которое накопило человечество, оценивают в десятки терабайт.
Двоичное кодирование текстовой информации Начиная с конца 60-х годов компьютеры все больше стали использоваться для обработки текстовой информации, и в настоящее время большая часть персональных компьютеров в мире значительную часть времени занято обработкой именно ТЕКСТОВОЙ информации.
Для представления текстовой информации обычно используется 256 различных символов (прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т. д.). Поставим вопрос: «Какое количество бит информации или двоичных разрядов необходимо, чтобы закодировать 256 различных символов?»
256 различных символов можно рассматривать как 256 различных состояний (событий). В соответствии с вероятностным подходом к измерению количества информации необходимое количество информации для двоичного кодирования 256 символов равно;
I = log2 256 = 8 бит = 1 байт
Следовательно, для двоичного кодирования 1 символа необходим 1 байт информации или 8 двоичных разрядов. Таким образом, каждому символу соответствует своя уникальная последовательность из восьми нулей и единиц.
Присвоение символу конкретного двоичного кода — это вопрос соглашения, которое фиксируется в кодовой таблице. К сожалению, существуют пять различных кодировок русских букв, поэтому тексты — созданные в одной кодировке, не будут правильно отображаться в другой.
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 («Код обмена информацией, 8-битный»). Эта кодировка применяется на компьютерах с операционной системой UNIX.
Наиболее распространенная кодировка — это стандартная кириллическая кодировка Microsoft Windows, обозначаемая сокращением СР1251 («СР» означает «Code Page», «кодовая страница»). Все Windows-приложения, работающие с русским языком, поддерживают эту кодировку.
Для работы в среде операционной системы MS DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft — кодировка CP866.
Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Мае).
Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.
Наконец, появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, а целых 65 536. Эту кодировку поддерживает пакет Microsoft Office 97-2003.
Двоичное кодирование текста происходит следующим образом: при нажатии на определенную клавишу в компьютер передается определенная последовательность электрических импульсов, причем каждому символу соответствует своя последовательность электрических импульсов (нулей и единиц на машинном языке). Программа драйвер клавиатуры и экрана по кодовой таблице определяет символ и создает его изображение на экране.
Таким образом, тексты хранятся в памяти компьютера в двоичном коде и программным способом преобразуются в изображения на экране.
Двоичное кодирование графической информации
С 80-х годов бурно развивается технология обработки на компьютере ГРАФИЧЕСКОЙ информации. Компьютерная графика широко используется в компьютерном моделировании в научных исследованиях, компьютерных тренажерах, компьютерной анимации, деловой графике, играх и т. д.
В последние годы, в связи с резким ростом аппаратных возможностей персональных компьютеров, пользователи получили возможность обрабатывать ВИДЕО информацию.
Графическая информация на экране дисплея представляется в виде изображения. Которое формируется из точек (пикселей). В современных компьютерах разрешающая способность (количество точек на экране дисплея), а также количество цветов зависит от видеоадаптера и может меняться программно.
Цветные изображения могут иметь различные режимы: 16 цветов, 256 цветов, 65 536 цветов (high color), 16 777 216 цветов (true color). Каждый цвет представляет собой одно из вероятных состояний точки экрана. Рассчитаем количество бит на точку, необходимых для режима true color: I = logs 65 536-16 бит = 2 байт.
Наиболее распространенной разрешающей способностью экрана является разрешение 800 на 600 точек, т.е. 480000 точек. Рассчитаем необходимый для режима true color объем видеопамяти: 1 = 2 байт 480 000 = 960 000 байт = 937,5 Кб. Аналогично рассчитывается объем видеопамяти, необходимый для хранения битовой карты изображений при других видеорежимах.
Единицы измерения информации
Содержание
Мы с вами уже так много говорим о компьютере, программах и их характеристиках, возможных действиях и их последствиях, о файлах и папках, а также многом другом. Вы знаете, что информация записывается на жесткий диск. Она хранится в виде файлов. Но сколько таких файлов сможет вместить Ваш винчестер?
Как узнать ответ на этот вопрос, если не знать, в чем же измеряется информация?
Ответ на этот вопрос Вы узнаете сегодня, если прочитаете данный опус.
Минимальная единица информации — бит
Начнем с малого. Единицы измерения информации ранжируются точно так же, как, к примеру, единицы массы или расстояния. Но если в 1 килограмме 1000 граммов, а в 1 метре 1000 миллиметров, то с измерением информации все немного иначе, хотя принцип и остается тот же.
Чтобы было проще понимать, что такое байт или что такое бит, сперва разберемся с некоторыми основами цифровой информации, то есть той, что хранится и обрабатывается на Вашем компьютере.
Почему цифровая? Сейчас объясню.
Вы можете передавать свои знания и какие-то новости посредством устной речи. Она ведь состоит из гласных и согласных какого-то языка, в нашем случае русского. Компьютер не умеет разговаривать, но и он должен передавать, получать и обрабатывать информацию. Так вот он делает это посредством набора единичек и нолей — двоичного кода. Вся информация, с которой работает Ваш компьютер, выглядит для него примерно вот так: 01 или 0110, или 010110101010. Разумеется, чем больше файл, тем длиннее и эта запись. Кстати, повторите урок о том, что такое файл. По сути, она просто может быть очень длинной, но не бесконечной. Именно поэтому данный вид информации и называется цифровым, т.е. последовательностью единичек и нулей. Замечу, что компьютер может понять только такой язык.
Самой маленькой величиной является бит (анг. BInary digiT – двоичная цифра). Это простейшая величина, которая может хранить лишь одно значение — либо «ноль», либо «единицу». Вот Вам строгое определение того, что такое бит:
Бит — это один двоичный разряд, принимающий одно из двух значений – «0» или «1».
Другими словами, бит – это небольшая емкость, которая хранит в себе самый маленький запас информации.
Не пытайтесь заучивать определение, просто поймите, насколько это мало. Для сравнения, обычная буква в текстовом редакторе для компьютера является набором из 8-ми нолей и единиц, т.е. 8-ми бит.
Для развития Вашей эрудиции скажу, что 0 и 1 — это как «да» (есть сигнал) и «нет» (нет сигнала) для компьютера. Другими словами, это равноценные значения.
Что такое байт
Думаю, все понимают, что измерять всю информацию на винчестере в битах будет очень и очень неудобно. Это все равно, что измерять массу солнца в граммах. Поэтому Вам придется познакомиться с новой величиной и узнать, что такое байт.
Один байт равен восьми бит. Именно восьми, а не десяти, как можно было бы подумать, разумно проводя аналогию с другими единицами измерения. Различных комбинаций ноликов и единичек в одном байте может быть превеликое множество (а точнее – «2» в 8 степени, т.е. 256 вариантов), но этого нам знать совершенно не обязательно. Просто запомним, 1 байт = 8 бит.
Обозначается байт прописной русской буквой «Б».
Производные от «бит»
Прежде, чем рассказать Вам, что такое килобайт, мегабайт, гигабайт и терабайт, упомяну, что существуют и такие единицы, как килобит, мегабит, гигабит и терабит. Вот формулы перевода одних единиц в другие (жирным шрифтом выделено обозначение величины):
1 килобит (Кбит) = 1024 бит («2» в 10 степени бит)
1 мегабит (Мбит) = 1024 килобит («2» в 10 степени килобит)
1 гигабит (Гбит) = 1024 мегабит («2» в 10 степени мегабит)
1 терабит (Тбит) = 1024 гигабит («2» в 10 степени гигабит)
Необычно, правда? Вспомните, что бит — это кодировка из двух цифр. Поэтому все последующие единицы представляют собой кодировку из количества цифр, равную двум в какой-либо степени (зависит от конкретной единицы измерения). Отсюда и такое некруглое значение.
Производные от «байт»
Но исчислять информацию в БИТАХ неудобно, как правило, все применяют «БАЙТЫ». Чаще всего самой популярной единицей измерения количества информации на Вашем компьютере является мегабайт. Если Вы наведете мышкой на любую папку с достаточным количеством информации, то всплывет маленькое пояснительное окошко, где будет указан объем этой папки. Вот таблица перевода одних единиц в другие (жирным шрифтом выделено обозначение величины):
1 килобайт (КБ) = 1024 байт («2» в 10 степени байт)
1 мегабайт (МБ) = 1024 килобайт («2» в 10 степени килобайт)
1 гигабайт (ГБ) = 1024 мегабайт («2» в 10 степени мегабайт)
1 терабайт (ТБ) = 1024 гигабайт («2» в 10 степени гигабайт)
Как видно, все аналогично битам.
Объем различных типов файлов
Уверен, многих интересует, как узнать, сколько же информации способен вместить именно Ваш компьютер, а точнее винчестер или жесткий диск. Кстати почитайте перед этим про локальные диски. Я Вас научу самому простому способу это сделать.
Откройте «Мой компьютер». Видите свои локальные диски? Единицы измерения информации, использующиеся для показа количества информации на локальных дисках у всех, как правило, одинаковы. Это гигабайты. Что такое гигабайт мы уже знаем, так что перейдем к подсчету свободного и занятого места на жестком диске. Под каждым диском есть специальное уведомление, где показано, сколько свободного места осталось и сколько всего информации диск может вместить.
Теперь приведу некоторые примеры файлов и их возможные объемы. Это поможет Вам ориентироваться в том, что Вы сможете записать на локальный диск, а что туда уже не влезет. Заметьте, один локальный диск НЕ МОЖЕТ задействовать место другого. Это значит, что файл целиком и полностью должен находиться на одном локальном диске. Есть, правда, специальные программы, позволяющие работать с локальными дисками, но об этом мы будем говорить в другой раз, так как тема сложная и достаточно объемная.
Кстати, различные типы файлов вы можете найти на своем рабочем столе.
Любите слушать музыку? Тогда Вам просто необходимо знать, что один музыкальный трек занимает до нескольких мегабайт объема памяти (в среднем, от 3 до 7). Попробуйте самостоятельно подсчитать, сколько таких мелодий вместит Ваш локальный диск, если на нем есть 1 гигабайт свободного места.
А как на счет того, чтобы посмотреть хороший фильм? Их объем, в зависимости от качества записи и длины трека, может занимать от 700 мегабайт до 1,5 гигабайта.
Для общего развития добавлю, что современные полноформатные игры могут занимать до нескольких десятков гигабайт. Не всякий локальный диск может выдержать такое.
Единицы измерения информации путать не стоит. Четко обращайте внимание на то, сколько места есть и сколько необходимо записать.
Современные жесткие диски могут содержать информацию объемом несколько терабайт. Что очень актуально, ведь качество игр, фильмов и даже музыки растет, что требует постоянного увеличения их информационного объема.
Теперь Вы знаете, что такое байты какие бывают производные от него. Вам известны рамки объема Ваших локальных дисков, а значит, Вы стали лучше понимать работу компьютера.
Компьютерная грамотность с Надеждой
Заполняем пробелы — расширяем горизонты!
Единицы измерения объема информации
Для измерения длины есть такие единицы, как миллиметр, сантиметр, метр, километр. Известно, что масса измеряется в граммах, килограммах, центнерах и тоннах. Бег времени выражается в секундах, минутах, часах, днях, месяцах, годах, веках. Компьютер работает с информацией и для измерения ее объема также имеются соответствующие единицы измерения.
Бит и байт — минимальные единицы измерения информации
Мы уже знаем, что компьютер воспринимает всю информацию через нули и единички.
Бит – это минимальная единица измерения информации, соответствующая одной двоичной цифре («0» или «1»).
Бит — это только 0 («ноль») или только 1 («единичка»). С помощью одного бита можно записать одно из двух состояний: 0 (ноль) или 1 (один). Чтобы записать два состояния, потребуется два бита. Бит — это минимальная ячейка памяти, меньше не бывает. В этой ячейке может храниться либо нолик, либо единичка.
Байт состоит из восьми бит. Используя один байт, можно закодировать один символ из 256 возможных (256 = 2 8 ). Таким образом, один байт равен одному символу, то есть 8 битам:
1 символ = 8 битам = 1 байту.
Буква, цифра, знак препинания — это символы. Одна буква — один символ. Одна цифра — тоже один символ. Один знак препинания (либо точка, либо запятая, либо вопросительный знак и т.п.) — снова один символ. Один пробел также является одним символом.
Кроме бита и байта, конечно же, есть и другие, более крупные единицы измерения информации.
Таблица байтов:
1 Кб (1 Килобайт) = 2 10 байт = 2*2*2*2*2*2*2*2*2*2 байт =
= 1024 байт (примерно 1 тысяча байт – 10 3 байт)
1 Мб (1 Мегабайт) = 2 20 байт = 1024 килобайт (примерно 1 миллион байт – 10 6 байт)
1 Гб (1 Гигабайт) = 2 30 байт = 1024 мегабайт (примерно 1 миллиард байт – 10 9 байт)
1 Тб (1 Терабайт) = 2 40 байт = 1024 гигабайт (примерно 10 12 байт). Терабайт иногда называют тонна.
1 Пб (1 Петабайт) = 2 50 байт = 1024 терабайт (примерно 10 15 байт).
1 Эксабайт = 2 60 байт = 1024 петабайт (примерно 10 18 байт).
1 Зеттабайт = 2 70 байт = 1024 эксабайт (примерно 10 21 байт).
1 Йоттабайт = 2 80 байт = 1024 зеттабайт (примерно 10 24 байт).
Такое приближение (или округление) вполне допустимо и является общепринятым.
Ниже приводится таблица байтов с английскими сокращениями (в левой колонке):
10 3 b = 10*10*10 b= 1000 b – килобайт
10 6 b = 10*10*10*10*10*10 b = 1 000 000 b – мегабайт
10 21 b – зеттабайт
10 24 b – йоттабайт
Выше в правой колонке приведены так называемые «десятичные приставки», которые используются не только с байтами, но и в других областях человеческой деятельности. Например, приставка «кило» в слове «килобайт» означает тысячу байт. В случае с километром она соответствует тысяче метров, а в примере с килограммом она равна тысяче грамм.
Продолжение следует…
Возникает вопрос: есть ли продолжение у таблицы байтов? В математике есть понятие бесконечности, которое обозначается как перевернутая восьмерка: ∞.
Напоследок парочка примеров по устройствам, на которые можно записать терабайты и гигабайты информации.
Есть удобный «терабайтник» – внешний жесткий диск, который подключается через порт USB к компьютеру. На него можно записать терабайт информации. Особенно удобно для ноутбуков (где смена жесткого диска бывает проблематична) и для резервного копирования информации. Лучше заранее делать резервные копии информации, а не после того, как все пропало.
CD-диски могут вмещать 650 Мб, 700 Мб, 800 Мб и 900 Мб.
DVD-диски рассчитаны на большее количество информации: 4.7 Гб, 8.5 Гб, 9.4 Гб и 17 Гб.
Упражнения по компьютерной грамотности
Статья закончилась, но можно еще прочитать:
Нашли ошибку? Выделите фрагмент текста и нажмите Ctrl+Enter.