Что необходимо сделать с информацией для ее дискретизации
Дискретизация
Что такое дискретизация в информатике
Для того чтобы решить определенные задачи, человек вынужден преобразовывать имеющуюся информацию из одной формы, в которой она представлена, в другую. Например, при чтении книги вслух мы преобразовываем информацию из текстовой (дискретной) формы в звуковую (непрерывную). Тот, кто занимается транскрибацией, преобразовывает звуковую форму в текстовую — совершает обратный процесс.
Для того чтобы передавать, хранить, автоматически обрабатывать данные, гораздо удобнее использовать дискретную форму представления информации. В этом и состоит ее основное преимущество. Именно поэтому информатика — наука, на которой основана работа всей компьютерной техники, — много внимания уделяет дискретизации.
Дискретизация — процесс, с помощью которого непрерывная форма представления информации преобразуется в дискретную.иеие
Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.
В информатике под понятием дискретности подразумевают алгоритм решения задачи, разбивающий весь процесс на определенное количество простых шагов (этапов), выполняемых поочередно.
Другими словами, дискретность — это набор действий, имеющих строго определенную, предписанную им алгоритмом последовательность. Каждое следующее действие может быть исполнено только при полном завершении предыдущего этапа.
Формы представления дискретной информации
Итак, существуют две формы представления информации:
Они принципиально отличаются в зависимости от своей природы.
Любой объект или явление, существующие в нашем мире, можно представить с помощью определенных физических величин и характеристик. Такое природное явление, как циклон, можно описать с помощью скорости ветра, температуры воздуха, количества выпавших осадков и другими характерными для циклона величинами.
Характерные физические величины для описания человека:
Все вышеуказанные физические величины имеют собственные определенные диапазоны. Количество значений, которые способна принимать та или иная величина, может быть бесконечным.
Подобные величины и ту информацию, которую они передают, принято называть непрерывными. Между значениями таких величин не бывает скачкообразных разрывов. Такая непрерывная величина, как масса тела, например, может принимать любые значения от нуля до бесконечности, включая дробные.
Кроме непрерывных величин, существуют и такие, которые обозначают целое, а не дробное количество: например, число музыкантов в оркестре или число атомов в молекуле вещества.
Если объект изучения обладает характерным свойством в какие-то моменты принимать строго конкретные значения (знаковые или числовые), то это свойство называют дискретной информацией об объекте.
Особенность дискретной информации — ее прерывистость, возможность пронумеровать и представить в цифровом виде с использованием логических нуля и единицы.
Дискретными значениями являются:
Для того чтобы обладать наиболее полными сведениями об объекте или явлении, чаще всего их описывают с помощью двух форм представления информации одновременно.
Геометрическую фигуру можно описать с помощью ее дискретного значения (квадрат) и непрерывного значения длины его стороны (15,25 см).
При использовании пружинных весов или весов со стрелкой измеряемая величина (масса) является сама по себе непрерывной. Но весы переводят этот показатель в дискретную форму в зависимости от того, к какому делению шкалы ближе окажется бегунок пружинных весов или стрелка.
В этом случае, чем более мелкие деления на шкале, тем более точной будет дискретное представление информации о массе взвешиваемого предмета.
Дискретную информацию принято представлять в символьном виде, с использованием знаков — натуральных чисел или букв. С помощью натуральных чисел можно представить деления на шкале измерительного прибора, нумерацию страниц книги или домов на улице города.
Цифровой вариант представления информации очень удобен для использования в ЭВМ.
В повседневной жизни для представления информации помимо цифр используют слова, составленные из букв какого-либо алфавита (русского, латинского, китайского и пр.). С помощью слов обозначают имена и свойства объектов, перечисляют действия.
Также широкое применение получили различные математические символы, знаки препинания.
Использование совокупности всех имеющихся символов, условно именуемой «алфавитом», дает возможность создания различных информационных объектов.
Такой вид представления информации называется символьным, так как она имеет дискретную природу, заключенную в использовании последовательности различных символов.
Существует большое количество «алфавитов» или систем письменности, с помощью которых можно передать (записать, сохранить) одну и ту же информацию различными символическими наборами.
В качестве примера поставим в соответствие каждой букве алфавита ее порядковый номер. В этом случае с помощью цифр от 0 до 9 можно записать текст целой книги.
Более того, ту же самую информацию можно закодировать с помощью двоичного кода, используя всего 2 символа — 0 и 1.
К дискретным формам представления информации относят также ее графическое изображение в виде различных чертежей, графиков, схем.
Информационные параметры сигнала
Дискретизация в системах обработки информации выглядит как обмен информацией, который происходит с помощью сигналов. Носителями таких сигналов выступают физические величины, которые могут быть представлены распределением сигналов в пространстве и времени.
Показатели соответствующих временных функций являются информационными параметрами сигнала. Среди таких показателей могут быть:
Как происходит дискретизация, основные этапы
По аналогии с видом представления информации сигналы классифицируют также на 2 типа:
В случае аналогового сигнала параметры внутри отдельных диапазонов могут принимать любые значения в любой момент времени.
В случае дискретного сигнала каждому установленному моменту времени соответствует определенное значение параметра. Дискретный сигнал описывает непрерывную информацию в виде точек графика, построенного в системе координат. В ней ось абсцисс представляет собой время сигнала в дискретном изображении, а ось ординат отражает дискретное представление уровня сигнала.
Преобразование аналогового сигнала в дискретный называется дискретизацией, которая происходит как по времени, так и по уровню сигнала.
Рассмотрим, как происходит дискретизация на примере самописцев атмосферного давления. Эти приборы работают на метеорологических станциях. Они в непрерывном режиме записывают изменение атмосферного давления на протяжении длительного времени в виде барограмм — кривых, вычерченных прибором в течение нескольких часов.
Одна из таких барограмм представлена ниже:
Взяв график за основу, можно снять с него необходимую нам информацию. Например, показания самописца в начале измерения атмосферного давления и каждый последующий час. Полученные данные заносятся в таблицу:
Таким образом, мы смогли преобразовать полученную в аналоговой (непрерывной) форме информацию в дискретный вид.
Если внимательно сравнить данные таблицы с данными графика, то можно заметить некоторую потерю точности. Так, самого большого значения давление достигло во время четвертого часа работы самописца, но в таблицу эта информация не попала.
Чтобы увеличить точность процесса дискретизации, следует брать меньшие временные интервалы. Например, снимать данные с барограммы не раз в час, а каждые полчаса или пятнадцать минут. В этом случае мы получим более точную картину изменения давления, представленную в дискретной форме.
Дискретные сигналы легче обрабатывать и хранить, чем аналоговые. Кроме того, на них практически не влияют помехи во время передачи на большие расстояния, что является их явным преимуществом. Поэтому использование дискретных сигналов получило более широкое распространение по сравнению с непрерывными.
Побочные эффекты дискретизации и квантования
Как мы уже выяснили, дискретизация происходит как по уровню (амплитуде) сигнала, так и по времени. При этом дискретизацию по уровню часто называют квантованием. В научной литературе могут встречаться оба термина, которые обозначают процесс оцифровки сигнала.
Поскольку все сигналы в природе имеют аналоговое происхождение, то для их хранения, обработки и передачи необходимо сначала оцифровывать сигналы — произвести с помощью аналого-цифровых приборов их дискретизацию и квантование по уровню.
После этого любой сигнал можно закодировать, провести его цифровую обработку, передать на расстоянии и хранить. При этом часто возникает необходимость преобразовать полученный цифровой сигнал обратно в аналоговый.
Подобным образом, например, происходит звуковое воспроизведение аудиозаписей с компакт-дисков. Цифровые сигналы, записанные в области высоких частот, преобразуются в низкочастотные звуковые.
Обратное преобразование сигнала происходит с определенной степенью точности, которая зависит от:
Следует учесть, что чем больше будет частота и число уровней, тем больше будет и цифровой информации, а значит, потребуется соответствующее количество ресурсов для ее передачи, хранения, обработки. Поэтому приходится соблюдать разумный компромисс между желаемой точностью воспроизведения сигнала и размерами обеспечивающих ее ресурсов.
Представление в компьютере информации: дискретизация и квантование
Большую часть информации об окружающей среде человек воспринимает через органы зрения и слуха. Это естественные для нас формы информации, которые мы сохраняем в виде изображений и звуковых записей на различных носителях.
Компьютерная же память не резиновая. В ней невозможно сохранить бесконечно много информации. Только ограниченное количество, пусть и большое. Поэтому предполагаемое для описания пространство, должно быть умозрительно разделено на ограниченное количество элементов. И именно описание этих элементов будет сохранено в компьютерной памяти.
Дискретизация – это и есть разделение пространства или времени на фиксированные по размеру области (точки, которые точками, по сути, не являются) или отрезки. Так описываемое двумерное изображение разбивается на маленькие плоскости. В пределах каждой такой плоскости характеристики изображения считаются одинаковыми. Понятно, что при этом часть информации теряется. Мы не получаем точную копию реального объекта, мы лишь описываем его существенные характеристики.
Итак, мы условно разбили реальность на области и планируем хранить информацию только о них. Но какую информацию? Если это изображение, то наверно это должны быть какие-то характеристики изображения. Чем характеризуется изображение? Как минимум цветом и яркостью. А ведь эти характеристики также не дискретны, а могут иметь множество непрерывных значений и подзначений. Так степень яркости можно измерять очень точно, а можно приблизительно. Если обозначить полное отсутствие освещенности нулем, а ее максимальное значение – 99 и хранить только целые значения, то их окажется всего 100. Для возможности хранения 100 различных значений достаточно 2 7 = 128 бит. Но ведь можно измерять и сохранять степень яркости очень точно до тысячных долей единицы и тогда для хранения потребуется намного больше памяти (чтобы было можно записать туда все возможные значения).
Разделение непрерывного ряда значений какой-либо характеристики на ограниченное количество диапазонов называют квантованием. В компьютере сохраняется лишь номер диапазона, в который попало конкретное значение свойства.
Если при дискретизации разделяется время или пространство, то при квантовании этому подвергаются возможные значения свойств.
Понятно, что чем более дискретна и квантована естественная информация, тем более точно она сохранена в памяти компьютера. Однако этой памяти потребуется больше.
Человеческие органы чувств имеют свои ограничения. Поэтому различие в цвете двух точек мы можем не уловить, хотя их физические характеристики длин волн могут различаться. Поэтому в определенных значениях потеря информации может быть незаметна для человека.
Дискретность информации и понятие дискретизации: следование от бытовых примеров к информатике
Информация – понятие ёмкое, вмещающее весь мир, что окружает нас. Элементами ее выступают явления, вещи, искусство, история и пр.
Формы предоставления информации
Представляется информация в таких формах:
Явления и объекты обладают характерными физическими величинами. Человека, к примеру, могут характеризовать:
А в природе, в виде примера, можно обозначить циклон. Его характерные величины – количество выпадающих осадков, температура воздуха, скорость ветра и т. д.
То есть для физических величин характерен определённый диапазон. Характеризующие величины могут оказаться почти подобными. Однако они различаются, и количество значений, принимаемых определённой величиной, бесконечно в своём разнообразии.
Эти величины именуются непрерывными, как и та информация, что выражается с помощью подобных величин. Ее также называют непрерывной. Причём непрерывность – основное свойство таких величин. Другими словами, между значениями не может быть разрывов.
Примером может служить значение массы тела. Это величина непрерывная, так как показатель способен колебаться от величины, исходящей с начального значения 0, и до бесконечности.
Но существуют и другие величины, помимо непрерывных, обозначающие количество, к примеру, атомов в молекуле, спортсменов на стадионе и пр. Значения таких показателей – целые числа, а не дробные.
Определение понятия дискретности
Такие целые числа можно пронумеровать. Поэтому, пытаясь глубоко разобраться, что такое дискретная информация, следует учитывать ее прерывистость и цифровое обозначение признаков в виде логического нуля и такой же логической единицы.
Выходит, что две основные формы информации имеют принципиальные различия, заключающиеся в природе каждой величины. Но чтобы зафиксировать более объёмные сведения о явлении или объекте, часто используют эти информации единовременно.
Пример 1. Высота какого-то треугольника – 26, 04 см. Здесь дискретное представление информации заключается в обозначении понятия «треугольник» – конкретной геометрической фигуры. А вот значение 26,04 – это информация непрерывная, она передаёт сведения об одном из показателей этой фигуры.
Пример 2. Берутся пружинные весы. Измеряемая ими масса – величина непрерывная. Информация заключена в длине отрезка, по которому перемещается показатель весов, ведь на этот механизм непрерывно воздействует масса тела.
Некоторые механические ювелирные весы имеют шкалу в диапазоне от 0,1 г (полкарата) до 1000 г. Самоцвет будет обладать одним из конкретных показателей из этого набора значений – к примеру, 8,3. Значит этим однозначным показателем закладывается дискретная форма представления информации о массе.
Удаётся даже по дискретному представлению восстановить непрерывную величину. Но в результате дискретная форма выведенного образа может не совпадать с реальным подлинником.
Что такое дискретность в информатике
Другими словами, дискретность это в информатике возможность решить задачу путём распределения процесса на отдельные последовательные шаги. Каждая сформированная совокупность команд или предписаний выделена. Только исполнив одну команду, удаётся приступить к исполнению последующей.
В какой форме представляется дискретная информация
Есть конечное перечисление разнообразий, помогающих определить явление, объект. Выделяя из возможного конкретный вариант, его обозначают индивидуально – присваивают имя. Как раз конкретное наименование и несёт смысловую нагрузку информации, касающейся явления или объекта. Таким именем может стать натуральное число:
Всё на свете можно пронумеровать, указать числами. Когда требуется представить информацию в ЭВМ, используется именно цифровая форма обозначений.
А в повседневной жизни представлять информацию исключительно цифрами не практично, поэтому используются последовательно произносимые слова:
Слова составляются из букв, используется конкретный алфавит (русский, английский и пр.). Также применяются символы:
Символы образуют своеобразные алфавиты, используя которые, можно создавать различные объекты.
Природа такой информации дискретна, она заключена в последовательных символах. Поэтому данный вид информации именуют символьным.
Уже разработано огромное количество систем письменности, помогающих идентичную информацию передавать с помощью разных символических наборов, а также всевозможных правил применения этих символов, из которых составляются слова, отдельные фразы, целые тексты.
Выходит, что у разных алфавитов имеется одинаковая «изобразительная возможность». Ту информацию, что можно передать с одного алфавита, удаётся передавать и с других. Таким способом, используя в виде алфавита, к примеру, всего 10 цифр, можно составить текст книги без потери информации. В алфавите может даже быть всего два различных символа (0 и 1), при этом «изобразительная возможность» его будет аналогичной.
Кроме приведённых выше примеров, разрабатываются и другие форматы представления дискретной информации:
Дискретизация информации
В системе обработки информации дискретизация представляет собой ее обмен, осуществляемый с помощью сигналов. Их носителями способны выступать определённые физические величины, представленные пространственным распределением сигналов, функциями времени.
Информационными параметрами сигнала выступают показатели передаваемых временных функций:
Различие сигналов
При квантовании (дискретизации) по времени функция, также непрерывная по времени, обретает способность преобразования в функцию дискретного аргумента времени. Построение дискретизации непрерывных сигналов производится по принципу их представления в образе взвешенных сумм.
Человек обладает далеко не совершенными органами чувств, значит он воспринимает окружающий мир дискретно. Даже применение архисложных приборов, способствующих повышению чувствительности или разрешающей способности, принципиально положение изменить не может. При этом шаг дискретизации всё же меняется.
Информатика. 7 класс
Конспект урока
Кодирование информации. Двоичный код
Перечень вопросов, рассматриваемых в теме:
Дискретизация информации – процесс преобразования информации из непрерывной формы представления в дискретную. Чтобы представить информацию в дискретной форме, её следует выразить с помощью символов какого-нибудь естественного или формального языка.
Алфавит языка – конечный набор отличных друг от друга символов, используемых для представления информации. Мощность алфавита – это количество входящих в него символов.
Алфавит, содержащий два символа, называется двоичным алфавитом. Представление информации с помощью двоичного алфавита называют двоичным кодированием. Двоичное кодирование универсально, так как с его помощью может быть представлена любая информация.
1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.
Теоретический материал для самостоятельного изучения
Для решения своих задач человеку часто приходится преобразовывать имеющуюся информацию из одной формы представления в другую. Например, при чтении вслух происходит преобразование информации из дискретной (текстовой) формы в непрерывную (звук). Во время диктанта на уроке русского языка, наоборот, происходит преобразование информации из непрерывной формы (голос учителя) в дискретную (записи учеников).
Информация, представленная в дискретной форме, значительно проще для передачи, хранения или автоматической обработки. Поэтому в компьютерной технике большое внимание уделяется методам преобразования информации из непрерывной формы в дискретную.
Дискретизация информации – процесс преобразования информации из непрерывной формы представления в дискретную.
Рассмотрим суть процесса дискретизации информации на примере.
На метеорологических станциях имеются самопишущие приборы для непрерывной записи атмосферного давления. Результатом их работы являются барограммы – кривые, показывающие, как изменялось давление в течение длительных промежутков времени. Одна из таких кривых, вычерченная прибором в течение семи часов проведения наблюдений, показана на рисунке 1.
На основании полученной информации можно построить таблицу, содержащую показания прибора в начале измерений и на конец каждого часа наблюдений.
Полученная таблица даёт не совсем полную картину того, как изменялось давление за время наблюдений: например, не указано самое большое значение давления, имевшее место в течение четвёртого часа наблюдений. Но если занести в таблицу значения давления, наблюдаемые каждые полчаса или 15 минут, то новая таблица будет давать более полное представление о том, как изменялось давление.
Таким образом, информацию, представленную в непрерывной форме (барограмму, кривую), мы с некоторой потерей точности преобразовали в дискретную форму (таблицу).
В дальнейшем вы познакомитесь со способами дискретного представления звуковой и графической информации.
В общем случае, чтобы представить информацию в дискретной форме, её следует выразить с помощью символов какого-нибудь естественного или формального языка. Таких языков тысячи. Каждый язык имеет свой алфавит.
Алфавит – конечный набор отличных друг от друга символов (знаков), используемых для представления информации. Мощность алфавита – это количество входящих в него символов (знаков).
Алфавит, содержащий два символа, называется двоичным алфавитом (рис. 3). Представление информации с помощью двоичного алфавита называют двоичным кодированием. Закодировав таким способом информацию, мы получим её двоичный код.
Рассмотрим в качестве символов двоичного алфавита цифры 0 и 1. Покажем, что любой алфавит можно заменить двоичным алфавитом. Прежде всего, присвоим каждому символу рассматриваемого алфавита порядковый номер. Номер представим с помощью двоичного алфавита. Полученный двоичный код будем считать кодом исходного символа.
Если мощность исходного алфавита больше двух, то для кодирования символа этого алфавита потребуется не один, а несколько двоичных символов. Другими словами, порядковому номеру каждого символа исходного алфавита будет поставлена в соответствие цепочка (последовательность) из нескольких двоичных символов. Правило получения двоичных кодов для символов алфавита мощностью больше двух можно представить схемой на рисунке.
Двоичные символы (0,1) здесь берутся в заданном алфавитном порядке и размещаются слева направо. Двоичные коды (цепочки символов) читаются сверху вниз. Все цепочки (кодовые комбинации) из двух двоичных символов позволяют представить четыре различных символа произвольного алфавита:
Цепочки из трёх двоичных символов получаются дополнением двухразрядных двоичных кодов справа символом 0 или 1. В итоге кодовых комбинаций из трёх двоичных символов получается 8 – вдвое больше, чем из двух двоичных символов:
Соответственно, четырёхразрядный двоичный код позволяет получить 16 кодовых комбинаций, пятиразрядный – 32, шестиразрядный – 64 и т. д.
Длину двоичной цепочки – количество символов в двоичном коде – называют разрядностью двоичного кода.
Обратите внимание, что:
32 = 2 ∙ 2 ∙ 2 ∙ 2 ∙ 2 и т. д.
Здесь количество кодовых комбинаций представляет собой произведение некоторого количества одинаковых множителей, равного разрядности двоичного кода.
Если количество кодовых комбинаций обозначить буквой N, а разрядность двоичного кода – буквой i, то выявленная закономерность в общем виде будет записана так:
В математике такие произведения записывают в виде:
Запись 2 i читают так: «2 в i-й степени».
Задача. Вождь племени Мульти поручил своему министру разработать двоичный код и перевести в него всю важную информацию. Двоичный код какой разрядности потребуется, если алфавит, используемый племенем Мульти, содержит 16 символов? Выпишите все кодовые комбинации.
Чтобы выписать все кодовые комбинации из четырёх 0 и 1, воспользуемся схемой на рис. 1.13: 0000, 0001, 0010, 0011, 0100, 0101, 0110, 0111, 1000, 1001, 1010, 1011, 1100, 1101, 1110, 1111.
Универсальность двоичного кодирования
В начале нашей беседы вы узнали, что информация, представленная в непрерывной форме, может быть выражена с помощью символов некоторого естественного или формального языка. В свою очередь, символы произвольного алфавита могут быть преобразованы в двоичный код. Таким образом, с помощью двоичного кода может быть представлена любая информация на естественных и формальных языках, а также изображения и звуки (рис. 6). Это и означает универсальность двоичного кодирования.
Двоичные коды широко используются в компьютерной технике, требуя только двух состояний электронной схемы – «включено» (это соответствует цифре 1) и «выключено» (это соответствует цифре 0).
Простота технической реализации – главное достоинство двоичного кодирования. Недостаток двоичного кодирования – большая длина получаемого кода.
Равномерные и неравномерные коды
Различают равномерные и неравномерные коды. Равномерные коды в кодовых комбинациях содержат одинаковое число символов, неравномерные – разное.
Выше мы рассмотрели равномерные двоичные коды.
Примером неравномерного кода может служить азбука Морзе, в которой для каждой буквы и цифры определена последовательность коротких и длинных сигналов. Так, букве Е соответствует короткий сигнал («точка»), а букве Ш – четыре длинных сигнала (четыре «тире»). Неравномерное кодирование позволяет повысить скорость передачи сообщений за счёт того, что наиболее часто встречающиеся в передаваемой информации символы имеют самые короткие кодовые комбинации.
Разбор решения заданий тренировочного модуля
№1.Тип задания: ввод с клавиатуры пропущенных элементов в тексте
Переведите десятичное число 273 в двоичную систему счисления.
Воспользуемся алгоритмом перевода целых чисел из системы с основанием p в систему с основанием q:
1. Основание новой системы счисления выразить цифрами исходной системы счисления и все последующие действия производить в исходной системе счисления.
2. Последовательно выполнять деление данного числа и получаемых целых частных на основание новой системы счисления до тех пор, пока не получим частное, меньшее делителя.
3. Полученные остатки, являющиеся цифрами числа в новой системе счисления, привести в соответствие с алфавитом новой системы счисления.
4. Составить число в новой системе счисления, записывая его, начиная с последнего остатка.
Ответ: 27310= 100010001.
№2. Тип задания: единичный / множественный выбор.
Четыре буквы латинского алфавита закодированы кодами различной длины: