Что значит размещение файла

Размещение файлов

Область данных диска, отведенную для хранения файлов, можно представить как линейную последовательность адресуемых блоков (секторов). Размещая файлы в этой области, ОС должна отвести для каждого файла необходимое количество блоков и сохранить информацию о том, в каких именно блоках размещен данный файл. Существуют два основных способа использования дискового пространства для размещения файлов.

· Непрерывное размещение характеризуется тем, что каждый файл занимает непрерывную последовательность блоков.

· Сегментированное размещение означает, что файлы могут размещаться «по кусочкам», т.е. один файл может занимать несколько несмежных сегментов разной длины. Оба способа размещения показаны на рис. 3‑1.

Что значит размещение файла

Непрерывное размещение имеет два серьезных достоинства.

· Информация о размещении файла очень проста и занимает мало места. Фактически достаточно хранить два числа: номер начального блока файла и число занимаемых блоков (или размер файла в байтах, по которому легко вычислить число блоков).

· Доступ к любой позиции в файле выполняется быстро, поскольку, зная смещение от начала файла, легко можно вычислить номер требуемого блока и прочитать сразу этот блок, не читая предыдущие блоки.

К сожалению, недостатки непрерывного распределения еще более весомы.

· При создании файла требуется заранее знать его размер, чтобы найти и зарезервировать на диске область достаточной величины. Последующее возможное увеличение файла весьма затруднено, т.к. после конца файла может не оказаться достаточно свободного места. Фактически вместо увеличения файла обычно приходится заново создавать файл большего размера в другом месте, переписывать в него данные и удалять старый файл. Но такое решение требует много времени на чтение и запись данных и, кроме того, снижает надежность хранения данных, поскольку ошибка при чтении или записи гораздо более вероятна, чем порча данных, «спокойно лежащих» на диске.

· В ходе обычной эксплуатации файловой системы, после многократного создания и удаления файлов разной длины, свободное пространство на диске оказывается разбитым на небольшие кусочки. Суммарный объем свободного места на диске может быть достаточно большим, но создать файл приличного размера не удается, для него нет непрерывной области нужной длины. Это явление носит название фрагментации диска. Для борьбы с ним приходится использовать специальную процедуру дефрагментации, которая перемещает все файлы, размещая их впритык друг к другу от начала области данных диска. Но такая процедура требует много времени, снижает, как сказано выше, надежность и усугубляет проблемы в случае, если позднее потребуется увеличить файл.

Сегментированное размещение лишено первого из недостатков непрерывного: при создании файла ему обычно вообще не выделяют память, а потом, по мере возрастания размера файла, ему могут быть выделены любые свободные сегменты на диске, независимо от их длины.

Не так просто с фрагментацией. Конечно, в отличие от непрерывного размещения, при сегментированном никакая фрагментация не помешает системе использовать все блоки, имеющиеся на диске. Однако последовательное чтение из сегментированного файла может выполняться существенно медленнее за счет необходимости переходить от сегмента к сегменту. Замедление особенно заметно, если файл оказался разбросан маленькими кусочками по нескольким цилиндрам диска. В результате, время от времени целесообразно выполнять дефрагментацию диска, чтобы повысить скорость доступа к данным. При сегментированном размещении дефрагментация означает не только объединение всех свободных участков диска, но и, главным образом, объединение сегментов каждого файла. Эта процедура выполняется значительно сложнее, чем дефрагментация при непрерывном размещении.

Можете ли вы предложить хороший алгоритм дефрагментации? Учтите, что он должен эффективно работать, даже если на диске осталось всего несколько свободных блоков.

Недостатком сегментированного размещения является то, что информация о размещении файла в этом случае намного сложнее, чем для непрерывного случая и, что наиболее неприятно, объем этой информации переменный: чем большее число сегментов занимает файл, тем больше нужно информации, ибо надо перечислить все сегменты. Имеется почти столько же способов решения этой проблемы, сколько вообще придумано разных файловых систем.

Чтобы уменьшить влияние сегментации на скорость доступа к данным файла, в ОС, использующих сегментированное размещение, применяются различные алгоритмы выбора места для файла. Их целью является разместить файл по возможности в одном сегменте, и только в крайнем случае разбивать файл на несколько сегментов.

В современных ОС для файловых систем на магнитных дисках практически всегда используют сегментированное размещение. Иное дело файловые системы на дисках, предназначенных только для чтения (например, CD ROM). Нетрудно понять, что в этом случае недостатки непрерывного размещения не имеют никакого значения, а его достоинства сохраняются.

Еще одной важной характеристикой размещения файлов является степень его «дробности». До сих пор мы предполагали, что файл может занимать любое целое число блоков, а под блоком фактически понимали сектор диска. Проблема в том, что для дисков большого объема число блоков может быть слишком большим. Допустим, в некоторой файловой системе размер блока равен 512 байт, а для хранения номеров блоков файла используются 16-разрядные числа. В этом случае размер области данных диска не сможет превысить 512 * 2 16 = 32 Мб, что нынче смешно. Конечно, можно перейти к использованию 32-разрядных номеров блоков, но тогда суммарный размер информации о размещении всех файлов на диске становится чересчур большим. Обычный выход из этого затруднения заключается в том, что минимальной единицей размещения файлов считают кластер (называемый в некоторых системах блоком или логическим блоком), который принимается равным 2 k секторов, т.е., например, 1, 2, 4, 8, 16, 32 сектора, редко больше. Каждому файлу отводится целое число кластеров, и в информации о размещении файла хранятся номера кластеров, а не секторов. Увеличение размера кластеров позволяет сократить количество данных о размещении файлов «и в длину и в ширину»: во-первых, для каждого файла нужно хранить информацию о меньшем числе кластеров, а во-вторых, уменьшается число двоичных разрядов, используемых для задания номера кластера (либо при той же разрядности можно использовать больший диск). Так, при кластере размером 32 сектора и 16-разрядных номерах можно адресовать до 1 Гб дисковой памяти.

Что значит размещение файла

Использование больших кластеров имеет свою плохую сторону. Поскольку размер файла можно считать случайной величиной (по крайней мере, этот размер никак не связан с размером кластера), то можно приближенно считать, что в среднем половина последнего кластера каждого файла остается незанятой. Это явление иногда называют внутренней фрагментацией (в отличие от описанной выше фрагментации свободного пространства диска, которую называют также внешней фрагментацией). Кроме того, если хотя бы один из секторов, входящих в кластер, отмечен как дефектный, то и весь кластер считается дефектным, т.е. не может быть использован. Очевидно, что при увеличении размера кластера возрастает и число неиспользуемых секторов диска.

Оптимальный размер кластера либо вычисляется автоматически при форматировании диска, либо задается вручную.

Для нормальной работы файловой системы требуется, чтобы, кроме информации о размещении файлов, система хранила в удобном для использования виде информацию об имеющихся свободных кластерах диска. Эта информация необходима при создании новых или увеличении существующих файлов. Используются различные способы представления информации о свободном месте, некоторые из них перечислены ниже.

· Можно хранить все свободные кластеры как связанный линейный список, т.е. в начале каждого свободного кластера хранить номер следующего по списку. Недостаток такого способа в том, что затрудняется поиск свободного непрерывного фрагмента нужного размера, поэтому сложнее оптимизировать размещение файлов.

· Названный недостаток можно преодолеть, если хранить список не из отдельных кластеров, а из непрерывных свободных фрагментов диска. Правда, работать с таким списком несколько сложнее.

· В системах с непрерывным размещением часто каждый непрерывный фрагмент диска описывают так же, как файл, но отмечают его флажком «свободен».

· Удобный и простой способ заключается в использовании битовой карты (bitmap) свободных кластеров. Она представляет собой массив, содержащий по одному биту на каждый кластер, причем значение 1 означает «кластер занят», а 0 – «кластер свободен». Для поиска свободного непрерывного фрагмента нужного размера система должна будет просмотреть весь массив.

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

Источник

Размещение файлов

Что значит размещение файла Что значит размещение файла Что значит размещение файла Что значит размещение файла

Что значит размещение файла

Что значит размещение файла

Область данных диска, отведенную для хранения файлов, можно представить как линейную последовательность адресуемых блоков (секторов). Размещая файлы в этой области, ОС должна отвести для каждого файла необходимое количество блоков и сохранить информацию о том, в каких именно блоках размещен данный файл. Существуют два основных способа использования дискового пространства для размещения файлов.

Непрерывное размещение характеризуется тем, что каждый файл занимает непрерывную последовательность блоков.

Сегментированное размещение означает, что файлы могут размещаться «по кусочкам», т.е. один файл может занимать несколько несмежных сегментов разной длины. Оба способа размещения показаны на рис. 16.1.

Что значит размещение файла

Рис. 16.1 Способы размещения файлов на диске

Непрерывное размещение имеет два серьезных достоинства.

Информация о размещении файла очень проста и занимает мало места. Фактически достаточно хранить два числа: номер начального блока файла и число занимаемых блоков (или размер файла в байтах, по которому легко вычислить число блоков).

Доступ к любой позиции в файле выполняется быстро, поскольку, зная смещение от начала файла, легко можно вычислить номер требуемого блока и прочитать сразу этот блок, не читая предыдущие блоки.

К сожалению, недостатки непрерывного распределения еще более весомы.

При создании файла требуется заранее знать его размер, чтобы найти и зарезервировать на диске область достаточной величины. Последующее возможное увеличение файла весьма затруднено, т.к. после конца файла может не оказаться достаточно свободного места. Фактически вместо увеличения файла обычно приходится заново создавать файл большего размера в другом месте, переписывать в него данные и удалять старый файл. Но такое решение требует много времени на чтение и запись данных и, кроме того, снижает надежность хранения данных, поскольку ошибка при чтении или записи гораздо более вероятна, чем порча данных, «спокойно лежащих» на диске.

В ходе обычной эксплуатации файловой системы, после многократного создания и удаления файлов разной длины, свободное пространство на диске оказывается разбитым на небольшие кусочки. Суммарный объем свободного места на диске может быть достаточно большим, но создать файл приличного размера не удается, для него нет непрерывной области нужной длины. Это явление носит название фрагментации диска. Для борьбы с ним приходится использовать специальную процедуру дефрагментации, которая перемещает все файлы, размещая их впритык друг к другу от начала области данных диска. Но такая процедура требует много времени, снижает, как сказано выше, надежность и усугубляет проблемы в случае, если позднее потребуется увеличить файл.

Сегментированное размещение лишено первого из недостатков непрерывного: при создании файла ему обычно вообще не выделяют память, а потом, по мере возрастания размера файла, ему могут быть выделены любые свободные сегменты на диске, независимо от их длины.

Не так просто с фрагментацией. Конечно, в отличие от непрерывного размещения, при сегментированном никакая фрагментация не помешает системе использовать все блоки, имеющиеся на диске. Однако последовательное чтение из сегментированного файла может выполняться существенно медленнее за счет необходимости переходить от сегмента к сегменту. Замедление особенно заметно, если файл оказался разбросан маленькими кусочками по нескольким цилиндрам диска. В результате, время от времени целесообразно выполнять дефрагментацию диска, чтобы повысить скорость доступа к данным. При сегментированном размещении дефрагментация означает не только объединение всех свободных участков диска, но и, главным образом, объединение сегментов каждого файла. Эта процедура выполняется значительно сложнее, чем дефрагментация при непрерывном размещении.

Недостатком сегментированного размещения является то, что информация о размещении файла в этом случае намного сложнее, чем для непрерывного случая и, что наиболее неприятно, объем этой информации переменный: чем большее число сегментов занимает файл, тем больше нужно информации, ибо надо перечислить все сегменты. Имеется почти столько же способов решения этой проблемы, сколько вообще придумано разных файловых систем.

Что значит размещение файла

Чтобы уменьшить влияние сегментации на скорость доступа к данным файла, в ОС, использующих сегментированное размещение, применяются различные алгоритмы выбора места для файла. Их целью является разместить файл по возможности в одном сегменте, и только в крайнем случае разбивать файл на несколько сегментов.

В современных ОС для файловых систем на магнитных дисках практически всегда используют сегментированное размещение. Иное дело файловые системы на дисках, предназначенных только для чтения (например, CD ROM). Нетрудно понять, что в этом случае недостатки непрерывного размещения не имеют никакого значения, а его достоинства сохраняются.

Еще одной важной характеристикой размещения файлов является степень его «дробности». До сих пор мы предполагали, что файл может занимать любое целое число блоков, а под блоком фактически понимали сектор диска. Проблема в том, что для дисков большого объема число блоков может быть слишком большим. Допустим, в некоторой файловой системе размер блока равен 512 байт, а для хранения номеров блоков файла используются 16-разрядные числа. В этом случае размер области данных диска не сможет превысить 512 * 216 = 32 Мб. Конечно, можно перейти к использованию 32-разрядных номеров блоков, но тогда суммарный размер информации о размещении всех файлов на диске становится чересчур большим. Обычный выход из этого затруднения заключается в том, что минимальной единицей размещения файлов считают кластер (называемый в некоторых системах блоком или логическим блоком), который принимается равным 2k секторов, т.е., например, 1, 2, 4, 8, 16, 32 сектора, редко больше. Каждому файлу отводится целое число кластеров, и в информации о размещении файла хранятся номера кластеров, а не секторов. Увеличение размера кластеров позволяет сократить количество данных о размещении файлов «и в длину и в ширину»: во-первых, для каждого файла нужно хранить информацию о меньшем числе кластеров, а во-вторых, уменьшается число двоичных разрядов, используемых для задания номера кластера (либо при той же разрядности можно использовать больший диск). Так, при кластере размером 32 сектора и 16-разрядных номерах можно адресовать до 1 Гб дисковой памяти.

Использование больших кластеров имеет свою отрицательную сторону. Поскольку размер файла можно считать случайной величиной (по крайней мере, этот размер никак не связан с размером кластера), то можно приближенно считать, что в среднем половина последнего кластера каждого файла остается незанятой. Это явление иногда называют внутренней фрагментацией (в отличие от описанной выше фрагментации свободного пространства диска, которую называют также внешней фрагментацией). Кроме того, если хотя бы один из секторов, входящих в кластер, отмечен как дефектный, то и весь кластер считается дефектным, т.е. не может быть использован. Очевидно, что при увеличении размера кластера возрастает и число неиспользуемых секторов диска.

Оптимальный размер кластера либо вычисляется автоматически при форматировании диска, либо задается вручную.

Для нормальной работы файловой системы требуется, чтобы, кроме информации о размещении файлов, система хранила в удобном для использования виде информацию об имеющихся свободных кластерах диска. Эта информация необходима при создании новых или увеличении существующих файлов. Используются различные способы представления информации о свободном месте, некоторые из них перечислены ниже.

Можно хранить все свободные кластеры как связанный линейный список, т.е. в начале каждого свободного кластера хранить номер следующего по списку. Недостаток такого способа в том, что затрудняется поиск свободного непрерывного фрагмента нужного размера, поэтому сложнее оптимизировать размещение файлов.

Названный недостаток можно преодолеть, если хранить список не из отдельных кластеров, а из непрерывных свободных фрагментов диска. Правда, работать с таким списком несколько сложнее.

В системах с непрерывным размещением часто каждый непрерывный фрагмент диска описывают так же, как файл, но отмечают его флажком «свободен».

Удобный и простой способ заключается в использовании битовой карты (bitmap) свободных кластеров. Она представляет собой массив, содержащий по одному биту на каждый кластер, причем значение 1 означает «кластер занят», а 0 – «кластер свободен». Для поиска свободного непрерывного фрагмента нужного размера система должна будет просмотреть весь массив.

Источник

Что такое таблица размещения файлов?

в Компьютеры 25.08.2017 0 642 Просмотров

Таблица размещения файлов (FAT) является системой, используемой на компьютерах для хранения информации о файле. Где хранится эта информация может варьироваться от внутреннего жесткого диска на флэш – карты памяти. Система размещения файлов в таблице используется главным образом для хранения информации на портативных носителях, таких как карты флэш-памяти. В прошлом она была использована для внутренних жестких дисков.
Существует много видов архитектуры компьютерной файловой системы. Оригинальная система ограничивается хранением не более 32 мегабайт информации, но в более поздних версиях добавлена поддержка нескольких гигабайт и даже несколько терабайт хранилища.

Что значит размещение файла

Большинство внутренних жестких дисков компьютеров требуют, чтобы переместить головку в диске в определенном положении и снять небольшой сегмент информации. Износ вовлечённый в этот процесс означает, что необходим способ хранения информации файла на жестком диске. Была разработана система FAT, чтобы свести к минимуму количество поисков, которые была обязана сделать головка жёсткого диска.

В дополнение к таблице размещения файлов, есть директории каталогов. Эти файлы хранят информацию о том, где на диске расположены файлы и где они находятся. В таблицы справочника также включена информация, касающаяся названия и свойств файла. Некоторые из свойств хранят расширение файла, атрибуты файла, а также дату и время создания. Другие свойства также могут быть сохранены, в зависимости от конкретной версии FAT системы и операционной системы, которая используется на ПК.

Система таблицы размещения файлов гарантирует, что файлы могут быть найдены и доступны в любом месте на диске с минимальными затратами времени потраченными на поиск. Это не только помогает свести к минимуму износ физического привода, но также гарантирует, что файлы могут быть быстро доступны. Это приводит к увеличению производительности и эффективности. Простота и доступность системы FAT делают её идеальной для использования на устройствах памяти, доступ к которым осуществляется посредством многих различных операционных систем.

Источник

Виртуальные файловые системы (VFS). Реализации файловых систем. Сетевая файловая система NFS

Ссылочное размещение файла

При ссылочном размещении каждый файл представляется в виде связанного списка дисковых блоков, которые могут быть разбросаны по диску. Преимущества данного метода:

Ссылочное размещение файлов изображено на рис. 20.3.

Что значит размещение файла

Что значит размещение файла

Индексируемое размещение

Пример индексируемого размещения приведен на рис. 20.5.

Что значит размещение файла

Как видно из схемы, при индексируемом размещении блоки файла могут быть расположены как угодно разрозненно, но индексный блок содержит все ссылки на них. Ссылка на блок данных может быть выбрана непосредственно из индексного блока, без какого-либо поиска.

Что значит размещение файла

Управление свободной внешней памятью

номер первого занятого блока = число битов в слове * число нулевых слов + номер первой 1.

Битовые шкалы, используемые для управления блоками, требуют дополнительной памяти. Например, при размере блока в 2 12 байтов и размере диска в 2 30 байтов (1 GB) длина битового вектора будет равна n = 2 30 /2 12 = 2 18 битов (или 32 KB).

При использовании битовых векторов легко получать информацию о смежно расположенных файлах. Для сравнения, при использовании связанного списка свободной дисковой памяти (метод, обычно применяемый в ОС для оперативной памяти), невозможно легко получить информацию о смежных областях памяти, но зато нет лишнего расходования памяти.

Представление информации о свободной дисковой памяти в виде списка блоков иллюстрируется на рис. 20.7.

Источник

Файловые системы хранения данных

Если сделать поиск по изображениям, то на запрос «file storage» одной из первых выдается примерно такая картинка:

Что значит размещение файла

Система хранения файлов (в смысле, папок)

Однако именно эта картинка наилучшим образом отражает принцип файлового хранения данных. Если сравнивать его с блочным хранением, то это будет хранение по страницам (блоки данных), а не по папкам с документами (файлы).

Виды хранения данных

Существуют три способа хранения данных: блочный, файловый и объектный. Они организуют и предоставляют данные различными способами, каждый из которых имеет свои возможности и ограничения.

Блочное хранилище разбивает данные на блоки (chunks) одинакового размера, организованные по-разному, то есть, разные блоки могут храниться в разных массивах данных.

Файловое хранилище организует и предоставляет данные в виде иерархии файлов в папках.

Объектное хранилище управляет данными при помощи т.н. «метаданных» – коротких информационных «наклеек» на целостном массиве данных (текстовый документ, видеоролик, электронная таблица и пр.), по которому его можно довольно легко найти в общем хранилище.

Что такое файловая система хранения

Файловая система хранения больше всего похоже на то, как мы видим информацию в своем компьютере: т.е. в виде файлов во вложенных папках. Путь к файлу в файловом хранилище может быть довольно длинным, сквозь глубокую иерархию вложенных друг в друга папок.

Доступ к данным в файловом хранилище осуществляется по file ID, который содержит имя сервера, путь к директории (папке) и имя искомого файла (server name + directory path + filename) в сети общего пользования NAS (Network Attached Storage). По file ID сервер системы хранения находит данные на диске в NAS.

Протоколы

Наиболее употребительными протоколами доступа к файлам через NAS являются NFS (Network File System) и CIFS (Common Internet File System).

NFS используется в операционных системах Unix и Linux. CIFS используется в операционной системе Windows и является публичным (открытым) вариантом более специализированного протокола SMB (Server Message Block), разработанного компанией Microsoft, который использует сетевой протокол TCP/IP.

Сервер системы файлового хранения использует блочное хранилище внутри локальной файловой системы для организации файлов, а пользователь имеет дело только с вышележащим протоколом, который определяет путь к файлу. Атрибуты файла, такие как тип (расширение), размер, дата создания и модификации сохраняются в файловой системе.

Ограничения

Ограничениями хранения и доступа к файлам через NAS являются пределы масштабирования нижележащей файловой системы и неспособность распределять рабочую нагрузку на несколько файловых серверов. То есть масштабирование системы как правило предполагает наращивание ресурсов файлового сервера, а не установку еще одного или нескольких таких же.

Организация файловых систем хранения

Файлы в файловых системах хранятся в директориях (каталогах, «папках»). В директории хранится информация о файлах: их атрибутах, местоположении и владельце. Большая часть этой информации, особенно та, которая непосредственно относится к хранению, управляется файловой системой. Сама директория – это тоже служебный файл, к которому можно получить доступ при помощи различных административных процедур.

В директории может храниться следующая информация:

Уровни директорий

Одноуровневые директории

В одноуровневых директориях файлы доступны всем пользователям.

Что значит размещение файла

Однако в таких директориях пользователи не могут иметь одно и то же имя для разных файлов.

Двухуровневые директории

В двухуровневой модели файловой системы организуется индивидуальный доступ разных пользователей к директориям. Разные пользователи не могут видеть файлы других пользователей.

В этом случае разные пользователи могут иметь файлы с одинаковыми именами. Поиск файлов такой модели более эффективен, нежели в одноуровневой.

Что значит размещение файла

Древообразная модель директорий

В такой модели директории могут быть организованы в виде дерева.

Что значит размещение файла

Древообразная модель директорий

Методы размещения файлов

Непрерывное размещение

При непрерывном размещении (Continuous Allocation) файла в момент его создания выделяется набор последовательных блоков. В таблице размещения файлов (file allocation table) нужно указать только номер начального блока и длину файла. Этот метод лучше всего подходит для последовательного размещения отдельных файлов в пустом хранилище.

Что значит размещение файла

Непрерывное размещение файлов

Преимущества: при таком размещении можно сразу прочитать несколько блоков, что обеспечивает высокую скорость ввода-вывода. Легко также получать доступ к отдельным блокам. Например, если файл начинается на блоке b, и нам нужен блок i, то его положение в хранилище вычисляется просто как b + i – 1.

Недостатки: файлы могут быть фрагментированы, если длина файла больше, чем число доступных последовательных блоков. При этом нужно совершать дополнительные операции на поиск кусков и составлению из них целостного файла. Поэтому используются специальные алгоритмы, которые укладывают файлы в хранилище – примерно так, как сельдей в бочку на рыбозаводе – без промежутков. Тем самым мы сокращаем требуемый объем хранилища.

Однако выполнение таких ненужных с точки зрения основного бизнеса задач снижает быстродействие системы в целом и приводит к нерациональному расходу ресурсов. Кроме того, при непрерывном размещении требуется объявлять длину файла в момент его создания.

Цепочное размещение

При цепочном размещении (Linked Allocation), еще его называют Non-contiguous allocation, размещение производится поблочно. При этом не требуется, чтобы блоки в файле были последовательными по номерам. Каждый блок при этом будет содержать указатель на следующий блок цепочки, в котором продолжается файл.

Преимущества: Таблица размещения файлов требует только одного ввода для каждого файла, где указан номер начального блока и общая длина файла. Блоки могут быть непоследовательными. Увеличение длины файла делается простым добавлением свободных блоков. При таком методе размещения фрагментация файлов не имеет большого значения.

Недостатки: последние блоки файлов могут быть не полностью занятыми. Требуется дополнительная информация (overhead) на управление указателем на следующий блок в каждом предыдущем блоке. Если указатель теряется, то файл может быть разорван и станет недоступным.

Индексированное размещение

Индексированное размещение (Indexed Allocation) призвано решить проблемы непрерывного и цепочного размещения. В этом случае таблица размещения файлов содержит отдельный одноуровневый указатель (индекс) для каждого файла. В индексе последовательно указаны номера блоков, в которых размещен файл. При этом блоки могут иметь как одинаковый размер, так и различные размеры. При этом исключается фрагментация файлов, в то время как размещение при помощи блоков различного размера исключает незанятые «хвосты» в последнем блоке каждого файла, если файл не умещается в определенное число блоков. Этот метод размещения файлов обеспечивает как последовательный, так и прямой доступ к файлам и в настоящее время является наиболее популярным.

Что значит размещение файла

Индексированное размещение файлов

Управление свободным пространством диска

Свободным пространством диска, как и занятым, тоже нужно управлять. Для эффективного размещения файлов во всех перечисленных выше методах требуется знать, какие блоки на диске доступны, а какие – заняты. Поэтому необходимо иметь также таблицы размещения дисков (disk allocation table), как и таблицу размещения файлов (file allocation table).

Имеются следующие методы управления свободным пространством диска.

Битовые таблицы (Bit Tables). В этом методе используется вектор, который содержит по одному биту для каждого блока на диске. Если бит равен 0, то это блок свободен, если 1, то занят.

Такой вектор может иметь вид: 00011010111100110001

Список свободный блоков (Free Block List). В этом методе каждому блоку назначается последовательный номер и список номеров свободных блоков сохраняется на специально выделенном блоке на каждом диске.

Преимуществом обоих методов является относительная легкость нахождения последовательной группы свободных блоков. Поэтому и тот, и другой хорошо подходят для всех вышеперечисленных методов размещения файлов.

Достоинства и недостатки

Самым большим преимуществом файловых систем хранения является их интуитивная понятность: интерфейс выглядит также, как и файловый менеджер на любом компьютере, и принцип иерархичности (вложенность) папок с файлами тоже взят из обыденной жизни.

Система достаточно легко масштабируется (до определенных пределов). Совместный доступ пользователей внутри масштабов системы практически ничем не ограничен. К достоинствам также можно отнести относительно невысокую цену.

Файлы в файловой системе ищутся достаточно быстро, если ее масштаб не запределен. Система имен файлов позволяет разным собственникам иметь файлы с одинаковым именем – с точки зрения системы это будут разные файлы – даже в том случае, если содержимое файлов с разными Owner ID будет одинаковым.

Файлы удобно группировать по типам: например, все программы, написанные на языке Java, все игровые файлы и пр.

К недостаткам файловой системы хранения следует отнести наличие определенных пределов масштабирования. При росте объема системы навигация становится более сложной, а время доступа к файлам увеличивается. То есть файлы будут открываться медленнее.

Бизнес-задачи

Файловая система хранения хорошо подходит для доступа к общим файлам и каталогам через локальную компьютерную сеть предприятия LAN (local area network) или WAN (wide area network). Поэтому практически во всех корпоративных ИТ-системах в том или ином виде можно обнаружить примеры эксплуатации файловых хранилищ:

Однако быстродействия файловых систем, особенно при больших масштабах, может не хватить для некоторых бизнес-критичных задач, где малое время отклика системы имеет значение для качества бизнес-операций. Например, это могут быть системы компьютерного зрения, системы анализа больших данных и бизнес-аналитики, а также нейросети, системы интеллектуальной видеоаналитики и прочие инновационные цифровые технологии. В таких случаях иногда бывает целесообразнее использовать блочные хранилища, которые имеют меньшее время отклика при больших объемах хранения.

Обзор продуктов NAS

Системы хранения Synology RS

Synology FlashStation FS6400 – это стоечный сервер 2U, предназначенный для чувствительных к задержкам задач с высокой интенсивностью операций ввода-вывода. Он хорошо подходит для постобработки мультимедийных файлов, развертывания виртуальных машин, обработки онлайн-транзакций и приложений баз данных.

Что значит размещение файла

Synology FlashStation FS6400 (источник: Synology)

Подходит для:

Synology SA3200D позволяет упростить и централизовать инфраструктуру управления данными в форм-факторе 2U. Избыточность контроллеров хранилища на базе Synology High Availability автоматически сокращает время простоя менее, чем до 1 минуты.

Благодаря архитектуре с двумя контроллерами Synology SA3200D обеспечивается выполнение операций и основных бизнес-функций в случае аварий или незапланированных ситуаций, приводящих к отключению критически важных систем. Аппаратная избыточность контроллеров, источников питания и вентиляторов устраняет возможность сбоев в работе. SA3200D работает на базе интуитивно понятной и многофункциональной операционной системы DiskStation Manager (DSM), которая обеспечивает комплексную защиту сети, файловых служб и приложений.

Что значит размещение файла

Synology SA3200D (источник: Synology).

Synology SA3200D – сертифицированное решение по виртуализации с поддержкой VMware® vSphere™, Microsoft® Hyper-V®, Citrix® XenServer™ и OpenStack Cinder. Система поддерживает протоколы iSCSI и NFS и интегрируется с VMware VAAI и Microsoft ODX.

Это позволяет ИТ-администраторам эффективно выполнять развертывание и упрощает операции хранения в различных средах виртуализации. ИТ-администраторы могут эффективно управлять виртуализированными рабочими нагрузками с помощью встроенных функций DSM и подключаемых плагинов для сред VMware и Windows. Такие функции, как быстрое клонирование, NFS v4.1 и Thin Provisioning, обеспечивают большую гибкость для удовлетворения потребностей администрирования.

Без дополнительных лицензионных платежей виртуализированная рабочая нагрузка может быть дополнительно защищена полноценным набором приложений для защиты данных, включая Synology Snapshot Replication, Hyper Backup и Active Backup for Business (в соответствии со сценарием защиты).

Система хранения Synology RackStation RS820+/RS820RP+ – это сетевая СХД для централизованного управления данными. Устройство RS820+/RS820RP+ оснащено четырехъядерным процессором и обеспечивает высокую производительность и масштабируемость хранилища, что хорошо подходит для совместного использования файлов на различных платформах и для резервного копирования данных. На Synology RS820+/RS820RP+ распространяется 3-летняя ограниченная гарантия компании Synology.

Что значит размещение файла

Synology RackStation RS820+/RS820RP+ (источник: Synology).

Synology RackStation RS819 – это стоечная сетевая система хранения для рабочих групп в форм-факторе 1U с 4 отсеками. Система хранения с шасси глубиной 12 дюймов для установки в двухопорную стойку обеспечивает высокую гибкость при развертывании серверов. RS819 с 64-разрядным четырехъядерным процессором, памятью DDR4 емкостью 2 ГБ и двумя портами Gigabit LAN обеспечивает пропускную способность последовательного чтения и записи более 225 МБ/с и 169 МБ/с соответственно. RS819 также обеспечивает масштабируемость хранилища до 8 дисков при подключении к одному модулю расширения Synology RX4182.

Что значит размещение файла

Synology RackStation RS819 (источник: Synology).

Унифицированный контроллер UC3200 для высокодоступных сред SAN поддерживает архитектуру «активный-активный» для обеспечения непрерывной работы служб iSCSI. Решение обеспечивает надежную защиту данных, обладает простым интерфейсом управления и максимально увеличивает время бесперебойной работы критически важных служб. На UC3200 предоставляется 5-летняя ограниченная гарантия Synology.

Что значит размещение файла

Унифицированный контроллер UC3200 (источник: Synology).

UC3200 – это экономичное и надежное решение IP SAN для критически важных сред. Корпус 2U оснащен узлами контроллера «активный-активный» (на базе 4-ядерного процессора Intel® Xeon® D-1521) и памятью DDR4 ECC UDIMM емкостью 8 ГБ (с возможностью увеличения до 64 ГБ). Система обеспечивает производительность свыше 140 000 операций ввода-вывода в секунду при произвольной записи блоками по 4 КБ.

UC3200 позволяет начать с минимальной конфигурации и расширять систему в будущем. По умолчанию сервер вмещает 12 слотов для 3,5-дюймовых или 2,5-дюймовых дисков SAS с возможностью масштабирования до 36 дисков SAS при подключении двух модулей расширения RXD1219sas. Порты RJ-45 – один порт 10GbE и два порта 1GbE (на каждом контроллере) и поддержка установки сетевой карты 10GbE/25GbE благодаря разъему PCIe 3.0 позволяют увеличить пропускную способность сети с помощью Link Aggregation.

Dell EMC NX

Система хранения Dell EMC NX3240. Оптимизированное управление файлами и блоками данных с помощью передового программного обеспечения для эффективного и адаптивного совместного использования данных.

Система хранения Dell EMC NX3340. Сетевая система хранения данных (NAS) с технологией Cluster Ready, обеспечивающая эффективное развертывание и интеграцию с высокой доступностью для простого управления данными.

Система хранения Dell EMC NX440. Сетевая система хранения данных (NAS) с автоматической настройкой и управлением для эффективного обмена данными.

Что значит размещение файла

Конструктив серии Dell EMC NX (источник: Dell EMC).

ПО Dell OpenManage™ с консолью Dell Management Console, iDRAC8 или iDRAC9 Enterprise, встроенным подключаемым модулем Java RDP или интерфейсом управления Windows Server

Функции управления данными в СХД Dell EMC

Дедупликация данных со сжатием, FCI (инфраструктура классификации файлов), FSRM (диспетчер ресурсов файлового сервера).

Серия сетевых файловых хранилищ NAS Dell EMC Storage NX – это решение для малых и средних компаний, удаленных филиалов и офисов, нуждающихся в общем доступе к файлам. Серия базируется на процессорах Intel Xeon, поэтому обеспечивает высокий уровень быстродействия при работе с любыми требовательными нагрузками. Хранилища серии легко адаптируются к различным нагрузкам и обеспечивают низкую совокупную стоимость хранения ТСО.

Серия Dell Storage NX способна повысить эффективность использования емкости сетевой системы хранения данных (NAS) и оптимизировать дисковое пространство с помощью следующих встроенных функций:

NX3340 используется в качестве шлюза NAS к дополнительным массивам сетей хранения данных для масштабного внешнего расширения. Поддержка кластеризации (до 64 узлов) с использованием томов Clustered Shared Volumes (CSV) при подключении к массивам хранения PowerVault MD3, EqualLogic или Dell Compellent.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *