Что называется текстовым документом
Текстовый файл
Те́кстовый файл — компьютерный файл, содержащий текстовые данные, как правило, организованные в виде строк.
Текстовым файлам противопоставляются двоичные файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текста (например, файлы, хранящие закодированные звук или изображение).
В отличие от термина «текстовый формат», характеризующего содержимое данных, термин «текстовый файл» относится к файлу и характеризует его как контейнер, хранящий такие данные.
Содержание
Описание
Текстовый файл представляет из себя последовательность символов (в основном печатных знаков, принадлежащих тому или иному набору символов). Это символы обычно сгруппированы в строки (англ. lines, rows ). В современных системах строки разделяются разделителями строк, в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: Перфокарта). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры конца файла.
Текстовой файл может содержать как форматированный, так и неформатированный текст.
Преимущества и недостатки
Форматы, основанные на текстовых файлах
В текстовом файле текст может храниться как в неформатированном, так и форматированном или размеченном виде (например, Rich Text Format, HTML), где к каждому символу может быть применено форматирование (шрифт, начертание, размер и т. п.).
Расширения имён файлов
В DOS и Windows для файлов с неформатированным текстом обычно используется расширение .txt. Тем не менее, текстовыми могут являться файлы с любым другим расширением или без оного. Например, исходные коды программ обычно хранятся в файлах с расширениями, соответствующими языку программирования, на котором написаны программы (.bas, .pas, .c).
Форматированный тест (текст с разметкой) обычно хранится в файлах с расширением, соответствующим формату или языку разметки — .rtf, .htm, .html.
Кодировки
8-битный текст
Исторически для кодирования текстовых файлов применялись 7-битный набор символов ASCII, а также 8-битные EBCDIC и различные расширения ASCII. В 8-битных кодовых страницах общепринято использовать в первой половине кодовой таблицы символы, соответствующие ASCII.
Преимуществом 8-битного представления текста является программная простота и независимость от проблемы порядка байтов или длины машинного слова на разных платформах. Недостаток — большое количество различных стандартов, что может приводить к несовместимости.
Unicode в текстовых файлах
Применение Unicode в текстовых файлах хотя в основном решает «проблему кодировок» и стандартизирует употребление управляющих символов, но создаёт свои проблемы. В большинстве современных систем неделимой единицей информации в потоке данных является байт (8 бит), которых для кодирования одного символа из Юникода требуется несколько. В качестве решения применяются несовместимые между собой системы UTF-8 и две версии UTF-16 (UTF-16LE и UTF-16BE с противоположным порядком байтов). Иногда в начало файла добавляют специальный символ-маркер (U+FEFF [1] ), позволяющий распознать формат однозначно. UTF-8 имеет преимущество обратной совместимости с ASCII, однако программная обработка текста в UTF-8 усложняется непостоянным размером символа. Также, тексты в Юникоде отличаются ещё большей избыточностью, нежели 8-битные.
Управляющие символы
Различные операционные системы придерживаются своего представления перевода строки и конца файла. В UNIX перевод строки состоит из одного символа LF (код 10), в Mac OS — из символа CR (код 13), а в DOS и Windows перевод строки кодируется последовательностью двух символов: CR и LF.
Помимо названных, в текстовых файлах применяются такие символы, как табуляция (код 9) и перевод страницы (код 12).
Информатика
Именная карта банка для детей
с крутым дизайном, +200 бонусов
Закажи свою собственную карту банка и получи бонусы
План урока:
Текст как форма представления информации
Примером текстовой информации может служить параграф школьного учебника, детская считалка, ремарка актера в пьесе, расписание уроков, магазинный чек и т.д.
Издавна люди пытались сохранить различного рода сведения на таких носителях, как камень, глина, береста, папирус, на смену которым пришла повсеместно используемая бумага.
Письменный текст записывали различными инструментами – острой костяной палочкой, перьевыми ручками, авторучками и с позапрошлого века стали печатать на пишущих машинках.
Причиной перехода к безбумажным технологиям во многих сферах деятельности человека является увеличение скорости и качества обработки информации, уменьшение себестоимости электронных носителей при росте цен на бумагу вследствие мирового экологического кризиса.
Представление текстовой информации в компьютере –это преобразование вводимых символов с помощью кодовой таблицы. Современная универсальная таблица кодировки Unicode позволяет охватить более 65 тысяч символов различных алфавитов, цифры, знаки препинания, математические и другие символы.
Фрагмент кодовой таблицы Unicode
Для каждого знака в памяти компьютера выделяется 2 байта или 16 бит двоичного кода. Таким образом, можно вычислить объем текстовой информации, легко перемножив количество символов (включая пробелы) на информационный вес одного символа. Для выражения крупных объемов информации используются такие единицы измерения, как килобайты, мегабайты и гигабайты.
Единицы измерения информации
Различают следующие виды текстовой информации:
Большинство текстов имеют сложную структуру, подразумевающую сочетание различных типов сведений: когнитивных, оперативных, эмоциональных и эстетических. Каждый из видов информации в тексте характеризуется своими особыми способами языкового выражения.
Текстовые документы
В целях упрощения работы с письменной информацией создали специальное программное обеспечение – текстовые редакторы (процессоры). Каждый текст, написанный в нем, будет называться текстовым документом. Это может быть и научная статья с формулами, и рассказ, и рекламное объявление.
Основные объекты текстового документа
Различают следующие основные структурные единицы текстового документа:
Страница в текстовом документе – это отрывок текста, помещающийся на листе определенного формата.
Компьютер – основной инструмент работы с текстом
В современном мире компьютер – уникальное устройство, в том числе и для работы с текстовой информацией. Элементарные программы для текстовых документов имеют возможность создания текстов, составленных из символов, печатаемых с клавиатуры, и небольшой комплект инструментов для оформления информации. Для подготовки наиболее сложных текстов с графиками, табличным представлением данных, надписями, схемами, картинками и фотографиями целесообразно использование сильных текстовых процессоров.
Среди множества программ, предназначенных для работы с текстовой информацией, выделяют следующие:
Основные стадии подготовки электронного текстового документа:
Ввод текста
При вводе текстовой информации следует придерживаться несложных правил:
Редактирование текста
Редактирование текста представляет собой процедуру внесения необходимых правок. Этот этап подготовки документа требует внимания и усидчивости.
В процессе редактирования текста изменяется содержание текста. В результате работы текст должен стать грамотным и понятным.
Основными функциями редактирования текста являются:
Редактирование текста осуществляется перемещением курсора в необходимое место с помощью мыши либо нажатием служебных клавиш (их комбинации).
Основные сочетания клавиш
Работать можно как с отдельными знаками, строками, абзацами,так и со всем текстом. Прежде всего нужный фрагмент следует выделить. Для этого нужно установить курсорную стрелку в начало элемента и, зажимая левую кнопку мышки, провести до его окончания.
Далее можно его скопировать, вырезать, удалить соответствующими кнопками или сочетаниями клавиш.
Microsoft Word – самая популярная программа для редактирования текста. Она обладает богатыми возможностями и удобным интерфейсом. Основные средства для редактирования текста в Word:
Форматирование текста
Следующий этап обработки текста заключается в его форматировании. Форматирование текста подразумевает изменение внешнего вида документа. Информация подвергается оформлению по необходимым критериям.
Форматирование текста представляет собой:
Вначале выбирается альбомная или книжная ориентация страницы (Разметка страницы → Ориентация).
Также в этой вкладке можно устанавливать различные параметры страницы (поля, размер, колонки и т.д.)
Нумерация страницы производится нажатием на кнопку Вставка → Номер страницы.
В процессе форматирования текста изменяется размер, начертание и цвет шрифта на Главной вкладке.
Оформление абзацев состоит в выравнивании текста относительно границ страницы (по левому или правому краю, центру или ширине).
Применение номерованных или маркированных списков позволит облегчить восприятие текстовой информации.
Подготовка документа заканчивается его распечатыванием. Для этой цели используют принтеры (устройства, переводящие электронную информацию на бумажный носитель) разного типа:
Лазерные принтеры обеспечивают самую качественную печать.
21.Текстовый документ и его структура. Технологии подготовки текстовых документов
Из курса истории вам известно, какую огромную роль в развитии человечества сыграло возникновение письменности, позволившей зафиксировать устное слово с помощью букв-знаков. Надписи на камне, папирусе, бумаге — не просто сообщения, дошедшие до нас через века. Это документы, позволяющие нам судить о том, как жили люди в ту или иную эпоху, о чём они думали, что их интересовало.
Слово «документ» переводится с латинского как «свидетельство», «доказательство». Первоначально оно означало письменное подтверждение событий или фактов. Например, факт рождения каждого человека документально оформляется в виде свидетельства о рождении; по окончании школы вы получите аттестат — документ, подтверждающий ваше образование, и т. д.
Современное понятие документа значительно шире, чем «бумага, заверенная печатью и подписью». Текст является одной из важнейших форм представления информации об окружающей действительности. Под текстовым документом сегодня понимается информация, представленная на бумажном, электронном или ином материальном носителе в текстовой форме. Текстовый документ может быть статьёй, докладом, рассказом, стихотворением, объявлением, ведомостью, инструкцией, справкой и т. д.
Любой текстовый документ состоит из разделов (хотя бы из одного), которые, в свою очередь, могут содержать подразделы и т. д. Например, ваш учебник состоит из пяти крупных разделов — глав; каждая глава состоит из параграфов; параграфы разбиты на пункты. Глава, параграф, пункт — это примеры разделов. Каждый раздел имеет название или заголовок. Различают заголовки разделов 1-го уровня (например, названия глав), 2-го уровня (названия параграфов), 3-го уровня (названия пунктов) и т. д. Названия разделов разных уровней составляют оглавление документа.
Текст внутри раздела по смыслу разбивается на абзацы. Чаще всего каждый новый абзац начинается с красной строки. В этом пункте (4.1.1) выделено 7 абзацев.
В абзаце можно выделить отдельные строки, слова и символы — символьные структурные элементы.
Документ кроме текста может содержать рисунки, таблицы, схемы и т. д.
Технологии подготовки текстовых документов
На протяжении тысячелетий люди записывают информацию. В течение этого времени менялось и то, на чём записывали информацию, и то, с помощью чего это делали. Но не менялось главное: чтобы внести изменения в текст, его надо было переписать. А это очень длительный и трудоёмкий процесс.
Появление компьютеров коренным образом изменило технологию письма. На смену технологии создания рукописных и машинописных документов на бумаге («бумажная» технология) сегодня пришла «компьютерная» технология. С помощью специальных компьютерных программ можно создать любой текст, при необходимости внести в него изменения, не переписывая текст заново, записать текст в долговременную память компьютера для длительного хранения, отпечатать на принтере какое угодно количество копий текста без его повторного ввода или отправить текст с помощью электронной почты на другие компьютеры.
«Компьютерная» технология обладает рядом преимуществ по сравнению с технологией «бумажной». Давайте сравним эти технологии (рис. 4.1).
Большинство текстов, создаваемых на компьютере, выводятся на печать и используются в традиционной бумажной форме (документы на всевозможных бланках, газеты, журналы, учебники, справочники, научно-популярная и художественная литература и пр.). Наряду с этим в последнее время широкое распространение получили электронные книги — компактные устройства, предназначенные для отображения текстовой информации, представленной в электронном виде.
Можно указать ряд преимуществ электронных книг перед традиционными:
Основные недостатки современных электронных книг:
Компьютерные инструменты создания текстовых документов
Подготовка текстов — одна из самых распространённых сфер применения компьютеров. На любом компьютере установлены специальные программы для создания текстовых документов.
Текстовый редактор — это прикладная программа для создания и обработки текстовых документов.
Существуют простые текстовые редакторы и текстовые редакторы с расширенными возможностями (текстовые процессоры).
Простой текстовый редактор удобен для создания небольших несложных по структуре и оформлению текстов. Такие тексты состоят из букв, цифр, знаков препинания и специальных символов, которые можно ввести с помощью клавиатуры компьютера. Таблицы, формулы, схемы, чертежи простой текстовый редактор обрабатывать не может.
Примером простого текстового редактора является программа Блокнот. Наиболее часто она используется для просмотра и редактирования текстовых файлов, имеющих расширение txt. В программе Блокнот реализован минимум возможностей для оформления текстового документа. Многие пользователи применяют программу Блокнот в качестве простого инструмента для создания web-страниц.
Текстовый процессор — это текстовый редактор с широкими возможностями, позволяющий не только писать письма, рассказы, стихи, доклады, статьи для школьной газеты, но и выполнять автоматическую проверку правописания, изменять вид и размер шрифта, включать в документ таблицы, формулы, рисунки, схемы, звуковые фрагменты и многое другое.
Примерами текстовых процессоров могут служить:
• Writer, входящий в состав пакета OpenOffice.org;
• Word, входящий в состав пакета Microsoft Office.
Для подготовки буклетов, брошюр, газет, журналов и книг используются такие мощные профессиональные программные средства, как издательские системы.
Окна текстовых процессоров имеют типовую структуру. Рассмотрим её на примере окна текстового процессора OpenOffice.org Writer (рис. 4.2).
Вдоль верхнего края окна приложения располагается строка заголовка, содержащая имя документа, имя программы и кнопки управления.
Ниже строки заголовка расположена строка меню, содержащая имена групп команд, объединённых по функциональному признаку.
Под строкой меню может находиться несколько панелей инструментов, в том числе Стандартная и Форматирование.
Далее следует градуированная в сантиметрах линейка, с помощью которой определяются границы документа.
Рабочая область — это основная часть окна, предназначенная для создания документа и работы с ним. В рабочем поле находится курсор, чаще всего имеющий вид вертикальной линии, указывающей позицию рабочего поля, в которую будет помещён вводимый символ или другой элемент документа.
В строке состояния (нижняя часть окна) выводится справочная информация; там же указывается номер страницы, в которой расположен курсор.
Самое главное
Текстовый документ — это представленная на бумажном, электронном или ином материальном носителе информация в текстовой форме. Основными структурными единицами текстового документа являются раздел, абзац, строка, слово, символ.
На смену технологии, предполагающей создание рукописных и машинописных документов на бумаге («бумажная» технология), сегодня пришла «компьютерная» технология: документы, созданные с помощью специальных компьютерных программ, выводятся на бумагу посредством подключаемых к компьютеру печатающих устройств или хранятся на устройствах внешней памяти и редактируются с помощью компьютера.
Компьютерные инструменты создания текстовых документов можно разделить на простые текстовые редакторы, текстовые процессоры и издательские системы.
29.Текстовые документы
В различных словарях можно найти следующие толкования понятия «текст»:
1) упорядоченный набор слов, предназначенный для того, чтобы выразить некий смысл;
2) всякая записанная речь (литературное произведение, сочинение, документ ит. п., а также часть, отрывок из них);
3) последовательность языковых и иных знаков, образующая единое целое, служащее объектом изучения.
С позиции информатики, текст — это последовательность знаков некоторого алфавита.
Вам известно, что в памяти компьютера тексты представляются в двоичном коде: 1) за каждым символом алфавита закрепляется определённый двоичный код; 2) в двоичном коде представляется и информация о типе и размере используемого шрифта, положении строк, полей, отступов и прочая дополнительная информация.
Практически в любой профессиональной деятельности работник сталкивается с необходимостью подготовки текстовых документов различного назначения и объёма: от заявления о приёме на работу до составления отчёта по результатам проделанной работы.
Можно выделить следующие виды текстовых документов:
Для каждой из перечисленных разновидностей текстовых документов существует определённый набор правил, которых следует придерживаться при работе над ними. Личное письмо отличается по стилистике от официального документа, а художественное произведение — от научного текста. Различаются также словари наиболее употребляемых слов и терминов для перечисленных разновидностей документов.
Дайте характеристику каждому из видов текстовых документов — художественному тексту, научному тексту, деловому документу, рекламному документу, личному документу.
Виды программного обеспечения для обработки текстовой информации
Существует множество программных продуктов, предназначенных для работы с текстовой информацией. Представим классификацию этой разновидности прикладного программного обеспечения по его назначению.
Текстовые редакторы — это программы, которые помогают подготовить текст простой структуры, но не обладают необходимыми средствами оформления его для печати. Типичный пример — редактор Блокнот (в ОС Windows).
Текстовые процессоры — более сложные программные комплексы, позволяющие выполнить оформление текста, точно задать его расположение, включить в него графические материалы. Примеры — Microsoft Word, OpenOffice Writer.
Специальные программные средства для подготовки научных текстов, содержащих математические, химические или другие формулы, сложные схемы и специфические обозначения, используемые в научных, учебных и технических публикациях и документах. При подготовке научных, технических и учебных текстов часто используется свободно доступная система подготовки публикаций ТEХ.
Издательские системы — комплексы программных средств, позволяющих выполнить весь цикл допечатной подготовки издания: импорт или набор текста, его оформление и расположение на листах, вставку иллюстраций и сложных объектов, и в итоге — вывод издания на печать. Примерами таких программ могут быть пакеты Adobe InDesign, Scribus, QuarkXPress. Процесс и результат создания страниц издания называют вёрсткой, а точную копию самого издания — оригинал-макетом. Использование издательских систем позволило значительно сократить срок подготовки печатных изданий, снизить трудоёмкость этого процесса, значительно расширить творческие возможности дизайнеров печатных изданий.
Электронные переводчики и словари предназначены для автоматического перевода текстов с одного языка на другой, проверки правописания текстов на разных языках. Особым видом словарей являются тезаурусы — словари, в которых слова связываются на основе каких-либо лексических отношений (например, слова, являющиеся синонимами, антонимами и т. п.). Примеры — PROMT, ABBYY Lingvo.
Системы оптического распознавания текстов (например, ABBYY FineReader) предназначены для преобразования отсканированного графического изображения текстового документа в текстовый формат.
Кроме того, программы для работы с текстовой информацией интегрированы в системы программирования, а также являются частью HTML-редакторов, предназначенных для создания вебстраниц.
Создание текстовых документов на компьютере
При подготовке текстовых документов на компьютере используются три основные группы операций: ввод, редактирование, форматирование.
Операции ввода позволяют сформировать содержимое и первоначальный вид текстового документа и сохранить его в памяти компьютера. Ввод может осуществляться не только набором с помощью клавиатуры, но и путём сканирования бумажного оригинала и последующего перевода документа из графического формата в текстовый (распознавания).
Напомним основные правила ввода текстовых документов с помощью клавиатуры.
При вводе и редактировании текста полезно включать режим отображения скрытых символов — символов, которые вводятся пользователем при наборе текста, но при печати не выводятся на бумагу, а на экране отображаются только при включении соответствующего режима (табл. 5.1). Режим отображения скрытых символов даёт возможность лучше понять структуру документа.
Для автоматизации ввода в современных текстовых процессорах существуют инструменты Автозамена и Автотекст.
Бывает, что при вводе текста с клавиатуры пользователь допускает опечатки: вместо нужной клавиши нажимает соседнюю, пропускает букву, меняет две буквы местами. Такие опечатки исправляются автоматически инструментом Автозамена, имеющим встроенный словарь наиболее типичных опечаток и ошибочных написаний.
Для быстрого ввода стандартных фраз по нескольким первым буквам можно использовать инструмент Автотекст. Он автоматически предлагает вставить короткую фразу из списка элементов автотекста, как только будут набраны несколько первых букв этой фразы.
Операции редактирования (правки) позволяют изменить уже существующий электронный документ путём добавления или удаления фрагментов, перестановки частей документа, слияния нескольких файлов, разбиения единого документа на несколько более мелких и т. д. (рис. 5.1)
На протяжении многих веков для внесения изменений в текст нужно было заново переписывать его. Основное преимущество компьютерной технологии создания текстовых документов заключается именно в удобстве его редактирования. Возможность быстро исправлять ошибки является одной из основных причин повсеместного перевода подготовки текстовой информации с бумажной на компьютерную основу.
23.3. Создание текстовых документов на компьютере
Ввод и редактирование при работе над текстом часто выполняются параллельно. При вводе и редактировании формируется содержание текстового документа.
Совокупность значений свойств объекта называют форматом объекта, а изменение этих значений — форматированием объекта.
Операции форматирования позволяют точно определить, как будет выглядеть текст на экране монитора или на бумаге после печати на принтере. Операции форматирования могут применяться как к отдельным объектам текстового документа (табл. 5.2), так и ко всему документу в целом. В первом случае говорят о прямом форматировании, во втором — о стилевом.
Такие действия по оформлению документа, как выравнивание абзацев, установка абзацных отступов и интервалов между абзацами, строками в абзацах и символами в словах и т. п., выполняются специальными средствами текстовых процессоров, а не вставкой пробелов и пустых строк.
Для облегчения анализа и последующего преобразования текста очень важно соблюдать основные правила его ввода, редактирования и форматирования.
В современных текстовых процессорах есть специальные инструменты, обеспечивающие автоматическую нумерацию страниц, таблиц и рисунков.
При работе с большими текстами, как правило, применяют стилевое форматирование. Смысл этой операции заключается в том, что структурным элементам, несущим одну и ту же функциональную нагрузку (например, заголовкам одного уровня, основному тексту, примерам и т. д.), назначается определённый стиль форматирования — набор параметров форматирования (шрифт, его начертание и размер, абзацные отступы, междустрочный интервал и др.).
Стиль — это имеющий имя набор значений свойств объектов каждого типа, входящих в текстовый документ.
В заключение приведём основные правила оформления текстов:
Средства автоматизации процесса создания документов
Мы рассмотрели основные операции ввода, редактирования и форматирования документов. Многие из них в той или иной мере направлены на автоматизацию процесса создания текстовых документов. Ещё больше возможностей в этом направлении обеспечивает использование шаблонов, макросов и средств, обеспечивающих работу со структурными компонентами документа.
Многие типовые документы должны иметь стандартный вид, который определяет, что и где размещается в создаваемом тексте, например: кому адресован документ, от кого он, дата создания документа и другие реквизиты.
Требования к оформлению, структуре и содержанию многих документов устанавливаются стандартами. Все они находятся в открытом доступе в Интернете.
Найдите в Интернете и познакомьтесь со следующими стандартами:
Какие из них имеют статус государственных, а какие — межгосударственных? Как это отражено в названии стандартов?
Что означают аббревиатуры ГОСТ, ЕСКД, СИБИД?
Какие из этих стандартов могут быть полезны в вашей учебной деятельности?
В текстовых процессорах есть шаблоны для создания документов разного типа.
Шаблон — это отформатированный определённым образом документ-заготовка, который хранится в отдельном файле и используется в качестве основы для создания новых документов определённого типа.
Пользователю достаточно ввести свою информацию в отдельные блоки шаблона, и она автоматически приобретёт заранее заданное оформление. В недалёком будущем каждому из вас для поиска подходящей работы придётся составить и разослать резюме. Подготовить его лучше всего с использованием соответствующего шаблона (рис. 5.2).
В текстовом процессоре Microsoft Word все шаблоны распределены на три группы:
1) установленные — шаблоны документов определённых типов (писем, факсов, отчётов и др.), которые инсталлированы на компьютере в составе пакета Microsoft Office;
2) Microsoft Office Online — шаблоны документов разнообразных типов (поздравительных открыток, визиток, бюллетеней, сертификатов, грамот, приглашений, заявлений, календарей и др.), которые расположены на веб-сайте Microsoft Office Online;
3) шаблоны пользователя — шаблоны, которые созданы пользователем.
23.4. Средства автоматизации процесса создания документов
При запуске программы Microsoft Word автоматически открывается шаблон Новый документ (файл Normal.dotm). При этом по умолчанию устанавливается формат (значения свойств) основных объектов документа — страницы, абзаца, символа, а также задаётся стилевое форматирование заголовков, списков, таблиц и др.
Запустите имеющийся в вашем распоряжении текстовый процессор. Исследуйте формат основных объектов документа в шаблоне Новый документ, выяснив для них значения свойств, приведённых ниже:
В процессе работы над документом в программе Microsoft Word часто приходится выполнять задания по некоторому алгоритму, состоящему из определённой последовательности действий. Например, подчеркнуть слова, написанные латинскими буквами, отформатировать какое-то слово во всём документе определённым образом и др.
Макрос — это последовательность команд, сгруппированных в одну макрокоманду, для автоматического выполнения определённого задания.
Основное назначение макроса состоит в том, чтобы освободить пользователя от многократного повторения однообразных действий во время обработки текстового документа, выполнить за него рутинную работу. Макрос создаётся один раз, сохраняется в шаблоне или документе и может многократно выполняться для автоматизации и ускорения обработки текстового документа.
Многостраничные документы (рефераты, брошюры, книги и т. п.) принято делить на структурные части — главы, параграфы, пункты ит. п., создавая таким образом иерархическую структуру документа. Рассмотрим в качестве примера структуру этого учебника. На верхнем (нулевом) уровне иерархии находится название документа («Информатика. 10 класс»); на первом уровне — названия глав, второй уровень составляют названия параграфов, третий — названия пунктов в параграфах, дальше размещается основной текст учебника.
Структура документа — это иерархическая схема размещения составных частей документа.
Использование в текстовом процессоре Microsoft Word специальных стилей с именами Заголовок 1, Заголовок 2 и т. д. даёт возможность автоматизировать создание иерархической структуры документа. В текстовом процессоре Microsoft Word для просмотра структуры документа используется режим просмотра Структура. В нём удобно редактировать иерархическую схему документа, изменяя с помощью специальных инструментов уровень текстовых фрагментов и последовательность их размещения.
Современные текстовые процессоры позволяют автоматически создавать оглавления документов, в которых к заголовкам разделов разных уровней применено стилевое форматирование. С помощью специальной команды пользователь указывает, заголовки каких уровней следует включить в оглавление, и абзацы указанных стилей автоматически выбираются из текста документа и помещаются с указанием номеров страниц, с которых они были взяты, в новый раздел «Оглавление».
Оглавление документа — это перечень названий структурных частей документа, упорядоченных в соответствии с его иерархической схемой, с указанием соответствующих номеров страниц
ГОСТ 7.32-2001 «СИБИД. Отчёт о научно-исследовательской работе. Структура и правила оформления»
Совместная работа над документом
Под совместной (коллективной) работой над документом принято понимать участие нескольких человек в создании одного текстового документа, при котором у каждого из них есть возможность отслеживать все изменения, сделанные в документе другими разработчиками, а также осуществлять возврат к одной из предыдущих версий документа.
На протяжении долгого времени процесс совместной работы над документом был устроен так: кто-то создавал текст на заданную тему, распечатывал его и отдавал другому человеку. Этот человек дописывал «от руки» свои вставки и комментарии и возвращал черновики на доработку. Такие итерации могли происходить неоднократно, в результате работа шла медленно, к тому же отдельные ценные мысли и идеи могли быть утеряны безвозвратно.
Современные инструменты создания текстовой информации предоставляют принципиально иные возможности для совместной работы над документом, поддерживая следующие варианты её организации.
1. Документ, над которым ведётся работа, можно сделать составным, объединяющим несколько других документов. Каждый разработчик создаёт и редактирует свою часть составного документа независимо от других, при этом в процессе работы он может просматривать текущую версию общего документа. Такой вариант организации совместной работы основывается на возможности создания мастер-документа, к которому могут прикрепляться другие документы.
2. Каждая из частей составного документа может редактироваться несколькими людьми. Для этого в современных текстовых процессорах предусмотрена возможность отслеживать и протоколировать сделанные изменения, делать примечания — пометки на полях.
Для отслеживания собственных исправлений, а также чтобы другие соавторы могли вносить изменения в документ, текстовый процессор предлагает использовать маркеры исправлений. Маркеры исправлений помогают увидеть, какие изменения были внесены в документ по сравнению с его последней версией. Для изображения исправлений используется специальный формат, например подчёркивание. С помощью маркеров исправлений можно сохранить запись о каждом сделанном исправлении и в дальнейшем либо принять его, либо отказаться. Исправление помечается полным именем его автора, датой и временем создания.
При совместной работе над документом важно, чтобы в настройках текстового процессора были указаны корректные данные о пользователе, т. к. именно они останутся в редактируемом документе.
Примечания — это обозначенные инициалами и пронумерованные комментарии, которые записываются и отображаются в специальном окне примечаний и не затрагивают текст документа. Перед тем как вставить примечание, имеет смысл выделить фрагмент текста, который следует прокомментировать. В этом случае при просмотре примечания текст, к которому оно относится, будет подсвечен.
Имеются возможности сравнения двух версий документов или объединения всех исправлений и примечаний в один документ, для просмотра их всех сразу. Сделанные в тексте изменения перед сохранением окончательной версии документа можно принять или отклонить.
Оба рассмотренных варианта организации совместной работы поддерживаются и в OpenOffice Writer, и в Microsoft Word.
3. Можно редактировать документ непосредственно в сети, также отслеживая все изменения, сделанные другими пользователями. Этот вариант поддерживается Google Docs — сетевым приложением, доступным через веб-браузер. Поскольку редактируемый документ сохраняется на сервере, он доступен всем пользователям, между которыми он разделяется. Каждый раз при сохранении документа сохраняется его новая версия и информация о том, кто этот документ редактировал. Команда просмотра изменений открывает список сделанных изменений с указанием, кто и когда их внёс. Различные версии документов можно сравнить между собой.
4. Можно использовать и промежуточный вариант, когда документ редактируется локально на компьютере, а храниться в сети и там же отслеживаются все изменения.
Оформление реферата как пример автоматизации процесса создания документов
Старшеклассники, студенты, курсанты в процессе своей учебной деятельности готовят рефераты по различным предметам.
Реферат — это самостоятельная исследовательская работа, в которой автор раскрывает суть исследуемой проблемы, приводит различные точки зрения, делает собственные выводы.
Выбрав тему реферата, необходимо определить цель работы, составить план (поставить задачи, определить порядок и сроки выполнения задач), найти и изучить материалы различных информационных источников, собрать и обработать информацию, сделать выводы, оценить полученные результаты.
Содержание реферата должно быть логичным, изложенным ясным языком. Основные положения реферата желательно подкреплять цитатами и ссылками на информационные источники.
Есть определённые требования и к оформлению реферата.
Реферат должен быть выполнен на одной стороне листов белой бумаги формата А4 (210 х 297 мм).
Размеры полей страницы (не менее):
Отступ первой строки: 8-12 мм, одинаковый по всему тексту.
Интервал междустрочный: полуторный.
Выравнивание абзаца: по ширине.
Гарнитура шрифта основного текста — Times New Roman или аналогичная.
Кегль (размер): 12-14 пунктов.
Цвет шрифта: чёрный.
Заголовки разделов и подразделов следует печатать на отдельной строке с прописной буквы без точки в конце, не подчёркивая. Если заголовок состоит из нескольких предложений, их разделяют точкой. Выравнивание по центру или по левому краю. Интервал: перед заголовком — 12 пунктов, после — 6 пунктов.
Страницы следует нумеровать арабскими цифрами, соблюдая сквозную нумерацию по всему тексту (титульный лист и оглавление включают в общую нумерацию). На титульном листе номер не проставляют.
В верхней части титульного листа пишется, в каком образовательном учреждении выполняется работа, далее буквами увеличенного кегля указывается тип («Реферат») и тема работы, ниже в правой половине листа — информация о тех, кто выполнил и кто проверит работу. В центре нижней части титульного листа пишется название населённого пункта и год выполнения работы.
Из курса русского языка вам известно, что цитата — это приведённое полностью или частично высказывание из авторского текста (научной, художественной, публицистической и др. литературы или доклада). Цитаты оформляются как прямая речь или как продолжение предложения.
Правовой статус цитирования определяется Гражданским кодексом РФ, согласно которому цитирование «допускается без согласия автора или иного правообладателя и без выплаты вознаграждения, но с обязательным указанием имени автора, произведение которого используется, и источника заимствования» (статья 1274 части 4 Гражданского кодекса РФ).
Допустим, при работе над рефератом вы взяли (заимствовали) информацию из источника «Андреева, Е. В. Математические основы информатики. Элективный курс: учебное пособие / Е. В. Андреева, Л. Л. Босова, И. Н. Фалина. — М.: БИНОМ. Лаборатория знаний, 2005». Необходимо правильно оформить ссылку на этот источник и внести его в список литературы.
Правила оформления ссылок регулируются ГОСТ Р 7.0.5-2008 «Система стандартов по информации, библиотечному и издательскому делу. Библиографическая ссылка. Общие требования и правила составления».
Правила оформления библиографических сведений в списке использованной литературы должны отвечать требованиям ГОСТ 7.12003 «Система стандартов по информации, библиотечному и издательскому делу. Библиографическая запись. Библиографическое описание. Общие требования и правила составления».
Для оформления ссылки в текстовом процессоре Microsoft Word можно:
1) установить курсор после заимствованного текста и выполнить команду Ссылки → Вставить ссылку → Добавить новый источник. ;
2) заполнить поля диалогового окна Создать источник (рис. 5.3);
3) затем щёлкнуть на кнопке ОК и после заимствованного фрагмента текста появится ссылка на источник в виде: «(Е. В. Андреева, 2005)».
Для оформления списка литературы в текстовом процессоре Microsoft Word можно:
1) выбрать стиль отображения списка литературы (библиографического списка), выполнив команду Ссылки → Стиль: → ГОСТ — сортировка по именам 2003;
2) выполнить команду Ссылки → Список литературы → Вставить список литературы.
Другие возможности автоматизации обработки текстовой информации
Компьютер помогает не только автоматизировать процесс создания текстовых документов, но и решить множество других задач, связанных с обработкой текстовой информации. Вот некоторые из них:
Область информатики, решающая эти и другие задачи, связанные с обработкой информации на естественном языке, называется компьютерной лингвистикой.
Рассмотрим более подробно задачу поиска текста в общем массиве. Существует несколько подходов к её решению.
Первый подход опирается на поиск фрагмента текста, соответствующего некоторому образцу. Таким способом в большом текстовом массиве можно находить упоминания тех или иных слов, адреса, номера телефонов и другие элементы. Основное достоинство такого подхода — возможность применять его к массиву текста без предварительной обработки (например, сразу при посимвольном получении текста). Применение рассматриваемого способа бывает затруднено, если текст хранится в разных местах.
Второй подход предусматривает предварительную обработку текста с целью получения его преобразованного, сокращённого вида (индекса). Получив запрос, поисковая система выделяет список слов и составляет список документов, в которых они содержатся. При этом рассчитывается релевантность — мера соответствия документа запросу, зависящая от наличия искомых слов, близости их друг к другу и других параметров. Документы с высокой релевантностью помещаются в начало списка, с низкой — в конец.
Одно из интересных применений автоматического анализа текстов — выявление заимствований.
Антиплагиат (antiplagiat.ru) — российский интернет-проект, программно-аппаратный комплекс для проверки текстовых документов на наличие заимствований из страниц сети Интернет и других источников. Проект доступен для всех пользователей.
Самое главное
Информационные технологии (ИТ) — это совокупность методов, производственных процессов, программно-технических и лингвистических средств, объединённых с целью сбора, обработки, хранения, распространения, отображения и использования информации, представленной в цифровой форме.
С позиции информатики, текст — это последовательность знаков некоторого алфавита. Существует множество программных продуктов, предназначенных для работы с текстовой информацией.
При подготовке текстовых документов на компьютере используются три основные группы операций: ввод, редактирование, форматирование.
Операции ввода позволяют сформировать содержимое и первоначальный вид текстового документа и сохранить его в памяти компьютера.
Операции редактирования (правки) позволяют изменить уже существующий электронный документ путём добавления, удаления, перестановки фрагментов, слияния нескольких файлов, разбиения единого документа на несколько более мелких и т. д.
Операции форматирования позволяют точно определить, как будет выглядеть текст на экране монитора или на бумаге после печати на принтере. Операции форматирования могут применяться как к отдельным объектам текстового документа, так и ко всему документу в целом.
Автоматизация процесса создания текстовых документов обеспечивается за счёт возможности работы с фрагментами, проверки правописания, стилевого форматирования, а также использования шаблонов, макросов и средств, обеспечивающих работу со структурными компонентами документа.
Компьютер помогает автоматизировать не только процесс создания текстовых документов, но и решить множество других задач, связанных с обработки текстовой информации, а именно: