Любые данные, обрабатываемые компьютером, включая текстовые, хранятся на внешних носителях только в виде файлов. В зависимости от характера информации, каждая программа предусматривает определенный способ организации данных , т.е. формат файла . С каждым форматом связано определенное расширение имени файла : )

§ TXT - это простейший из всех известных способов организации данных (расширение имени файла - txt). Вся информация в таком файле представлена просто символами кодовой таблицы. Этот формат текстового файла называют ещё «каноническим» форматом.

Примечание.

Основное достоинство текстового файла - его простота и универсальность . Фактически - это мировой стандарт представления текстовой информации . Применяется этот формат в тех случаях, когда не имеет значения качество воспроизведения документа на бумаге: для хранения и печати всевозможной рутинной информации, для обмена данными между людьми через мировые сети, для подготовки черновиков серьезных книг и т. д. Кроме того, «канонический » формат имеют файлы настроек большинства современных операционных систем (включая DOS и Windows ).

Для представления текстовой (символьной) информации в компьютерах используется так называемая кодовая таблица .

Определение. Кодовая таблица - это внутреннее представление символов в компьютере. В кодовой таблице каждому символу (букве, цифре, служебному знаку) присвоен какой-либо код - десятичное число в диапазоне от 0 до 255 (т.к. для представления одного символа используется 1 байт). Таким образом, можно закодировать ровно 256 символов.

Примечание.

Кодовая таблица делится на две половины :

§ Первая половина содержит коды символов в диапазоне от 0 до 127. Она принята во всём мире в качестве стандарта США и называется таблицей ASCII (American Standard Code for Information Interchange) .

§ Вторая половина – коды от 128 до 255. Она не определена американскими стандартами и предназначена для размещения символов национальных алфавитов (в частности, кириллицы ), псевдографических символов , некоторых математических знаков . В разных странах, на разных моделях ПК, в разных операционных системах могут использоваться разные варианты второй половины кодовой таблицы (их называют расширениями ASCII ). Текстовые файлы, которые содержат только символы первой половины кодовой таблицы, часто называют файлами ASCII . 1)

Текстовая информация (если в ней имеются символы второй половины кодовой таблицы) может быть представлена чаще всего в двух кодировках - СР-866 (MS-DOS ) и СР-1251 (Windows ). 1) По этим причинам, если текстовый файл подготовлен в среде MS-DOS (например, с помощью MS-DOS Editor ), его нельзя правильно прочитать средствами Windows - и наоборот, файл с расширением txt , в кодировке СР-1251 , созданный, например, в текстовом редакторе Блокнот, будет неправильно прочитан в MS-DOS .

Примечание.

Следовательно, если, после открытия текстового файла, пользователь увидел на экране «абракадабру », то это означает, что такой файл был создан в другой среде (однако следует отметить, что существуют средства перекодировки (конвертации) файлов для перевода текста из одной системы кодировки в другую).

В текстовых файлах можно создавать также таблицы и несложные «стилизованные» рисунки. Для этих целей используются символы псевдографики и специальные символы-заполнители из второй половины кодовой таблицы. Для создания, просмотра имодификации (редактирования) текстовых документов используются специальные прикладные программы, которые называются редакторами текстов .

Кроме формата TXT известны также следующие форматы текстовых файлов:

§ RTF (Rich Text Format) - формат обмена документов между текстовыми процессорами (расширение имени файла - rtf). Он был разработан фирмой Microsoft в 1986 году. Главное его достоинство в том, что его внутренняя организация предусматривает передачу всех основных элементов форматирования: параметров шрифта, абзаца и прочее. Этот формат распознается практически всеми текстовыми редакторами и процессорами.

§ DOC - является одним из самых популярных форматов в России в настоящее время, хотя, по-существу, это внутренний формат текстового процессора Microsoft Word (расширение имени файла - doc). Полностью сохраняет форматирование текстового документа.

§ HTML (Hypertext Markup Language) - универсальный язык гипертекстовой разметки, применяемый в Internet для разработки Web-страниц (расширение имени файла - htm). Этот формат используется как альтернативный формат сохранения информации в текстовых процессорах.

§ PDF (Portable Document Format) - переносимый формат документов, причем он дает возможность любым организациям, работающим с большим объемом документов, сохранять точное форматирование страниц при обмене файлами (расширение имени файла - pdf). Этот формат документов был задуман для реализации просмотра полностью отформатированных документов без помощи создавшего их приложения или установки дополнительных шрифтов. Для оперирования с PDF-файлами необходимо установить программный пакет Adobe Acrobat.

В таблице ниже перечислены различные виды документов, которые можно сохранять в приложении Word.

Формат файла

Описание

Документ Word (DOCX).

По умолчанию XML формат документов Word 2008 для Mac, Word для Mac 2011, Word 2016 для Mac, Word 2007 для Windows, Word 2010 для Windows, Word 2013 для Windows и Word 2016 для Windows.

Документ Word 97–2004 (DOC)

Формат документов, совместимый с версиями от Word 98 до Word 2004 для Mac и от Word 97 до Word 2003 для Windows.

Шаблон Word (DOTX).

Сохранение документа в виде XML-шаблона, на базе которого можно создавать новые документы. Сохранение содержимого документа и его параметров, в том числе стилей, разметки страниц, элементов автотекста, пользовательских сочетаний клавиш и меню.

Шаблон Word 97–2004 (DOT)

Сохранение документа в виде шаблона, на основе которого можно создавать новые документы. Сохранение содержимого документа и его параметров, в том числе стилей, разметки страниц, элементов автотекста, пользовательских сочетаний клавиш и меню. Совместим с версиями Word 97–2003 для Windows и Word 98–2004 для Mac.

Формат RTF

Экспорт содержимого и форматирования документа в формате, распознаваемом и читаемом другими приложениями, включая совместимые программы Майкрософт.

Обычный текст (TXT)

Экспорт содержимого документа в текстовый файл и сохранение текста без форматирования. Этот формат следует выбирать лишь в том случае, если целевая программа не способна читать файлы других доступных форматов. В этом формате используется расширенный набор символов ASCII для Mac.

Веб-страница (HTM)

Сохранение документа в формате, предназначенном для просмотра в Интернете. HTML - это стандартный веб-формат, который отображается в браузерах Macintosh и Windows.

Экспорт документа в PDF-файл, который выглядит одинаково на компьютерах Macintosh и Windows.

Документ Word с поддержкой макросов (DOCM)

XML-формат документов, который позволяет хранить код макросов VBA. Макросы VBA выполняются в Word 2016 для Mac и Word для Mac 2011, но они не работают в Word 2008.

Шаблон Word с поддержкой макросов (DOTM)

Сохранение документа в виде XML-шаблона, который позволяет хранить код макросов VBA. Макросы VBA выполняются в Word 2016 для Mac и Word для Mac 2011, но они не работают в Word 2008.

XML-документ Word (XML)

Экспорт содержимого документа в XML-файл. Преобразование всех инструкций форматирования и текста в формат XML. Совместим с Word 2007 для Windows.

XML-документ Word 2003 (XML)

Экспорт содержимого документа в XML-файл. Преобразование всех инструкций форматирования и текста в формат XML. Совместим с Word 2003 для Windows.

Веб-страница в одном файле (MHT)

Сохранение документа в формате, предназначенном для просмотра в Интернете, с созданием единого файла со всеми элементами страницы, такими как графические объекты. Используется интернет-стандарт MIME HTML.

Шаблон документа Word (DOC)

Сохранение документа с пометкой "Шаблон" для системы поиска. При открытии такого файла будет открываться новый документ без названия.

Настраиваемый словарь (DIC)

Сохранение содержимого документа в качестве файла словаря, предназначенного для хранения слов и терминов, которые не входят в основной словарь.

Словарь исключений (DIC)

Сохранение содержимого документа в качестве файла словаря, предназначенного для хранения предпочтительных вариантов правильно написанных слов. Выбирайте этот вариант, если нужно сохранить в словаре исключений слово наподобие "нуль", чтобы приложение Word не помечало его как неправильно написанное.

Совместимый с Word 4.0–6.0/95 (RTF)

Этот формат RTF совместим с версиями от Word 4.0 до Word 6.0 для Mac, а также с Word 6.0 и Word 95 для Windows.

Тема Office (THMX)

Сохранение шрифта, цветовой схемы и фона файла для использования в качестве новой темы.

Чтобы применить к документу тему из другого документа, на вкладке Главная в разделе Темы выберите команду Обзор тем . Чтобы сохранить измененную тему как новую, на вкладке Главная в разделе Темы выберите команду Сохранить тему .

См. также

Примечание: Отказ от ответственности относительно машинного перевода . Данная статья была переведена с помощью компьютерной системы без участия человека. Microsoft предлагает эти машинные переводы, чтобы помочь пользователям, которые не знают английского языка, ознакомиться с материалами о продуктах, услугах и технологиях Microsoft. Поскольку статья была переведена с использованием машинного перевода, она может содержать лексические,синтаксические и грамматические ошибки.

Масштаб отображения документа

Режимы отображения документов

Один и тот же документ в текстовом процессоре можно рассматривать в разных режимах.

В обычном режиме представляется только содержательная часть документа без реквизитных элементов оформления, относящихся к печатным страницам, таких как: колонтитулы, подстраничные сноски и т.п. Этот режим удобен на ранних этапах разработки документа (ввод текста, редактирование, рецензирование), а также во всех случаях, когда содержательная часть документа имеет более высокое значение, чем внешнее представление. В этом режиме операции с объемными документами происходят быстрее.

В режиме Web-документа экранное представление не совпадает с печатным. Оно характерно для электронных публикаций в WWW. Назначенные параметры страницы не учитываются, а форматирование на экране является относительным. В этом режиме разрабатывают электронные публикации.

В режиме разметки экранное представление документа полностью соответствует печатному, вплоть до назначенных параметров страницы. Этот режим удобен для большинства работ, связанных с форматированием текста, предназначенного для печати.

В режиме структуры можно отобразить только заголовки документа. Режим полезен в тех случаях, когда разработку документа начинают с создания плана содержания. Режим отличается тем, что при его включении на панели инструментов автоматически открывается вспомогательная панель Структура.

Выбор одного из выше указанных режимов представления документа выполняют с помощью командных кнопок, расположенных в левом нижнем углу окна приложения , или командами меню Вид.

Через меню Файл доступны еще два режима представления документа, используемые для предварительного просмотра. Для электронных документов используют команду Файл → Предварительный просмотр Web-страницы, а для печатных – Файл → Предварительный просмотр.

Если шрифт на экране выглядит слишком мелким, нужно настроить масштаб отображения документа командой Вид → Масштаб или использовать раскрывающийся список Масштаб на панели инструментов Стандартная . Если желаемого масштаба нет в списке, его можно ввести непосредственно в поле списка.

Существуют универсальные форматы текстовых файлов, которые могут быть прочитаны большинством текстовых процессоров и оригинальные форматы, которые используются отдельными текстовыми процессорами. Для преобразования текстового файла из одного формата в другой используются специальные программыконверторы . В текстовых процессорах такие конверторы входят в состав системы.

Некоторые форматы текстовых файлов:

Только текст (.txt) – наиболее универсальный формат. Сохраняет текст без форматирования, в текст вставляются только управляющие символы конца абзаца.

Текст в формате(.rtf) – универсальный формат, который сохраняет все форматирование. Текст в данном формате может быть прочитан и интерпретирован многими приложениями (например, предыдущими версиями Word)

Документ Word (.doc) – оригинальный формат используемой версии Word.

Текстовый документ Works для Windows (.wps) - оригинальный формат интегрированной системы Works. Преобразование в формат документа Word возможно при наличии конвертора, при этом форматирование Works сохраняется не полностью.

HTML документ (.htm, .html) – формат хранения Web-страниц. Содержит управляющие коды (теги) языка разметки гипертекста.

Преобразование формата текстового документа можно производить в процессе его сохранения или открытия. Конверторы, входящие в состав текстового процессора, позволяют импортировать и экспортировать документы из одного приложения в другое.



Эта статья также доступна на следующих языках: Тайский

  • Next

    Огромное Вам СПАСИБО за очень полезную информацию в статье. Очень понятно все изложено. Чувствуется, что проделана большая работа по анализу работы магазина eBay

    • Спасибо вам и другим постоянным читателям моего блога. Без вас у меня не было бы достаточной мотивации, чтобы посвящать много времени ведению этого сайта. У меня мозги так устроены: люблю копнуть вглубь, систематизировать разрозненные данные, пробовать то, что раньше до меня никто не делал, либо не смотрел под таким углом зрения. Жаль, что только нашим соотечественникам из-за кризиса в России отнюдь не до шоппинга на eBay. Покупают на Алиэкспрессе из Китая, так как там в разы дешевле товары (часто в ущерб качеству). Но онлайн-аукционы eBay, Amazon, ETSY легко дадут китайцам фору по ассортименту брендовых вещей, винтажных вещей, ручной работы и разных этнических товаров.

      • Next

        В ваших статьях ценно именно ваше личное отношение и анализ темы. Вы этот блог не бросайте, я сюда часто заглядываю. Нас таких много должно быть. Мне на эл. почту пришло недавно предложение о том, что научат торговать на Амазоне и eBay. И я вспомнила про ваши подробные статьи об этих торг. площ. Перечитала все заново и сделала вывод, что курсы- это лохотрон. Сама на eBay еще ничего не покупала. Я не из России , а из Казахстана (г. Алматы). Но нам тоже лишних трат пока не надо. Желаю вам удачи и берегите себя в азиатских краях.

  • Еще приятно, что попытки eBay по руссификации интерфейса для пользователей из России и стран СНГ, начали приносить плоды. Ведь подавляющая часть граждан стран бывшего СССР не сильна познаниями иностранных языков. Английский язык знают не более 5% населения. Среди молодежи — побольше. Поэтому хотя бы интерфейс на русском языке — это большая помощь для онлайн-шоппинга на этой торговой площадке. Ебей не пошел по пути китайского собрата Алиэкспресс, где совершается машинный (очень корявый и непонятный, местами вызывающий смех) перевод описания товаров. Надеюсь, что на более продвинутом этапе развития искусственного интеллекта станет реальностью качественный машинный перевод с любого языка на любой за считанные доли секунды. Пока имеем вот что (профиль одного из продавцов на ебей с русским интерфейсом, но англоязычным описанием):
    https://uploads.disquscdn.com/images/7a52c9a89108b922159a4fad35de0ab0bee0c8804b9731f56d8a1dc659655d60.png