, хотя, строго говоря, это неверно [прояснить ] .

Например, окончание имени (расширение) «.txt » обычно используют для обозначения файлов, содержащих только текстовую информацию , а «.doc » - содержащих текстовую информацию, структурированную в соответствии со стандартами программы Microsoft Word . Файлы, содержимое которых соответствует одному формату (реже - одному семейству форматов), иногда называют файлами одного типа .

Определение этого термина довольно просто: куча файлов под одной крышей. Конанер чаще всего состоит из видеокодека и аудиокодека, хотя иногда он может содержать другие типы файлов, такие как субтитры. Контейнеры позволяют выбирать видео и аудио кодек, что означает, что вы можете решить, где вы компромисс между качеством изображения и звука и занимаемым ими пространством. Вот несколько примеров популярных контейнеров.

Поэтому основное различие между различными типами контейнеров не ограничивается типом кодеков, которые они поддерживают, но также и их дополнительными функциями. Так в чем же разница между всеми этими видеоформатами и какие из них следует использовать?

Так как общепринятая в вычислительной технике концепция файла - неструктурированная последовательность байтов , компьютерные программы , сохраняющие структурированные данные в файлы, должны как-то преобразовывать их в последовательность байтов и наоборот (в ООП эти операции называются, соответственно, «сериализацией » и «десериализацией»; для текстовой информации последнее также называется «разбор» или «парсинг »). Алгоритм этих преобразований, а также соглашения о том, как различные фрагменты структурированных данных располагаются внутри файла, и составляют его «формат».

Вас спросят, где вы хотите сохранить новый документ и какое имя оно будет иметь. После ввода этих данных нажмите кнопку «Сохранить». Файл будет создан в указанном вами местоположении. Вы можете сохранить документ под другим именем, нажав кнопку «Сохранить как» в меню «Файл».

Просмотр панели эскиза отображает структуру вашего документа. Если документ имеет структуру, нажмите кнопку панели «Структура», чтобы отобразить ее. Нажмите кнопку меню, чтобы выбрать способ отображения документа, который вы предпочитаете: 100%, одна страница, ширина страницы, мелкие изображения или полный экран.

Различные форматы файлов могут различаться степенью детализации, один формат может быть «надстройкой» над другим или использовать элементы других форматов. Например, текстовый формат накладывает только самые общие ограничения на структуру данных. Формат HTML устанавливает дополнительные правила на внутреннее устройство файла, но при этом любой HTML-файл является в то же время текстовым файлом.

Вы можете перемещаться между страницами с помощью кнопок «Предыдущая страница» и «Следующая страница» в левом нижнем углу экрана. К сожалению, у нас нет сертификата, поэтому мы не можем больше узнать о разрешениях. Для цифровой подписи документа сначала необходимо получить цифровой сертификат. Сертификаты используются для проверки личности человека или устройства, аутентификации службы или шифрования файлов. Сертификат для личного использования не распространяется автоматически, поэтому вам необходимо связаться с дистрибьютором сертификата, чтобы запросить его и импортировать.

Другой пример - структура самих компьютерных программ - исполняемых файлов : она должна строго соответствовать некоторым ожиданиям запускающей её операционной системы .

Теперь вы увидите доступный сертификат, и вам нужно будет подтвердить его правильность или нет. Если у вас нет подписи, выберите «Запросить подписи» в меню «Подписи». Напишите свое имя и нажмите кнопку списка, чтобы увидеть параметры подписи. Вы можете видеть все цифровые подписи, если вы выберете «Подпись» в меню «Подписи».

В левой части окна вы увидите список всех подписей, используемых для этого документа. Для получения дополнительной информации дважды щелкните по одной из подписей. Если доступно, вы увидите имя человека, который подписал, намерение, дату, пока документ не будет подписан и местоположение. Вы можете выбрать, чтобы подписать документ или удалить подпись из документа, в зависимости от нажатых кнопок.

Спецификации

Для многих форматов файлов существуют опубликованные спецификации , в которых подробно описана структура файлов данного формата, то, как программы должны кодировать данные для записи в этот формат и как декодировать их при чтении. Большинство таких спецификаций свободно доступны, некоторые распространяются за плату.

Иногда компании могут считать определённые форматы файлов своей коммерческой тайной и не публиковать их. Хорошо известный пример - форматы файлов пакета Microsoft Office . В некоторых случаях компания, выпустившая приложение, просто не считает нужным тратить время на написание подробной спецификации.

Если спецификация формата недоступна, то для обеспечения совместимости программы с данным форматом приходится заниматься обратной разработкой . В большинстве или во всех странах форматы файлов не защищены законами об авторских правах. Однако в некоторых странах патентами могут быть защищены алгоритмы, используемые для кодирования данных в какой-либо формат. Например, в широко распространённом формате GIF использовался патентованный алгоритм (срок действия патентов в разных странах истек в 2003-2004 гг.), что привело к разработке альтернативного формата PNG .

Определение типа файла

Тип файла - это информация для быстрой идентификации содержимого файла операционной системой и пользователем без необходимости считывания всего содержимого файла. Благодаря этой информации пользователь приблизительно знает тип содержащейся информации в файле, а в операционной системе может быть сопоставлена программа для обработки файлов данного типа. Для того, чтобы правильно работать с файлами, программы должны иметь возможность определять их тип. По историческим причинам, в разных операционных системах используются разные подходы для решения этой задачи.

Расширение имени файла

Некоторые операционные системы, например, CP/M , DOS , и Microsoft Windows используют для определения типа файла часть его имени , то есть «расширение имени файла ». В старых операционных системах это были три символа, отделённые от имени файла точкой (в файловых системах семейства FAT имя и расширение хранились отдельно, точка добавлялась уже на уровне ОС); в более новых системах расширение может являться просто частью имени, и тогда его длина ограничена только неиспользованной длиной имени (которая может составлять, например, 255 символов). Например, HTML-файлам может соответствовать расширение «.htm» или «.html».

Пользователь может свободно изменить расширение файла. Поскольку многие оболочки пользователя используют расширение, чтобы определить программу, с помощью которой нужно открыть файл, это может сделать последний недоступным для работы или вообще «потерять», если пользователь забудет исходное расширение. Поэтому Windows Explorer по умолчанию скрывает расширения. Эта практика имеет и обратную сторону: так как расширение файла не видно, можно обмануть пользователя, заставив его думать, что, например, файл с расширением.exe - изображение с другим расширением. В то же время опытный пользователь может использовать возможность изменить назначенный файлу тип, просто сменив расширение, чтобы открыть его в другой программе, не указывая её напрямую. Это может быть полезно, если в программе не предусмотрено открытие файлов с каким‑то расширением, а пользователь знает, что их формат подходит для обработки в данной программе.

Магические числа

Другой способ, широко используемый в UNIX -подобных операционных системах, заключается в том, чтобы сохранить в самом файле некое «магическое число» (сигнатуру) - последовательность символов, по которой может быть опознан формат файла. Первоначально этот термин использовался для специального набора 2-

Формат файла обычно указывается в его имени, как часть, отделённая точкой (обычно эту часть называют расширением имени файла, хотя, строго говоря, это неверно). Например, окончание имени (расширение) «.txt» обычно используют для обозначения файлов, содержащих только текстовую информацию, а «.doc» - содержащих текстовую информацию, структурированную в соответствии со стандартами программы Microsoft Word. Файлы, содержимое которых соответствует одному формату (реже - одному семейству форматов), иногда называют файлами одного типа .

Так как общепринятая в вычислительной технике концепция файла - неструктурированная последовательность байтов , компьютерные программы , сохраняющие в файлах структурированные данные, должны как-то преобразовывать их в последовательность байтов и наоборот (в ООП эти операции называются, соответственно, «сериализацией » и «десериализацией»; для текстовой информации последнее также называется «разбор» или «парсинг»). Алгоритм этого преобразования, а также соглашения о том, как различные фрагменты информации располагаются внутри файла, и составляют его «формат».

Различные форматы файлов могут различаться степенью детализации, один формат может быть «надстройкой» над другим или использовать элементы других форматов. Например, текстовый формат накладывает только самые общие ограничения на структуру данных. Формат HTML устанавливает дополнительные правила на внутреннее устройство файла, но при этом любой HTML-файл является в то же время текстовым файлом.

Спецификации

Для многих форматов файлов существуют опубликованные спецификации , в которых подробно описана структура файлов данного формата, то, как программы должны кодировать данные для записи в этот формат и как декодировать их при чтении. Большинство таких спецификаций свободно доступны, некоторые распространяются за плату.

Иногда компании могут считать определённые форматы файлов своей коммерческой тайной и не публиковать их. Хорошо известный пример - форматы файлов пакета Microsoft Office . В некоторых случаях компания, выпустившая приложение, просто не считает нужным тратить время на написание подробной спецификации.

Если спецификация формата недоступна, то для обеспечения совместимости программы с данным форматом приходится заниматься обратной разработкой . В большинстве или во всех странах форматы файлов не защищены законами об авторских правах. Однако в некоторых странах патентами могут быть защищены алгоритмы, используемые для кодирования данных в какой-либо формат. Например, в широко распространённом формате GIF использовался патентованный алгоритм (срок действия патентов в разных странах истек в 2003-2004 гг.), что привело к разработке альтернативного формата PNG .

Определение типа файла

Для того, чтобы правильно работать с файлами, программы должны иметь возможность определять их тип. По историческим причинам, в разных операционных системах используются разные подходы для решения этой задачи.

Расширение имени файла

Некоторые операционные системы, например, CP/M , DOS , и Microsoft Windows используют для определения типа файла часть его имени , т. е. «расширение имени файла ». В старых операционных системах это были три символа, отделённые от имени файла точкой (в файловых системах семейства FAT имя и расширение хранились отдельно, точка добавлялась уже на уровне ОС); в более новых системах расширение может являться просто частью имени, и тогда его длина ограничена только неиспользованной длиной имени (которая может составлять, например, 255 символов). Например, HTML-файлам может соответствовать расширение «.htm» или «.html».

Пользователь может свободно изменить расширение файла. Поскольку многие оболочки пользователя используют расширение, чтобы определить программу, с помощью которой нужно открыть файл, это может сделать последний недоступным для работы или вообще «потерять», если пользователь забудет исходное расширение. Поэтому Windows Explorer по умолчанию скрывает расширения. Эта практика имеет и обратную сторону: так как расширение файла не видно, можно обмануть пользователя, заставив его думать, что, например, файл с расширением.exe - изображение с другим расширением. В то же время, опытный пользователь может использовать возможность изменить назначенный файлу тип, просто сменив расширение, чтобы открыть его в другой программе, не указывая её напрямую. Это может быть полезно, если в программе не предусмотрено открытие файлов с каким‑то расширением, а пользователь знает, что их формат подходит для обработки в данной программе.

Магические числа

Другой способ, широко используемый в UNIX -подобных операционных системах, заключается в том, чтобы сохранить в самом файле некое «магическое число» (сигнатуру) - последовательность символов, по которой может быть опознан формат файла. Первоначально этот термин использовался для специального набора 2-байтовых идентификаторов, сохраняемых в начале файла (эта практика перекочевала и в другие ОС, например, в MS-DOS), однако, любая последовательность символов, характерная для данного формата, может быть использована как «магическое число».

Для определения формата файла служит команда file, которая использует файл /usr/share/misc/magic

$ file /bin/ls /bin/ls: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked (uses shared libs), for GNU/Linux 2.6.18, stripped $ file notes.txt notes.txt: UTF-8 Unicode text $ file leave_2009-10-12.odt leave_2009-10-12.odt: OpenDocument Text

Метаданные

Некоторые файловые системы позволяют сохранять дополнительные атрибуты для каждого файла, т. е. «метаданные ». Эти метаданные можно использовать для хранения информации о типе файла. Такой подход используется в компьютерах Apple Macintosh . Метаданные поддерживаются такими современными файловыми системами как HPFS , NTFS , ext2 , ext3 и другими. Недостатком этого метода является плохая переносимость - при копировании файлов между файловыми системами разных типов метаданные могут быть потеряны.

MIME

Типы данных, определённые стандартом MIME , широко используются в различных сетевых протоколах , однако в файловых системах они пока применяются редко.

См. также

Ссылки

  • Энциклопедия форматов файлов (англ.)
  • (англ.)
  • Magic signature database - Standard file format information and FFID registry (англ.)
  • Format wars File formats for websites and print explained
  • File signatures (aka magic numbers) found in files to indicate their file type (англ.)
  • dotwhat.net - File extension and format information (англ.)
  • PRONOM technical registry (англ.)
  • Library of Congress file format information (англ.)

Wikimedia Foundation . 2010 .

Смотреть что такое "Формат файла" в других словарях:

    формат файла - файловый формат Кодированный поток и дополнительные данные и информация, не явно требуемые для декодирования кодированного потока. Примерами таких данных являются поля текста с титрами, информация о защите и предыстории; данные о размещении… …

    формат файла - способ (метод) и структура хранения информации в файле … Русский индекс к Англо-русскому словарь по музыкальной терминологии

    формат файла архива - архивировать в tar архив От англ. tape archive. Формат битового потока или файла архива, а также название традиционной для Unix программы для работы с такими архивами. Первоначально программа tar использовалась для создания архивов на магнитной… … Справочник технического переводчика

    формат файла для аудио-видео данных со сжатием фирмы Microsoft - Формат AVI (от англ. Audio Video Interleave) является основным для хранения видеофайлов в ОС Windows. AVI позволяет сочетать различные виды компрессии (особой популярностью пользуется пара: DivX для видео и WMA для аудио).… … Справочник технического переводчика

    формат файла MPEG-4 - (МСЭ Т J.124). Тематики электросвязь, основные понятия EN MPEG 4 file formatMP4 … Справочник технического переводчика



Эта статья также доступна на следующих языках: Тайский

  • Next

    Огромное Вам СПАСИБО за очень полезную информацию в статье. Очень понятно все изложено. Чувствуется, что проделана большая работа по анализу работы магазина eBay

    • Спасибо вам и другим постоянным читателям моего блога. Без вас у меня не было бы достаточной мотивации, чтобы посвящать много времени ведению этого сайта. У меня мозги так устроены: люблю копнуть вглубь, систематизировать разрозненные данные, пробовать то, что раньше до меня никто не делал, либо не смотрел под таким углом зрения. Жаль, что только нашим соотечественникам из-за кризиса в России отнюдь не до шоппинга на eBay. Покупают на Алиэкспрессе из Китая, так как там в разы дешевле товары (часто в ущерб качеству). Но онлайн-аукционы eBay, Amazon, ETSY легко дадут китайцам фору по ассортименту брендовых вещей, винтажных вещей, ручной работы и разных этнических товаров.

      • Next

        В ваших статьях ценно именно ваше личное отношение и анализ темы. Вы этот блог не бросайте, я сюда часто заглядываю. Нас таких много должно быть. Мне на эл. почту пришло недавно предложение о том, что научат торговать на Амазоне и eBay. И я вспомнила про ваши подробные статьи об этих торг. площ. Перечитала все заново и сделала вывод, что курсы- это лохотрон. Сама на eBay еще ничего не покупала. Я не из России , а из Казахстана (г. Алматы). Но нам тоже лишних трат пока не надо. Желаю вам удачи и берегите себя в азиатских краях.

  • Еще приятно, что попытки eBay по руссификации интерфейса для пользователей из России и стран СНГ, начали приносить плоды. Ведь подавляющая часть граждан стран бывшего СССР не сильна познаниями иностранных языков. Английский язык знают не более 5% населения. Среди молодежи — побольше. Поэтому хотя бы интерфейс на русском языке — это большая помощь для онлайн-шоппинга на этой торговой площадке. Ебей не пошел по пути китайского собрата Алиэкспресс, где совершается машинный (очень корявый и непонятный, местами вызывающий смех) перевод описания товаров. Надеюсь, что на более продвинутом этапе развития искусственного интеллекта станет реальностью качественный машинный перевод с любого языка на любой за считанные доли секунды. Пока имеем вот что (профиль одного из продавцов на ебей с русским интерфейсом, но англоязычным описанием):
    https://uploads.disquscdn.com/images/7a52c9a89108b922159a4fad35de0ab0bee0c8804b9731f56d8a1dc659655d60.png