1* Файл, каталог, логический диск. Папки. Совместный доступ. Документ. Форматы. Поиск в файлах и поиск файлов.

Форматы.

Как уже сказано, есть компьютерные носители – съёмные и несъёмные, добавляемые и штатные. Носители – это физические объекты, на которые в соответствии со стандартами наносятся записи. Сами стандарты при этом знать не надо. Обычно их называют форматами. То есть существуют физические форматы, имеющие прямое отношение к физическому носителю, к его способу записи, материалу и пр. Например, нам известно, что на бумаге удобно писать, и принято это делать определённым образом – в Европе пишут слева направо, в Японии – вертикально, на еврите пишут справа налево. У некоторых народов было в обиходе верёвочное письмо.

Такая же ситуация с форматами носителей. Замечено, что на бумаге удобно писать, а не завязывать её в узел; никто не пишет на верёвке, потому, что это не удобно. Природа носителя сказывается на технике записи.

Надписи на бумаге можно стирать резинкой, а вот стирать высеченное на камне затруднительно, если нет динамита. Природа носителя и способ стирания определяют возможность стирания.

Бумага позволяет нам рисовать, то есть передавать картинки, а верёвка – нет. Рисование позволяет нам передавать иллюстрации, а завязывание узлов – нет. Методика записи сказывается на том, что можно записывать; сама же она определяется носителем.

Вопрос о направлении письма практически произволен и в основном определяется традицией, которая в приложении к компьютерной практике превращается в совместимость форматов записи. Так же язык и его правила – условность, однако соблюдаемая.

И уж точно формат не определяет того, что именно будет написано; он может определять лишь объём записи. Она же влияет на то, что записано. Никому не нужен диск с трёхминутным видео.

Физическая сторона определяет скорость вращения диска и пр. То есть физические форматы и форматы записи для типа носителя взаимосвязаны. Это объяснение имеет прямое отношение к дискам с видео. Ниже мы рассмотрим ещё одно значение понятия формата. Если вы представите верёвки, свитки и камни с насечками, то никогда не забудете понятие формата. Это довольно непримитивное понятие, и широко используемое, так что это важно.

Файлы. Ярлыки. Синхронизация.

А пока надо рассмотреть понятие файла. Файл – это массив компьютерной технической информации, о которой говорилось выше. Файл может иметь нулевой объём. Обычно он соответствует единице информации в содержательном смысле. То есть его можно считать книгой в библиотеке которую вы можете открыть и посмотреть. Его также можно уподобить тетрадке, в которой вы можете писать, а не только читать. Это определяется его атрибутами и возможностью записи на носитель, где расположен файл.

Если файл имеет атрибут «только для чтения», то изменять его может не получиться. Атрибуты же определяют, является ли файл скрытым, системным и архивным. По непонятной мне причине, а может быть по ошибке неархивные файлы отмечены как архивные. Я не призываю менять этот атрибут. При нём всё нормально работает. Системные файлы имеют прямое отношение к корректной работе программ и в общем их не следует трогать. Поэтому их часто скрывают, то есть делают скрытыми. Пользователю ничего скрывать не надо.

Ещё существуют файлы-ярлыки. В обиходе их называют ярлыками. Это крошечные – я имею в виду объём – файлы-указатели на файлы и каталоги (см ниже). Это свойство современных операционных систем (см о них). Практически важно не перепутать ярлык с обычным файлом или каталогом. Запомните это. Может так случиться, что ярлык указывает на отсутствующий файл или каталог. При этом этот ресурс может быть просто переименован или перемещён, а ярлык не будет переносить к нему. То есть неработа ярлыка не гарантирует отсутствие ресурса. С другой стороны, наличие ярлыка не гарантирует его присутствия. Удаление ярлыка не ведёт к удалению ресурса.

Каждый файл имеет размер, измеримый в известных вам величинах, производных от байта или он указан в битах. Бит – это основная единица в академическом смысле, байт равен восьми битам.

Пользователь может создать, удалить, переместить, скопировать, переименовать файл если он не используется. Обычно действия сводятся к редакции файлов.

Каждый файл имеет время создания, последнего открытия и последнего изменения. Тут необходимы некоторые оговорки: 1) файл может быть частью составного документа (см ниже), 2) после разархивации (об этом ниже) файлу присваивается время создания равное времени разархивации. В результате возникает такой казус:



3) время и дата устанавливаются по встроенным часам компьютера, которые могут быть отрегулированы вручную для продолжения работы условно-бесплатных программ,4) время и дата файла скачанного из сети может быть временем его скачивания.

Поэтому я с большим сомнением отношусь к тому, что называется синхронизацией. Заменяя старую версию файла на новую вы можете не только заменить новую на старую, но и просто потерять данные, так как изменение было с сокращениями. Синхронизация требует дисциплины, которой обычно не хватает. Этот вопрос освещён в документации прилагаемой к соответствующим программам. В качестве альтернативы синхронизации иногда можно использовать сравнение файлов по содержимому. Также можно устроить сравнение по именам, датам и другим свойствам.

Документ. Формат файла.

С понятием файла тесно связано понятие документа. Документ – это единица пользовательской информации, выводимой в определённой программной среде, пищей для него является обычно один файл. В таком случае документ простой.

Если требуется несколько файлов, то документ составной. Типичный составной документ – HTML-документ о котором так много написано в главе о сетях. Наличие внедрённых или связанных объектов, о которых речь ниже фактически делает документ составным. Практически важно, что использование таких вставок ограничивает возможность передачи данных между компьютерами, следовательно, людьми.

Формат файла – это тип файла. Он существует оттого что есть различные способы хранения информации разного типа. Так, для хранения текста есть текстовый формат, для хранения изображений есть форматы JPG, PCX, GIF и пр. Они исторически возникли при разной скорости и вычислительной мощности техники для разных нужд и под разное представление о качественной иллюстрации.

Файл определённого формата обрабатывается в определённой программе, а другая не обязана его понимать и вообще работать с ним. В обиходе это называется «-Эта штука джпеги-то открывает? -Ага...» Всё это выливается в несколько расхожих типов файлов, которые вам скоро будут как родные, как и ваши провода, программы и техника.

Имя файла. Расширение. Программы как файлы. Поддержка кириллицы.

Каждый файл имеет имя. В этой книге названием файла называются все символы имени до последних, идущих после точки, то есть до расширения. Расширение – это необязательная часть имени файла, указывающая на его формат.

В этой книге расширения могут быть набраны в верхнем регистре но на самом деле обычно их пишут в нижнем регистре. В отдельных случаях только такие расширения и могут быть использованы. Поэтому общая метода в том чтобы вам писать их в нижнем регистре.

Программы ориентируются по расширению поскольку оно связано с форматом, а значит, и с методикой записи-чтения этого файла.

Сейчас программы работают с длинными именами файлов, которые могут включать пробелы, а старые программы на это не были рассчитаны и показывают длинные имена обрезая их до 8 символов. Например, имя javaharlalNeru.html будет сокращено до javaharl~1.html. Но самое важно не в этом, а в том, что вы не сможете найти файл по длинному имени, и программы не смогут. Это значит, что невозможно выполнение и открытие этого файла, если не использовать обрезанный вариант его имени.

Во-вторых, старые программы могут не работать с кириллицей. Вряд ли вы с этим столкнетесь, но в таком случае вы не сможете даже прочесть имя файла. Вот что вы можете получить на экране:

23.10.2005 13: 26 <DIR> .

23.10.2005 13: 26 <DIR> ..

23.10.2005 13: 26 <DIR> Setup

23.10.2005 13: 26 536 064 GIFAnimator.exe

23.10.2005 13: 26 17 642 GIFAnimator.hlp

23.10.2005 13: 26 248 GIFAnimator.cnt

23.10.2005 13: 26 10 752 README.WRI

28.10.2005 14: 24 0 ????????? ????????.txt


Вопросительными знаками программа заменила символы кириллицы. При этом само имя не изменилось, как и в случае его обрезания. Но изменилось его отображение, и теперь можно только догадываться что это за файл. Поскольку расширения не содержат кириллических символов тип файла вы узнаете, так же как время и дату его последнего изменения и объём. Для файла README.WRI это 13: 26, 23.10.2005 и 10752 бита, а тип файла – документ WordPad.


Программы исторически существовали по-разному: в конце 80-х – начале 90-х годов было типично что программа состоит из одного исполнимого файла, и нескольких служебных файлов к нему. Исполнимый файл – это файл, который непосредственно используется как машинная инструкция; служебные файлы к нему используются им для сохранения параметров и чтения массивов данных для работы. Электрик чинит проводку. Для этого он использует инструменты. Сами инструменты не делают ничего, но без них починить не получится. Служебный файл, не являясь сам исполнимым тем не менее не является пользовательским, и он не является данными, он входит в программу. Например, программа NortonCommander состоит из 34 файлов, из которых 16 исполнимые, один из них главный, то есть стартовый; а также есть 4 файла документации и 2 файла для хранения параметров. Файл HIEW.ORD не пользовательский и не может им быть. Несмотря на его понятное и редактируемое содержимое он – служебный, вот его содержимое:


[HiewOrd 5.30]


[DOSCALLS]

1 DosICreateThread

2 DosCwait

3 DosEnterCritSec

4 DosIExecPgm

...


Сегодня как правило программы состоят из нескольких взаимосвязанных исполнимых файлов, которые часто используют исполнимые файлы общего пользования вместе с другими программами, а также сотни служебных файлов и один или несколько файлов параметров и документации. Например, программа Opera содержит 231 файл, из которых 141 – картинки, ничем не отличающиеся от пользовательских кроме одного – они входят в программу; там же 8 файлов, обозначаемых как «компонент приложения» и 20 файлов документации. Исполнимые файлы обычно имеют расширение ЕХЕ.

Ниже вы познакомитесь с понятием компьютерной сети. Сетевые программы которые не хранятся на вашем компьютере а лишь запрашиваются как поток данных, выполняются и используют для этого временные, технические файлы тоже существуют.

Каталоги (директории). Папки. Портфель.

Каталоги, или директории – это растяжимые пакеты для файлов. Также в каталог можно положить другой каталог. Объём каталога изменяется при изменении объёмов входящих в него файлов и подкаталогов. Каталог может быть пустым. Его собственный размер равен нулю. Количество файлов и каталогов не ограничено независимо от их взаимного положения. Каталоги во многом играют организующую роль на практике.

Каталог тоже имеет имя, но не имеет расширения. Вернее, вы можете увидеть каталоги с любым именем, но никакого значения это не имеет. Нет разных форматов каталогов.

В зависимости от конкретных программ и режима их работы вы увидите или нет время модификации и создания каталога. Я прочёл что в Windows2000 и XP время модификации каталога может изменяться при изменении файлов в этом каталоге. Это можно проверить опытным путём. Или посмотреть в справке. Пока вам неизвестно что такое Windows2000 и XP зато информация на месте.

Вот пример хранения данных в каталоге. В каталоге RAZNOE находятся файлы masha.gif (графический), matan.pdf (текстосодержащий), baikal2.jpg (графический), diplom.doc (текстосодержащий). В каталоге RAZNOE нет подкаталогов. Как вы, наверное, уже догадались, это файлы пользователя, и он их назвал как ему захотелось. Он лишь заинтересован не менять расширения, чтобы не создавать лишних сложностей при чтении и обработке этих файлов.

Пользователь может создать, удалить, переместить, скопировать, переименовать файл или каталог если он не используется. Обычно действия сводятся к редакции файлов.

При удалении каталога может возникнуть препятствие потому что в нём есть системный файл. Общего рецепта здесь нет. Поскольку обычно это один или несколько малых файлов, никакого о выигрыша в свободном месте от их стирания нет. С другой стороны, обычно на этот момент всё равно нет программы, которая использовала этот файл. Сама ситуация стирания может быть мотивирована тем, что пользователь не знает о наличии системных файлов в каталоге. Что естественно, так как большинство программ не показывают их.

Понятие папки (folder) пришло вместе с Windows (см ниже) и не совсем совпадает с понятием каталога. Каталог – это ёмкость для файлов и каталогов, а папка может вмещать логический диск. Папки – это виртуальные ёмкости, которые обеспечиваются нужной функциональностью в среде Windows (см главу об операционных системах), а каталоги там считаются папками и обращаться с ними следует так же. Ниже я не буду делать между понятиями каталога и папки разницы, поскольку это создаст больше проблем чем уточнит понятий.

Каталог может иметь особый статус. В таком случае его значок будет тоже особенным. Я напоминаю, что программы имеют внешнее выражение на дисплее, и оно занимается в том числе показом значков, обозначающих тип файлов и каталогов.

Портфелем называется каталог, содержимое которого автоматически подвергается синхронизации. Он имеет особый значок. Обычные каталоги имеют желтый значок папки, системные каталоги могут иметь разные значки, портфели имеют значок в виде портфеля.

Резка файлов.

Резка файлов – это процесс создания нескольких файлов из одного без оглядки на внутреннее строение разрезаемого файла. Поэтому нет никаких гарантий что кусок файла можно будет использовать полезным образом. Резка обусловлена прежде всего потребностью положить большой файл на небольшой носитель. Её не надо путать с резкой видео и звуковых файлов которая делается для создания работоспособных файлов. Также резка не равна архивации (см ниже). Файлы на самом деле имеют чёткую структуру, определяемую форматом, это вам не колбаса.

Значки рядом с именами файлов.

Значки файлов повторяют значок программы-обработчика этого формата. На самом деле программ, способных работать с этим форматом на этом компьютере может быть несколько. Однако иногда бывает что программа формально поддерживает формат, а фактически не работает с этим файлом. Она поддерживает другой подформат. Например, формат TIFF имеет такие подформаты как LZW, PACKBITS, G4.

Логический диск (том).

Логический диск – это часть носителя, который сам совершенно не обязан быть дисковидной формы. Логический диск может быть единственным на носителе и занимать его целиком. Размер логического диска фиксирован. Если вы попытаетесь положить на логический диск больше файлов чем он может вместить, то возникнет программный казус. Хорошая программа в таком случае сообщает о недостатке места, плохая – застывает и не реагирует, то есть «зависает». Перегрузка диска относится к теоретическим ситуациям с новыми компьютерами, так как физическая ёмкость носителей достаточно велика.

На логическом диске могут быть каталоги и файлы, как описано выше. Логический диск имеет имя в том смысле, что программы приписывают ему букву латинского алфавита. Обычно логические диски практически совпадают со съёмными носителями.

Путь к файлу.

Как уже было сказано, существуют логические диски, внутри которых могут быть расположены каталоги, а внутри них подкаталоги. Файлы могут находиться и непосредственно на логическом диске, и в каталоге или подкаталоге.

Пусть какой - либо файл называется А. Он расположен в подкаталоге Б. Последний в каталоге В на диске Г. Это можно записать так: А > Б > В > Г. Путь к файлу - это список тех же дисков и каталогов, но записанных в обратном порядке. Это путь от общего к частному: Г > В > Б > А.

Чтобы записать путь к файлу, надо перечислить эти элементы, разделяя их косой чертой (левый слэш). Путь к файлу включает и имя файла, то есть его название, точку и расширение, если оно есть. Например,

D:\ARCHIV\CDROM\cdsetup.exe

На логическом диске D в каталоге ARCHIV в каталоге CDROM есть файл cdsetup.exe

Путь к файлу надо вводить точно, иначе нужный файл не будет найден или будет выдано сообщение об ошибке.

Выше речь шла о файлах, форматах, значках, каталогах и логических дисках. Вот как программы обычно показывают это:




На логическом диске Е в каталоге MediaJukebox есть исполнимые файлы Media Jukebox.exe, Download Manager.exe; есть служебные файлы CDManager.dll, CDWriterXP.ocx и другие. В файле desktop.ini хранятся настройки одной или нескольких программ из этого пакета. Строго говоря это пакет программ. Многоточие не является частью имени файла. Оно показывает, что имя не умещается. Нет никакой ошибки в том, что одна программа показывает файлы другой. Имя файла – это нечто наблюдаемое, в том числе когда он используется. Разным типам файлов соответствуют разные значки. У исполнимых файлов современных программ они обычно уникальны. У файла Media Jukebox.tlb нет характеризующего значка, поэтому ему присвоен стандартный – и ни о чём не говорящий - флажок. Это оттого что его расширению не соответствует какой-либо значок.

Совместный доступ.

Понятие совместного доступа вошло в обиход в конце 90-х годов, то есть оно не такое древнее, как понятие файла. Оно пришло вместе с возможностью обращения по локальной сети к другому компьютеру. Тогда, очевидно, возникает общий (shared) ресурс. В обиходе это называется «расшаренный». Это на наших глазах появляется новый диалект английского языка. Совместный доступ к одному каталогу – это возможность выполнять определённые операции с файлами в нём. Человек, обладающий административными правами, может определять что можно и нельзя делать с файлами.

Поиск в файлах.

Теперь пару слов о поиске в файлах, придётся использовать неизвестные пока слова, они будут понятны по мере чтения книги. Вообще-то в наше время лучше это делать с помощью специальных приложений (например GoogleDesktop) а не средствами ОС. При поиске файлов, содержащих заданный текст, Windows 95/98 не находит текст, записанный в кодировке Unicode.

Вообще вопрос о кодировке и форматах тут неясен и может быть источником иллюзии отсутствия искомого. Вместо средств Windows 95/98 в таких случаях следует использовать средства поиска файлов, входящие в состав MicrosoftOffice. Пока для вас это заявление не понятно зато оно на месте.

На сегодня кажется нет средств поиска иллюстраций если они в документе. Хотя если используется техника связывания с документом то найти само изображение можно. Остаётся только вопрос к какому файлу оно привязано. То же верно про составные документы. На сегодня кажется нет и средств поиска по полям документа, его реквизитам, сноскам и пр. Это объяснено в главе о тексте. Принадлежность иллюстрации к составному HTML-документу (в который вы можете конвертировать разные другие документы) определяется текстом его технической ссылки (см ниже). Это текст поэтому он будет находиться всеми программами поиска текста если они будут «понимать» используемую кодировку (см ниже). Он содержит имя файла иллюстрации.

Сами графические файлы обычно можно искать просмотром, но когда на это нет времени или их тысячи то можно попробовать программы, они требуют отдельной установки.

С видеофайлами вопрос решается довольно несложно. Они программно раскладываются на части с разным сюжетом (сцены) и на отдельные кадры – например, можно брать каждый 25-й кадр и получать столько снимков сколько секунд в видеофайле. Размер видеофайлов не связан с продолжительностью так как даже при одинаковой частоте кадров есть разные форматы и свойства файла.

Также размер мало связан с количеством текста в текстосодержащем файле одного формата. Особенно это верно для формата PDF. Вы можете скачать из интернета документ размером в несколько мб состоящий всего из 20-50 страниц.

Область звукообработки на сегодня развита и является ареалом профессионалов поэтому очень вероятно что поиск музыки осуществлён на довольно хорошем уровне. Формат звукозаписи определяет можно ли включать в файл сведения об артисте и пр. На сегодня есть множество программ позволяющих искать по этим параметрам и выводить их в виде отчёта для множества файлов.

Файлы архивов могут быть разного формата, что может создать ограничения для какой-либо программы ищущей в архивах. Если вы хотите найти файл в архиве то введите его имя в строке Текст обычного окна поиска, а в качестве области поиска установите каталог где находится архив. Поиск же в самих файлах внутри архивов можно выполнить с помощью WindowsCommander, Arhangel, Find или другой программы.