Операции над файлами
Большинство современных ОС рассматривают файл как неструктурированную
последовательность байтов переменной длины. В стандарте POSIX над файлом
определены следующие операции.
- int open(char * fname, int flags,
mode_t mode)
Эта операция "открывает" файл, устанавливая соединение между
программой и файлом. При этом программа получает "ручку" или
дескриптор файла — целое число, идентифицирующее данное соединение.
Фактически это индекс в системной таблице открытых файлов для данной
задачи. Все остальные операции используют этот индекс для ссылки на
файл. Параметр char * fname задает имя файла, int flags — это битовая
маска, определяющая режим открытия файла. Файл может быть открыт только
для чтения, только для записи и для чтения и записи; кроме того, можно
открывать существующий файл, а можно пытаться создать новым файл нулевой
длины. Необязательный третий параметр mode используется только при создании
файла и задает атрибуты этого файла.
- off_t lseek(int handle, off_t offset.,
int whence)
Эта операция перемещает указатель чтения/записи в файле. Параметр offset
задает количество байтов, на которое нужно сместить указатель, а параметр
whence — начало отсчета смещения. Предполагается, что смещение можно
отсчитывать от начала файла (SEEK_SET), от его кониа (SEEK_END) и от
текущего положения указателя (SEEK_CUR). Операция возвращает положение
указателя, отсчитываемое от начала файла. Таким образом, вызов iseek
(handle, о, SEEK_cuR) возвратит текущее положение указателя, не передвигая
его.
- int read(int handle, char * where,
size__t howjnuch)
Операция чтения из файла. Указатель where задает буфер, куда нужно поместить
прочитанные данные; третий параметр указывает, сколько данных надо считать.
Система считывает требуемое число байтов из файла, начиная с указателя
чтения/записи в этом файле, и перемещает указатель к концу считанной
последовательности. Если файл кончился раньше, считывается столько данных,
сколько оставалось до его конца. Операция возвращает количество считанных
байтов. Если файл открывался только для записи, вызов read возвратит
ошибку.
- int write(int handle, char * what,
size__t how_much)
Операция записи в файл. Указатель what задает начало буфера данных;
третий параметр указывает, сколько данных надо записать. Система записывает
требуемое число байтов в файл, начиная с указателя чтения/записи в этом
файле, заменяя хранившиеся в этом месте данные, и перемещает указатель
к концу записанного блока. Если файл кончился раньше, его длина увеличивается.
Операция возвращает количество записанных байтов. Если файл открывался
только для чтения, вызов write возвратит ошибку.
- int ioctl ( int handle, int cmd,
.. . .)
int fcntl(int handle, int cmd, . . . )
Дополнительные операции над файлом. Первоначально, по-видимому, предполагалось,
что ioctl — это операции над самим файлом,
a fcntl — это операции над дескриптором открытого
файла, но потом историческое развитие несколько перемешало функции этих
системных вызовов. Стандарт POS1X определяет некоторые операции как
над дескриптором, например дублирование (в результате этой операции
мы получаем два дескриптора, связанных с одним и тем же файлом), так
и над самим файлом, например, операцию truncate —
обрезать файл до заданной длины. В большинстве версий Unix операцию
truncate можно использовать и для вырезания
данных из середины файла. При считывании данных из такой вырезанной
области считываются нули, а сама эта область не занимает физического
места на диске.
Важной операцией является блокировка участков файла. Стандарт POSIX
предлагает для этой цели библиотечную функцию, но в системах семейства
Unix эта функция реализована через вызов fcntl.
Большинство реализаций стандарта POSIX предлагает и свои дополнительные
операции. Так, в Unix SVR4 этими операциями можно устанавливать
синхронную или отложенную запись (Подробнее понятие отложены записи обсуждается
в разд. Асинхронная модель ввода-вывода
с точки зрения приложений) и т. д.
- caddr t mmap(cadclr t addr, size_t
len, int prot, int flags, int handle, off_t
Отображение участка файла в виртуальное адресное пространство процесса.
Параметр prot задает права доступа к отображенному
участку: на чтение, запись и исполнение. Отображение может происходить
на заданный виртуальный адрес, или же система может выбирать адрес для
отображения сама.
Еще две операции выполняются уже не над файлом, а над его именем: это
операции переименования и удаления файла. В некоторых системах, например
в системах семейства Unix, файл может иметь несколько имен, и существует
только системный вызов для удаления имени. Файл удаляется при удалении
последнего имени.
Видно, что набор операций над файлом в этом стандарте очень похож на
набор операций над внешним устройством. И то, и другое рассматривается
как неструктурированный поток байтов. Для полноты картины следует сказать,
что основное средство межпроцессной коммуникации в системах семейства
Unix (труба) также представляет собой неструктурированный поток данных.
Идея о том, что большинство актов передачи данных может быть сведено к
байтовому потоку, довольно стара, но Unix была одной из первых систем,
где эта идея была приближена к логическому завершению.
Примерно та же модель работы с файлами принята в СР/М, а набор файловых
системных' вызовов MS DOS фактически скопирован с вызовов Unix v7. В свою
очередь, OS/2 и Windows NT/2000/XP унаследовали принципы работы с файлами
непосредственно от MS DOS.
В системах, не имеющих Unix в родословной, может использоваться несколько
иная трактовка понятия файла. Чаще всего файл трактуется как набор записей
(рис. 11.4). Обычно система поддерживает записи как постоянной длины,
так и переменной. Например, текстовый файл интерпретируется
как файл с записями переменной длины, а каждой строке текста соответствует
одна запись. Такова модель работы с файлами в VMS и в ОС линии OS/360-MVS-z/OS
фирмы IBM.
Практика систем с неструктурированными файлами показала, что, хотя структурированные
файлы часто бывают удобны для программиста, необязательно встраивать поддержку
записей в ядро системы. Это вполне можно сделать и на уровне библиотек.
К тому же структурированные файлы сами по себе не решают серьезной проблемы,
полностью осознанной лишь в 80-е годы при разработке новых моделей взаимодействия
человека с компьютером.
Рис. 11.4. Неструктурированный файл и файлы как наборы
записей |