Курс на Си. Подбельский. Курс программирования на Си. В., Фомин С. С. Курс программирования на языке Си Учебник
Скачать 1.57 Mb.
|
fgetc( ), getc( ) — ввод (чтение) одного символа из файла; fputc( ), putc( ) - запись одного символа в файл; fprintf( ) - форматированный вывод в файл; fscanf( ) - форматированный ввод (чтение) из файла; fgets( ) - ввод (чтение) строки из файла; fputs( ) - запись строки в файл. Двоичный (бинарный) режим обмена с файлами. Двоичный режим обмена организуется с помощью функций getc( ) и putc( ), обращение к которым имеет следующий формат: с = getc(fp); putc(c, fp); где fp - указатель на поток; c - переменная типа int для приема очередного символа из файла или для записи ее значения в файл. Прототипы функции: int getc ( FILE *stream ); int putc ( int c, FILE *stream ); В качестве примера использования функций getc( ) и putc( ) рассмотрим программы ввода данных в файл с клавиатуры и программу вывода их на экран дисплея из файла. Программа ввода читает символы с клавиатуры и записывает их в файл. Пусть признаком завершения ввода служит поступивший от клавиатуры символ '#'. Имя файла запрашивается у пользователя. Если при вводе последовательности символов была нажата клавиша В приводимых ниже программах используются уже рассмотренные выше функции getchar( ), putchar( ) для посимвольного обмена со стандартными потоками stdin, stdout. /* Программа ввода символов */ #include int main() { FILE *fp; /* Указатель на поток */ char c; /* Восьмеричный код "Возврат каретки": */ const char CR='\015'; /* Восьмеричный код "Перевод строки": */ const char LF = '\012'; char fname[20]; /* Массив для имени файла */ /* Запрос имени файла: */ puts("BBegume имя файла: \n"); gets(fname); /* Открыть файл для записи: */ if ((fp = fopen(fname,"w")) == NULL) { perror(fname); return 1; } /* Цикл ввода и записи в файл символов: */ while ((c = getchar()) != '#') { if (c == '\n') { putc(CR, fp); putc(LF, fp); } else putc(c, fp); } /* Цикл ввода завершен; закрыть файл: */ fclose(fp); return 0; } Следующая программа читает поток символов из ранее созданного файла и выводит его на экран дисплея: /* Программа вывода символьного файла на экран дисплея */ #include FILE *fp; /* Указатель на поток */ char c; char fname[20]; /* Массив для имени файла */ /* Запрос имени файла: */ puts("BBegume имя файла: \n "); gets(fname); /* Открыть файл для чтения: */ if ((fp = fopen(fname,"r")) == NULL) { perror(fname); return 1; } /* Цикл чтения из файла и вывода символов на экран: */ while ((c = getc(fp)) != EOF) putchar(c); fclose(fp); /* Закрыть файл */ return 0; } Программу чтения символов из файла можно усовершенствовать, добавив возможность вывода информации на экран порциями (кадрами): /* Усовершенствованная программа вывода символьного файла на экран дисплея по кадрам */ #include int main() { FILE *fp; /* Указатель на поток) */ char c; /* Восьмеричный код "Перевод строки": */ const char LF='\012'; int MAX=10; /* Размер кадра */ int nline; /* Счетчик строк */ char fname[10]; /* Массив для имени файла */ /* Запрос имени файла: */ puts("BBegume имя файла \n"); gets(fname); /* Открыть файл для чтения: */ if ((fp = fopen(fname,»r»)) = = NULL) { perror(fname); return 1; } while (1) { /* Цикл вывода на экран */ nline = 1; while (nline c = getc(fp); if (c == EOF) { fclose(fp); return 0; } if (c == LF) nline++; putchar(c); } /* Конец цикла вывода кадра */ getchar(); /* Задержка вывода до нажатия любой клавиши */ } /* Конец цикла вывода */ } /* Конец программы */ В этой программе после вывода очередного кадра из MAX строк для перехода к следующему кадру необходимо нажать любую клавишу. Используя двоичный обмен с файлами, можно сохранять на диске информацию, которую нельзя непосредственно вывести на экран дисплея (целые и вещественные числа во внутреннем представлении). Строковый обмен с файлами. Для работы с текстовыми файлами, кроме перечисленных выше, удобно использовать функции fgets( ) и fputs( ). Прототипы этих функций в файле stdio.h имеют следующий вид: int fputs(const char *s, FILE *stream); char * fgets(char *s, int n, FILE *stream); Функция fputs( ) записывает строку (на которую указывает s) в файл, определенный указателем stream на поток, и возвращает неотрицательное целое. При ошибках функция возвращает EOF. Функция fgets( ) читает из определенного указателем stream файла не более (n-1) символов и записывает их в строку, на которую указывает s. Функция прекращает чтение, как только прочтет (n-1) символов или встретит символ новой строки '\n', который переносится в строку s. Дополнительно в конец каждой строки записывается признак окончания строки '\0'. В случае успешного завершения функция возвращает указатель s. При ошибке или при достижении конца файла, при условии, что из файла не прочитан ни один символ, возвращается значение NULL. В этом случае содержимое массива, который адресуется указателем s, остается без изменений. Проиллюстрируем возможности указанных функций на программе, которая переписывает текст из одного файла в другой. На этом же примере еще раз проиллюстрируем особенность языка Си - возможность передачи информации в выполняемую программу из командной строки (см. §5.8). В стандарте языка Си определено, что любая программа на языке Си при запуске на выполнение получает от операционной системы информацию в виде значений двух аргументов - argc (сокращение от argument count - счетчик аргументов) и argv (сокращение от argument vector). Первый из них определяет количество строк, передаваемых в виде массива указателей argv. По принятому соглашению, argv[0] - это всегда указатель на строку, содержащую полное имя файла с выполняемой программой. Остальные элементы массива argv[1],...,argv[argc-1] содержат ссылки на параметры, записанные через пробелы в командной строке после имени программы. (Третий параметр char * envp[ ] мы уже рассмотрели в §5.8, но он используется весьма редко.) Предположим, что имя выполняемой программы copyfile.exe, и мы хотим с ее помощью переписать содержимое файла f1.dat в файл f2.txt. Вызов программы из командной строки имеет вид (> - «приглашение» от операционной системы): >copyfile.exe f1.dat f2.txt Текст программы может быть таким: #include main(int argc, char *argv[ ]) { char cc[256];/* Массив для обмена с файлами */ FILE *f1, *f2; /* Указатели на потоки */ if (argc != 3) /* Проверка командной строки */ { printf("\n Формат вызова программы: "); printf("\n copyfile.exe" printf("\n файл-источник файл-приемник"); return 1; } if ((f1 = fopen(argv[1], "r")) == NULL) /* Открытие входного файла */ { perror(argv[1]); return 1; } if ((f2 = fopen(argv[2], "w")) == NULL) /* Открытие выходного файла */ { perror(argv[2]); return 1; } while (fgets(cc, 256, f1) != NULL) fputs(cc, f2); fclose(f1); fclose(f2); return 0; } Обратите внимание, что значение argc явно не задается, а определяется автоматически. Так как argv[0] определено всегда, то значение argc не может быть меньше 1. При отсутствии в командной строке двух аргументов (имен файлов ввода-вывода) значение argc оказывается не равным трем, и поэтому на экран выводится поясняющее сообщение: Формат вызова программы: copyfile.exe файл-источник файл-приемник Если имя входного файла указано неудачно или нет места на диске для создания выходного файла, то выдаются соответствующие сообщения: Ошибка при открытии файла f1.dat или Ошибка при открытии файла f2.txt Режим форматного обмена с файлами. В некоторых случаях информацию удобно записывать в файл в виде, пригодном для непосредственного (без преобразования) отображения на экран дисплея, то есть в символьном виде. Например, для сохранения результатов работы программы, чтобы затем распечатать их на бумагу (получить «твердую» копию), или когда необходимо провести трассировку программы - вывести значения некоторых переменных во время выполнения программы для их последующего анализа. В этом случае можно воспользоваться функциями форматного ввода (вывода) в файл fprintf( ) и fscanf( ), которые имеют следующие прототипы: int fprintf ( указатель_на_поток, форматная-строка, список-переменных); int fscanf ( указатель_на_поток, форматная_строка, список_адресов_переменных); Как и в функциях printf( ) и scanf( ), форматная строка может быть определена вне вызова функции, а в качестве аргумента в этом случае будет указатель на нее. От рассмотренных выше функций printf( ), scanf( ) для форматного обмена с дисплеем и клавиатурой функции fprintf( ) и fscanf( ) отличаются лишь тем, что в качестве первого параметра в них необходимо задавать указатель на поток, с которым производится обмен. В качестве примера приведем программу, создающую файл int.dat и записывающую в него символьные изображения чисел от 1 до 10 и их квадратов [9]: #include int main() { FILE *fp; /* Указатель на поток */ int n; if ((fp = fopen("int.dat","w")) == NULL) { perror("int.dat"); return 1; } for (n=1; n<11; n++) fprintf(fp, "%d %d\n", n, n*n); fclose(fp); return 0; } В результате работы этой программы в файле int.dat формируется точно такая же «картинка», как и в том случае, если бы мы воспользовались вместо функции fprintf( ) функцией printf( ) для вывода результатов непосредственно на экран дисплея. В этом легко убедиться, воспользовавшись соответствующей обслуживающей программой операционной системы для вывода файла int.dat на экран дисплея. Несложно и самим написать такую программу, используя для форматного чтения данных из файла функцию fscanf( ): #include int main() { FILE *fp; /* Указатель на поток */ int n, nn, i; if ((fp = fopen("int.dat","r")) == NULL) { perror("int.dat"); return 1; } for (i=1; i<11; i++) { fscanf(fp, "%d %d", &n, &nn); printf(" %d %d \n",n, nn); } fclose(fp); return 0; } Позиционирование в потоке. В начале главы были рассмотрены посимвольный, построчный и форматный обмены с файлами, организованными в виде потока байтов. Эти средства позволяли записать в файл данные и читать из него информацию только последовательно. Операция чтения (или записи) для потока всегда производится, начиная с текущей позиции в потоке. Начальная позиция чтения/ записи в потоке устанавливается при открытии потока и может соответствовать начальному или конечному байту потока в зависимости от режима открытия потока. При открытии потока в режимах «r» и «w» указатель текущей позиции чтения/записи в потоке устанавливается на начальный байт потока, а при открытии в режиме «а» - в конец файла (за конечным байтом). При выполнении каждой операции ввода-вывода указатель текущей позиции в потоке перемещается на новую текущую позицию в соответствии с числом прочитанных (записанных) байтов. Рассмотрим средства позиционирования в потоке, позволяющие перемещать указатель (индикатор) текущей позиции в потоке на нужный байт. Эти средства дают возможность работать с файлом на диске как с обычным массивом, осуществляя доступ к содержимому файла в произвольном порядке. В библиотеку языка Си включена функция fseek( ) для перемещения (установки) указателя текущей позиции в потоке на нужный байт потока (файла). Она имеет следующий прототип: int fseek (указатель_на_поток, смещение, начало_отсчета); Смещение задается переменной или выражением типа long и может быть отрицательным, то есть возможно перемещение по файлу в прямом и обратном направлениях. Начало отсчета задается одной из предопределенных констант, размещенных в заголовочном файле stdio.h: SEEK_SET (имеет значение 0) - начало файла; SEEK_CUR (имеет значение 1) - текущая позиция; SEEK_END (имеет значение 2) - конец файла. Здесь следует напомнить некоторые особенности данных типа long. Этот тип определяется для целочисленных констант и переменных, которым в памяти должно быть выделено больше места, чем данным типа int. Обычно переменной типа long выделяется 4 байта, чем и определен диапазон ее значений. Описание данных типа long: long A, p, Z[16]; Константа типа long записывается в виде последовательности десятичных цифр, вслед за которыми добавляется разделитель L или l. Примеры констант типа long: 0l 0L 10L 688L 33l В текстах программ лучше использовать L, чтобы не путать l с цифрой 1. Функция fseek( ) возвращает 0, если перемещение в потоке (файле) выполнено успешно, в противном случае возвращается ненулевое значение. Приведем примеры использования функции fseek( ). Перемещение к началу потока (файла) из произвольной позиции: fseek(fp, 0L, SEEK_SET); Перемещение к концу потока (файла) из произвольной позиции: fseek(fp, 0L, SEEK_END); В обоих примерах смещение задано явно в виде нулевой десятичной константы 0L типа long. При использовании сложных типов данных (таких как структура) можно перемещаться в потоке (файле) на то количество байтов, которое занимает этот тип данных. Пусть, например, определена структура: struct str {... ... } st; Тогда при следующем обращении к функции fseek( ) указатель текущей позиции в потоке будет перемещен на одну структуру назад относительно текущей позиции: fseek(fp, -(long)sizeof(st), SEEK_CUR); Для иллюстрации работы с файлом в режиме произвольного доступа рассмотрим пример небольшого трехъязычного словаря, содержащего названия цифр от 1 до 9 на английском, немецком и французском языках. Для обслуживания словаря необходимы две программы: программа загрузки словаря в файл на диске и программа поиска слова в словаре (в ней используется функция fseek( )). «База данных» словаря организована в файле vac.dat. Функция загрузки запрашивает названия для цифр от 1 до 9. Названия конкретной цифры (в предположении, что каждое название не превышает 9 букв) на всех трех языках записываются в одной строке через пробелы. Сформированная строка по нажатии клавиши #include int main() { int i, k; int n; char buf[30]; /* Буфер */ char *c; int *pti; FILE *fp; /* Указатель на поток */ /* Открыть файл для записи */ if ((fp = fopen("vac.dat","w")) == NULL) { perror("vac.dat"); return 1; } for (i=1; i<=9; i++) { /* Очистить буфер: */ for (k=0; k<30; k++) buf[k] = ' '; /* Запрос названий цифр */ n = i; pti = &n; printf("\n Введите названия цифры %d:\n", i); scanf("%s %s %s", buf, buf+10, buf+20); /* Запись в файл цифры */ c = (char *)pti; for (k=0; k <2; k++) putc(*c++, fp); /* Запись в файл названий цифр */ c = buf; for (k=0; k<30; k++) putc(*c++, fp); } fclose(fp); return 0; } Рис. 7.2. Состав записи «Цифра» Введенные данные (представление цифры в формате целого числа и названия цифр на трех языках) побайтно выводятся в файл vac. dat, образуя в нем «записи», структура которых показана на рис. 7.2.
Цифра Названия цифр на разных языках Следующая программа перевода (trans) запрашивает сначала язык, на котором нужно выводить названия цифр, а затем в цикле запрашиваются цифры. Язык идентифицируется первой буквой своего русского наименования: 'а' или 'А' - для английского; 'н' или 'Н' - для немецкого; 'ф' или 'Ф' - для французского. Признаком завершения программы служит ввод цифры 0. Текст программы trans: /* Программа перевода trans.c */ #include { int i, k; char *c; long pos; /* Смещение в файле */ char buf[30]; char ln; FILE *fp; /* Указатель на поток */ int lang; /* Индикатор "язык" */ /* Открыть файл: */ if ((fp = fopen("vac.dat","r")) == NULL) { perror("vac.dat"); return 1; } /* Запросить язык: */ lang = -1; while (lang == -1) { puts("\n Введите первую букву названия" " языка: (а,н,ф)"); scanf("%c", &ln); if ((ln =='a')||(ln =='А')) lang = 0; else if ((ln =='н')||(1п =='Н')) lang = 1; else if ((ln =='ф') 11 (ln =='Ф')) lang = 2; } while (1) /* Цикл перевода */ { c = buf; puts("введите цифру (0 - для завершения):"); scanf("%d", &k); if (k = = 0) { fclose(fp); return 0; } /* Вычислить смещение */ pos = (k-1)*32+2+lang*10; fseek(fp, pos, SEEK_SET); /* Выбрать перевод */ for (i=0; i<=9; i++) *c++=getc(fp); c++; c = '\0'; printf("%d->%s\n", k, buf); } fclose(fp); return 0; } При вычислении позиции (pos) в файле, с которой начинается строка перевода, участвуют следующие составляющие: k-1 - выбирает подстроку (длиной 32 байта), в которой содержится перевод; 2 - учитывает длину поля цифры (2 байта); lang* 10 - задает смещение до требуемого значения цифры в подстроке перевода. На рис. 7.3 показаны составляющие смещения для искомого поля с переводом на немецкий язык.
к-й элемент pos Рис. 7.3. Составляющие смещения для записей в файле словаря Предлагаем самостоятельно разработать функцию поиска в файле заданной подстроки и на ее основе написать программу перевода названий цифр с одного языка на другой. В табл. 7.3 приводятся названия цифр от 1 до 9 на трех языках. Таблица 7.3. Трехъязычный словарь «Цифры»
Кроме рассмотренной функции fseek( ), в библиотеке функций языка Си находятся следующие функции для работы с указателями текущей позиции в потоке: long ftell(FILE *) - получить значение указателя текущей позиции в потоке; void rewind(FILE *) - установить указатель текущей позиции в потоке на начало потока. Необходимо иметь в виду, что недопустимо использовать функции работы с указателем текущей позиции в потоке для потока, связанного не с файлом, а с устройством. Поэтому применение описанных выше функций с любым из стандартных потоков приводит к неопределенным результатам. 7.2. Ввод-вывод нижнего уровня Ввод-вывод, ориентированный на поток, обычно применяется для выполнения достаточно стандартных операций ввода-вывода. Применение рассмотренных выше функций обмена с потоками гарантирует успешность переноса программы (в отношении ввода-вывода) в различные операционные системы. Функции ввода-вывода более низкого уровня позволяют пользоваться средствами ввода-вывода операционной системы непосредственно. При этом не выполняются буферизация и форматирование данных. Программы, использующие низкоуровневый ввод-вывод, переносимы в рамках некоторых систем программирования Си, в частности относящихся к UNIX. Учитывая близость функций низкоуровневого ввода-вывода к средствам ввода-вывода операционной системы, можно рекомендовать их применение для разработки собственной подсистемы ввода-вывода, например ориентированной на работу со сложными структурами данных (списки, деревья, сложные записи и т. п.). При низкоуровневом открытии файла с ним связывается не указатель файла (потока), а дескриптор (handle) файла. Дескриптор является целым значением, характеризующим размещение информации об открытии файла во внутренних таблицах операционной системы. Дескриптор файла используется при последующих операциях с файлом. В библиотеку языка Си включены следующие основные функции ввода-вывода нижнего уровня: open( )/close( ) - открыть/закрыть файл; creat( ) - создать файл; read( )/write( ) - читать/писать данные; sopen( ) - открыть файл в режиме разделения, то есть для одновременного доступа со стороны нескольких процессов (работающих программ); eof( ) - проверить достижение конца файла; lseek( ) - изменить текущую позицию в файле; tell( ) - получить значение текущей позиции в файле. Для работы с функциями нижнего уровня в программу должны включаться соответствующие заголовочные файлы. Имена этих файлов могут быть различными в разных операционных системах. Поэтому перед написанием программ, использующих функции ввода-вывода нижнего уровня, или при переносе программ в другую операционную систему необходимо ознакомиться с документацией по библиотеке Си для конкретной операционной системы. Функции нижнего уровня, в отличие от функций для работы с потоком, не требуют включения в программу заголовочного файла stdio.h. Однако этот файл содержит определения ряда констант (например, признак конца файла EOF), которые могут оказаться полезными. В случае применения этих констант файл stdio.h должен быть включен в программу. Открытие/закрытие файла До выполнения операций ввода-вывода в файл (из файла) на низком уровне необходимо открыть или создать файл одной из следующих функций: open( ), sopen( ) или creat( ). Функция sopen( ) используется в том случае, когда необходимо дать возможность одновременного доступа к файлу для нескольких выполняющихся программ. Разумеется, речь идет о доступе к файлу в режиме чтения. Обычно файл блокируется для доступа со стороны других выполняющихся программ, и именно функция sopen( ) необходима для разрешения одновременного доступа. При открытии файла в программу возвращается дескриптор файла, значение которого является целочисленным. В отличие от дескриптора, указатель на поток есть указатель на структуру типа FILE, определенного в заголовочном файле stdio.h. Формат вызова функции open( ), в результате выполнения которой приобретает значение дескриптор файла: fd = open ( имя_файла, флаги, права_доступа ); В программе дескриптор файла fd должен быть определен как int fd. Параметр имя_файла является указателем на массив символов, содержащий имя файла. Второй параметр флаги определяет режим открытия файла, который является выражением, сформированным (с помощью '|' - побитовой операции ИЛИ) из одной или более предопределенных констант, размещенных в заголовочном файле fcntl.h. В некоторых реализациях UNIX эти константы находятся в файле sys/file.h. Примечание Обратите внимание на то, что в UNIX при образовании полного имени файла применяется символ '/' (прямой слэш). Приведем в алфавитном порядке список констант (флагов), задающих режим открытия файла: O_APPEND - открыть файл для добавления (для записи в конец файла); O_BINARY - открыть файл в бинарном режиме (см. §7.1.1); O_CREAT - создать и открыть новый файл; O_EXCL - этот флаг позволяет избежать непреднамеренного уничтожения уже существующего файла. Если этот флаг указан вместе с флагом O_CREAT и файл уже существует, то функция открытия файла завершается с ошибкой; O_RDONLY - открыть файл только для чтения; O_RDWR - открыть файл и для чтения, и для записи; O_TEXT - открыть файл в текстовом режиме (см. §7.1.1); O_TRUNC - открыть существующий файл и стереть его содержимое (подготовить для записи новой информации). Обратите внимание на то, что режим открытия файла должен быть задан обязательно, так как его значение по умолчанию не устанавливается. Третий параметр - права_доступа - должен применяться лишь в режиме открытия файла O_CREAT, то есть только при создании нового файла. В операционных системах семейства Windows для задания параметра права_доступа используются следующие предопределенные константы: S_IWRITE - разрешить запись в файл; S_IREAD - разрешить чтение из файла; S_IREAD|S_IWRITE - разрешить и чтение, и запись. Перечисленные константы размещены в заголовочном файле stat.h, находящемся в каталоге sys. Обычно его подключение осуществляется директивой #include <sys\stat.h>. Если параметр права_доступа не указан, то устанавливается разрешение только на чтение из файла. Чаще всего в операционных системах семейства Windows этот параметр не используется. В ОС UNIX в силу того, то она является многопользовательской, система защиты файлов более развита. Права доступа к файлам устанавливаются для трех категорий пользователей: владелец файла; участник группы пользователей; прочие пользователи. Права доступа к конкретному файлу устанавливаются владельцем файла специальными командами. Права доступа отображаются при просмотре оглавления каталога командой ls -l в виде символьной строки, которая формируется по следующему правилу: для каждой группы пользователей в строке прав доступа выделяются три символа, каждый из которых может принимать следующие значения: r - разрешено чтение из файла; w - разрешена запись в файл; x - разрешено выполнение файла (для файлов, хранящих исполняемую программу). Символы r, w, x задаются строго на своих местах в указанном порядке (rwx). Если какой-либо из типов доступа к файлу запрещен, на месте соответствующего символа записывается символ '-' (минус). Таким образом, если для владельца файла разрешены все виды доступа к файлу (rwx), для участника группы пользователей - только чтение и выполнение (r-x), а для прочих пользователей - только выполнение (--x), то строка прав доступа будет выглядеть так: rwxr-x--x От этой строки символов легко перейти к собственно параметру права_доступа, являющемуся целым числом. Если на соответствующем месте в строке указан символ, отличный от '-', то записывают '1', иначе записывают '0'. Получившееся двоичное число (111101001) переводят в восьмеричное, записав в виде восьмеричной цифры каждую группу из трех двоичных цифр, начиная с самой правой группы: 0751. Это число и следует указать в качестве параметра права_доступа в функции open( ). Приведем несколько примеров открытия файла. Открыть файл для чтения: fd = open("t.txt", O_RDONLY); Открыть существующий файл для записи новых данных: fd = open("new.txt",O_WRONLY|O_CREAT|O_TRUNC,0600); Параметр права_доступа, заданный восьмеричной константой 0600 (для UNIX), в символьном изображении имеет вид rw , то есть для владельца файла разрешены чтение и запись, для двух других категорий пользователей не разрешен ни один из видов доступа к файлу. Если файл с именем new.txt существует, то перед записью новых данных он будет усечен до нулевого размера (очищен). При открытии файла с указанными параметрами в других ОС параметр права_доступа опускается. Открыть файл для добавления: fd=open("t.txt",O_WRONLY|O_APPEND|O_CREAT,0600); Открыть файл для чтения и записи: fd = open("t.txt", O_RDWR); Создать новый файл для записи: if ((fd = open("tmpfile",O_WRONLY|O_CREAT|O_EXCL, 0666)) == -1) puts("tmpfile уже существует\п"); В операционной системе UNIX такая последовательность операторов открывает новый файл для записи. Если файл не существует, то он создается. Иначе функция завершается неудачей. Флаг O_EXCL специально задан для предотвращения непреднамеренного уничтожения уже существующего файла. Этот флаг используется совместно с O_CREAT. Права доступа (rw-rw-rw-) разрешают чтение и запись в файл для всех категорий пользователей. В других ОС параметр права_доступа должен быть опущен. Приведем более полный пример создания файла (MS-DOS, Windows): #include #include #include #include #include #include { int fd; /* Дескриптор файла */ if ((fd = open("tmpfile", O_RDWR|O_CREAT|O_EXCL, S_IREAD|S_IWRITE)) < 0) { if (errno == EEXIST) fprintf(stderr, "файл tempfile" " уже существует\п"); exit(errno); } } Создаваемый файл в соответствии с выбранными флагами открывается для чтения и записи. Права доступа (rw ) позволяют только владельцу работать с файлом (читать и писать). Для идентификации ошибок, возникающих при открытии файла, используется именующее выражение (переменная) errno, определенное в заголовочном файле errno.h. При выполнении функций стандартной библиотеки в область памяти, именуемой errno, записываются коды ошибок. Предопределенная в errno.h константа EEXIST означает, что файл, указанный в функции open( ), уже существует. В этом примере для вывода сообщения об ошибке применена функция форматного вывода в файл fprintf( ), в которой использован предопределенный дескриптор файла stderr стандартного потока для вывода сообщений об ошибках. Кроме функции open( ), для открытия файла можно использовать функцию creat( ), упомянутую в начале параграфа. Функция creat( ) полностью эквивалентна такому вызову функции open( ): open (имя_файла, O_CREAT|O_TRUNC|O_WRONLY); Функция creat( ) создает новый файл и открывает его для записи. Наличие в библиотеке наряду с функцией open( ) функции creat( ) вызвано требованиями совместимости с ранними версиями UNIX, имевшими только три основных режима открытия файла (O_RDONLY, O_WRONLY, O_RDWR), что вынуждало использовать для создания нового файла специальную функцию creat( ). Так же как и при использовании потоков, в начале работы каждой программы автоматически открываются файлы стандартного ввода, стандартного вывода и стандартного вывода сообщений об ошибках. Эти файлы имеют значения дескрипторов файлов 0, 1 и 2, которые можно использовать при обменах на нижнем уровне со стандартными файлами. Необходимо иметь в виду, что в каждой операционной системе имеется ограничение на количество одновременно открытых в программе файлов. Обычно их число устанавливается от 20 до 40. Во время работы программы, в которой обрабатывается большое количество файлов, необходимо своевременно закрывать ненужные файлы. Для закрытия файла на нижнем уровне служит функция close( ), прототип которой имеет вид: int close (дескриптор_файла); Функция close( ) при успешном завершении возвращает 0. В случае ошибки возвращается -1. При завершении программы все открытые файлы автоматически закрываются. Чтение и запись данных Ввод-вывод данных на нижнем уровне осуществляется функциями read( ) и write( ). Прототипы этих функций имеют следующий вид: int read(int fd, char *buffer, unsigned int count); int write(int fd, char *buffer, unsigned int count); Обе функции возвращают целое число - количество действительно прочитанных или записанных байтов. Функция read( ) читает количество байтов, заданное третьим параметром count, из файла, открытого с дескриптором файла fd, в буфер, определенный указателем buffer. При достижении конца файла функция read( ) возвращает значение 0. В случае возникновения ошибки при чтении из файла функция read( ) возвращает значение -1. Операция чтения, так же как и для потокового ввода-вывода, начинается с текущей позиции в файле. После завершения операции чтения текущая позиция будет определять первый непрочитанный символ. Если файл открыт в текстовом режиме, то происходят точно такие же преобразования при вводе последовательности символов CR и LF в символ '\n' (LF), как и при работе с потоком. Указанное преобразование приводит к тому, что в возвращаемом значении вместо двух символов CR и LF учитывается только один символ '\n' (LF). Функция write( ) записывает последовательность байтов, количество которых задано третьим параметром count, в файл, открытый с дескриптором файла fd, из буфера, определенного указателем buffer. Запись производится с текущей позиции. Если файл открыт в текстовом режиме, то количество реально записанных байтов может превышать count за счет преобразований всех символов '\n' в последовательности символов CR, LF. Если при выполнении операции записи возникла ошибка, то функция write( ) возвращает значение -1, а глобальная переменная errno получает одно из следующих значений, заданных предопределенными константами в заголовочном файле errno.h: EACCES - файл защищен для записи (доступен только для чтения); ENOSPC - исчерпано свободное пространство на внешнем устройстве; EBADF - недействительный дескриптор файла. Приведем два примера применения функций низкоуровневого ввода-вывода. Пример 1. Копирование последовательности отдельных символов из стандартного ввода в стандартный вывод: #include int main( ) { char c[2]; while ((read(0, c, 1)) > 0) write(1, c, 1); return 0; } В текст программы включается заголовочный файл io.h, содержащий прототипы функций read( ) и write( ). При вызове этих функций для файлов стандартного ввода и стандартного вывода используются соответственно значения дескрипторов стандартных файлов 0 и 1. Прочитанный символ и код клавиши Запустив программу на выполнение, можно вводить одиночные символы с клавиатуры, завершая ввод каждого из них нажатием на клавишу V v w w e e Первый символ из пары одинаковых символов (v-v; w-w и т. д.) - это символ, введенный с клавиатуры и выведенный системой ввода- вывода на экран (стандартный режим ввода данных с клавиатуры). Второй символ пары выведен на устройство стандартного вывода функцией write( ). Программа копирования завершает работу при вводе сигнала прерывания (одновременном нажатии клавиш Пример 2. Копирование произвольного файла. Программа получает имена файлов из командной строки при запуске и позволяет копировать произвольные файлы (см. аналог этой программы в §7.1.3). #include #include #include int main(int argc, char *argv[ ]) { int fdin, fdout; /* Дескрипторы файлов */; int n; /* Количество прочитанных байтов */ char buff[BUFSIZ]; if ( argc != 3) { printf("Формат вызова программы:"); printf("\n %s файл_источник файл_приемник", argv[0]); return 1; } if ((fdin = open(argv[1], O_RDONLY)) == -1) { perror(argv[1]); return 1; } if ((fdout = open(argv[2], O_WRONLY|O_CREAT|O_TRUNC)) == -1) { perror(argv[2]); return 1; } /* Файлы открыты - можно копировать */ while ((n = read(fdin, buff, BUFSIZ)) > 0 ) write(fdout, buff, n); return 0; } Константа BUFSIZ (размер буфера для потокового ввода-вывода) определена в заголовочном файле stdio.h. Ее значение обычно равно 512 байт. Пусть программа откомпилирована и создан исполняемый файл с именем, например, copyf.exe. Вызов программы из командной строки будет иметь вид: >copyf f1.dat f2.dat где f1.dat - файл-источник; f2.dat - файл-приемник. Если ошибок при исполнении программы нет, файл будет скопирован, но никаких сообщений на экране дисплея не появится. Произвольный доступ к файлу В приведенных выше программах с функциями ввода-вывода низкого уровня обмен с файлом осуществлялся последовательно. При необходимости файл можно читать на низком уровне и в произвольном порядке. Так же как это делалось при работе с потоками, можно изменять значение указателя текущей позиции чтения/запи- си в файле. Для этой цели служит функция lseek( ). Прототип этой функции имеет следующий вид: long lseek(int fd, long offset, int origin); Функция lseek( ) изменяет текущую позицию в файле, связанном с дескриптором fd, на новую, определяемую смещением (второй параметр - offset) относительно выбранной точки отсчета (третий параметр - origin). Точка отсчета задается одной из предопределенных констант, размещенных в заголовочном файле io.h или файле unistd.h (UNIX): SEEK_SET (имеет значение 0) - начало файла; SEEK_CUR (имеет значение 1) - текущая позиция; SEEK_END (имеет значение 2) - конец файла. При удачном завершении функция lseek( ) возвращает новую текущую позицию чтения/записи, представляющую собой смещение от начала файла. Попытка переместиться за пределы файла считается ошибкой. Код ошибки заносится в глобальную переменную errno, определенную в заголовочном файле errno.h. Для определения текущей позиции в файле можно использовать функцию tell( ), прототип которой имеет следующий вид: long tell(int fd); Приведем примеры использования функции lseek( ). Пример 1. Установка текущей позиции в файле на его начало: lseek(fd, 0L, SEEK_SET); Пример 2. Установка текущей позиции для последующего добавления данных в файл (позиция в конце файла): lseek(fd, 0L, SEEK_END); Пример 3. Модификация записей в существующем файле. Запись - это последовательность байтов в файле, представляющая сложный структурный элемент в контексте программы, обрабатывающей эти записи. Логическая структура записи может быть любой: массивом, строкой, структурой и т. д. В следующем фрагменте программы предполагается, что все записи имеют одинаковый размер (в байтах) и размещены в файле подряд. /* Прочитать запись в буфер */ read(fd, buff, sizeof( запись )); /* Вернуть указатель в файле на место, с которого начиналось чтение записи */ lseek(fd, -sizeof( запись ), SEEK_CUR); /* Откорректировать запись в буфере */ /* Поместить запись на прежнее место */ write(fd, buff, sizeof( запись )); Буфер buff может быть определен как массив символов, достаточный для размещения одной записи. Контрольные вопросы Каким образом при отсутствии в языке Си средств ввода-вывода реализуются операции ввода-вывода? Дайте определение файла в языке Си. Что означает термин «потоковый ввод-вывод»? Дайте определение потоку. Какие действия можно производить при работе с потоком? Для чего служит структура предопределенного типа FILE? Укажите различия между именем файла и указателем типа FILE. Укажите имя функции и перечислите ее параметры, необходимые для открытия потока в текстовом режиме. Припомните типичную последовательность операторов, которая используется при открытии файла, связанного с потоком. Какие изменения происходят в структуре типа FILE при открытии файла? Перечислите стандартные потоки и функции для работы с ними. Перечислите функции для ввода-вывода строк и форматного ввода-вывода. Какие функции включены в библиотеку Си для работы с файлами на диске? Для чего служат средства позиционирования в потоке? В чем состоит отличие ввода-вывода низкого уровня от потокового ввода-вывода? Перечислите режимы, в которых можно открыть низкоуровневый файл. Что означает параметр открытия файла «права доступа» и как он применяется? Каким образом осуществляется произвольный доступ к низко- уровнему файлу? Что необходимо сделать, для того чтобы изменить режим обработки файла? Как можно проверить, достигнут ли конец файла? В какую точку потока (на начало, в конец) устанавливается указатель чтения/записи в режимах «r», «w» и «a»? Какие точки отсчета выбирают при смещениях по файлу? |