Главная страница
Навигация по странице:

  • 10.1 ВВЕДЕНИЕ

  • 10.2.1 Вывод встроенных типов

  • 10.2.2 Вывод пользовательских типов

  • 10.3.1 Ввод встроенных типов

  • 10.3.2 Состояния потока

  • Бьерн Страуструп. Язык программирования С Второе дополненное издание


    Скачать 2.87 Mb.
    НазваниеБьерн Страуструп. Язык программирования С Второе дополненное издание
    Дата30.01.2020
    Размер2.87 Mb.
    Формат файлаpdf
    Имя файлаStraustrup-Yazyk_programmirovaniya_c.pdf
    ТипДокументы
    #106559
    страница22 из 35
    1   ...   18   19   20   21   22   23   24   25   ...   35

    ГЛАВА 10. ПОТОКИ
    "Доступно только то, что видимо"
    Б. Керниган
    В языке С++ нет средств для ввода-вывода. Их и не нужно, поскольку такие средства можно просто и элегантно создать на самом языке. Описанная здесь библиотека потокового ввода-вывода реализует строгий типовой и вместе с тем гибкий и эффективный способ символьного ввода и вывода целых, вещественных чисел и символьных строк, а также является базой для расширения, рассчитанного на работу с пользовательскими типами данных. Пользовательский интерфейс библиотеки находится в файле . Эта глава посвящена самой потоковой библиотеке, некоторым способам работы с ней и определенным приемам реализации библиотеки.
    10.1 ВВЕДЕНИЕ
    Широко известна трудность задачи проектирования и реализации стандартных средств ввода-вывода для языков программирования. Традиционно средства ввода-вывода были рассчитаны исключительно на небольшое число встроенных типов данных. Однако, в нетривиальных программах на С++ есть много пользовательских типов данных, поэтому необходимо предоставить возможность ввода-вывода значений таких типов. Очевидно, что средства ввода-вывода должны быть простыми, удобными, надежными в использовании и, что важнее всего, адекватными. Пока никто не нашел решения, которое удовлетворило бы всех; поэтому необходимо дать возможность пользователю создавать иные средства ввода-вывода, а также расширять стандартные средства ввода-вывода в расчете на определенное применение.
    Цель создания С++ была в том, чтобы пользователь мог определить новые типы данных, работа с которыми была бы столь же удобна и эффективна как и со встроенными типами. Таким образом, кажется разумным потребовать, чтобы средства ввода-вывода для С++ программировались с использованием возможностей С++, доступных каждому. Представленные здесь потоковые средства ввода-вывода появились в результате попытки удовлетворить этим требованиям.
    Основная задача потоковых средств ввода-вывода - это процесс преобразования объектов определенного типа в последовательность символов и наоборот. Существуют и другие схемы ввода- вывода, но указанная является основной, и если считать символ просто набором битов, игнорируя его естественную связь с алфавитом, то многие схемы двоичного ввода-вывода можно свести к ней.
    Поэтому программистская суть задачи сводится к описанию связи между объектом определенного типа и бестиповой (что существенно) строкой.
    Последующие разделы описывают основные части потоковой библиотеки С++:
    10.2 Вывод: То, что для прикладной программы представляется выводом, на самом деле является преобразованием таких объектов как int, char *, complex или Employee_record в последовательность символов. Описываются средства для записи объектов встроенных и пользовательских типов данных.
    10.3 Ввод: Описаны функции для ввода символов, строк и значений встроенных и пользовательских типов данных.
    10.4 Форматирование: Часто существуют определенные требования к виду вывода, например, int должно печататься десятичными цифрами, указатели в шестнадцатеричной записи, а вещественные числа должны быть с явно заданной точностью фиксированного размера.
    Обсуждаются функции форматирования и определенные программистские приемы их создания, в частности, манипуляторы.
    10.5 Файлы и потоки: Каждая программа на С++ может использовать по умолчанию три потока - стандартный вывод (cout), стандартный ввод (cin) и стандартный поток ошибок (cerr). Чтобы работать с какими-либо устройствами или файлами надо создать потоки и привязать их к этим устройствам или файлам. Описывается механизм открытия и закрытия файлов и связывания файлов с потоками.
    10.6 Ввод-вывод для С: обсуждается функция printf из файла для С а также связь между

    Бьерн Страуструп.
    Язык программирования С++
    258 библиотекой для С и для С++.
    Укажем, что существует много независимых реализаций потоковой библиотеки ввода-вывода и набор средств, описанных здесь, будет только подмножеством средств, имеющихся в вашей библиотеке.
    Говорят, что внутри любой большой программы есть маленькая программа, которая стремится вырваться наружу. В этой главе предпринята попытка описать как раз маленькую потоковую библиотеку ввода-вывода, которая позволит оценить основные концепции потокового ввода-вывода и познакомить с наиболее полезными средствами. Используя только средства, описанные здесь, можно написать много программ; если возникнет необходимость в более сложных средствах, обратитесь за деталями к вашему руководству по С++.
    Заголовочный файл определяет интерфейс потоковой библиотеки. В ранних версиях потоковой библиотеки использовался файл . Если существуют оба файла, определяет полный набор средств, а определяет подмножество, которое совместимо с ранними, менее богатыми потоковыми библиотеками.
    Естественно, для пользования потоковой библиотекой вовсе не нужно знание техники ее реализации, тем более, что техника может быть различной для различных реализаций. Однако, реализация ввода- вывода является задачей, диктующей определенные условия, значит приемы, найденные в процессе ее решения, можно применить и для других задач, а само это решение достойно изучения.
    10.2 ВЫВОД
    Строгую типовую и единообразную работу как со встроенными, так и с пользовательскими типами можно обеспечить, если использовать единственное перегруженное имя функции для различных операций вывода. Например: put(cerr,"x = "); // cerr - выходной поток ошибок put(cerr,x); put(cerr,'\n');
    Тип аргумента определяет какую функцию надо вызывать в каждом случае. Такой подход применяется в нескольких языках, однако, это слишком длинная запись. За счет перегрузки операции << , чтобы она означала "вывести" ("put to"), можно получить более простую запись и разрешить программисту выводить в одном операторе последовательность объектов, например так: cerr << "x = " << x << '\n';
    Здесь cerr обозначает стандартный поток ошибок. Так, если х типа int со значением 123, то приведенный оператор выдаст x = 123 и еще символ конца строки в стандартный поток ошибок. Аналогично, если х имеет пользовательский тип complex со значением (1,2.4), то указанный оператор выдаст x = (1,2.4) в поток cerr. Такой подход легко использовать пока x такого типа, для которого определена операция
    <<, а пользователь может просто доопределить << для новых типов.
    Мы использовали операцию вывода, чтобы избежать многословности, неизбежной, если применять функцию вывода. Но почему именно символ << ? Невозможно изобрести новую лексему (см. 7.2).
    Кандидатом для ввода и вывода была операция присваивания, но большинство людей предпочитает, чтобы операции ввода и вывода были различны. Более того, порядок выполнения операции = неподходящий, так cout=a=b означает cout=(a=b). Пробовали использовать операции < и >, но к ним так крепко привязано понятие "меньше чем" и "больше чем", что операции ввода-вывода с ними во всех практически случаях не поддавались прочтению.
    Операции << и >> похоже не создают таких проблем. Они асиметричны, что позволяет приписывать им смысл "в" и "из". Они не относятся к числу наиболее часто используемых операций над встроенными

    Бьерн Страуструп.
    Язык программирования С++
    259 типами, а приоритет << достаточно низкий, чтобы писать арифметические выражения в качестве операнда без скобок: cout << "a*b+c=" << a*b+c << '\n';
    Скобки нужны, если выражение содержит операции с более низким приоритетом: cout << "a^b|c=" << (a^b|c) << '\n';
    Операцию сдвига влево можно использовать в операции вывода, но, конечно, она должна быть в скобках: cout << "a<10.2.1 Вывод встроенных типов
    Для управления выводом встроенных типов определяется класс ostream с операцией << (вывести): class ostream : public virtual ios {
    // public: ostream& operator<<(const char*); //
    строки ostream& operator<<(char); ostream& operator<<(short i)
    { return *this << int(i); } ostream& operator<<(int); ostream& operator<<(long); ostream& operator<<(double); ostream& operator<<(const void*); // указатели
    //
    };
    Естественно, в классе ostream должен быть набор функций operator<<() для работы с беззнаковыми типами.
    Функция operator<< возвращает ссылку на класс ostream, из которого она вызывалась, чтобы к ней можно было применить еще раз operator<<. Так, если х типа int, то cerr << "x = " << x; понимается как
    (cerr.operator<<("x = ")).operator<<(x);
    В частности, это означает, что если несколько объектов выводятся с помощью одного оператора вывода, то они будут выдаваться в естественном порядке: слева - направо.
    Функция ostream::operator<<(int) выводит целые значения, а функция ostream::operator<<(char) - символьные. Поэтому функция void val(char c)
    { cout << "int('"<< c <<"') = " << int(c) << '\n';
    } печатает целые значения символов и с помощью программы main()
    { val('A'); val('Z');
    } будет напечатано int('A') = 65 int('Z') = 90

    Бьерн Страуструп.
    Язык программирования С++
    260
    Здесь предполагается кодировка символов ASCII, на вашей машине может быть иной результат.
    Обратите внимание, что символьная константа имеет тип char, поэтому cout<<'Z' напечатает букву Z, а вовсе не целое 90.
    Функция ostream::operator<<(const void*) напечатает значение указателя в такой записи, которая более подходит для используемой системы адресации. Программа main()
    { int i = 0; int* p = new int(1); cout << "local " << &i
    << ", free store " << p << '\n';
    } выдаст на машине, используемой автором, local 0x7fffead0, free store 0x500c
    Для других систем адресации могут быть иные соглашения об изображении значений указателей.
    Обсуждение базового класса ios отложим до 10.4.1.
    10.2.2 Вывод пользовательских типов
    Рассмотрим пользовательский тип данных: class complex { double re, im; public: complex(double r = 0, double i = 0) { re=r; im=i; } friend double real(complex& a) { return a.re; } friend double imag(complex& a) { return a.im; } friend complex operator+(complex, complex); friend complex operator-(complex, complex); friend complex operator*(complex, complex); friend complex operator/(complex, complex);
    //...
    };
    Для нового типа complex операцию << можно определить так: ostream& operator<<(ostream&s, complex z)
    { return s << '(' real(z) << ',' << imag(z) << ')';
    }; и использовать как operator<< для встроенных типов. Например, main()
    { complex x(1,2); cout << "x = " << x << '\n';
    } выдаст x = (1,2)
    Для определения операции вывода над пользовательскими типами данных не нужно модифицировать описание класса ostream, не требуется и доступ к структурам данных, скрытым в описании класса.
    Последнее очень кстати, поскольку описание класса ostream находится среди стандартных заголовочных файлов, доступ по записи к которым закрыт для большинства пользователей, и изменять которые они вряд ли захотят, даже если бы могли. Это важно и по той причине, что дает защиту от случайной порчи этих структур данных. Кроме того имеется возможность изменить реализацию ostream,

    Бьерн Страуструп.
    Язык программирования С++
    261 не затрагивая пользовательских программ.
    10.3 ВВОД
    Ввод во многом сходен с выводом. Есть класс istream, который реализует операцию ввода >> ("ввести из" - "input from") для небольшого набора стандартных типов. Для пользовательских типов можно определить функцию operator>>.
    10.3.1 Ввод встроенных типов
    Класс istream определяется следующим образом: class istream : public virtual ios {
    //... public: istream& operator>>(char*);
    // строка istream& operator>>(char&);
    // символ istream& operator>>(short&); istream& operator>>(int&); istream& operator>>(long&); istream& operator>>(float&); istream& operator>>(double&);
    //...
    };
    Функции ввода operator>> определяются так: istream& istream::operator>>(T& tvar)
    {
    // пропускаем обобщенные пробелы
    // каким-то образом читаем T в`tvar' return
    *this;
    }
    Теперь можно ввести в VECTOR последовательность целых, разделяемых пробелами, с помощью функции: int readints(Vector& v)
    // возвращаем число прочитанных целых
    { for (int i = 0; i { if
    (cin>>v[i]) continue; return i;
    }
    // слишком много целых для размера Vector
    // нужна соответствующая обработка ошибки
    }
    Появление значения с типом, отличным от int, приводит к прекращению операции ввода, и цикл ввода завершается. Так, если мы вводим
    1 2 3 4 5. 6 7 8. то функция readints() прочитает пять целых чисел
    1 2 3 4 5
    Символ точка останется первым символом, подлежащим вводу. Под пробелом, как определено в стандарте С, понимается обобщенный пробел, т.е. пробел, табуляция, конец строки, перевод строки или возврат каретки. Проверка на обобщенный пробел возможна с помощью функции isspace() из файла .

    Бьерн Страуструп.
    Язык программирования С++
    262
    В качестве альтернативы можно использовать функции get(): class istream : public virtual ios {
    //... istream& get(char& c); // символ istream& get(char* p, int n, char ='n'); // строка
    };
    В них обобщенный пробел рассматривается как любой другой символ и они предназначены для таких операций ввода, когда не делается никаких предположений о вводимых символах.
    Функция istream::get(char&) вводит один символ в свой параметр. Поэтому программу посимвольного копирования можно написать так: main()
    { char c; while (cin.get(c)) cout << c;
    }
    Такая запись выглядит несимметрично, и у операции >> для вывода символов есть двойник под именем put(), так что можно писать и так: main()
    { char c; while (cin.get(c)) cout.put(c);
    }
    Функция с тремя параметрами istream::get() вводит в символьный вектор не менее n символов, начиная с адреса p. При всяком обращении к get() все символы, помещенные в буфер (если они были), завершаются 0, поэтому если второй параметр равен n, то введено не более n-1 символов. Третий параметр определяет символ, завершающий ввод. Типичное использование функции get() с тремя параметрами сводится к чтению строки в буфер заданного размера для ее дальнейшего разбора, например так: void f()
    { char buf[100]; cin >> buf;
    // подозрительно cin.get(buf,100,'\n');
    // надежно
    //...
    }
    Операция cin>>buf подозрительна, поскольку строка из более чем 99 символов переполнит буфер. Если обнаружен завершающий символ, то он остается в потоке первым символом подлежащим вводу. Это позволяет проверять буфер на переполнение: void f()
    { char buf[100]; cin.get(buf,100,'\n'); // надежно char c; if (cin.get(c) && c!='\n') {
    // входная строка больше, чем ожидалось
    }
    //...
    }
    Естественно, существует версия get() для типа unsigned char.
    В стандартном заголовочном файле определены несколько функций, полезных для обработки при вводе:

    Бьерн Страуструп.
    Язык программирования С++
    263 int isalpha(char)
    // 'a'..'z' 'A'..'Z' int isupper(char)
    // 'A'..'Z' int islower(char)
    // 'a'..'z' int isdigit(char)
    // '0'..'9' int isxdigit(char)
    // '0'..'9' 'a'..'f' 'A'..'F' int isspace(char)
    // ' ' '\
    t' возвращает конец строки
    // и перевод формата int iscntrl(char)
    // управляющий символ в диапазоне
    // (ASCII 0..31 и 127) int ispunct(char)
    // знак пунктуации, отличен от
    // приведенных выше int isalnum(char)
    // isalpha() | isdigit() int isprint(char)
    // видимый: ascii ' '..'

    ' int isgraph(char)
    // isalpha() | isdigit() | ispunct() int isascii(char c) { return 0<=c && c<=127; }
    Все они, кроме isascii(), работают с помощью простого просмотра, используя символ как индекс в таблице атрибутов символов. Поэтому вместо выражения типа
    (('a'<=c && c<='z') || ('A'<=c && c<='Z')) // буква которое не только утомительно писать, но оно может быть и ошибочным (на машине с кодировкой
    EBCDIC оно задает не только буквы), лучше использовать вызов стандартной функции isalpha(), который к тому же более эффективен. В качестве примера приведем функцию eatwhite(), которая читает из потока обобщенные пробелы: istream& eatwhite(istream& is)
    { char c; while (is.get(c)) { if
    (isspace(c)==0)
    { is.putback(c); break;
    }
    } return is;
    }
    В ней используется функция putback(), которая возвращает символ в поток, и он становится первым подлежащим чтению.
    10.3.2 Состояния потока
    С каждым потоком (istream или ostream) связано определенное состояние. Нестандартные ситуации и ошибки обрабатываются с помощью проверки и установки состояния подходящим образом. Узнать состояние потока можно с помощью операций над классом ios: class ios {
    //ios является базовым для ostream и istream
    //... public: int eof() const;
    // дошли до конца файла int fail() const;
    // следующая операция будет неудачна int bad() const;
    // поток испорчен int good() const;
    // следующая операция будет успешной
    //...
    };
    Последняя операция ввода считается успешной, если состояние задается good() или eof(). Если состояние задается good(), то последующая операция ввода может быть успешной, в противном случае она будет неудачной. Применение операции ввода к потоку в состоянии, задаваемом не good(), считается пустой операцией. Если произошла неудача при попытке чтения в переменную v, то значение v не изменилось (оно не изменится, если v имеет тип, управляемый функциями члена из istream или

    Бьерн Страуструп.
    Язык программирования С++
    264 ostream). Различие между состояниями, задаваемыми как fail() или как bad() уловить трудно, и оно имеет смысл только для разработчиков операций ввода. Если состояние есть fail(), то считается, что поток не поврежден, и никакие символы не пропали; о состоянии bad() ничего сказать нельзя.
    Значения, обозначающие эти состояния, определены в классе ios: class ios {
    //... public: enum io_state
    { goodbit=0, eofbit=1, filebit=2, badbit=4,
    };
    //...
    };
    Истинные значения состояний зависят от реализации, и указанные значения приведены только, чтобы избежать синтаксически неправильных конструкций.
    Проверять состояние потока можно следующим образом: switch (cin.rdstate()) { case ios::goodbit:
    // последняя операция с cin была успешной break; case ios::eofbit:
    // в конце файла break; case ios::filebit:
    // некоторый анализ ошибки
    // возможно неплохой break; case ios::badbit:
    // cin возможно испорчен break;
    }
    В более ранних реализациях для значений состояний использовались глобальные имена. Это приводило к нежелательному засорению пространства именования, поэтому новые имена доступны только в пределах класса ios. Если вам необходимо использовать старые имена в сочетании с новой библиотекой, можно воспользоваться следующими определениями: const int _good = ios::goodbit; const int _bad = ios::badbit; const int _file = ios::filebit; const int _eof = ios::eofbit; typedef ios::io_state state_value ;
    Разработчики библиотек должны заботится о том, чтобы не добавлять новых имен к глобальному пространству именования. Если элементы перечисления входят в общий интерфейс библиотеки, они всегда должны использоваться в классе с префиксами, например, как ios::goodbit и ios::io_state.
    Для переменной любого типа, для которого определены операции << и >>, цикл копирования записывается следующим образом: while (cin>>z) cout << z << '\n';
    Если поток появляется в условии, то проверяется состояние потока, и условие выполняется (т.е. результат его не 0) только для состояния good(). Как раз в приведенном выше цикле проверяется состояние потока istream, что является результатом операции cin>>z. Чтобы узнать, почему произошла неудача в цикле или условии, надо проверить состояние. Такая проверка для потока реализуется с

    Бьерн Страуструп.
    Язык программирования С++
    265 помощью операции приведения (7.3.2).
    Так, если z является символьным вектором, то в приведенном цикле читается стандартный ввод и выдается для каждой строки стандартного вывода по одному слову (т.е. последовательности символов, не являющихся обобщенными пробелами). Если z имеет тип complex, то в этом цикле с помощью операций, определенных в 10.2.2 и 10.2.3, будут копироваться комплексные числа. Шаблонную функцию копирования для потоков со значениями произвольного типа можно написать следующим образом: complex z; iocopy(z,cin,cout); // копирование complex double d; iocopy(d,cin,cout); // копирование double char c; iocopy(c,cin,cout); // копирование char
    Поскольку надоедает проверять на корректность каждую операцию ввода-вывода, то распространенным источником ошибок являются именно те места в программе, где такой контроль существенен. Обычно операции вывода не проверяют, но иногда они могут завершиться неудачно.
    Потоковый ввод-вывод разрабатывался из того принципа, чтобы сделать исключительные ситуации легкодоступными, и тем самым упростить обработку ошибок в процессе ввода-вывода.
    1   ...   18   19   20   21   22   23   24   25   ...   35


    написать администратору сайта