Язык С (Керниган, Ричи). Язык сиБ. В. Керниган, Д. М. Ричи
Скачать 1.46 Mb.
|
2.5. Арифметические операции. Бинарными арифметическими операциями являются +, -, *, / и операция деления по модулю %. Имеется унарная операция -, но не существует унарной операции +. При делении целых дробная часть отбрасывается. Выражение X % Y дает остаток от деления X на Y и, следовательно, равно нулю, когда х делится на Y точно. Например, год является високосным, если он делится на 4, но не делится на 100, исключая то, что делящиеся на 400 годы тоже являются високосными. Поэтому «Язык С» Б.В. Керниган, Д.М. Ричи 45 IF(YEAR % 4 == 0 && YEAR % 100 != 0 \!\! YEAR % 400 == 0) год високосный ELSE год невисокосный Операцию % нельзя использовать с типами FLOAT или DOUBLE. Операции + и - имеют одинаковое старшинство, которое младше одинакового уровня старшинства операций *, / и %, которые в свою очередь младше унарного минуса. Арифметические операции группируются слева направо. (Сведения о старшинстве и ассоциативности всех операций собраны в таблице в конце этой главы). Порядок выполнения ассоциативных и коммутативных операций типа + и - не фиксируется; компилятор может пе- регруппировывать даже заключенные в круглые скобки выражения, связанные такими операциями. таким образом, а+(B+C) может быть вычислено как (A+B)+C. Это редко приводит к какому-либо расхождению, но если необходимо обеспечить строго определенный порядок, то нужно использовать явные промежуточные переменные. Действия, предпринимаемые при переполнении и антипереполнении (т.е. При получении слишком маленького по абсолютной величине числа), зависят от используемой машины. 2.6. Операции отношения и логические операции Операциями отношения являются => > =< < все они имеют одинаковое старшинство. Непосредственно за ними по уровню старшинства следуют операции равенства и неравенства: == != которые тоже имеют одинаковое старшинство. операции отношения младше арифметических операций, так что выражения типа I Логические связки && и \!\! более интересны. Выражения, связанные операциями && и \!\!, вычисляются слева направо, причем их рассмотрение прекращается сразу же как только становится ясно, будет ли результат истиной или ложью. учет этих свойств очень существенен для написания правильно работающих программ. Рассмотрим, например, оператор цикла в счи- тывающей строку функции GETLINE, которую мы написали в главе 1. FOR(I=0;I S[I]=C; 46 «Язык С» Б.В. Керниган, Д.М. Ричи Ясно, что перед считыванием нового символа необходимо проверить, имеется ли еще место в массиве S, так что условие I GETCHAR : прежде чем проверять символ, его нужно считать. Старшинство операции && выше, чем у \!\!, и обе они младше операций отношения и равенства. Поэтому такие выражения, как I кобки необходимы. Унарная операция отрицания ! Преобразует ненулевой или истинный операнд в 0, а нулевой или ложный операнд в 1. Обычное использование операции ! Заключается в записи IF( ! INWORD ) Вместо IF( INWORD == 0 ) Tрудно сказать, какая форма лучше. Конструкции типа ! INWORD Читаются довольно удобно (“если не в слове”). Но в более сложных случаях они могут оказаться трудными для понимания. Упражнение 2-1. Напишите оператор цикла, эквивалентный приведенному выше оператору FOR, не используя операции &&. 2.7. Преобразование типов Если в выражениях встречаются операнды различных типов, то они преобразуются к общему типу в соответствии с небольшим набором правил. В общем, автоматически производятся только преобразования, имеющие смысл, такие как, например, преобразование целого в плавающее в выражениях типа F+I. Выражения же, лишенные смысла, такие как использование переменной типа FLOAT в качестве индекса, запрещены. Во-первых, типы CHAR и INT могут свободно смешиваться в арифметических выражениях: каждая переменная типа CHAR автоматически преобразуется в INT. Это обеспечивает значительную гибкость при проведении определенных преобразований символов. Примером может «Язык С» Б.В. Керниган, Д.М. Ричи 47 служить функция ATOI, которая ставит в соответствие строке цифр ее численный эквивалент. ATOI(S) /* CONVERT S TO INTEGER */ CHAR S[]; INT I, N; N = 0; FOR ( I = 0; S[I]>=’0' && S[I]<=’9'; ++I) N = 10 * N + S[I] - ‘0’; RETURN(N); KAK Уже обсуждалось в главе 1, выражение S[I] - ‘0’ имеет численное значение находящегося в S[I] символа, потому что значение символов ‘0’, ‘1’ и т.д. образуют возрастающую последовательность расположенных подряд целых положительных чисел. Другой пример преобразования CHAR в INT дает функция LOWER, преобразующая данную прописную букву в строчную. Если выступающий в качестве аргумента символ не является прописной буквой, то LOWER возвращает его неизменным. Приводимая ниже программа справедлива только для набора символов ASCII. LOWER(C) /* CONVERT C TO LOWER CASE; ASCII ONLY */ INT C; IF ( C >= ‘A’ && C <= ‘Z’ ) RETURN( C + ‘@’ - ‘A’); ELSE /*@ Записано вместо ‘A’ строчного*/ RETURN(C); Эта функция правильно работает при коде ASCII, потому что численные значения, соответствующие в этом коде прописным и строчным буквам, отличаются на постоянную величину, а каждый алфавит является сплошным - между а и Z нет ничего, кроме букв. Это последнее замечание для набора символов EBCDIC систем IBM 360/370 оказывается несправедливым, в силу чего эта программа на таких системах работает неправильно - она преобразует не только буквы. При преобразовании символьных переменных в целые возникает один тонкий момент. Дело в том, что сам язык не указывает, должны ли переменным типа CHAR соответствовать численные значения со знаком или без знака. Может ли при преобразовании CHAR в INT получиться отрицательное целое? К сожалению, ответ на этот вопрос меняется от машины к машине, отражая расхождения в их архитектуре. На некоторых машинах (PDP-11, например) 48 «Язык С» Б.В. Керниган, Д.М. Ричи переменная типа CHAR, крайний левый бит которой содержит 1, преобразуется в отрицательное целое (“знаковое расширение”). На других машинах такое преобразование сопровождается добавлением нулей с левого края, в результате чего всегда получается положительное число. Определение языка “C” гарантирует, что любой символ из стандартного набора символов машины никогда не даст отрицательного числа, так что эти символы можно свободно использовать в выражениях как положительные величины. Но произвольные комбинации двоичных знаков, хранящиеся как символьные переменные на некоторых машинах, могут дать отрицательные значения, а на других положительные. Наиболее типичным примером возникновения такой ситуации является сучай, когда значение 1 используется в качестве EOF. Рассмотрим программу CHAR C; C = GETCHAR(); IF ( C == EOF ) На машине, которая не осуществляет знакового расширения, переменная ‘с’ всегда положительна, поскольку она описана как CHAR, а так как EOF отрицательно, то условие никогда не выполняется. Чтобы избежать такой ситуации, мы всегда предусмотрительно использовали INT вместо CHAR для любой переменной, получающей значение от GETCHAR. Основная же причина использования INT вместо CHAR не связана с каким-либо вопросом о возможном знаковом расширении. просто функция GETCHAR должна передавать все возможные символы (чтобы ее можно было использовать для произвольного ввода) и, кроме того, отличающееся значение EOF. Следовательно значение EOF не может быть представлено как CHAR, а должно храниться как INT. Другой полезной формой автоматического преобразования типов является то, что выражения отношения, подобные I>J, и логические выражения, связанные операциями && и \!\!, по определению имеют значение 1, если они истинны, и 0, если они ложны. Таким образом, присваивание ISDIGIT = C >= ‘0’ && C <= ‘9’; полагает ISDIGIT равным 1, если с - цифра, и равным 0 в противном случае. (В проверочной части операторов IF, WHILE, FOR и т.д. “Истинно” просто означает “не нуль”). Неявные арифметические преобразования работают в основном, как и ожидается. В общих чертах, если операция типа + или *, которая связывает два операнда (бинарная операция), имеет операнды разных типов, то перед выполнением операции “низший” тип преобразуется к “высшему” и получается результат “высшего” типа. Более точно, к каждой арифметической операции применяется следующая последовательность правил преобразования. «Язык С» Б.В. Керниган, Д.М. Ричи 49 - Типы CHAR и SHORT преобразуются в INT, а FLOAT в DOUBLE. - Затем, если один из операндов имеет тип DOUBLE, то другой преобразуется в DOUBLE, и результат имеет тип DOUBLE. - В противном случае, если один из операндов имеет тип LONG, то другой преобразуется в LONG, и результат имеет тип LONG. - В противном случае, если один из операндов имеет тип UNSIGNED, то другой преобразуется в UNSIGNED и результат имеет тип UNSIGNED. - В противном случае операнды должны быть типа INT, и результат имеет тип INT. Подчеркнем, что все переменные типа FLOAT в выражениях пре- образуются в DOUBLE; в “C” вся плавающая арифметика выполняется с двойной точностью. Преобразования возникают и при присваиваниях; значение правой части преобразуется к типу левой, который и является типом результата. Символьные переменные преобразуются в целые либо со знаковым расширением ,либо без него, как описано выше. Обратное преобразование INT в CHAR ведет себя хорошо - лишние биты высокого порядка просто отбрасываются. Таким образом INT I; CHAR C; I = C; C = I; значение ‘с’ не изменяется. Это верно независимо от того, вовлекается ли знаковое расширение или нет. Если х типа FLOAT, а I типа INT, то как х = I; так и I = х; приводят к преобразованиям; при этом FLOAT преобразуется в INT отбрасыванием дробной части. Тип DOUBLE преобразуется во FLOAT округлением. Длинные целые преобразуются в более короткие целые и в переменные типа CHAR посредством отбрасывания лишних битов высокого порядка. Так как аргумент функции является выражением, то при передаче функциям аргументов также происходит преобразование типов: в частности, CHAR и SHORT становятся INT, а FLOAT становится DOUBLE. Именно поэтому мы описывали аргументы функций как INT и DOUBLE даже тогда, когда обращались к ним с переменными типа CHAR и FLOAT. Наконец, в любом выражении может быть осуществлено (“принуждено”) явное преобразование типа с помощью конструкции, называемой перевод (CAST). В этой конструкции, имеющей вид 50 «Язык С» Б.В. Керниган, Д.М. Ричи (имя типа) выражение Выражение преобразуется к указанному типу по правилам преобразования, изложенным выше. Фактически точный смысл операции перевода можно описать следующим образом: выражение как бы присваивается некоторой переменной указанного типа, которая затем используется вместо всей конструкции. Например, библиотечная процедура SQRT ожидает аргумента типа DOUBLE и выдаст бессмысленный ответ, если к ней по небрежности обратятся с чем-нибудь иным. таким образом, если N - целое, то выражение SQRT((DOUBLE) N) до передачи аргумента функции SQRT преобразует N к типу DOUBLE. (Отметим, что операция перевод преобразует значение N в надлежащий тип; фактическое содержание переменной N при этом не изменяется). Операция перевода имрация перевода имеет тот же уровень старшинства, что и другие унарные операции, как указывается в таблице в конце этой главы. Упражнение 2-2. Составьте программу для функции HTOI(S), которая преобразует строку шестнадцатеричных цифр в эквивалентное ей целое значение. При этом допустимыми цифрами являются цифры от 1 до 9 и буквы от а до F. 2.8. Операции увеличения и уменьшения В языке “C” предусмотрены две необычные операции для увеличения и уменьшения значений переменных. Операция увеличения ++ добавляет 1 к своему операнду, а операция уменьшения — вычитает 1. Мы часто использовали операцию ++ для увеличения переменных, как, например, в IF(C == ‘\N’) ++I; Необычный аспект заключается в том, что ++ и — можно использовать либо как префиксные операции (перед переменной, как в ++N), либо как постфиксные (после переменной: N++). Эффект в обоих случаях состоит в увеличении N. Но выражение ++N увеличивает переменную N до использования ее значения, в то время как N++ увеличивает переменную N после того, как ее значение было использовано. Это означает, что в контексте, где используется значение переменной, а не только эффект увеличения, использование ++N и N++ приводит к разным результатам. Если N = 5, то х = N++; устанавливает х равным 5, а х = ++N; «Язык С» Б.В. Керниган, Д.М. Ричи 51 полагает х равным 6. В обоих случаях N становится равным 6. Операции увеличения и уменьшения можно применять только к переменным; выражения типа х=(I+J)++ являются незаконными. В случаях, где нужен только эффект увеличения, а само значение не используется, как, например, в IF ( C == ‘\N’ ) NL++; выбор префиксной или постфиксной операции является делом вкуса. но встречаются ситуации, где нужно использовать именно ту или другую операцию. Рассмотрим, например, функцию SQUEEZE(S,C), которая удаляет символ ‘с’ из строки S, каждый раз, как он встречается. SQUEEZE(S,C) /* DELETE ALL C FROM S */ CHAR S[]; INT C; INT I, J; FOR ( I = J = 0; S[I] != ‘\0’; I++) IF ( S[I] != C ) S[J++] = S[I]; S[J] = ‘\0’; Каждый раз, как встечается символ, отличный от ‘с’, он копируется в текущую позицию J, и только после этого J увеличивается на 1, чтобы быть готовым для поступления следующего символа. Это в точности эквивалентно записи IF ( S[I] != C ) S[J] = S[I]; J++; Другой пример подобной конструкции дает функция GETLINE, которую мы запрограммировали в главе 1, где можно заменить IF ( C == ‘\N’ ) S[I] = C; ++I; более компактной записью IF ( C == ‘\N’ ) S[I++] = C; В качестве третьего примера рассмотрим функцию STRCAT(S,T), которая приписывает строку т в конец строки S, образуя конкатенацию строк S и т. При этом предполагается, что в S достаточно места для хранения полученной комбинации. 52 «Язык С» Б.В. Керниган, Д.М. Ричи STRCAT(S,T) /* CONCATENATE T TO END OF S */ CHAR S[], T[]; /* S MUST BE BIG ENOUGH */ INT I, J; I = J = 0; WHILE (S[I] != ‘\0’) / *FIND END OF S */ I++; WHILE((S[I++] = T[J++]) != ‘\0’) /*COPY T*/ ; Tак как из T в S копируется каждый символ, то для подготовки к следующему прохождению цикла постфиксная операция ++ применяется к обеим переменным I и J. Упражнение 2-3. Напишите другой вариант функции SQUEEZE(S1,S2), который удаляет из строки S1 каждый символ, совпадающий с каким-либо символом строки S2. Упражнение 2-4. Напишите программу для функции ANY(S1,S2), которая находит место первого появления в строке S1 какого-либо символа из строки S2 и, если строка S1 не содержит символов строки S2, возвращает значение -1. 2.9. Побитовые логические операции В языке предусмотрен ряд операций для работы с битами; эти операции нельзя применять к переменным типа FLOAT или DOUBLE. & Побитовое AND \! Побитовое включающее OR ^ побитовое исключающее OR << сдвиг влево >> сдвиг вправо \^ дополнение (унарная операция) “\” иммитирует вертикальную черту. Побитовая операция AND часто используется для маскирования некоторого множества битов; например, оператор C = N & 0177 передает в ‘с’ семь младших битов N , полагая остальные равными нулю. Операция ‘э’ побитового OR используется для включения битов: C = X э MASK устанавливает на единицу те биты в х , которые равны единице в MASK. Следует быть внимательным и отличать побитовые операции & и ‘э’ от логических связок && и \!\! , Которые подразумевают вычисление значения «Язык С» Б.В. Керниган, Д.М. Ричи 53 истинности слева направо. Например, если х=1, а Y=2, то значение х&Y равно нулю , в то время как значение X&&Y равно единице./почему?/ Операции сдвига << и >> осуществляют соответственно сдвиг влево и вправо своего левого операнда на число битовых позиций, задаваемых правым операндом. Таким образом , х<<2 сдвигает х влево на две позиции, заполняя освобождающиеся биты нулями, что эквивалентно умножению на 4. Сдвиг вправо величины без знака заполняет освобождающиеся биты на некоторых машинах, таких как PDP-11, заполняются содержанием знакового бита /”арифметический сдвиг”/, а на других - нулем /”логический сдвиг”/. Унарная операция \^ дает дополнение к целому; это означает , что каждый бит со значением 1 получает значение 0 и наоборот. Эта операция обычно оказывается полезной в выражениях типа X & \^077 где последние шесть битов х маскируются нулем. Подчеркнем, что выражение X&\^077 не зависит от длины слова и поэтому предпочтительнее, чем, например, X&0177700, где предполагается, что х занимает 16 битов. Такая переносимая форма не требует никаких дополнительных затрат, поскольку \^077 является константным выражением и, следовательно, обрабатывается во время компиляции. Чтобы проиллюстрировать использование некоторых операций с битами, рассмотрим функцию GETBITS(X,P,N), которая возвращает /сдвинутыми к правому краю/ начинающиеся с позиции р поле переменной х длиной N битов. мы предполагаем , что крайний правый бит имеет номер 0, и что N и р - разумно заданные положительные числа. например, GETBITS(х,4,3) возвра- щает сдвинутыми к правому краю биты, занимающие позиции 4,3 и 2. GETBITS(X,P,N) /* GET N BITS FROM POSITION P */ UNSIGNED X, P, N; RETURN((X >> (P+1-N)) & \^(\^0 << N)); Операция X >> (P+1-N) сдвигает желаемое поле в правый конец слова. Описание аргумента X как UNSIGNED гарантирует, что при сдвиге вправо освобождающиеся биты будут заполняться нулями, а не содержимым знакового бита, независимо от того, на какой машине пропускается программа. Все биты константного выражения \^0 равны 1; сдвиг его на N позиций влево с помощью операции \^0< |