Информация, с которой оперирует компьютер, в общем-то аналогична той, что используется человеком. Информация вводится, запоминается и обрабатывается в виде наборов символов или численно-буквенных выражений. Графическую или речевую информацию компьютер использовать не может, хотя иногда такую информацию тоже удается преобразовать в последовательности символов, пригодных для обработки на ЭВМ.
Исторически сложилось так, что техническое обеспечение компьютера представляет собой электрические или электронные цепи, поэтому информация, с которой имеет дело компьютер, представляется в виде наборов электрических сигналов. При этом единицей информации принято считать состояние <1> или <О> из двух возможных состояний простейшего элемента.
Поясним сказанное более подробно. Наличие электрического сигнала можно принять за единицу, а отсутствие этого сигнала - за нуль. Точно так же единицей или нулем можно считать наличие высокого или низкого напряжения в какой-то точке электрической цепи. Поскольку наличие или отсутствие сигнала соответствует двум возможным состояниям информационного элемента, то при регистрации информации с помощью только единиц или нулей удобнее пользоваться не десятичной, а двоичной системой счисления. По этой причине компьютер работает с двоичными числами.
Двоичная структура информации является настолько общей, что если даже представить себе какой-нибудь компьютер далекой внеземной цивилизации, то и он, наверное, был бы построен по двоичному принципу. Кроме двоичной системы, сравнительно эффективной для ЭВМ является также троичная система счисления.
Двоичная цифра в переводе на английский язык звучит как . Используя из этого термина несколько букв в качестве аббревиатуры, получим слово . Таким образом, битом называется, двоичный информационный элемент, способный принимать значение <1> или <О>.
Вся информация в компьютере представляется в виде наборов таких битов. Если один бит может устанавливаться в одно из двух возможных состояний, обозначенных как <1> или <О>, то группа из двух расположенных рядом битов может принимать уже одно из четырех возможных состояний: 00, 01, 10 и 11.
Клавиатура пишущей машинки содержит 80 различных печатных знаков. Чтобы охватить такую группу символов, требуется 7 бит или, как их иногда называют, 7 двоичных разрядов, с помощью которых можно реализовать 128 различных комбинаций. Как правило, биты группируются в цепочки по 4 двоичных разряда каждая, называемые тетрадами. Объединение двух таких тетрад дает возможность составить 16x16 = 256 различных двоичных сочетаний.
Кроме ТОГО, объединив биты в группу из 4 элементов, с помощью такой группы можно реализовать 16 разных двоичных комбинаций, связав их с цифрами 16-ричной системы счисления. В этих комбинациях двоичное число 0000 будет соответствовать 16-ричному пулю, 0001-единице, 0010 - двойке и так далее до 9. Начиная с 10, число уже нельзя представить с помощью одной цифры, и поэтому в 16-ричной системе в качестве цифр, соответствующих 10 и выше, до 15, вводятся буквы латинского алфавита от А до F. Таким образом, числу 1010 соответствует <цифра> А, числу 1011-<цифра> В и так до числа 1111, обозначаемого с помощью F. В результате посредством цифр от 0 до F (заметим еще раз, что латинские буквы А - F обозначают здесь последние 6 цифр в 16-ричной системе счисления) можно выразить группу символов, состоящую из 4 бит или 4 двоичных разрядов. Такое представление намного удобнее длинных цепочек из единиц и нулей. Используя два разряда такого 16-ричного числа, можно, как уже говорилось выше, образовать 256 различных сочетаний, с помощью которых можно поочередно закодировать все символы клавиатуры. Если применить все 256 комбинаций, то их окажется достаточно, чтобы закодировать все прописные и строчные буквы латинского алфавита, знаки препинания (скобки, запятые и др.) и даже знаки японского алфавита - каны. Разумеется, для кодирования всех иероглифов, число которых достигает нескольких тысяч; 256 чисел не хватит.
Что такое байт
Группы из 8 бит или, что примерно то же самое, группы из двух 16-ричных разрядов, представляющие символьную информацию в ЭВМ, получили в вычислительной технике особое название: такие группы стали называться <байтами> (byte). Итак, 1 байт содержит в себе 8 бит. Правда, в некоторых компьютерах 1 байт эквивалентен 6 бит. Но всегда единица информации, называемая байтом, выражает в ЭВМ один символ (цифру, букву или какой-либо другой знак). В компьютерах, где 1 байт содержит 6 бит, язык ЭВМ использует только 64 различных символа.
Поскольку для компьютера 1 байт соответствует одному символу, информация, с которой приходится работать компьютеру, представляется последовательностями байтов, эквивалентных заданным последовательностям символов. Информация, преобразованная в последовательности символов, называется цифровой информацией. В буквальном смысле <цифровой> означает <превращенный в цифры>. Хотя символы, с которыми работает ЭВМ, не всегда состоят из одних только цифр, каждому символу можно поставить в соответствие некоторый номер, и тогда вместо символа можно обращаться к этому числовому номеру. Фактически в компьютере символы чаще всего воспринимаются как числа.
|