План лекции:
Кодирование информации. Единицы измерения информации. Количественная мера: биты, байты, Килобайты и т.д., машинное слово. Статистический и семантический подходы к измерению информации. Представление символов в ЭВМ. Стандарты ASCII, ANSI, Unicode.
Системы счисления. Двоичные, десятичные и шестнадцатеричные числа. Переход от одной системы счисления к другой.
Краткий конспект лекции
Информация в ЭВМ кодируется (символ - цифровой код), обрабатывается (цифры переводятся в двоичную систему счисления и проводятся арифметические и логические операции), декодируется.
Расчеты ЭВМ проводит в двоичной системе счисления, цифры 0 и 1 соответствуют отсутствию, либо наличию заряда в элементе схемы.
Элементарная единица информации 1 бит - bit (binary digit - двоичная цифра).
Для обозначения расположения данных в памяти компьютера используется шестнадцатеричная система счисления (цифры от 0 до 9 и буквы A, B, C, D ,E, F).
Таблица единиц измерения информации:
8 бит
1байт (б)
210 байт
1024 байт
1Килобайт (Кб)
220 байт
1024 Килобайт
1Мегабайт (Мб)
230 байт
1024 Мегабайт
1Гигабайт (Гб)
240 байт
1024 Гигабайт
1Терабайт (Тб)
Число бит, которые могут содержаться регистрами процессора и обрабатываться как отдельный модуль называется машинным словом. От размера слова зависит скорость обработки данных компьютером. В ПК используют 32 - 64 разрядные слова.
Магнитный диск для хранения данных разбит на сектора и дорожки. Размер сектора -512 байт.
Запись информации на магнитный диск происходит порциями. Наименьший размер порции записи - кластер.
Системы счисления классифицируются на позиционные и не позиционные.
В позиционных системах счисления цифра в каждой позиции (разряде) имеет свое значение «вес», зависящий от основания системы счисления.
В общем виде число в системе счисления с основанием m (АnАn-1 … А1 А0)m можно записать как Аn*mn+ Аn-1*mn-1+ … + А1*m1+ А0*m0.
Для перевода целого числа из десятичной системы счисления в двоичную находятся остатки от деления на 2 сначала самого числа, а затем частного. Процесс повторяется до получения частного, меньшего, чем 2. Целая часть числа в двоичной системе счисления записывается как последовательность остатков от последнего к первому.
Для перевода числа из двоичной системы счисления в десятичную цифры умножаются на 2 в степени, соответствующей разряду цифры.
Таблица соответствия чисел в системах счисления
Десятичная
Шестнадцатеричная
A
B
C
D
E
F
Двоичная
Пусть 1 символ кодируется 8 битами, что соответствует 1 байту.
Возможное число комбинаций 0 и 1 в 8 позициях равно 28=256.
В стандарте ASCII символ кодируется 8 битами. В первой половине таблицы кодов от 0 до 126 содержатся буквы латинского алфавита, арабские цифры, знаки арифметических операций, препинания и некоторые другие. Вторая половина таблицы - коды от127 до 255 содержат буквы национального алфавита и символы псевдографики. номер кодовой страницы, Россия - 866.
Стандарт ASCII используется в MS-DOS, в OC Windows используется стандарт ANSI, в котором символ также кодируется 8 битами и первая половина таблицы совпадает с ASCII. Вторая - содержат буквы национального алфавита. Номер кодовой страницы, России - 1251.
Стандарт UNICODE создан международной организацией по стандартизации (ISO) для обмена информацией через Интернет, в нем один символ кодируется 16 битами, что позволяет закодировать 216=65536 различных символов. В UNICODE нет кодовых страниц.