Основные форматы представления данных. Файловая система. Форматы представления данных. Форматы представления растровых данных - RAW

Машинные команды оперируют данными, которые принято называть операндами. К наиболее общим (базовым) типам операндов можно отнести: адреса, числа, символы и логические данные. Помимо них ВМ обеспечивает обработку и более сложных информационных единиц: графических изображений, аудио-, видео- и анимационной информации. Такая информация является производной от базовых типов данных и хранится в виде файлов на внешних запоминающих устройствах. Для каждого типа данных в ВМ предусмотрены определенные форматы.

Среди цифровых данных можно выделить две группы:

Целые типы, используемые для представления целых чисел;

Вещественные типы для представления рациональных чисел.

В рамках первой группы имеется несколько форматов представления численной информации, зависящих от ее характера. Для представления вещественных чисел используется форма с плавающей запятой.

Числа в форме с фиксированной запятой

Представление числа X в форме с фиксированной запятой (ФЗ), которую иногда называют также естественной формой, включает в себя знак числа и его модуль в q-ичном коде. Здесь q – основание системы счисления или база. Для современных ВМ характерна двоичная система (q =2). Знак положительного числа кодируется двоичной цифрой 0, а знак отрицательного числа – цифрой 1.

Числам с ФЗ соответствует запись вида . Отрицательные числа обычно представляются в дополнительном коде. Разряд кода числа, в котором размещается знак, называется знаковым разрядом кода. Разряды, где располагаются значащие цифры числа, называются цифровыми разрядами кода. Знаковый разряд размещается левее старшего цифрового разряда. Положение запятой одинаково для всех чисел и в процессе решения задач не меняется. Хотя запятая и фиксируется, в коде числа она никак не выделяется, а только подразумевается. В общем случае разрядная сетка ВМ для размещения чисел в форме с ФЗ имеет вид, представленный на рис. 1.1, где n разрядов используются для записи целой части числа и r разрядов – для дробной части.

Рис. 1.1. Формат представления чисел с фиксированной запятой

При фиксации запятой перед старшим цифровым разрядом могут быть представлены только правильные дроби. Для ненулевых чисел возможны два варианта представления (нулевому значению соответствуют нули во всех разрядах): знаковое и беззнаковое. Фиксация запятой перед старшим разрядом встречалась в ряде машин второго поколения, но в настоящее время практически отжила свое.

При фиксации запятой после младшего разряда представимы лишь целые числа. Это наиболее распространенный способ, поэтому в дальнейшем понятие ФЗ будет связываться исключительно с целыми числами.

Формат без знакового разряда Формат со знаковым разрядом
2 n -1 2 n-2 2 1 2 0 2 n-2 2 1 2 0
Знак
n-2 n-1 n-2 n-1

Рис. 1.2. Представление целых чисел в формате Ф3

Представление чисел в формате ФЗ упрощает аппаратурную реализацию ВМ и сокращает время выполнения машинных операций, однако при решении задач необходимо постоянно следить за тем, чтобы все исходные данные, промежуточные и окончательные результаты не выходили за допустимый диапазон формата, иначе возможно переполнение разрядной сетки и результат вычислений будет неверным.

Десятичные числа

В ряде задач, главным образом, учетно-статистического характера, приходится иметь дело с хранением, обработкой и пересылкой десятичной информации. Особенность таких задач состоит в том, что обрабатываемые числа могут состоять из различного и весьма большого количества десятичных цифр. Традиционные методы обработки с переводом исходных данных в двоичную систему счисления и обратным преобразованием результата зачастую сопряжены с существенными накладными расходами. По этой причине в ВМ применяются иные специальные формы представления десятичных данных. В их основу положен принцип кодирования каждой десятичной цифры эквивалентным двоичным числом из четырех битов (тетрадой), то есть так называемым двоично-десятичным кодом.

Байт Байт Байт Байт
Зона Цифра Зона Цифра Зона Цифра Знак Цифра
Байт Байт Байт Байт
Цифра Цифра Цифра Цифра Цифра Цифра Цифра Знак

Рис. 1.3. Форматы десятичных чисел: а – зонный; б – уплотненный

Используются два формата представления десятичных чисел (все числа рассматриваются как целые): зонный (распакованный) и уплотненный (упакованный). В обоих форматах каждая десятичная цифра представляется двоичной тетрадой, то есть заменяется двоично-десятичным кодом. Из оставшихся задействованных шести четырехразрядных двоичных комбинаций (2 4 = 16) две служат для кодирования знаков «+» и «».

Зонный формат применяется в операциях ввода/вывода. В нем под каждую цифру выделяется один байт, где младшие четыре разряда отводятся под код цифры, а в старшую тетраду (поле зоны) записывается специальный код «зона», не совпадающий с кодами цифр и знаков.

При выполнении операций сложения и вычитания над десятичными числами обычно используется упакованный формат и в нем же получается результат (умножение и деление возможно только в зонном формате). В упакованном формате каждый байт содержит коды двух десятичных цифр. Правая тетрада последнего байта предназначается для записи знака числа. Десятичное число должно занимать целое количество байтов. Если это условие не выполняется, то четыре старших двоичных разряда левого байта заполняется нулями. Так, представление числа –7396 в коде ДКОИ и упакованном формате имеет вид, приведенный на рис. 1.4.

Байт Байт Байт
Минус

Рис.1.4. Представление числа –7396 в упакованном формате

Размещение знака в младшем байте, как в зонном, так и в упакованном представлениях, позволяет задавать десятичные числа произвольной длины и передавать их в виде цепочки байтов. В этом случае знак указывает, что байт, в котором он содержится, является последним байтом данного числа, а следующий байт последовательности – это старший байт очередного числа.

Числа с плавающей запятой

От недостатков ФЗ в значительной степени свободна форма представления чисел с плавающей запятой (ПЗ), известная также под названиями нормальной или полулогарифмической формы. В данном варианте каждое число разбивается на две группы цифр. Первая группа цифр называется мантиссой, вторая – порядком. Число представляется в виде произведения ,

где m – мантисса числа X ,

р – порядок числа,

q – основание системы счисления.

Для представления числа в форме с ПЗ требуется задать знаки мантиссы и порядка, их модули в q -ичном коде, а также основание системы счисления. Нормальная форма неоднозначна, так как взаимное изменение m и p приводит к «плаванию» запятой, чем и обусловлено название этой формы.

Рис. 1.5. Форма представления чисел с плавающей запятой

Помимо разрядности порядка и мантиссы диапазон представления чисел зависит и от основания используемой системы счисления, которое может быть отличным от 2. Например, в универсальных ВМ (мэйнфреймах) фирмы IВМ используется база 16. Это позволяет при одинаковом количестве битов, отведенных под порядок, представлять числа в большем диапазоне. Так, если поле порядка равно 7 битам, максимальное значение q p , на которое умножается мантисса, равно 2 128 (при q =2) или 16 128 (при q =16), а диапазоны представления чисел соответственно составят и .

В большинстве вычислительных машин для упрощения операций над порядками последние приводят к целым положительным числам, применяя так называемый смещенный порядок. Для этого к истинному порядку добавляется целое положительное число – смещение . Например, в системе со смещением 128 порядок –3 представляется как 125 (–3 + 128). Обычно смещение выбирается равным половине представимого диапазона порядков. Отметим, что смещенный порядок занимает все биты поля порядка, в том числе и тот, который ранее использовался для записи знака порядка.

Р СМ – машинный порядок, значение которого всегда положительно.

где См – смещение, .

Р max – максимальное значение порядка в пределах отведенного для него числа разрядов.

Если для изображения порядка отводится 6 разрядов и 1 разряд для изображения знака порядка, то

Таким образом P СМ может изменяться в пределах:

Для изображения смещенного порядка отводится 7 двоичных разрядов. Если значение смещенного порядка окажется равным нулю, то вырабатывается программное прерывание «Потеря порядка».

Следует отметить, что при изображении кода числа в памяти ЭВМ первые две старшие тетрады представляют совместно знак числа и смещенный порядок.

Мантисса в числах с ПЗ обычно представляется в нормализованной форме. Это означает, что на мантиссу налагаются такие условия, чтобы она по модулю была меньше единицы (|q | < 1), а первая цифра после точки отличалась от нуля. Полученная таким образом мантисса называется нормализованной.

Если первые i цифр мантиссы равны нулю, для нормализации ее нужно сдвинуть относительно запятой на i разрядов влево с одновременным уменьшением порядка на i единиц. В результате такой операции число не изменяется.

Рассмотренные принципы представления чисел с ПЗ поясним на примере. На рис. 1.6. представлен типичный 32-битовый формат числа с ПЗ. Старший (левый) бит содержит знак числа. Значение смещенного порядка хранится в разрядах с 1-го по 8-й. Третье поле слова содержит нормализованную мантиссу.

Знак мантиссы Смещенный порядок Мантисса

Рис. 1.6. Типичный 32–битовый формат числа с плавающей запятой

При выполнении в ЭВМ арифметических операций автоматически выполняются следующие действия над порядками:

а) При сложении и вычитании чисел предварительно выравниваются порядки. Для этого мантисса меньшего числа сдвигается вправо на число шестнадцатеричных разрядов, равное разности порядков чисел. При этом порядок меньшего числа увеличивается до порядка большего числа. Затем производится сложение (вычитание) мантисс. Полученное число нормализуется.

б) При умножении чисел их мантиссы перемножаются, а порядки складываются.

в) При делении мантисса делимого делится на мантиссу делителя, а из порядка делимого вычитается порядок делителя.

Знак результата при выполнении умножения (деления) определяется знаком произведения (частного) мантисс чисел, участвующих в операции.

Описанные процедуры завершаются приведением результата к нормализованной форме.

Арифметико-логическое устройство, работающее над числами с плавающей запятой должно иметь аппаратные средства для выполнения операций над мантиссами и порядками и вспомогательных операций (выравнивание порядков, нормализация и т.д.).

КУРСОВАЯ РАБОТА

По дисциплине «Информатика»

Форматы данных: представление и кодирование информации в компьютере

ВВЕДЕНИЕ

Кодирование информации - это процесс формирования определенного представления информации. При кодировании информация представляется в виде дискретных данных. Декодирование является обратным к кодированию процессом. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. С помощью программ для компьютера можно выполнить обратные преобразования полученной информации.

При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Знаки или символы любой природы, из которых конструируются информационные сообщения, называют кодами. Полный набор кодов составляет алфавит кодирования. Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.

1. ФОРМАТЫ ДАННЫХ: ПРЕДСТАВЛЕНИЕ И КОДИРОВАНИЕ ИНФОРМАЦИИ В КОМПЬЮТЕРЕ

1 Компьютерное кодирование чисел

Существуют два основных формата представления чисел в памяти компьютера. Один из них используется для кодирования целых чисел, второй (так называемое представление числа в формате с плавающей точкой) используется для задания некоторого подмножества действительных чисел.

Множество целых чисел, представимых в памяти ЭВМ, ограничено. Диапазон значений зависит от размера области памяти, используемой для размещения чисел. В k-разрядной ячейке может храниться 2k различных значений целых чисел.

Чтобы получить внутреннее представление целого положительного числа N, хранящегося в k-разрядном машинном слове, необходимо:

) перевести число N в двоичную систему счисления;

) полученный результат дополнить слева незначащими нулями до k разрядов.

Например, получим внутреннее представление целого числа 1607 в 2-х байтовой ячейке. Переведем число в двоичную систему: 160710 = 110010001112. Внутреннее представление этого числа в ячейке будет следующим: 0000 0110 0100 0111.

Для записи внутреннего представления целого отрицательного числа (-N) необходимо:

) получить внутреннее представление положительного числа N;

) обратный код этого числа заменой 0 на 1 и 1 на 0;

) полученному числу прибавить 1.

Например, получим внутреннее представление целого отрицательного числа -1607. Воспользуемся результатом предыдущего примера и запишем внутреннее представление положительного числа 1607: 0000 0110 0100 0111. Инвертированием получим обратный код: 1111 1001 1011 1000. Добавим единицу: 1111 1001 1011 1001 - это и есть внутреннее двоичное представление числа -1607.

Формат с плавающей точкой использует представление вещественного числа R в виде произведения мантиссы m на основание системы счисления n в некоторой целой степени p, которую называют порядком: R = m × np.

Представление числа в форме с плавающей точкой неоднозначно. Например, справедливы следующие равенства:

12.345 = 0.0012345 × 104 = 1234.5 × 10-2 = 0.12345 × 102.

Чаще всего в ЭВМ используют нормализованное представление числа в форме с плавающей точкой. Мантисса в таком представлении должна удовлетворять условию: 0.1p <= m < 1p. Иначе говоря, мантисса меньше 1 и первая значащая цифра не ноль (p - основание системы счисления).

В памяти компьютера мантисса представляется как целое число, содержащее только значащие цифры (0 целых и запятая не хранятся), так для числа 12.345 в ячейке памяти, отведенной для хранения мантиссы, будет сохранено число 12345. Для однозначного восстановления исходного числа остается сохранить только его порядок, в данном примере - это 2.

Двоичная система счисления (двоичный код) - код, в котором для представления информации используются цепочки бит. Для представления целых чисел используются:

¾ прямой код - знак кодируется нулем для положительных и единицей для отрицательных. 510= 0 000101; -510= 1 000101

¾ обратный код (или дополнительный - дополненный до единицы) для положительных чисел совпадает с прямым кодом, а для отрицательных получается из соответствующего прямого путем поразрядного обращения каждого бита кроме знакового: -5=1 111010

Данный код позволяет унифицировать сложение и вычитание с оговоркой, что если при суммировании чисел в обратном коде длина результата превысит стандартную длину цепочки, то происходит циклический перенос старшего разряда в младший.

Для умножения и деления обратный код менее удобен, чем прямой. В основном обратный код нужен для получения дополнительного.

Дополнительный код (или дополнение до двух) для положительных чисел совпадает с прямым, а для отрицательных чисел получается из обратного кода сложением с 1. Преимущества дополнительного кода перед обратным кодом является упрощение суммирования, т.к. не возникает необходимости в циклическом переносе из старшего разряда в младший.

2 Компьютерное кодирование текста

Множество символов, используемых при записи текста, называется алфавитом. Количество символов в алфавите называется его мощностью.

Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т. к. 28 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ. Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111. Этот код является порядковым номером символа в двоичной системе счисления.

Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице. Международным стандартом на персональных компьютерах является таблица кодировки ASCII.

Принцип последовательного кодирования алфавита заключается в том, что в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.

Стандартными в этой таблице являются только первые 128 символов, т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов.

Сейчас существует несколько различных кодовых таблиц для русских букв (КОИ-8, СР-1251, СР-866, Mac, ISO), причем тексты, созданные в одной кодировке, могут неправильно отображаться в другой. Решается такая проблема с помощью специальных программ перевода текста из одной кодировки в другую. В операционной системе Windows пришлось передвинуть русские буквы в таблице на место псевдографики, и получили кодировку Windows 1251 (Win-1251).

В течение долгого времени понятия «байт» и «символ» были почти синонимами. Однако, в конце концов, стало ясно, что 256 различных символов - это не так много. Математикам требуется использовать в формулах специальные математические знаки, переводчикам необходимо создавать тексты, где могут встретиться символы из различных алфавитов, экономистам необходимы символы валют ($, £, ¥). Для решения этой проблемы была разработана универсальная система кодирования текстовой информации - Unicode. В этой кодировке для каждого символа отводится не один, а два байта, т.е. шестнадцать бит. Таким образом, доступно 65536 (216) различных кодов. Этого хватит на латинский алфавит, кириллицу, иврит, африканские и азиатские языки, различные специализированные символы: математические, экономические, технические и многое другое. Главный недостаток Unicode состоит в том, что все тексты в этой кодировке становятся в два раза длиннее. В настоящее время стандарты ASCII и Unicode мирно сосуществуют.

3 Компьютерное кодирование графики

Почти все создаваемые, обрабатываемые или просматриваемые с помощью компьютера изображения можно разделить на две большие части - растровую и векторную графику.

Для представления графической информации растровым способом используется так называемый точечный подход. На первом этапе вертикальными и горизонтальными линиями делят изображение. Чем больше при этом получилось элементов (пикселей), тем точнее будет передана информация об изображении.

Как известно из физики, любой цвет может быть представлен в виде суммы различной яркости красного, зеленого и синего цветов. Поэтому надо закодировать информацию о яркости каждого из трех цветов для отображения каждого пикселя. В видеопамяти находится двоичная информация об изображении, выводимом на экран.

Таким образом, растровые изображения представляют собой однослойную сетку точек, называемых пикселями (pixel, от англ. picture element), а код пикселя содержит информацию о его цвете.

Для черно-белого изображения (без полутонов) пиксель может принимать только два значения: белый и черный (светится - не светится), а для его кодирования достаточно одного бита памяти: 1 - белый, 0 - черный.

Пиксель на цветном дисплее может иметь различную окраску, поэтому одного бита на пиксель недостаточно. Для кодирования 4-цветного изображения требуются два бита на пиксель, поскольку два бита могут принимать 4 различных состояния. Может использоваться, например, такой вариант кодировки цветов: 00 - черный, 10 - зеленый, 01 - красный, 11 - коричневый.

На RGB-мониторах все разнообразие цветов получается сочетанием базовых цветов: красного (Red), зеленого (Green), синего (Blue), из которых можно получить 8 основных комбинаций (Таблица 1):

Таблица 1

Основные комбинации цвета


Качество кодирования изображения зависит от двух параметров.

Во-первых, качество кодирования изображения тем выше, чем меньше размер точки и соответственно большее количество точек составляет изображение.

Во-вторых, чем большее количество цветов, то есть большее количество возможных состояний точки изображения, используется, тем более качественно кодируется изображение (каждая точка несет большее количество информации). Совокупность используемых в наборе цветов образует палитру цветов.

Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, которые в свою очередь содержат определенное количество точек (пикселей). Качество изображения определяется разрешающей способностью монитора, т.е. количеством точек, из которых оно складывается. Чем больше разрешающая способность, то есть чем больше количество строк растра и точек в строке, тем выше качество изображения. В современных персональных компьютерах обычно используются три основные разрешающие способности экрана: 800х600, 1024х768 и 1280х1024 точки.

Цветные изображения формируются в соответствии с двоичным кодом цвета каждой точки, хранящимся в видеопамяти. Цветные изображения могут иметь различную глубину цвета, которая задается количеством битов, используемым для кодирования цвета точки. Наиболее распространенными значениями глубины цвета являются 8, 16, 24 или 32 бита.

В противоположность растровой графике векторное изображение состоит из геометрических примитивов: линия, прямоугольник, окружность и т.д. Каждый элемент векторного изображения является объектом, который описывается с помощью специального языка (математических уравнения линий, дуг, окружностей и т.д.). Сложные объекты (ломаные линии, различные геометрические фигуры) представляются в виде совокупности элементарных графических объектов. Объекты векторного изображения, в отличие от растровой графики, могут изменять свои размеры без потери качества (при увеличении растрового изображения увеличивается зернистость).

компьютерный число текст графика звук

1.4 Компьютерное кодирование звука

Из курса физики известно, что звук - это колебание частиц воздуха, непрерывный сигнал с меняющейся амплитудой (Рис. 1).

Рис. 1. Звук

При кодировании звука этот сигнал надо представить в виде последовательности нулей и единиц. Как это происходит в микрофоне? Через равные промежутки времени, очень часто (десятки тысяч раз в секунду) измеряется амплитуда колебаний. Каждое измерение производится с ограниченной точностью и записывается в двоичном виде. Частота, с которой записывается амплитуда, называется частотой дискретизации. Полученный ступенчатый сигнал сначала сглаживается посредством аналогового фильтра, а затем преобразуется в звук с помощью усилителя и динамика.

На качество воспроизведения закодированного звука в основном влияют два параметра: частота дискретизации - количество измерений амплитуды за секунду в герцах и глубина кодирования звука - размер в битах, отводимый под запись значения амплитуды. Например, при записи на компакт-диски (CD) используются 16-разрядные значения, а частота дискретизации равна 44032 Гц. Эти параметры обеспечивают превосходное качество звучания речи и музыки. Для стереозвука отдельно записывают данные для левого и для правого канала.

Если преобразовать звук в электрический сигнал (например, с помощью микрофона), мы увидим плавно изменяющееся с течением времени напряжение. Для компьютерной обработки такой аналоговый сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел.

Поступают следующим образом: измеряют напряжение через равные промежутки времени и записывают полученные значения в память компьютера. Этот процесс называется дискретизацией (или оцифровкой), а устройство, выполняющее его - аналого-цифровым преобразователем (АЦП) (Рис. 2).

Рис. 2. Аналогово-цифровое преобразование звука

Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование (для него служит цифро-аналоговый преобразователь - ЦАП), а затем сгладить получившийся ступенчатый сигнал.

Чем выше частота дискретизации (т. е. количество отсчетов за секунду) и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен звук. Но при этом увеличивается и размер звукового файла. Поэтому в зависимости от характера звука, требований, предъявляемых к его качеству и объему занимаемой памяти, выбирают некоторые компромиссные значения.

Описанный способ кодирования звуковой информации достаточно универсален, он позволяет представить любой звук и преобразовывать его самыми разными способами. Но бывают случаи, когда выгодней действовать по-иному.

Человек издавна использует довольно компактный способ представления музыки - нотную запись. В ней специальными символами указывается, какой высоты звук, на каком инструменте и как сыграть. Фактически, ее можно считать алгоритмом для музыканта, записанным на особом формальном языке. В 1983 г. ведущие производители компьютеров и музыкальных синтезаторов разработали стандарт, определивший такую систему кодов. Он получил название MIDI.

Конечно, такая система кодирования позволяет записать далеко не всякий звук, она годится только для инструментальной музыки. Но есть у нее и неоспоримые преимущества: чрезвычайно компактная запись, естественность для музыканта (практически любой MIDI-редактор позволяет работать с музыкой в виде обычных нот), легкость замены инструментов, изменения темпа и тональности мелодии. Существуют и другие, чисто компьютерные, форматы записи музыки. Среди них следует отметить формат MP3, позволяющий с очень большим качеством и степенью сжатия кодировать музыку. При этом вместо 18-20 музыкальных композиций на стандартный компакт-диск (CD-ROM) помещается около 200. Одна песня занимает примерно 3-5 мегабайт, что позволяет пользователям сети Интернет легко обмениваться музыкальными композициями.

ПРАКТИЧЕСКАЯ ЧАСТЬ

1 Постановка задачи

Произвести расчет стоимости междугородних телефонных разговоров абонента по заданным значениям. Для определения дня недели, когда производился звонок, следует использовать функцию ДЕНЬНЕД(), а также функции ЕСЛИ() и ИЛИ() (рис. 5.1, рис. 5.2).

Сформировать документ «Квитанция для оплаты телефонных разговоров». По данным квитанции построить гистограмму с отражением стоимости звонков на определенную дату.

Таблица 2

Тарифы на услуги междугородней телефонной связи

Тарифы на услуги междугородней телефонной связи ОАО «Россвязь» для абонентов квартирного сектора

Наименование города

Код города

в рабочие дни, руб.

в выходные дни, руб.

Волгоград

Челябинск

Новосибирск


Таблица 3

Квитанция для оплаты телефонных разговоров

Код города

Стоимость, руб.







Срок оплаты счета до:



2.2 Описание алгоритма решения задачи

) Запустить табличный процессор MS Excel.

) Создать книгу с именем «Стоимость звонков».

) На рабочем листе MS Excel создать таблицу с базовыми данными о выполненных маршрутах.

) Заполнить таблицу с базовыми данными (рис. 3).

Рис. 3. Таблица с базовыми данными

) Чтобы узнать, каким днем недели была дата, создадим дополнительную таблицу, используя функцию ДЕНЬНЕД (Рис. 4)

Рис. 4. Расчет дня недели

) Заполним графу «Стоимость, руб.» в Рис. 5, используя функции ЕСЛИ и ИЛИ. В ячейку J8 внесем формулу:

ЕСЛИ(ИЛИ(B18<6;B18=5);I8*C9;I8*D9)

) Размножить введенную в ячейку J8 формулу для остальных ячеек (с J8 по J12) данной графы.

) Занести в ячейку J13 формулу:

СУММ(J8:J12)

Полученная таблица представлена на Рис. 5

Рис. 5. Расчет стоимости телефонных разговоров

) По полученным данным построим гистограмму с отражением стоимости звонков на определенную дату (Рис. 6).

Рис. 6. Результаты вычислений в графическом виде

ЗАКЛЮЧЕНИЕ

С тех пор как люди научились думать и считать, не было изобретено лучшего способа представления чисел и других данных для анализа и принятия решений, как занесение их в разного рода таблицы. Долгое время и до недавних пор это были ряды и столбцы цифр в различных ведомостях, формах, бланках, отчетах и иных бумажных документах. Сведение данных в такие таблицы и расчеты вручную либо с помощью подручных средств типа счетов или калькулятора может потребовать многих часов кропотливого труда. С изобретением компьютеров появилась альтернатива: рутинные обязанности по обработке данных понемногу стали поручать машине. Решением проблемы явились электронные таблицы, которые в простой и естественной форме соединяют преимущества обоих способов работы с данными. Пользователь (служащий) получил возможность для размещения данных использовать таблицы на экране монитора, а для их обработки - стандартный набор арифметических операций.

Электронная таблица - это диалоговая система обработки данных. Область применения электронных таблиц весьма широка: от ведения домашнего бюджета до инженерных расчетов объема сбыта продукции и финансового состояния предприятий. Данная работа выполнена с применением программы Microsoft Excel из офисного пакета Microsoft Office, в настоящее время наиболее популярным в мире табличным процессором. Это одна из первых программ, в которой в полной мере было продемонстрировано умелое использование преимуществ среды Windows, отношение к которой до этого было весьма скептическим. Microsoft Excel побеждает за счет многообразия возможностей создания качественных таблиц и графиков, чрезвычайно гибкой настраиваемости рабочей среды, возможности формировать полнофункциональные приложения, создавая собственные меню и подменю, а также диалоговые окна, примечания к ячейкам и сообщения и многое другое.

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

1. Грег Харвей. Microsoft Office Excel 2003 для «чайников». - М.: Диалектика, 2008. - 692 с.

2. Леонтьев В. Новейшая энциклопедия персонального компьютера - М.: Олма Медиа Групп, 2007. - 734 с.

Представление данных в компьютере

Симонович С.В. Информатика. Базовый курс. Учебник для вузов, 3-е изд. - СПб.: Питер, 2011. - 640 с.

Широбокова Н. Представление информации в компьютере

Существуют два формата представления графической информации:

l растровый;

l векторный.

В растровом формате изображение запоминается в файле в виде мозаичного набора множества точек, соответствующих пикселам отображения этого изображения на экране дисплея. Файл, создаваемый сканером, в памяти компьютера имеет растровый формат (так называемая битовая карта - bitmap). Редактировать этот файл средствами стандартных текстовых и графических редакторов не представляется возможным, ибо они не работают с мозаичным представлением информации.

В векторном формате информация идентифицируется характеристиками шрифтов, кодами символов, абзацев и т. п. Стандартные текстовые процессоры предназначены для работы именно с таким представлением информации.

Фундаментальное отличие векторных форматов от растровых можно показать на таком примере: в векторном формате окружность идентифицируется радиусом, координатами своего центра, толщиной и типом линии; в растровом формате хранятся просто последовательные ряды точек, геометрически формирующих окружность.

Форматы растровой графики

Формат PSD – собственный формат программы Adobe Photoshop, редактира изображений (поддерживает все цветовые модели, слои без ограничений, а каждый слой может содержать до 24 альфа-каналов).

Формат BMP (bitmap) или DIB (device-independent bitmap) - формат хранения графических изображений. Глубина цвета от 1 до 48 бит на пиксель.– предназначен для Windows, позволяет использовать палитры из 2, 16, 256 или 16 миллионов цветов. Существует несколько разновидностей этого формата:

Обычный, с расширением .bmp ;

Сжатый, с расширением .rle ; сжатие происходит без потерь, но поддерживается
только 4- и 8-битный цвет;



Формат, не зависящий от устройства (Device Independent Bitmap) с расширением .dib .

Формат TGA (Truevision Graphic Adapter) – для видео­ изображений, в максимальной степени приспособлен к телевизионным стандартам, а также для сохранения графики на компьютерах с операционной системой MS DOS, поддерживает 32-битный цвет.

Формат TIFF (Tagged Image File Format) - универсальный формат графических файлов для цифровых изображений, самый широкий диапазон передачи цветов от монохром­ного до 24-битной модели RGB и 32-битной модели CMYK, обладает переносимостью на разные платформы. Формат TIFF поддерживает LZW -уплотнение без потерь информации.

Формат JPEG (Joint Photographic Experts Group) - самый популярный формат для хранения фотографических изображений, в том числе стандарт для Интернета, обеспечивает сжатие растровых изображений до 100 раз (практически от 5 до 15 раз).

Формат GIF (Graphics Interchange Format) - формат для обмена графической информацией, обеспечивает небольшой размер файлов, применяется в Интернет, уступает по степени сжатия только формату JPEG . Формат ограничен 256 – цветной палитрой, мало пригоден для хранения фотографических изображений.

Формат PNG (Portable Network Graphics) – переносимая сетевая графика, основанный на вариации алгоритма сжатия без потерь качества (в отличие от GIF сжимает растровые изображения и по горизонтали, и по вертикали), поддерживает цветные графические изображения с глубиной цвета до 48 бит, позволяет хранить полную информацию о степени прозрачности в каждой точке изображения в виде так называемого альфа-канала.

Формат Flashpix (FPX) – графический формат, позволяющий сохранять изображения с несколькими разрешениями для презентации на CD–ROM или в Интернете, позволяет работать с высококачественными изображениями без использования значительного количества памяти и дискового пространства. Некоторые цифровые камеры сохраняют снимки в данном формате.

Битовая карта требует очень большого объема памяти для своего хранения. Так, битовая карта с одного листа документа формата А4 (204297 мм) с разрешением 10 точек/мм и без передачи полутонов (штриховое изображение) занимает около 1 Мбайта памяти, она же при воспроизведении 16 оттенков серого - 4 Мбайта, при воспроизведении цветного качественного изображения (стандарт HighColor - 65 536 цветов) - 16 Мбайт.

Для сокращения объема памяти, необходимой для хранения битовых карт, используются различные способы сжатия информации. Наиболее распространенный алгоритм растрового уплотнения, предложенный международным консультационным комитетом по телеграфии и телефонии (International Telegraph and Telephone Consultative Committee) CCITTGroup 4 дает коэффициент сжатия информации до 40:1 (в зависимости от содержания файла - графика сжимается существенно лучше текста).

Другие используемые форматы сжатия:CTIFF (CompressedTagged Image File Format) Group 3, семейство MPEG (Multimedia Photographics Experts Group), JPEG (Joint Photographics Experts Group), GIF(Graphics Interchange Format) и другие.

Форматы без сжатия: Uncompressed TIFF (Tagged Image File Format), BMP(BitMaP) и другие.

Сканер используется обычно совместно с программами распознавания образов - OCR(Optical Character Recognition). Система OCRраспознает считанные сканером с документа битовые (мозаичные) контуры символов и кодирует их ASCII-кодами, переводя в удобный для текстовых редакторов формат.

Некоторые системы OCR предварительно нужно обучить - ввести в память сканера шаблоны и прототипы распознаваемых символов и соответствующие им коды. Сложности возникают при различении букв, совпадающих по начертанию в разных алфавитах (например, в латинском (английском) и в русском - кириллица) и разных гарнитур шрифтов. Но большинство систем не требуют обучения: в их памяти уже заранее помещены распознаваемые символы. Так, одна из лучших OCR - FineReader - распознает тексты на десятках языках (в том числе языках программирования Basic, C++ и т. д), использует большое число электронных словарей, при распознавании проверяет орфографию, готовит тексты к публикации в Интернете и т. п.

В последние годы появились интеллектуальные программы распознавания образов типа Omnifont (например, Cunei Form 2000), которые опознают символы не по точкам, а по характерной для каждого из них индивидуальной топологии.

При наличии системы распознавания образов текст записывается в память ПК уже не в виде битовой карты, а в виде кодов, и его можно редактировать обычными текстовыми редакторами.

Файлы в растровом формате разумно хранить только в том случае, если:

l документы и соответствующие им файлы не должны редактироваться в процессе их использования;

l документ должен храниться в виде факсимильных копий оригинала (фотографии, рисунки, документы с резолюциями и т. п.);

l имеются технические возможности для хранения и просмотра большого числа огромных (по 1–20 Мбайт) файлов.

Основные факторы, учитываемые при выборе сканера:

l размер, цветность и форма (листовые, сброшюрованные и т. д.) документов, подлежащих сканированию, должны соответствовать возможностям сканера;

l разрешающая способность сканера должна обеспечивать воспроизведение высококачественных копий документов по их электронным образам;

l производительность сканера должна быть достаточно высокой при приемлемом качестве получаемого изображения;

l должна обеспечиваться минимальная погрешность в размерах получаемого электронного изображения по отношению к оригиналу в случае, если размеры изображения с электронного документа служат основанием для производства расчетов;

l наличие программных средств сжатия растровых файлов при хранении их в памяти компьютера;

l наличие программных средств распознавания образов (OCR) при хранении векторных файлов в памяти компьютера;

l наличие программно-аппаратных средств для улучшения качества изображения в растровых файлах (повышения контрастности и яркости изображения, удаления фонового «шума»);

l качество и тип бумаги носителя в известных пределах не должны сильно влиять на качество получаемого электронного изображения;

l работа на сканере должна быть удобной и простой и исключать ошибки при сканировании при неверной заправке носителя;

l стоимость сканера.

Сканер может подключаться к ПК через параллельные (LPT) или последовательные (USB) интерфейсы. Для работы со сканером ПК должен иметь специальный драйвер, желательно, драйвер, соответствующий стандарту TWAIN. В последнем случае возможна работа с большим числом TWAIN-совместимых сканеров и обработка файлов поддерживающими стандарт TWAIN программами, например, распространенными графическими редакторами CorelDraw, Adobe Photoshop, MaxMate, Picture Publisher, Photo Finish и т. д.

Дигитайзеры

Дигитайзер(digitaizer), илиграфический планшет, - это устройство, главным назначением которого является оцифровка изображений (рис.14.5).

Рис.14.5. Дигитайзер.

Он состоит из двух частей: основания(планшета) и устройства целеуказания (пера или курсора), перемещаемого по поверхности основания. При нажатии на кнопку курсора его положение на поверхности планшета фиксируется и координаты передаются в компьютер.

Дигитайзер может быть использован для ввода рисунка, создаваемого пользователем, в компьютер: пользователь водит пером-курсором по планшету, но изображение появляется не на бумаге, а фиксируется в графическом файле. Принцип действия дигитайзера основан на фиксации местоположения курсора с помощью встроенной в планшет сетки тоненьких проводников с довольно большим шагом между соседними проводниками (от 3 до 6 мм). Механизм регистрации позволяет получить логический шаг считывания информации, намного меньше шага сетки (до 100 линий на 1 мм).

TIFF (Tagged Image File Format). Формат предназначен для хранения растровых изображений высокого качества (расширение имени файла.TIF). Относится к числу широко распространенных, отличается переносимостью между платформами (IBM PC и Apple Macintosh), обеспечен поддержкой со стороны большинства графических, верстальных и дизайнерских программ.

PSD (PhotoShop Document). Собственный формат программы Adobe Photoshop (расширение имени файла.PSD), один из наиболее мощных по возможностям хранения растровой графической информации. Позволяет запоминать параметры слоев, каналов, степени прозрачности, множества масок.

PCX , Формат появился как формат хранения растровых данных программы PC PaintBrush фирмы Z-Soft и является одним из наиболее распространенных (расширение имени файла.PCX). Отсутствие возможности хранить цветоделенные изображения, недостаточность цветовых моделей и другие ограничения привели к утрате популярности формата. В настоящее время считается устаревшим.

PhotoCD . Формат разработан фирмой Kodak для хранения цифровых растровых изображений высокого качества (расширение имени файла.PCD). Сам формат хранения данных в файле называется Image Рас. Файл имеет внутреннюю структуру, обеспечивающую хранение изображения с фиксированными величинами разрешений, и потому размеры любых файлов лишь незначительно отличаются друг от друга и находятся в диапазоне 4-5 Мбайт.

Windows Bitmap . Формат хранения растровых изображений в операционной системе Windows (расширение имени файла.BMP). Соответственно, поддерживается всеми приложениями, работающими в этой среде.

JPEG (Joint Photographic Experts Group). Формат предназначен для хранения растровых изображений (расширение имени файла. JPG). Позволяет регулировать соотношение между степенью сжатия файла и качеством изображения. Применяемые методы сжатия основаны на удалении «избыточной» информации, поэтому формат рекомендуют использовать только для электронных публикаций.

GIF (Graphics Interchange Format). Стандартизирован в 1987 году как средство хранения сжатых изображений с фиксированным (256) количеством цветов (расширение имени файла.GiF). Получил популярность в Интернете благодаря высокой степени сжатия. Последняя версия формата GIF89a позволяет выполнять чересстрочную загрузку изображений и создавать рисунки с прозрачным фоном.

PNG (Portable Network Graphics). Сравнительно новый (1995 год) формат хранения изображений для их публикации в Интернете (расширение имени файла.PNG). Поддерживаются три типа изображений - цветные с глубиной 8 или 24 бита и черно-белое с традицией 256 оттенков серого. Сжатие информации происходит практически без потерь, предусмотрены 254 уровня альфа-канала, чересстрочная развертка.

WMF (Windows MetaFile). Формат хранения векторных изображений операционной системы Windows (расширение имени файла.WMF). По определению поддерживается всеми приложениями этой системы. Однако отсутствие средств для работы со стандартизированными цветовыми палитрами, принятыми в полиграфии, и другие недостатки ограничивают его применение.

EPS (Encapsulated PostScript). Формат описания как векторных, так и растровых изображений на языке PostScript фирмы Adobe, фактическом стандарте в области допечатных процессов и полиграфии (расширение имени файла. EPS), Так как язык PostScript является универсальным, в файле могут одновременно храниться векторная и растровая графика, шрифты, контуры обтравки (маски), параметры калибровки оборудования, цветовые профили.

PDF (Portable Document Format). Формат описания документов, разработанный фирмой Adobe (расширение имени файла.PDF). Хотя этот формат в основном предназначен для хранения документа целиком, его впечатляющие возможности позволяют обеспечить эффективное представление изображений. Формат является аппаратно-независимым, поэтому вывод изображений допустим на любых устройствах - от экрана монитора до фотоэкспонирующего устройства.

Типы данных

Выделение диапазонов

Элементы рабочего листа

Компоненты экрана Excel

Окно приложения Excel

Окно документа Excel (окно Рабочей книги)

Основное рабочее пространство экрана – Рабочая книга, содержащая один или несколько Рабочих листов.

Рабочий лист – это электронная таблица.

Рабочая книга – совокупность Рабочих листов, размещенных в одном файле.

Строка заголовка

Строка меню (9 меню с основными командами работы);

Стандартная панель инструментов;

Панель форматирования;

Поле имени; - Строка формул;

Полосы прокрутки;

Ярлычки рабочих листов; - Кнопки прокрутки ярлычков.

Строка состояния


Рабочий лист состоит из столбцов и строк.

Заголовки столбцов: A, B, C . . . AA, AB, AC . . . IV à всего 256 столбцов

Заголовки строк: 1, 2, 3 . . . à всего 65 536 строк.

Пересечения столбцов и строк называются ячейками (> 16 млн.).

Каждая ячейка имеет свой адрес, который определяется соответствующими столбцом и строкой (A1, B3, F9 …).

Если ячейку сделать активной, то она выделяется жирной рамкой и ее адрес помещается в Поле имени.

Только в активной ячейке можно производить ввод или редактирование данных или формул .

Выделение столбцов

Выделение строк

Выделение рабочего листа

Выделение смежных ячеек (клавиша )

Выделение несмежных ячеек (клавиша )

Использование «Поля имени»

Для выбора ячейки внутри выделенного диапазона нельзя пользоваться мышью или клавишами управления курсором. Это приведет к отмене выделения диапазона.

Для перемещения внутри выделенного диапазона вперед от ячейки к ячейке надо использовать клавиши:

- перемещение по рядам;

- перемещение по столбцам.

Для перемещения в обратном направлении надо использовать сочетание клавиш

+ или +


Текст – любая последовательность символов, которые Excel не может
распознать как число, дату или время
(длина текстового значения ячейки не может быть больше 255 символов).
(Пример: 252003, Киев).

Число – это числовая константа (Пример: 5; 23; 4,07 -43)
Числа могут содержать только следующие символы:

Существуют следующие форматы представления чисел :

Целые числа (123);

Десятичные дроби (123,5);

Простые дроби (1/5);

Числа в степенной форме (123 Е+4).

Если перед числом поставить минус или заключить его в скобки, Excel будет считать это число отрицательным.

Если число не помещается в ячейке, то оно будет отображаться в виде символов ######## или будет преобразовано в экспоненциальный формат
(напр.: 2 Е+08 à 2 умножить на 10 в степени 8)

Дата и время – вещественное число, представляющее собой количество дней от начала ХХ века.

Дата кодируется в целой части этого числа, а время – в дробной части.

В Excel дата и время считаются числовыми значениями, с которыми можно производить вычисления. Самая ранняя дата, которую может распознать Excel – 1 января 1900 года. Ей присвоен порядковый номер 1 ; 2 января 1900 года – 2 и т.д.

Время Excel понимает как дробную часть дня.

Вводить дату и время можно в любом из допустимых форматов.

В строке формул дата отображается в формате типа 1.06.1997

Формула – выражение начинающееся со знака “= “ (равно) и состоящее из аргументов и операторов.

Формат Описание Хранимое значение Выводимое значение
Общий Общий формат представления данных. Никакого форматирования не производится, данные отображаются в том же виде, в каком были введены. Ячейке автоматически присваивается формат вводимых данных. 123 АбВг 123 АбВг
Числовой Формат представления целых чисел и десятичных дробей. Можно установить количество отображаемых знаков после запятой, а также наличие и вид разделителей. 1234,56 1234,56 1 234,6 1234,00 1.234
Денежный Данные в столбце выравниваются по десятичной точке. Можно установить количество знаков после запятой и символ валюты. 123р. 123грн. $123
Финансовый Аналогично формату «денежный» но выравниваются не только десятичные точки, но также знак числа и символ валюты. 123р.
Дата Используются все употребляемые форматы представления даты и даты вместе со временем. 10.01.97 1-окт-97 Октябрь 1, 1997
Время Использует все употребляемые форматы представления времени. 0,3004 35704,3004 7:12 7:12 АМ 10.01.97 7:12:35
Процентный Представление числа в сотых долях (процентном формате) 0,123 12,3%
Дробный Простая дробь. Можно выбрать требуемую точность 1,23 1 20/87 1 4/16 1 23/100
Экспоненци-альный Все числа представляются в степенной (экспоненциальной) форме. 123 000 123Е+3 1,23Е+5
Текстовый Данные сохраняются точно в том виде, в котором были введены. F,Du F,Du
Дополнительный Телефонные номера и др. 555-5555
Все форматы Форматы, определяемые пользователем

Ввод, редактирование и форматирование данных

Обзоры