Аналоговый сигнал со значениями квантования
Когда каждый дискретный элемент связывается с определенным набором уровней квантования, а исходный аналоговый сигнал преобразуется в последовательность стандартизированных значений, это и есть идеальная ситуация для последующего процесса кодирования.
Дискретизация аналогового сигнала
Первое, на что стоит обратить внимание, это — изменение амплитуды вдоль одной оси. Можно условиться, что это ось времени (хотя в принципе это несущественно для абстрактного примера).
Справка
Амплитуда происходит от латинского слова "amplitude", что переводится как "величина" и означает максимальное отклонение изменяющейся по определенному закону величины от среднего значения или от некоторого значения, условно принятого за нулевое.
Два разных аналоговых сигнала с одинаковыми интервалами
Пример-метафора
Пока наши действия напоминают работу метронома. Действительно, мы разделили непрерывный сигнал на определенные длительности времени: скажем, каждую секунду происходит биение, и эти биения мы можем пронумеровать и сосчитать. Но то, что происходит между этими биениями, пока выпадает из фиксирования.
А почему? Ответ ясен: дискретные интервалы принципиально ничем не отличаются от сигнала в целом (кроме, разумеется, длительности). Ведь внутри интервалов такой же непрерывный фрагмент аналогового сигнала. В обоих случаях — непрерывные сигналы. И кажется, что решение состоит в уменьшении интервалов.
Замечание
Уменьшение интервалов, конечно, имеет определенное значение, например эта процедура определяет качество цифрового сигнала.
Однако на данном этапе, когда мы рассматриваем логические основания, необходимо понять, что принципиально деление на все более мелкие (до бесконечности) элементы данную проблему не решает.
Вспомним знаменитую апорию древнегреческого философа Зенона об Ахилле: чемпиону по бегу не удается догнать черепаху. Почему? Черепаха вышла, прошла какую-то часть своего пути прежде, чем начнет свой бег спортсмен. Но прежде, чем он пробежит свою половину пути, черепаха сдвинется на какое-то расстояние. И рассуждая строго логически, приходим к выводу, что нельзя догнать эту загадочно-логическую черепаху.
Справка
Апория (от греческого слова "aporia", что означает "безвыходность") — это трудная или неразрешимая проблема, связанная с возникновением противоречия, с наличием аргумента против очевидного и общепринятого. Зенон из Элей (ок. 490—430 до н. э.) — представитель элейской школы, его считают основателем диалектики как искусства постижения истины посредством спора или истолкования противоположных мнений. Философ известен знаменитыми апориями, обосновывающими невозможность движения. Решение апории состоит в исключении бесконечного деления пространства и времени, что в реальной действительности принципиально невозможно.
В самом деле, мы пока не дали ясного ответа на вопрос: зачем было затеяно это деление на дискретные фрагменты?
Исходный аналоговый сигнал
Замечание
Мы не рискнем назвать эту волну звуком, потому что на самом деле звук речи или музыкальный звук — это не просто какая-либо чистая волна. Более того, чистая волна как раз мало интересна. Музыкальные голоса ценятся, если в них присутствуют дополнительные звуки (обертоны — частичные тоны, звучащие выше и слабее основного тона, слиты с ним и на слух почти не распознаются). Наличие и сила каждого из них определяют тембр звука или голоса и его своеобразие, по которому мы как раз и опознаем человека.
Кодирование аналогового сигнала
В предыдущем разделе сказано, что шкала квантования выбирается с заранее заданными уровнями. Действительно, как мы выяснили там же, квантованный сигнал, в отличие от исходного (аналогового сигнала), может принимать принципиально конечное число значений.
Эти значения, как правило, равны порядковому номеру уровня квантования, что позволяет легко создать условия для последующего кодирования, т. к. это число (номер уровня) легко представить комбинацией двоичных единиц — чисел в двоичной системе счисления. А мы уже знаем, что такие числа можно считать кодами уровней квантования.
Соответственно, данный этап преобразования номера уровня квантования в двоичный код называется кодированием.
Чем был обоснован выбор восьми уровней квантования? В данном конкретном случае только удобством последующего кодирования.
Если требуется получить восемь двоичных кодов, для этого, как мы уже знаем, достаточно всего трех двоичных разрядов.
Информацию о расчетах количества двоичных разрядов см. в главе 5.
Составим таблицу (табл. 6.1) кодов для восьми условных уровней квантования.
Таблица 6.1. Коды восьми уровней квантования
Уровень квантования |
Двоичный код |
Уровень квантования |
Двоичный код | ||||||
0 |
000 |
4 |
100 | ||||||
1 |
001 |
5 |
101 | ||||||
2 |
010 |
6 |
110 | ||||||
3 |
011 |
7 |
111 | ||||||
Теперь, используя эту кодовую таблицу, можно, наконец, представить исходный аналоговый сигнал (см. рис. 6.1) в виде последовательности двоичных кодов (рис. 6.8).
Если мы поменяем местами столбики таблицы (см. табл. 6.1), то получим кодовую таблицу для кодирования восьми уровней аналогового сигнала. В этой таблице представлены восемь двоичных чисел от 000 до 111, а их значениями являются соответствующие уровни квантования.
Эта таблица важна еще и потому, что она потребуется для процедуры обратного преобразования (рис. 6.9). Следует только обратить внимание на то, что аналоговый сигнал, синтезированный из цифрового сигнала, в нашем примере довольно значительно отличается от исходного аналогового сигнала (рис. 6.10), что, впрочем, создано специально.
Конвертирование аналогового сигнала в цифровой
Я считаю, что в мире имеется бесконечное множество различных движений, происходящих непрерывно.
Рене Декарт
В непрерывном аналоговом сигнале нет отчетливо выделенных дискретных элементов, поэтому не представляется возможным составить элементарный список, не говоря уже о кодовой таблице. Если нельзя в строках списка (или в ячейках кодовой таблицы) располагать понятные и отличающиеся друг от друга, т. е. различимые, элементы, необходимо применить процедуру принудительной дискретизации.
В качестве условного примера рассмотрим некий аналоговый сигнал (рис. 6.1), в котором по определению отсутствуют дискретные элементы. Это означает, что априорно не существует такой таблицы, по которой можно было бы перечислить его составляющие.
Квантование аналогового сигнала
Для сравнения значений, которые были усреднены (интегрированы) в пределах каждого дискретного интервала, необходимо ввести еще одну координату, расположенную перпендикулярно рассмотренной ранее, условно названной координатой "времени". С помощью новой координаты можно определить уровни усредненного сигнала в соответствии с заранее установленной шкалой.
По форме этот процесс в определенной степени напоминает дискретизацию, поскольку шкала также состоит из дискретных отсчетов и значения присваиваются не непрерывно, а с интервалом, т. е. дискретно. Действительно, можно сказать, что это — вторая дискретизация, которая тем не менее получила особое название "квантование".
Справка
Термин "квантование" происходит от латинского слова "quantum", что означает "сколько". Процедура оценки, или оценивания, т. е. получение ответа на вопрос "сколько" — это и есть процедура квантования.
Исходя из этой этимологии, вертикальная шкала называется шкалой квантования, а дискретные отсчеты на этой шкале — уровнями квантования. Это значит, что уровни квантования делят диапазон возможного изменения значений сигнала на конечное число интервалов. В общем случае шкалы могут быть как равномерными, так и неравномерными.
Процедура квантования необходима для привязки усредненных сигналов в дискретных интервалах к определенному набору значений со ступенчатым изменением (квантование сигнала по уровню).
Фактически же этот процесс означает оценку усредненного сигнала по заранее заданной шкале, предположим для простоты, с восемью равномерными уровнями: 0, 1, 2, 3, 4, 5, 6, 7 (рис. 6.6).
Определение
Квантование — это процедура замены величины усредненного дискретного отсчета ближайшим значением из набора фиксированных величин — уровней квантования.
Можно с сожалением признать, что квантование - это очередное "округление" величины усредненного отсчета: выбирается ближайшее значение по принципу округления (например, 11 округляется до 10, а 17 - до 20). Такое округление, разумеется, также вносит дополнительные искажения сигнала.
Преобразование аналогового сигнала в цифровые коды
Преобразование аналогового сигнала в цифровые коды
В главах 3, 4 и 5 были рассмотрены необходимость и достоинства импульсного способа передачи информации, необходимость и сущность двоичной системы счисления, на основе которой обеспечивается возможность кодирования десятичных чисел и составления кодовой таблицы. В данной главе рассмотрены последние этапы теории кодирования, а именно подготовка условий для кодирования условного аналогового сигнала, у которого отсутствуют какие бы то ни было заранее выделенные элементы.
Глава посвящена созданию таких искусственных элементов, которые позволяют использовать их в качестве дискретных элементов, подлежащих кодированию. Для вычисления кодовой таблицы из полученных дискретных элементов необходимо предусмотреть следующие процессы:
сначала искусственное разделение непрерывного сигнала на отдельные элементы — процесс дискретизации;
затем усреднение сигнала в пределах дискретного элемента и оценку по определенной дискретной шкале — процесс квантования;
и наконец, присвоение квантированному уровню условного кода — процесс кодирования сигнала.
Принудительная дискретизация
Фонетическое письмо определяет всю нашу культуру и всю нашу науку, вовсе не будучи обычным, рядовым явлением.
Жак Деррида
Выше мы пришли к выводу, что для того, чтобы составить кодовую таблицу, нам нужно наличие отдельных или, как говорят специалисты, — дискретных элементов. Поэтому мы и рассматривали элементы списка, или таблицы, которые отличаются друг от друга сами по себе (дискретны, как говорят, "по жизни"), т. е. каждый чем-то однозначно выделяется.
Пример-метафора
Каждый студент группы имеет студенческий билет и зачетную книжку, из которых можно узнать не только его фамилию, но и другие отличительные сведения (прежде всего уровень успеваемости).
Безусловно, это касается не только студентов, но и любого человека. Каждый из нас "дискретен" по отношению ко всему человечеству. Но когда мы наблюдаем какую-либо огромную массу людей, скажем, на стадионе, нам достаточно трудно выделить отдельных представителей рода человеческого. Люди кажутся пестрым ковром, и чтобы найти человека, выделить его из этой огромной толпы, требуется особое умение или какой-либо оптический инструмент (например, бинокль).
Но представьте себе ситуацию, когда та область, которую нам предстоит кодировать, не имеет ясно выраженных элементов. По крайней мере, мы их перечислить не можем, не можем взять и "разложить по полочкам", не можем составить список от первого до последнего элемента.
Иногда выделение элементов действительно сопряжено со многими трудностями, даже в той области, которая уже исторически с ней справилась, но все равно при обучении всякий раз происходит повторение исторического пути. В качестве удачного примера с точки зрения дискретизации в предыдущем разделе мы рассмотрели пример букв (фонетического письма), однако на самом деле все не так просто.
Пример-метафора
Обратим внимание на то, что буквы фонетического алфавита (фонетического письма) — это знаки не совсем тех звуков, которые мы произносим. Когда мы говорим слово "молоко", мы произносим на самом деле три разных звука (очень нейтральный звук в первом слоге, почти звук "а" без ударения и звук "о" в ударной позиции), а на письме обозначаем одной и той же буквой "о".
В данном случае получается, что звук "а", который мы действительно произносим, на самом деле буквой "а" не записывается. Поэтому существует наука фонология (раздел лингвистики), которая как раз занимается тем, что вводит такое понятие, как фонема. И вот фонема это не просто чистый звук "а", это некий ареал.
Скажем, в слове "молоко" это фонема не "а", хотя мы фактически ее произносим. А на самом деле буква "о", это вариант "а", причем это не просто "а", а нейтральный звук, в который "о" попадает, когда она безударна. То есть вот это "а", которое мы произносим в слове "молоко", — на самом деле вариант буквы "о".
Справка
Фонология (от греческих слов "phone", что означает "звук", и "логия" — "наука") — это раздел языкознания, изучающий структурные и функциональные закономерности звукового строя языка.
Справка
Фонема (от греческого слова "phonema", что означает "звук") — это единица языка, с помощью которой различаются и отождествляются морфемы и тем самым слова, т. к. она определяет совокупность различительных признаков. Например, в русской речи в словах "дам" и "там" представлены фонемы [д] и [т], которые различаются по признаку "глухость" и "звонкость". В русском языке выделены 44 фонемы, которые реализуется в речи в виде множества вариантов, число которых невозможно сосчитать. Напомним, что в алфавите русского языка используется 33 буквы.
Исходя из этого, понятно, что выделение фонетического алфавита, запись текста сопряжены с массой проблем (тем более что язык развивается, не стоит на месте). Кроме того, огромную роль играют индивидуальные особенности произношения, ведь даже дикторов, обладающих наиболее стандартизированным произношением, мы свободно отличаем друг от друга.
Поэтому до сих пор не удается в полной мере заставить компьютерное устройство преобразовывать речь в текст.
Системы распознавания речи, так же, как и системы распознавания оптических образов, до конца не разработаны. Хотя существуют программы для превращения сканированных изображений страниц в текстовые, которые работают неплохо, но для этого требуется масса определенных условий. Существуют также системы распознавания речи, но они еще более несовершенны и имеют очень узкий диапазон.
Таким образом, даже в тех областях, в которых исторически выделены более или менее четкие дискретные элементы, существуют научные и теоретические проблемы. А уж что говорить о тех областях, где очевидная дискретность отсутствует!
Однако необходимость в компьютерной обработке и такой информации существует, поэтому перейдем к условиям, которые требуются для кодирования непрерывного потока аналогового сигнала.
Таким основополагающим условием является принудительная дискретизация, т. е. "искусственное создание" элементов. В этом случае искусственные элементы должны в какой-либо мере отражать характер информации, которая "подвергается принуждению", следовательно, возможны различные принципы дискретизации (линейная, пространственная, временная, а также их разные сочетания).
Для того чтобы наиболее наглядно представить процедуру принудительной дискретизации, рассмотрим абстрактный пример аналогового сигнала, который в конечном счете необходимо конвертировать в последовательность цифровых кодов.
Замечание
В части III эти процедуры будут рассмотрены на примере графических изображений.
Разбиение аналогового сигнала на интервалы
Цель такого разбиения проста — это единственный способ получения дискретных элементов, причем стоит обратить внимание, что применяется искусственный прием, который ранее мы определяли как "принудительная" дискретизация.
Важная мысль
Для создания дискретных элементов применяется искуссвенный прием — "принудительная" дискретизация.
В самом деле, выбранные интервалы принципиально никак не учитывают содержание сигнала, а хладнокровно "режут по живому" - - в этом суть процесса "принудительной" дискретизации.
В данном конкретном случае дискретизация является линейной, т. к. используется всего одна координата (одна линия, вдоль которой происходит разбиение на равные интервалы).
Замечание
В общем случае интервалы могут быть и разными, но тогда придется ответить на два вопроса: во-первых, как попасть в нужные, смысловые точки, а во-вторых, как передать с каждым дискретным интервалом значения разных длительностей. Не стоит забывать, что все указанные действия ориентированы на техническую реализацию. А техника "склонна" выполнять механические и однозначные действия.
Полученные интервалы очень полезно каким-либо образом "пометить", например пронумеровать с помощью натурального ряда чисел: О, 1, 2, 3 и т. д.
Можем ли мы считать, что процесс дискретизации закончен? Отнюдь нет. Ведь кривая аналогового сигнала, подвергнутая "принудительной дискретизации", нисколько не изменилась, получить какие бы то ни было элементы пока не удалось.
В самом деле, только количества "дискретов", на которое разделяется сигнал, явно недостаточно. Поскольку в этом случае (по количеству "дискретов") могут казаться равными все сигналы одинаковой длины, ведь они составляются из одинакового количества "дискретных интервалов", хотя внутри интервалов сигналы будут абсолютно разными (рис. 6.3).
Разбиение на равные интервалы
В качестве первой операции необходимо разбить эту ось на определенные интервалы, возможно, это и будут интервалы по времени (рис. 6.2).
Различие и дискретность
Этот Виктор Перестукин решал задачу, и у него получилось, что траншею выкопали полтора землекопа.
Лия Гераскина
В конечном счете, всех интересует только то содержание, которое понятно и доступно человеку. А то, что происходит внутри компьютера, заботит хотя и большое количество специалистов, но все-таки их гораздо меньше тех, кто использует его в качестве инструмента.
Если вы вспомните главы, посвященные аппаратной части настольных издательских систем, то там утверждалось, что устройства ввода предназначены для преобразования соответствующей информации в цифровую форму, а устройства вывода, наоборот, для преобразования цифровых кодов в значения, понятные для восприятия человека.
Информацию о существующих в настоящее время устройствах ввода информации см. в части I.
Замечание
Однако следует попутно заметить, что такая идиллическая ситуация возможна только при том условии, что кодовые таблицы для соответствующего вида информации на входе и на выходе совпадают, т. е. при условии, что они в данной системе стандартизированы.
В этой главе мы обратим более пристальное внимание на другую половину кодовой таблицы, т. е. на столбец "значение". И первый важнейший вопрос: каким обязательным свойством должно обладать значение для того, чтобы его можно было закодировать?
Замечание
Кстати, в предыдущих главах нам удавалось составлять кодовые таблицы без упоминания этого свойства.
Пример 1
Вспомним, что мы рассматривали возможность кодирования студентов определенной группы или даже всего факультета. Если кого-то исключили, или кто-то перешел в другое учебное заведение, или девушка сменила фамилию по понятной причине, то это ведь не означает, что вся кодовая таблица распадается и возникает необходимость вновь ее формировать на каких-либо других принципах.
Пример 2
Кроме того, мы также получили таблицу, в которой произвольным образом присвоили коды четырем ахроматическим цветам.
Эти примеры приведены для того, чтобы можно было увидеть различие между списком студентов и списком цветов.
Возможна ли ситуация, когда в кодовой таблице представлены, как у одного детского писателя, "четверть студента N" и "три четверти студента М"? Безусловно, нет. А у цвета это вполне возможно. Например, "сине-зеленый", "розово-фиолетовый" и т. д.
Итак, нам необходимо определить то свойство, без которого не обойтись при составлении кодовых таблиц. А только кодовая таблица позволит в дальнейшем использовать этот вид информации в компьютерных технологиях.
Пример-метафора
Считается, что любой коллектив — это совокупность отдельных индивидуальностей, как бы они друг с другом ни были связаны. Футбольную команду можно представить в виде списка, в котором каждому футболисту будет отведена отдельная строка, что дает основание для того, чтобы в эту строку добавить и условный код.
Что касается футболистов (как, впрочем, и других спортсменов), то каждый из них— постоянный участник процедур кодирования: любой футболист (или спортсмен) получает номер, который позволяет в данный отрезок времени однозначно идентифицировать участников матча или забега. Номер помогает различать спортсменов. Налицо классическая схема кодирования и декодирования (если совпадают таблицы кодирования).
Поэтому для того, чтобы закодировать информацию о конкретных людях (или о чем угодно) и заполнить столбик значений, необходимо однозначно выделить каждого из них. Это значит, что все значения, предназначенные для кодирования, должны отличаться друг от друга по какому-нибудь критерию.
Это и есть главное свойство, которое называется "дискретностью".
Определение
Дискретность — это свойство, позволяющее различать однотипные или однородные объекты.
Справка
Слово "дискретность" латинского происхождения: "discretus" — это причастие от глагола "discere", что переводится как "отделять", "разделять", следовательно, само слово означает "разделенный" или "отделенный".
Таким образом, необходимо сформулировать обязательное условие: все значения, подлежащие кодированию, должны быть дискретны.
Важная мысль
Все значения, подлежащие кодированию, должны быть дискретны.
Это означает, что располагая раздельными элементами, а проще говоря, располагая элементарным списком элементов, можно легко включить их в кодовую таблицу (или говоря наукообразно, "подвергнуть кодированию").
Пример-метафора
Работа по дискретизации элементов речи, или текста, и созданию алфавита языка выполнена задолго до компьютерных технологий, а задача последних оказалась относительно проста (когда уже существует готовый алфавит, хотя бы и неоптимальный с точки зрения удобства кодирования) — поставить в соответствие каждой букве числовые двоичные коды.
В случае с алфавитом какого бы то ни было языка задача упрощена тем, что к моменту кодирования букв программисты уже располагали конечным количеством элементов, им осталось только их пересчитать и определить, какое количество двоичных разрядов потребуется для этой цели. А затем поставить в соответствие каждому дискретному элементу свой код.
В любом случае кодовую таблицу легко создавать, имея в наличии алфавит, список, перечень или прейскурант.
Пример
Каждый из нас вполне способен отличить белое от черного. В языке существуют резко отличающиеся и не смешиваемые друг с другом (однозначные) понятия "белого" и "черного". Безусловно, иногда возможна неуверенность по поводу того, можем ли мы четко квалифицировать какой-нибудь реальный цвет как "белый" или как "черный". В одних условиях нам может казаться, что этот цвет очень светлый, почти белый, а в других — очень темный, почти черный.
Для компьютерных технологий "дискретный" является синонимом "целочисленный". Например, даже дробные числа должны получить особую форму дискретных чисел (кодов).
Если данные не дискретны, т. е. как бы размыты, процедура кодирования невозможна. В этом принципиальное различие компьютерного "мышления" и человеческого: сами-то мы часто оперируем чрезвычайно неопределенными понятиями — "искусство", "талант", "любовь", "счастье", "надежда".
Следует обратить внимание на то, что дискретность — это универсальное требование цифровых технологий, по сути процесс собственно дискретизации и процесс квантования — это различные виды дискретизации (разбиение непрерывного сигнала на отдельные отсчеты или уровни).
Различие исходного и преобразованного сигналов
Справка
Для того чтобы реальный звуковой сигнал, поступающий на микрофон и индуцирующий непрерывный электрический сигнал, был оцифрован с приемлемым качеством, необходимо выполнять квантование не реже 40 000 тысяч раз в секунду, а фактически даже больше — именно 44 100 раз, что означает частоту 44,1 кГц.
Важная мысль
Кодовая таблица предполагает соответствующую таблицу квантования на другом устройстве. Если это не так, воспроизведение может радикально отличаться от требуемого.
Резюме
Для того чтобы кодировать любую информацию, необходимо однозначно выделить ее элементы. Это значит, что все значения, предназначенные для кодирования, должны быть строго дискретны.
Для получения дискретных элементов в непрерывном потоке аналогового сигнала, в котором отсутствуют отдельные элементы, применяется принудительная дискретизация — разбиение потока на определенные равные интервалы. Полученные интервалы можно пронумеровать с помощью натурального ряда чисел.
Следущий шаг дискретизации — это усреднение, или интегрирование, непрерывно изменяющегося сигнала в пределах каждого отсчета. Аналоговый сигнал преобразуется в ступенчатую линию, которая в общем, конечно, имитирует исходную кривую с определенной (кстати, заранее заданной) погрешностью.
Для сравнения полученных усредненных значений вводится координата, с помощью которой можно определить уровни этого усредненного сигнала в соответствии с заранее установленной шкалой. Этот процесс соответствует второй дискретизации, которая получила название квантование. В результате процедуры квантования получают дискретные значения, привязанные к уровням квантования. Эти значения равны порядковому номеру уровня квантования, что позволяет легко создать условия для последующего кодирования.
Соответственно, следующий этап преобразования номера уровня квантования в двоичный код называется кодированием.
В данной части были рассмотрены два основных способа передачи информации: аналоговый и импульсный.
Аналоговый нам необходим по причинам того, что объективная информация (звук или изображение) представляет собой аналоговую форму, поэтому на этапах ввода и вывода информации приходится иметь дело с аналоговыми сигналами.
Рассмотренные в данной части особенности достаточны для того, чтобы представлять себе, какие сигналы подлежат преобразованию в форму, "понятную" компьютеру.
С другой стороны, компьютерные технологии не обладают органами чувств и мышлением, которыми природа снабдила человека. Для их функционирования требуется самый простой и однообразный вид сигнала, каковым является импульсный.
В компьютерных технологиях основополагающую роль играет понятие бита, который определяется как минимальное количество информации, его использование обеспечивает количественное измерение информации. И поскольку двоичная система счисления идеально совпадает с понятием бита, это дает возможность передавать информацию одновременно с ее учетом.
Любое двоичное число — это совокупность битов, каждый бит — это один разряд, а разрядность двоичного числа — это количество знакомест (или количество разрядов, или количество битов), заранее отведенных для записи двоичного числа. Количество двоичных разрядов определяет количество кодов, которое равняется соответствующей степени числа "2".
Кодовый алфавит — это минимальный перечень элементов, а кодовая таблица — это совокупность кодов и их значений. Длина кодовой таблицы может быть произвольной, но ограничивается возможностями технической реализации.
Значение кода не является законом природы — это всякий раз результат условности, результат договоренности, закрепленный теми или иными стандартами.
В общем случае, кодовая таблица может включать любое содержание, если есть возможность подготовить его к кодированию, т. е. принудительно выделить дискретные элементы, даже если они носят искусственный характер.
Части I и II являются подготовительными для последующих основных частей, посвященных пиксельной и векторной графике. Часть III посвящена пиксельной графике, которая использует идентичные принципы кодирования. Часть IV представляет собой рассказ о векторной графике, которая также основана на дискретизации, но в несколько ином аспекте.
в процессе квантования, называются шумом
Замечание
Искажения сигнала, происходящие в процессе квантования, называются шумом квантования. Принципиально важно, что это искажение не может быть в дальнейшем устранено, т. к. шум квантования коррелирован с сигналом. В общем случае это искажение уменьшается при увеличении количества уровней квантования.
В результате процедуры квантования получают дискретные значения, привязанные к уровням квантования (рис. 6.7).
Усреднение сигналов в пределах "дискретов"
Замечание
В содержательном смысле превращение фрагмента непрерывного сигнала в одно-единственное значение является нетривиальной процедурой. Действительно, как выбрать наиболее характерное значение? Если бы анализом и отбором занимались люди, например музыканты, то понятно, что при очень небольшой производительности качество приближалось бы к оптимально художественному. На самом деле, для технической реализации необходимо применить стандартизированный прием, например использовать текущее значение в момент "биения" метронома. Этот нюанс уже зависит от конкретного технического решения.
Но поскольку за эту интеграцию "отвечает" вычислительная техника, необходимо принять максимально простой алгоритм. А самой простой процедурой в этой ситуации является усреднение (хотя возможен выбор минимального или максимального значения в интервале).
Пример-метафора
Предположим, что в учебной канцелярии возникла необходимость сравнить успеваемость двух групп. Как это сделать? Понятно, что в обеих группах есть "отличники" и "двоечники", т. е. существует определенный разброс оценок по разным дисциплинам. Если же будут выбраны усредненные значения, не учитывающие разброса, то в общем (с неизбежными погрешностями) мы получим основания для того, чтобы сравнивать, т. к. располагаем дискретными значениями. Скажем, в одной группе средний балл получился равным 4,9, а в другой — 3,1. Понятно, что первая группа по успеваемости значительно превосходит вторую, хотя для двух конкретных студентов из этих групп это соотношение может быть несправедливым.
Конечно, в этом алгоритме есть недостатки, которые являются неизбежной платой за возможность сравнения. В той группе, где средний балл оказался равным 3,1, отдельный студент может иметь пятерки по всем предметам. Невзирая на это, вся группа числится в отстающих. Кого-то это может не устраивать, но такова объективная реальность, таков механизм, таков алгоритм.
Замечание
Этот алгоритм не носит, впрочем, всеобщего характера.
Возможны и анекдотические случаи: скажем, средняя температура по больнице.
В результате усреднения (интеграции) сигнала в пределах диапазона дискретизации на графике появится множество средних значений. На каждом дискретном участке они отображаются линиями, параллельными горизонтальной оси.
Пример-метафора
Представьте себе график прибылей какого-либо предприятия. Этот график отображает информацию о каждом рабочем дне. Для прогнозирования необходима обобщенная информация, например помесячно.
Но с помощью такого ежедневного графика невозможно сравнивать помесячные доходы друг с другом (вспомните успеваемость группы по отдельным учащимся и по отдельным предметам), значения по дням имеют очень значительный разброс. Поэтому необходимо определить усредненные значения прибыли за каждый месяц. В результате вместо ежедневного графика получается график помесячный, который наглядно отображает уровни прибылей.
Стоит обратить внимание, что после процедуры усреднения аналоговый сигнал преобразуется в ступенчатую линию, которая, в общем, конечно, имитирует исходную кривую (рис. 6.5).
Усреднение в пределах интервала дискретизации
Ответ на заданный выше вопрос можно сформулировать таким образом: непрерывный поток информации, или непрерывный сигнал, подвергается разбиению на небольшие дискретные участки с совершенно определенной целью — получить на этих участках один-единственный отсчет (дискретный элемент). Сама по себе эта процедура, конечно, ничего не решает, но создает предпосылку для последующих шагов.
В качестве следующего шага необходимо выяснить, как в пределах интервала получить одно значение, один дискретный элемент?
Для того чтобы получить единственное значение в пределах этого "дискретного интервала", необходимо просто-напросто усреднить сигнал между границами этих "дискретов" (рис. 6.4).
Таким образом, следущий шаг этапа дискретизации — это усреднение, или интегрирование, непрерывно изменяющегося сигнала в пределах каждого отсчета.
Вид ступенчатой линии сигнала после усреднения
На данном этапе можно уточнить определение дискретизации.
Определение
Дискретизация — это разделение на участки, в которых сигнал усредняется, В этом случае определяются отдельные, независимые друг от друга отсчеты, которые можно сравнивать между собой.
Усредненные значения — необходимый этап конвертирования аналогового сигнала в цифровой, но не конечный, а промежуточный. Следующим этапом является сравнение полученных значений по специальной шкале, т. е. квантование.
ЧАСТЬ III
ПИКСЕЛЬНАЯ ГРАФИКА
Глава 7. Дискретизация, квантование и кодирование графических изображений
Глава 8. Разрешение пиксельной графики
Глава 9. Глубина цвета пиксельной графики
Глава 10. Объем файла пиксельной графики
Глава 11. Трансформирование пиксельной графики
Данная часть является одной из главных и предлагает полное описание основ важного способа кодирования графической информации — пиксельной графики, при этом особенно выделено определение параметров пиксельной графики.
В данной части повторяются основные процессы на материале простого изображения, вывод основных параметров (разрешения и глубины цвета) и их единиц измерения, использование этих параметров для предварительного расчета объема файла и для трансформирования изображения пиксельной графики.
Глава 7 представляет рассмотрение тех же вопросов, которые обсуждались в части II, но уже на материале графических изображений: дискретизация, квантование и кодирование простейшего изображения.
В главе 8 предлагаются дальнейшая конкретизация процедуры дискретизации и обсуждение важного параметра пиксельной графики — разрешения.
Глава 9 посвящена последующей конкретизации процедуры квантования и обсуждению важного параметра пиксельной графики — глубины цвета.
В главе 10 предлагается расчет объема пиксельного файла и обсуждение алгоритмов сжатия информации.
В главе 11 обсуждаются вопросы трансформирования пиксельной графики.
Пиксельная графика характеризуется тремя основными параметрами, один из которых совершенно очевиден (площадь изображения), а два других (разрешение и глубина цвета) требуют последовательного освоения материала.
Декартовы координаты
Самый точный метод определения координат судна - это опрос местных жителей. Анекдот
Если мы договариваемся использовать в качестве дискретных элементов прямоугольники, то лучше декартовых координат трудно что-либо придумать. Действительно, из многих существующих координатных систем декартовы, названные по имени Рене Декарта, наиболее доступны и надежны для позиционирования на плоскости.
Поэтому самым простым способом разбиения плоскости представляются сетки, получаемые в пределах ортогональных (прямоугольных) координат.
Справка
Рене Декарт (1596—1650)— французский философ, математик, физик и физиолог. Положил начало аналитической геометрии, о которой мы, безусловно, вспомним в части, посвященной векторной графике. Декарт сформулировал закон сохранения количества движения, объяснил образование и движение небесных тел вихревыми потоками. Очень интересны философские взгляды Декарта, в частности он разделил душу и тело на две не связанные друг с другом категории, которые по причине божественного соизволения сосуществуют (правда, в разных пропорциях) только в человеке. Кроме того, Декарт — автор знаменитого высказывания "Cogito ergo sum", что означает "Мыслю, следовательно, существую".
По имени Декарта названа система координат на плоскости или в пространстве, обычно со взаимно перпендикулярными осями и одинаковыми масштабами по осям — так называемые "прямоугольные декартовы координаты".
Поэтому любое изображение (фотографию или рисунок) мы помещаем в декартовы координаты: по нижнему краю изображения располагается ось X, а с правым краем изображения совпадает ось Y.
В самом первом приближении элементы, на которые разбивается изображение, — это прямоугольные области. В общем случае образуются дискретные элементы с различными значениями ширины и высоты. Принципиально это не возбраняется, но, учитывая грядущие трансформации, стоит задуматься над тем, что даже ортогональные трансформации (вращение на 90, 180, 270 и 360 градусов) в такой ситуации будут чреваты неприятностями.
Более подробную информацию о неприятностях с трансформациями пиксельных изображений см. в главе 11.
Исходя из этих соображений, изображение выгодно разбивать на квадратные элементы.
А коль скоро принимаются за основу квадратные элементы, то и отсчеты на обеих осях устанавливаются одинаковыми, т. е. с равными интервалами между отсчетами (рис. 7.2).
Дискретизация, квантование и кодирование графических изображений
Дискретизация, квантование и кодирование графических изображений
Эта глава является вводной перед обсуждением кодирования изображений, в ней пойдёт речь о процедурах, которые ранее относились к абстрактному сигналу, а теперь применяются к графическим изображениям.
В этой главе будет снова рассмотрен процесс дискретизации, но уже не в абстрактном изложении, а в применении к изображению, хотя и к простейшему.
Поскольку у изображения нет предварительного списка элементов, необходимо выполнить принудительную пространственную дискретизацию. Особенностью дискретизации изображений является двухмерность, что позволяет использовать для сохранения данных математический аппарат двумерных матриц. Именно для этого создается виртуальная матрица той же размерности по горизонтали и по вертикали, которая заполняется битами информации в соответствии с принятой заранее таблицей квантования.
Этим процессом заканчивается кодирование графического изображения. В результате формируется виртуальное цифровое изображение, которое для просмотра и управления требует особого этапа — визуализации. Необходимым условием визуализации является использование той же таблицы квантования, что и при оцифровке изображения.
Дискретизация штрихового изображения
- Как работает сканер?
- У-у-у...
Шутка
Итак, у нас все готово, чтобы начать конвертировать простейшее штриховое (черно-белое) изображение в цифровую форму. Предположим, нам очень повезло и необходимо превратить в цифровую форму такой "оригинал" -идеальный черный квадратик (рис. 7.3).
Характер дискретизации изображений
Чтобы двигаться в нужном направлении, предварительно необходимо выяснить своеобразие графического сигнала, скажем, в сравнении с абстрактным сигналом, который выше уже обсуждался.
Информацию о работе с абстрактным аналоговым сигналом см. в части II.
Совершенно очевидно, что этот вопрос был поставлен только из соображений системности. Всякому, кто стремится войти в прекрасный мир изображений, понятно, что подавляющее число произведений традиционных направлений живописи, графики и фотографии располагаются на плоскости, соответственно, и все их содержательные элементы должны представлять какие-то плоскостные элементы: из совокупности площадей разной формы и цвета строится любое изображение.
Исходя из этого, способ дискретизации тоже должен основываться на плоских элементах, обладающих площадью, а, следовательно, двумя измерениями.
Замечание
В каких случаях нам достаточно одной линейной дискретизации? Конечно, когда, нужно выяснить размер с помощью измерительного устройства типа "линейка": линейка снабжается дискретными отметками.
В этом случае необходимо плоскостное изображение дискретизировать на какие-то плоские элементы, обладающие параметрами площади, т. е. длиной и шириной.
Какую форму могут (или должны) иметь дискретные элементы в самом общем случае? В принципе, любую.
Справка
Характерным примером изображений, составленных из очевидно дискретных элементов, является мозаика, которая возникла в античную эпоху как элемент украшения зданий (рис. 7.1). Когда она создается (а это долгий и сложный в технологическом плане процесс), используются камни (смальта, керамические плитки) самых разных форм и размеров. Нет никаких принципиальных ограничений. Художник-мозаичист сам свободно выбирает камень, исходя из требуемого цвета и его площади ("каменного мазка"), т. е. учитываются, в первую очередь, содержание и творческая манера. В одном случае требуется камень большой площади, в другом — используются несколько мелких элементов.
О чем это говорит? Только о том, что для такой произвольной и очень гибкой дискретизации необходимы опыт, взгляд и рука художника. И даже, более того, желателен именно специалист по мозаике с достаточной практикой.
Для использования в технических системах указанный способ не может устроить, потому что он не технологичен. Тут требуется универсальный принцип, который можно было бы "поручить" электронному устройству.
Следовательно, нужно выбрать самый элементарный способ, а именно такой, который можно совершенно надежно алгоритмизировать и который всегда будет работать.
Характер квантования изображения
После процедуры дискретизации наступает очередь следующего этапа — заполнения математической матрицы числовой информацией в соответствии с данными, фиксируемыми в пределах каждой ячейки дискретизации.
На предыдущем этапе изображение было принудительно "разрезано" на элементы ("квадратики") для того, чтобы отделить один элемент от другого. При этом каждый элемент получил свое уникальное положение в сетке дискретизации и, соответственно, в математической матрице.
Каждый отделенный элемент необходимо оценить в соответствии с некоторой заранее заданной шкалой — это и есть процедура квантования. Отличие данного процесса от того, который обсуждался ранее, состоит в характере квантования.
Информацию о понятии квантования см. в части II.
В изображениях (для начала ограничимся черно-белыми или тоновыми рисунками) единственное различие, которое имеет значение при таком типе дискретизации, строится на тональных градациях.
Важная мысль
Характер квантования дискретных элементов изображений состоит в различении элементов по уровню освещенности (по уровню тона).
Замечание
Забегая вперед, можно сказать, что это справедливо даже для квантования цветных изображений.
Вспомним, что мы выбрали для экспериментов черно-белый штриховой "оригинал". "Штриховой" означает, что используется жесткая дихотомия: либо одно, либо другое, т. е. только белое или только черное. Это послужит путеводной нитью в составлении таблицы квантования.
Изображение в декартовых координатах
Важная мысль
Для изображений идеально подходит дискретизация на квадратные элементы, положение которых однозначно определяется по декартовой системе координат.
Кодирование штрихового изображения
И я выхожу из пространства В запущенный сад величин.
Осип Мандельштам
И вот, наконец, мы начинаем кодировать исходное изображение ("оригинал") по двум состояниям, т. е. оценивать каждый дискретный элемент по составленной нами таблице квантования (табл. 7.1).
Там, где в "оригинале" дискретные ячейки имеют белый цвет, в соответствующие им ячейки матрицы (битовой карты) записываются "единицы". А там, где в "оригинале" представлены ячейки черного цвета, записываются "нули" (рис. 7.6).
1 |
1 |
1 |
1 | ||||||
1 |
0 |
0 |
1 | ||||||
1 |
0 |
0 |
1 | ||||||
1 |
1 |
1 |
1 | ||||||
1 |
1 |
1 |
1 | ||||||
Рис. 7.6. Заполнение виртуальной матрицы битами, обозначающими коды цвета
После полного заполнения всех ячеек матрицы можно считать, что процесс оцифровки (кодирования) исходного изображения ("оригинала") завершился.
Важная мысль
Математическая матрица, заполненная совокупностью цифр (кодов), — это по сути и есть изображение в цифровом виде, т. е. цифровое изображение.
Таким образом, полученная таблица (битовая карта) (рис. 7.7) может быть записана любым компьютерным способом как последовательность двоичных чисел, импульсов, положения магнитных доменов и т. д. В таком виде информацию можно хранить (в одном из стандартных форматов), передавать, в том числе копировать неограниченное число раз и вообще обрабатывать средствами вычислительных систем.
1 |
1 |
1 |
1 | ||||||
1 |
0 |
0 |
1 | ||||||
1 |
0 |
0 |
1 | ||||||
1 |
1 |
1 |
1 | ||||||
1 |
1 |
1 |
1 | ||||||
Рис. 7.7. Битовая карта "оригинала"
Однако пользователю такая информация абсолютно не доступна. А для того чтобы управлять содержанием, например изменить какой-либо фрагмент изображения, необходимо выполнить процедуру, обратную вводу — визуализировать битовую карту, т. е. создать видимое изображение, в первую очередь на экране монитора.
Матрица дискретизации
В самом деле, пока мы располагаем только страницей с рисунком (его мы самонадеянно окрестили "оригиналом"), на который нанесена сетка координат. Каким же образом эта информация преобразуется в цифровые данные и попадет в компьютер (например, в какое-либо графическое приложение)?
Важная мысль
Здесь собственно и начинается то, что мы называем компьютерной графикой, ибо с этого момента мы переходим к представлению информации средствами компьютера, т. е. цифрами.
А из цифр, если они характеризуют некий ареал значений, как правило, можно составить таблицу, которая на математическом языке называется матрицей.
Определение
Матрица — это прямоугольная таблица из чисел (рис. 7.5) или математических выражений, состоящая из произвольного числа строк и столбцов. Каждая ячейка такой таблицы имеет одинаковый характер.
Справка
Матрица используется во многих разделах физики, экономики и других точных науках, а в математике ею занимается так называемая матричная алгебра, описывающая правила и способы действия с матрицами. Следует заметить, что матрицы широко используются в компьютерных технологиях, поскольку любые устройства хранения информации можно трактовать как матрицу, каждая ячейка которой обладает определенным адресом (то есть координатами).
Необходимость дискретизации изображений
В общем случае полноцветное изображение (репродукция, цветная фотография, цветной слайд, а еще шире — прекрасная объективная реальность) представляет собой непрерывный (continuous) сигнал, не имеющий формально выраженных элементов (графического алфавита), которые можно было бы выделить, внести в список и поставить каждому цифровой код.
Эта тема подробно обсуждалась на примере буквенного алфавита в главе 3. Информацию об особенностях изображений см. в части II.
По этой причине понятно, что необходимо прибегнуть к "принудительной" дискретизации, как это было рассмотрено на примере абстрактного аналогового сигнала.
О работе с абстрактным аналоговым сигналом см. в части II.
В результате этой операции должны получиться некие дискретные элементы, которые можно подвергнуть операции квантования, а затем кодировать в соответствии с требуемой кодовой таблицей.
Важная мысль
Для преобразования изображений в цифровую форму первым условием также является "принудительная" дискретизация.
А пока, исходя из того, что у графики нет явно выраженных (и самое главное — универсальных) элементов, можно констатировать принципиальную исходную позицию: изображение необходимо подвергнуть дискретизации, но прежде следует ответить на довольно простой вопрос: каков характер предстоящей дискретизации.
Замечание
Мы отдаем себе отчет в том, что многие читатели уже используют в своей работе сканирующие устройства с большим или меньшим успехом... Однако следует сразу понять, что мы начнем обсуждать не техническую, а только логическую сторону этих процессов, а именно рассмотрим только самые общие принципы, на которых основано огромное множество указанных устройств. Если читателей интересуют именно конкретные технические вопросы, они могут параллельно обратиться к книгам издательства БХВ-Петербург: "Сканеры и цифровые камеры".
Необходимость координат
Зачем требуется однозначно позиционировать получаемые элементы, станет ясно после рассмотрения следующих ситуаций.
Пример-метафора 1
Представьте себе обычную ситуацию: медсестра в палате измеряет температуру у больных и записывает показания термометра в специальную таблицу: 36,6; 37,2; 37,5; 38,4 и т. д. Казалось бы, фиксируется полная и вполне точная информация (как и положено, с точностью до одной десятой градуса).
И тем не менее любой из нас сообразит, что в этой таблице температур все-таки отражена не вся необходимая информация. Действительно, в таблице отсутствуют фамилии больных!
Без фамилий (или еще хуже: с неверно указанными фамилиями) такая таблица не только не имеет никакого смысла, но даже является вредной и опасной. На самом деле, эта таблица необходима и важна только в том случае, если обеспечивается однозначное соответствие значений, в данном случае — фамилий и значений температуры.
Пример-метафора 2
Другой пример связан с геодезическими съемками, например с целью определения магнитных аномалий. Таблица значений уровней магнитного поля также будет бессмысленна, если не располагать точными координатами точек, в ко-
торых аномалия имеет место (под Курском или в центре Санкт-Петербурга). Не зря на профессиональном языке процесс определения координат и соответствующих им значений называется "привязкой" (location survey). В этом термине подчеркивается неотделимая связь значения и положения его на карте, а, соответственно, и в реальности.
Разумеется, что и дискретные элементы, на которые разбивается изображение, должны получить свое четкое местоположение. Следовательно, в этом случае требуются соответствующие координаты.
Справка
Координаты (от латинских слов "со", что означает "совместно" и "ordinates", что означает "упорядоченный" — это совокупность чисел, которые определяют положение точки на плоскости, на поверхности или в пространстве. Прямоугольные (декартовы) координаты точки на плоскости суть две взаимно перпендикулярные прямые, которые называются осями. Горизонтальная ось обычно обозначается буквой "X" и называется осью абсцисс, а вертикальная обозначается буквой "У" и называется осью ординат.
Информацию о других системах координат см. в главе 13.
"Оригинал" в системе декартовых координат
Надеемся, вы согласитесь, что пока это еще не цифровое изображение, а в лучшем случае — подготовка к нему.
Пример математической матрицы
Действительно, процедура дискретизации применительно к компьютерному изображению начинается с создания пустой матрицы, в ячейки которой можно записать числа — коды той или иной графической информации.
Осталось только поставить в жесткое и однозначное соответствие сетку дискретизации, которую мы нанесли на "оригинал", и математический объект — матрицу, которая виртуально создается средствами прикладных программ, например в оперативной памяти компьютера. В матрице фиксируется такое количество ячеек, которое достаточно для сохранения необходимого массива данных. А сетка дискретизации (декартовы координаты) -это, в общем, и есть таблица, или матрица.
Разумеется, с самого начала необходимо обеспечить идентичность размерностей: количество ячеек по горизонтали и по вертикали в сетке дискретизации должно соответствовать количеству строк и столбцов матрицы.
Важная мысль
Размерность сетки дискретизации "оригинала" должна соответствовать размерности виртуальной цифровой матрицы.
Следует только добавить, что матрица, которая создается средствами графической программы, получила в английской терминологии название тар ("карта").
Справка
Например, в физике существует понятие "карта Карно" по расчету коэффициента полезного действия теплового двигателя. Такая карта, по сути, является обыкновенной таблицей.
В этом смысле карта (тар) — просто таблица, а поскольку в подобную таблицу записываются биты информации ("нули" или "единицы"), такая таблица (карта) получила название "битовая карта" (bitmap).
Подробную информацию о понятии "бит" см. в части II.
В связи с этим дискретную компьютерную графику иногда называют "битовой" (bitmapped).
Определение
Битовая графика (bitmapped image) — это вид графики, у которого выполнена пространственная дискретизация и используются элементы, напоминающие элементы простейшей мозаики или вышивки крестом.
Но вот компьютерная матрица создана (она виртуальная, поскольку ее нельзя — пока! — увидеть). Теперь настала пора ее заполнить. Однако прежде необходимо разобраться, как это сделать, для чего нам требуется перейти к следующему этапу — квантованию.
Пример мозаики ("Дмитрий
Остается единственно возможное в этой ситуации решение — не пытаться искать в каждом отдельном изображении какие-то особые элементы (оставим это художникам), а наоборот, "навязать" всему огромному изобразительному корпусу свое простое, экономное и универсальное решение — принудительную дискретизацию (enforcement discretization) площади изображения на условные элементы одинаковой и максимально упрощенной формы (простой геометрической формы).
В данный момент ключевое слово - "принудительная". Дискретизация принудительна, т. к. никоим образом не учитывает содержание "картинки". Для принудительной дискретизации не играет роли, какую часть изображения мы "разбиваем" — фон или важные детали, часть рисунка или окружающие его поля и т. д. Если выразиться резко, то это — дискретизация "по живому" ("невзирая на лица").
Важная мысль
Принудительная дискретизация изображений позволяет создать универсальный способ создания элементов для последующего квантования и кодирования.
Таким образом, принудительная дискретизация позволяет решить поставленную выше задачу легко и изящно. В простоте этого метода кроется огромный запас "жизненной силы" и одно из главных его достоинств. Но вместе с тем, как всегда в жизни, главное достоинство является причиной очень многих огорчений, связанных с этим методом.
Подробную информацию о "плюсах" и "минусах" этого метода см. в части V.
Вторым по важности ключевым словом является "простой", т. е. речь в данном случае идет о том, что необходимо выбрать самый простой элемент дискретизации. А что может быть проще "квадратика"?! (Только линия, которая, как мы выяснили, для реализации этой задачи не подходит.)
При этом, правда, неизбежно возникают следующие вопросы.
Формальный вопрос: как описать различие в местоположении совершенно одинаковых элементов?
Содержательный вопрос: как описать фактическое различие между элементами?
Формальный вопрос решается введением координатной сетки, а содержательный — последующим этапом квантования.
Информацию о координатной сетке см, в следующем разделе, а о квантовании — в разд. "Квантование штрихового изображения" данной главы.
Простейший "оригинал"
Замечание
Мы будем использовать понятие "оригинал", но берем это слово в кавычки, потому что это пока условный, очень упрощенный рисунок — некая модель изображения.
Если вы знакомы с предыдущими частями этой книги, для вас будет естественным предположить, что первым этапом нашей работы является дискретизация?
Замечание
Мы говорим в данном случае о том, с чего теоретически "начнет" работу сканер, когда перед ним "ставится" задача — превратить графическое изображение в цифровую форму.
Мы помещаем "оригинал" в декартовы координаты, а фактически — просто строим сетку, линии которой образуют клетки-ячейки, т. е. независимые друг от друга дискретные элементы (если выразиться короче — "дискреты").
На изображении получаются дискретные элементы по вертикали, которые можно, например, пронумеровать и дискретные элементы по горизонтали, которым, также можно поставить в соответствие такую же систему обозначений (рис. 7.4).
Растеризация
Процедура оцифровки изображения (дискретизации, квантования и кодирования) называется также растеризацией. Например, довольно часто это относится к преобразованию векторного изображения в пиксельное.
Полную информацию о преобразованиях векторной графики в пиксельную см. в части V.
Резюме
Используя принцип технической системы (типа сканера), необходимо обеспечить дискретизацию "оригинала" — разбиение его на одинаковые плоские квадратные фрагменты.
Параллельно в соответствии с количеством требуемых уровней тона (цвета) необходимо представить количество значений тона в виде таблицы квантования, или, другими словами, составить кодовую таблицу уровней тона (в данной главе использовались два тона). Каждому тону соответствует двоичный код.
Коды записываются в виртуальную (невидимую) математическую матрицу в соответствии со значением каждого дискретного элемента и сохраняются в одном из стандартных форматов.
И наконец, используя ту же кодовую таблицу, цифровое изображение в форме виртуальной матрицы выводят (визуализуют) на внешнее устройство, например монитор или принтер, теперь уже в форме, доступной для человеческого восприятия.
Весь цикл получения цифрового изображения простейшего "оригинала" — квадрата, нарисованного, например, черной тушью на белой бумаге, состоит из этапов дискретизации, квантования и кодирования. Для управления цифровым изображением или использования его в качестве графической информации необходимо обеспечить функцию визуализации.
Представив в целом процедуру оцифровки изображений в предыдущей главе, в последующих двух главах мы рассмотрим основные параметры пиксельной графики (а именно разрешение и глубину цвета), без понимания которых невозможно создать новое пиксельное изображение или правильно выполнить сканирование изображения, нанесенного на какой-либо материальный носитель (бумагу, картон, пленку и т. п.).
Различие дискретизации и квантования
Хотя дискретизация и квантование основаны на едином принципе разбиения непрерывного сигнала на отдельные и независимые друг от друга элементы, необходимо провести четкую линию различия между ними.
В процессе дискретизации единое и не имеющее формального членения изображение разбивается на абсолютно одинаковые по размеру (по площади) элементы, причем, как уже говорилось, разбивается принудительно. С точки зрения дискретизации все эти элементы одинаковы и отличаются только своим положением (координатами в сетке). На самом деле, конечно, координаты — это еще не коды. Они определяют только положение элемента на плоскости.
В процессе квантования все одинаковые элементы необходимо разделить по какому-либо принципу хотя бы на "две кучки". Иначе никакого цифрового изображения получить нельзя: если все элементы будут иметь одно и то же значение, т. е. один и тот же цвет, получится элементарная плоскость ("плашка"), на которой отсутствует изобразительное содержание. Поэтому, для того, чтобы передать хоть какое-то содержание, мы должны научиться различать эти элементы в соответствии с предварительно заданной таблицей квантования.
Таблица квантования для штрихового изображения
Поскольку в штриховом изображении используются только два ахроматических цвета, их можно представить как два состояния. Выше мы обсуждали: для того, чтобы закодировать два состояния, требуется всего один двоичный разряд (один бит информации).
Подробнее о построении кодовой таблицы см. в части II.
На основании этого мы можем предварительно составить таблицу квантования для штрихового изображения (табл. 7.1).
Таблица 7.1. Таблица квантования для штрихового изображения
Значение ахроматического цвета |
Коды (1 двоичный разряд) | ||||
Черный Белый |
0 1 | ||||
Визуализация цифрового изображения
На данном этапе цифровое изображение ("скрытое изображение") получило форму, доступную для хранения и обработки на соответствующих электронных устройствах, но недоступную для восприятия и управления человеком.
Для того чтобы эту ситуацию исправить, мы должны заставить программу и соответствующие драйверы устройств, используя ту же самую таблицу квантования (табл. 7.1), полученную матрицу (рис. 7.7) представить доступными для человеческого восприятия средствами — визуализировать цифровое изображение, например на экране монитора (хотя, в конечном счете, не окажется лишним и принтер).
В общем случае получается некий "оттиск" (рис. 7.8) — конечный продукт, который мы получаем с использованием технического устройства.
Замечание
Заметьте, что слово "оттиск" помещено в кавычки по той же причине, что и "оригинал".
И заметно, что в общем и целом "оригинал" похож на "оттиск". Это значит, что общими усилиями мы справились с задачей и правильно прошли все требуемые этапы.
Визуализированный "оттиск"
Те процессы, которые обсуждались выше на довольно абстрактном примере, сейчас рассмотрены на примере конкретного графического изображения (пусть и упрощенного). Действительно, на входе — конкретный "оригинал", на выходе — конкретный "оттиск".
Подробную информацию об абстрактном аналоговом примере см. в части II.