Защита информации в компьютерных сетях

Метрика и законы движения информации

Изучение закономерностей движения информации в обществе и развития общественного информационного производства необходимо начать с определения системы мер, характеризующих эти процессы количественно. Шенноновская мера информации неплохо характеризует качество сигналов как средства взаимодействия систем управления и их частей. Эта мера с успехом может быть использована при исследовании некоторых конкретных информационных производств, целью которых является уменьшение или увеличение неопределенности в какой-либо информационной системе.

Для раскрытия общих закономерностей движения информации в обществе необходимы более грубые и более предметные измерения информации и ее потоков. Нейропсихологи утверждают, что кратковременная память человека в состоянии удерживать около семи различных объектов, обдумываемых им одновременно. При этом сложность и природа объектов может быть различной. Причем в шенноновских битах (двоичных единицах) эти объекты, как правило, измерить не удается.

Общаясь друг с другом, люди работают в режиме «вопрос – ответ», причем в битах можно измерить только длину, передаваемых друг другу сообщений. С позиций движения информации нас больше интересует число вопросов и ответов, произведенных в процессе общения. Сложность вопросов и ответов только косвенно можно измерить битами. В зависимости от субъектов и темы общения сложность может измеряться в более крупных, чем бит или символ (буква, байт и пр.), единицах.

В сложных информационных производствах одновременно общаются друг с другом много пар: «человек – человек», «человек – машина», «машина – машина».

В процессе общения вырабатываются и на какое-то время фиксируются некоторые порции информации. Сопоставить различные информационные производства можно только при относительно близких единицах измерения этих порций или единицах информации.

В библиотеке, т. е. в информационном производстве, призванном обслуживать читателей, можно обнаружить несколько различных единиц информации: это книги, их библиографические описания, рефераты, каталожные записи, формуляры читателей и др. Причем все эти виды информации взаимодействуют в процессе обслуживания читателей, а также в процессах кооперации библиотеки с другими информационными производствами: другими библиотеками, коллекторами, издательствами и пр. Аналогичную картину можно обнаружить в информационном производстве любого другого типа.

В каждом информационном производстве информация перемещается в процессе ее использования или создания от одной технологической позиции к другой порциями, имеющими некоторое законченное содержание в виде формальных записей на бумажных, магнитных, электронных, акустических и других носителях, воспринимаемых получающей стороной, в том числе и памятью людей.

Мы будем различать следующие порции (единицы) информации, принятые во многих информационных производствах: символ, поле, запись, документ, текст, файл или другие массивы информации.

Символ является одним из знаков принятого в производстве языка общения. Несколько символов составляют поле, имеющее в языке общения смысл некоторого указателя – слова или числа.

Несколько полей составляют запись, в которой содержится информация об одном или нескольких взаимосвязанных событиях и/или фактах, используемых или получаемых в процессе информационного производства. Документ содержит несколько записей.

Из документов и записей составляются массивы информации краткосрочного или долговременного хранения. Наличие таких массивов предполагает использование в информационном производстве технологических позиций, обеспечивающих формирование и хранение массивов, поиск в массиве требуемых документов и/или записей и ознакомление с ними заинтересованных лиц – смежников по технологической цепочке производства. Поиск задается некоторой записью или документом, называемым запросом.

В библиотеке имеется несколько взаимосвязанных массивов. Прежде всего это массив книг (документов), в котором так приятно покопаться библиофилу. Расстановка книг в хранилище массива однозначно отражается в одном или нескольких массивах указателей (предметном, алфавитном, авторском и пр.). Одно из полей библиографической записи в этих указателях содержит адрес книги в хранилище книг. Запросы читателей оформляются специальной записью типа «бланк заказа».

Аналогичную организацию массивов можно наблюдать в каждом информационном производстве, включая информационное производство человека.

Пока мы остановимся на следующих единицах информации, участвующих в процессах информационного производства: символ, поле, запись, документ, массив.

Если представить общественное информационное производство в виде множества взаимосвязанных информационных производств, то в нем можно наблюдать потоки документов и/или записей. Эти потоки формируются благодаря как фиксированным связям между отдельными информационными производствами, так и временным, и разовым связям, возникающим по мере необходимости,

В первом случае информация распространяется по заранее установленному регламенту (контракт, кооперация, подписка и пр.) и не требует многократного оформления запроса. В таких случаях принято считать, что действует постоянный запрос.

Во втором случае для получения информации заинтересованное информационное производство должно отправить запрос другому производству, которое по своей технологии подготовит и отправит заказчику ответ в виде записи или документа, или массивов записей и/или документов.

Наблюдая процессы передачи информации можно заметить, что между отдельными субъектами общественного информационного производства идет интенсивный обмен информацией, в то время как между другими его практически нет. В этом случае мы говорим о наличии или отсутствии взаимного интереса. Очевидно, что предложить общую меру интереса, применимую для каждого конкретного случая, очень трудно. Этот показатель зависит от многих факторов или, по терминологии математики, он является функцией многих аргументов. Перечислить все эти факторы или аргументы не представляется возможным. Для наших целей достаточно рассмотреть зависимость показателя интереса от трех обобщенных факторов – информационного расстояния R, информационной сложности S и старения Т.

Под информационным расстоянием будем понимать некоторую усредненную величину, характеризующую удаленность двух субъектов общественного информационного производства, входящих в общую технологическую структуру.

Информационное расстояние между субъектами информационного производства можно описать некоторым многомерным вектором, компоненты которого соответствуют географической, родственной, служебной, этнической и другой близости этих субъектов. Некоторую скалярную норму этого вектора мы обозначим R.

Такое определение информационного расстояния, конечно, не является строгим (жестким). Уточнить его можно только при рассмотрении отдельных небольших групп информационных производств со взвешенными связями друг с другом. Однако, для установления характера зависимости меры информационного интереса от информационного расстояния последнее можно определить также качественно.

Информационное расстояние до последнего времени существенно зависело от географического: чем дальше субъекты по месту их нахождения, тем больше информационное расстояние между ними. Если субъекты информационного производства – люди, информационное расстояние между ними увеличивается по мере удаленности родственных отношений, мест жительства, учебы или работы, профессиональных интересов и пр.

Представим себе, что мы измерили интенсивность информационных потоков между всеми парами субъектов общественного производства и рассортировали их по величине информационного расстояния между субъектами пары. Для каждого достаточно малого интервала информационного расстояния R÷R±∆R найдем среднюю величину интереса по всем парам с информационным расстоянием, лежащем в этом интервале – J(R).

Многочисленные наблюдения показывают, что эта зависимость представляет собой круто падающую функцию аргумента на относительно малом интервале R близком к нулю. Если считать, что интерес субъекта информационного производства к самому себе (R=0) бесконечен, то зависимость среднего интереса от информационного расстояния может быть приблизительно описана выражением J(R)=K/R2, что позволяет сформулировать эмпирический закон информационного тяготения.

Интерес субъектов информационного производства друг к другу обратно пропорционален квадрату информационного расстояния между ними.

Несколько проще определяется зависимость показателя интереса от сложности информации. С достаточной определенностью сложность документа или записи можно измерить количеством содержащихся в них полей или символов. Если сложность документа очень большая, то им интересуется не очень много людей и/или информационных производств.

Полный комплект технической документации на производство самолета, пожалуй, не интересует никого в отдельности. Но наличием свободных мест на конкретные рейсы самолета интересуются многие тысячи людей ежедневно, причем большинство из них не интересуются даже маркой самолета, обслуживающего рейс. Полный комплект документации на самолет содержит сотни тысяч или миллионы записей, а информация о наличии свободных мест укладывается в одной короткой записи. Подсчитав число запросов на документы различной сложности в течение достаточно длительного промежутка времени мы, можем построить зависимость средней величины показателя интереса к документам от их сложности – J(S).

Наблюдения показывают, что эта зависимость также представляет собой круто падающую у нуля кривую. В точке нулевой сложности интерес также равен нулю, поэтому функция величины показателя интереса определяется только для сложности большей некоторой величины. Такую функцию можно представить в виде гиперболы, примыкающей к минимальной сложности s – J(S)= L/(S-s), и мы приходим к эмпирическому закону информационной сложности.

Интерес к документу обратно пропорционален его сложности.

Этот закон наблюдают и используют на практике многие действующие информационные производства. В библиотеке гораздо интенсивнее обращаются к библиографическим карточкам, чем к книгам. Для этого и создаются в библиотеках, архивах, музеях и других хранилищах сложных документов справочные массивы их кратких смысловых идентификаторов. Конечно, никакие справочные массивы не могут полностью заменить необходимость ознакомления со сложными документами. Старение информации также снижает интерес к ней. Это настолько известно всем, что не требует пространного обоснования в данных заметках. Наибольший интерес в библиотеке обычно вызывают стенды новых поступлений. Вчерашняя ежедневная газета мало кого интересует и т. д.

Для многих информационных продуктов процесс старения периодически прерывается проявлением к нему интереса какими-либо субъектами информационного производства. Проявленный интерес одного или нескольких субъектов информационного производства к казалось бы забытому информационному продукту как бы обновляет его.

Эмпирическая зависимость средней величины показателя интереса от старения информации может быть аппроксимирована аналогичной с зависимостью от информационного расстояния возможно только с другим постоянными коэффициентом и другим показателем степени – и мы получаем формулировку эмпирического закона старения информации.

Интерес к информации обратно пропорционален времени, прошедшему с момента ее последнего проявления.

Под моментом последнего проявления понимается момент последнего использования информации в каком-либо акте общения в информационном производстве. Старый документ может быть интересен бесконечно долго, если к содержащейся в нем информации люди обращаются достаточно часто. Примером тому могут быть религиозные трактаты и учебники, содержащие проверенные практикой научные истины – Библия, Коран, алгебра и т. п.

Параметры закона старения информации, определенные в каком-либо информационном производстве, могут помочь в совершенствовании технологии перемещения записей и документов между массивами оперативного, ретроспективного и архивного хранения (большой, средней и малой величины показателя информационного интереса). Интерес, проявленный к ретроспективному и/или архивному документу, позволяет вернуть его в оперативный фонд, где, как правило, реализуются более оперативные технологии копирования и распространения.

Обращаем внимание на тот факт, что формулы замеченных закономерностей варьируют в литературе по этим проблемам в зависимости от метрики принятой авторами и их интерпретации поведения указанных зависимостей в нуле и на бесконечности.

Следует еще раз подчеркнуть, что все три закона хорошо согласуются с практикой. Наблюдаемые отклонения от них, как правило, проявляются в относительно узких специфических информационных производствах, а также вблизи нулевых значений величин информационного расстояния, информационной сложности и времени старения.

Информационные производства развиваются под давлением спроса на информацию, который, в свою очередь, определяется интересом. Развитые информационные производства, эффективно удовлетворяющие спрос (находящиеся в активном общении), развивают интерес к производимой ими информации. Если какое-либо информационное производство успешно развивается, можно утверждать то, что оно подчиняется приведенным выше законам информатики. Если информационное производство топчется на месте или деградирует, то оно по каким-либо причинам не подчиняется этим законам.

Наглядным проявлением законов движения информации является развитие информационных сетей. При передаче в США в 60-гг. в коммерческую эксплуатацию автоматизированной системы связи ARPA предполагалось, что она позволит университетам и крупным промышленным исследовательским центрам объединить мощности своих вычислительных центров для решения сложных математических и проектно-конструкторских задач. Некоторые эксперименты по такому объединению проводятся и до сих пор. Однако очень скоро обнаружилось, что подавляющая часть трафика сети используется для передачи запросов на простейшую информацию типа справок, рефератов и прочее, а также на передачу информации в виде рефератов, справок, банковских поручений и/или их подборок. При этом никаких сложных преобразований информации не требовалось. Для решения сложных задач оказалось эффективнее наращивать собственные вычислительные мощности исследовательских центров.

Еще одним ярким примером действия законов движения информации является развитие алгоритмических языков программирования. В 60-е гг. начали широко применяться три алгоритмических языка: ФОРТРАН – для технических задач, КОБОЛ – для решения экономических задач и АЛГОЛ – для универсального применения. В США разрабатывались и использовались трансляторы для всех этих языков. Кадровые и финансовые проблемы не давали возможности нашей стране поступать так же. Поэтому было принято решение сосредоточить усилия на разработке трансляторов с универсального языка, который к тому же в версии АЛГОЛ-60 был признан международным.

К моменту окончания разработки этих трансляторов для машин советского производства обнаружилось, что в мире более 95 % решаемых на ЭВМ задач относятся к классу простейших технических задач, для которых наиболее эффективным языком является ФОРТРАН, а следующим по интенсивности решения оказались экономические задачи, описанные на языке КОБОЛ. АЛГОЛ оказался элитарным языком и не оправдал затраченных на него в СССР усилий.

Наряду с тремя статическими законами, отмечающими стационарные закономерности движения информации, наблюдаются и динамические закономерности движения информации, связанные с изменением ее содержания в информационных продуктах.

Сама проблема отношения формы (информационного продукта) и содержания (содержащейся и/или извлекаемой информации) является вечной.

Преобразуясь по мере движения от одного информационного производства к другому, информация содержательно может сохраняться, обогащаться и теряться. Оставаясь в пределах вербальной информации можно обнаружить, что она сохраняется в процессах простого копирования, т. е. в процессах переноса символов с одного физического носителя на другой.

Информация может обогащаться и не теряться, если наряду с копированием предмета информационного производства к нему добавляются некоторые комментарии. Заметим, что добавление реквизитов копировального производства обогащает исходный предмет труда информационного производства.

Если в продукте информационного производства присутствует только часть предмета труда и нет комментариев, то происходит потеря информации. Эта процедура часто используется для создания простых и достаточно эффективных идентификаторов сложных информационных продуктов. Однако такая процедура бывает связана и с умышленным, а иногда и с криминальным утаиванием информации.

Частичное присутствие предмета труда в продукте информационного производства вместе с комментариями, не смотря на потери, приводит к обогащению. Обращаем внимание на то обстоятельство, что сопровождение реквизитами производителя частичной копии предмета труда обогащает его. Обогащением следует считать подборки частичных копий предметов труда и результаты их статистической, математической, аналитической и др. обработки и обобщения.

Любое обобщение информации, содержащейся в предмете труда, приводит как к обогащению, так и к потере информации, если в продукте информационного производства отсутствует точная копия предмета труда.

Отмеченную закономерность можно выразить в форме первого закона информационной динамики:

только полное копирование информационных продуктов сохраняет информацию.

Пренебрежение этим законом приводит к печальным последствииям в информационных производствах, связанных с выработкой и принятием решений на основе анализа обобщенной информации о результатах деятельности большого количества других производств – заводов, институтов, школ, организаций и пр.

Наряду с потерями информации при частичном копировании документов при их движении в общественном информационном производстве наблюдается случайное или намеренное искажение информации.

Случайное искажение может быть следствием опечаток при копировании документов (перенос мыслей человека на механические или электронные носители можно считать авторским копированием). Оно может появиться при изложении содержания документа на другом языке – перевод текста.

Такого рода искажения присутствуют всюду. Они представляют определенную опасность при использовании документов в качестве средства производства содержательной составляющей документа. Опечатка в рецептуре лекарства может привести к тяжким последствиям для больного, а некачественный перевод дипломатического документа – к нарушению взаимопонимания между странами.

Для выявления случайных искажений информации в информационных производствах присутствуют специальные процедуры их обнаружения и исправления – такие, как редактирование и корректура текстов документов. Однако всегда остается некоторая не нулевая вероятность появления случайных искажений в любом документе. Этот факт можно сформулировать в виде второго закона информационной динамики:

никакой информационный продукт не гарантирован от случайных искажений при своем движении в общественном информационном производстве.

Гораздо больший урон обществу доставляют намеренные искажения информации, приводящие к сознательной дезинформации и прямому обману отдельного человека, групп людей и общества в целом. Нет ни одного человека в мире, не испытавшего на себе последствий намеренного искажения информации. Ложь и клевета на бытовом уровне, искажение данных в финансовых документах с целью обмана деловых партнеров и государства представляют собой неустранимые и повсеместные явления в обществе.

Если для выявления случайных искажений практика выработала довольно эффективные методы, то намеренные искажения зачастую обнаруживаются только по их, иногда весьма плачевным, последствиям.

Подмеченные свойства намеренных искажений информации можно считать третьим законом информационной динамики:

намеренные искажения информации обнаруживаются только по их последствиям.

Следует упомянуть еще одно распространенное явление, наблюдаемое в движении информации в обществе, – заблуждение, основанное на вере. Феномен веры в обществе нельзя объяснить с позиций современной информатики. Его приходится учитывать при наблюдении такого явления, как отнесение информационных продуктов, основанных на какой-либо вере, к категории лжи людьми другой веры.

Основанные на вере религиозные учения играют неоценимую роль в поддержании нравственных устоев общества, а базирующиеся на ограниченной практике постулаты научных школ позволяют развиваться науке. История человечества демонстрирует бесконечное разнообразие в развитии как религиозных, так и научных постулатов веры. Мы придерживаемся в этой проблеме мета-постулата:

пока практика не опровергла какого-либо постулата веры – оспаривать его бессмысленно.

Конечно, придерживаясь этого постулата, мы не отрицаем необходимости активной борьбы общества с вероучениями, посягающими на человеческую жизнь и достоинство.

Мы отметили только внешне наблюдаемые признаки действия законов движения информации.


На главную