Термин content-analysis впервые начал применяться в конце XIX – начале XX вв. в американской журналистике (см. раб.: Б.Мэттью, А.Тенни, Д.Спиид, Д.Уипкинс). У истоков методологии контент-анализа находились американский социолог Г. Лассуэл и французский журналист Ж.Кайзер.

Так, в начале 60-х гг. Г. Лассуэл осуществил попытку политологического анализа СМИ, исходя из учета формальных критериев. Он ввел в научный оборот некую абстрактную единицу: «слово». Целью работы Лассуэла было получение собственно социологического результата на нетипичном для социологии материале: текстах печатных изданий. Исследователь проделал огромную работу, но, поскольку в методике Лассуэла качественные оценки не были адекватно соотнесены с количественными методами, результаты его трудов с трудом поддавались верификации.

В начале 60-х гг. Ж. Кайзер разработал оригинальную методику статистического анализа периодики. В ее основе лежал подход к тестовому массиву, как информационной системе. Тем самым Кайзер сформулировал теоретическую базу последующего распространения социологических методов в сферы изучения всех нарративных источников, включая эпиграфический и эпистолярный материал. В работе Ж. Кайзера акцентировалось внимание на внешней форме организации материала: его расположении, оглавлении, оформлении и т.д. Кайзер разработал целый комплекс исследовательских процедур, обеспечивающих полную формализацию, как единичного газетного номера, так и совокупности однотипных периодических изданий. Тем самым Ж.Кайзер сформулировал систему, позволяющую фиксировать развитие тенденций в публикациях СМИ.

Свое дальнейшее развитие «кайзеровское направление» методологии контент-анализа получило в работах Э. Морэн. Э. Морен ввела в научный оборот термин «единица информации» - семантический блок, содержание которого отвечает на вопрос: «О чем говориться?» Последнее обстоятельство сделало возможным изучение любых форм организации текстового материала, причем, как на терминологическом уровне, так и на уровне фразы, абзаца, статьи и даже целых книг. Тем самым, Э.Морэн разрушила критерий однородности, применявшийся ранее при статистической обработке нарративов. Взамен, она предложила идеологию «семантических групп», которые, по ее мнению, должны учитываться по тематическому признаку. Кроме того, Э.Морэн разработала концепцию «тона» материала, который определялся социометрически: «положительная информация», «отрицательная», «нейтральная».

Важный вклад в развитие контент-анализа внесли российские и эстонские социологи, особенно А.Н.Алексеев, Ю. Вооглайд, П. Вихалемм, Б.А. Грушин, М. Лауристинь и др.

Для изучения содержания текста традиционно применяется метод контент-анализа. Слово «контент» означает содержимое (или содержание) документа. Под документом при этом понимается не только официальный текст (типа инструкции или правового закона), но все написанное или произнесенное, все, что стало коммуникацией. Так, по словам Ядова В.А., документальной называют любую информацию, фиксированную в печатном или рукописном тексте, на магнитной ленте, на фото- или киноплёнке.

Контент-анализу подвергаются книги, газетные или журнальные статьи, объявления, телевизионные выступления, кино- и видеозаписи, фотографии, лозунги, этикетки, рисунки, другие произведения искусства, а также, разумеется, и официальные документы. В настоящее время в связи с активным использованием электронных средств общения, анализу подвергаются и электронные документы.

Существуют различные определения контент-анализа, некоторые из них не совпадают во взглядах на количественный и качественный аспект метода. Так, существуют две точки зрения на контент-анализ :

Контент-анализ - самостоятельный метод, отличный от обычного содержательного анализа документов

Принципиальное отличие этих методов анализа заключено в явно выраженной строгости, формализованности, систематизированности контент-анализа. Он нацелен на выработку количественного описания смыслового и символического содержания документа, на фиксацию его объективных признаков и подсчет последних.

Федотова Л.Н. выделяет такие присущие методу характеристики: сложность, тщательность, пунктуальность трудоёмкость.

Являясь сторонником данной точки зрения на контент-анализ, В.А.Ядов определяет контент-анализ следующим образом - это перевод в количественные показатели массовой текстовой (или записанной на плёнку) информации с последующей статистической её обработкой.

Вторая точка зрения принимает в расчет оба вида анализа.

Контент-анализ включает в себя как количественный, так и качественный анализ текста.

Первый дополняет второй, а их сочетание углубляет понимание смысла любого текста. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении, но что имеет важный социальный смысл.

Итак, с точки зрения видов проводимого анализа, выделяется два вида: количественный и качественный контент-анализ. При проведении количественного контент-анализа анализируется частота появления в тексте каких-либо единиц, будь упоминания тем или названий компаний. Определения качественного контент-анализа достаточно размыты, в них чаще всего говорится, что при проведении качественного анализа выводы делаются на основе наличия в тексте какого-либо факта. На самом деле, речь идет об интерпретации содержания текста, которое часто встречается в исторической науке и филологии. По этой причине качественный контент-анализ вернее называть интерпретативным.

В западной исследовательской традиции контент-анализ однозначно рассматривается как количественный метод. Несомненно, что количественный контент-анализ обладает более широкой областью применения и надежностью, чем качественный. Одна из наиболее значимых причин – это объективный характер количественных показателей, в то время как интерпретация почти всегда носит субъективный характер. Впрочем, интерпретация результатов количественного анализа тоже имеет субъективные элементы.

По мнению ряда социологов (Маркоффа, Шапиро, Вейтмана и др.), контент-анализ можно было бы назвать «текстуальным кодированием», так как он предполагает получение количественной информации о содержимом документа на основе ее кодирования.

Итак,количественный контент-анализ в первую очередь интересуется частотой появления в тексте определенных характеристик (переменных) содержания.

Качественный контент-анализ позволяет делать выводы даже на основе единственного присутствия или отсутствия определенной характеристики содержания.

На вопрос: "в каких случаях не следует прибегать к количественному анализу?", В.А. Ядов отвечает: если мы имеем дело с уникальными документами, где главная цель изучения - всесторонняя содержательная интерпретация материала.

От количественных данных качественные отличаются тем, что содержание последних несет в себе смысл, непосредственно характеризующий самого их носителя, в то время как количественные указывают на масштаб, объем, интенсивность характеристик изучаемого явления. Качественные данные позволяют раскрыть значения социального явления, количественные показывают, насколько часто оно случается или насколько интенсивно представлено в социальной реальности. Качественные данные обозначают предмет исследования, количественные - показывают, насколько сильно он проявлен в объекте. Продолжая такого рода рассуждения, можно сделать вывод, что одни данные в большей степени ориентированы на создание суждения о социальном явлении, другие - на оценку значимости или тестирование этого суждения. Эти различия в природе двух типов данных привели к тому, что так называемые качественные исследования (исследования, основанные на сборе и анализе качественных данных) стали связывать в большей степени с этапом генерирования или построения теории, а количественные исследования - с ее верификацией.

То, что качественным методам отводится второстепенная роль, значительно сужает их возможности, по мнению Б. Глезера и А. Страусса, выдвинувших "обоснованную теорию" (grounded theory). Авторы помещают свой метод качественного исследования - "обоснованную теорию" - между подходом контент-анализа и подходом, предлагающим выработку некоторых предварительных идей и гипотез. Классический контент-анализ предлагает следующую модель: сначала задается модель кодировки, а потом данные систематически собираются, оцениваются и анализируются по заранее определенным, неизменным и единым для всех них шкалам, которые позволяют придать качественным (словесным) данным квантифицируемую форму.

Метод Глезера и Страусса предполагает постоянное сравнение и перегруппировку данных. Цель метода постоянного сравнения, в котором объединены кодирование и анализ, - генерирование теории более систематически, чем предполагается во втором подходе, при помощи использования развернутого кодирования и аналитических процедур.

Сравнительный метод используется на каждом этапе аналитического процесса построения обоснованной теории. Он включает в себя следующие процедуры: кодирование, выделение ключевых категорий, теоретический отбор и формирование теоретической выборки, теоретическое насыщение и интеграцию теории.

Этапы контент-анализа

	Определение задач, теоретической основы и объекта исследования, разработка категориального аппарата, набор соответствующих качественных и количественных единиц.
	Составление кодировочной инструкции.
	Пилотажная кодировка текста
	Кодировка всего массива исследуемых текстов.
	Статистическая обработка полученных количественных данных.
	Интерпретация полученных данных на основе задач и теоретического контекста исследования.

Контент-анализ состоит из ряда этапов: отбора материалов, выбора единицы анализа, подсчета единиц и, наконец, интерпретации результатов. С точки зрения чистой методологии отбор материалов носит предварительный характер. После определения темы происходит определение потенциального круга источников, в которых может находиться интересующая информация. Затем из этой информации отбирается та, которая содержит значимую с точки зрения исследования информацию. Отобранные материалы далее анализируются. В классических описаниях метода оговаривается, что при большом объеме более или менее однородных источников допустим анализ не всего массива информации, а только части её.

Описывая процедуру контент-анализа, можно выделить несколько этапов, а именно:

1-й этап исследования : Определение задач, теоретической основы и объекта исследования, разработка категориального аппарата, набор соответствующих качественных и количественных единиц.

Данный этап непосредственно связан с составлением программы исследования. Он носит характер качественного анализа, который подготавливает перевод смыслового содержания текста в цифровое выражение для его последующего количественного анализа. В этих целях на основе задач и теоретического контекста осуществляется выбор объекта исследования и определяются конкретные единицы анализа.

2-й этап : Составление кодировочной инструкции.

На этом этапе осуществляется соотнесение категорий и подкатегорий контент-анализа с конкретными содержательными элементами текста, т.е. происходит отыскание в тексте индикаторов выбранных категорий исследования. Здесь либо составляется соответствующий словарь индикаторов категорий, либо даётся развёрнутое описание категорий в терминах исследуемых текстов. Все категории и подкатегории контент-аналитического исследования кодируются, т.е. им даются определённые цифровые или буквенные обозначения, что составляет код данного исследования. Всё это входит в кодировочную инструкцию. В неё также включается обозначение знака информации. Он обычно определяется как "положительное", "отрицательное" и "нейтральное" отношение, что соответственно кодируется как +, -, 0.

Составление кодировочной инструкции имеет очень большое значение, так как по существу в ней находят своё конкретное выражение основные положения методики исследования. Кроме соответствующего определения категорий и подкатегорий и других единиц анализа в кодировочную инструкцию включаются правила кодирования, оговариваются спорные случаи и т.д. При составлении конкретного кода в категориях предусматривается подкатегория "другое", в которую включаются те индикаторы данной категории, которые не вошли в выделенные подкатегории, но тем не менее являются её референтами и поэтому должны быть зафиксированы в частоте (и объёме) её упоминаний. Необходимость включения подкатегории "другое" вызывается тем, что заранее невозможно, а часто и не нужно предусматривать все подкатегории.

3 -й этап: Пилотажная кодировка текста

На данном этапе осуществляется кодировка части исследуемого массива текстов с целью апробации методики, изложенной в кодировочной инструкции. Кодировка текста представляет собой процедуру непосредственного перевода качественных, смысловых единиц (категорий, подкатегорий) через нахождение их индикаторов в тексте в количественные единицы, т.е. перевод текстов в условные обозначения - коды (цифры или буквы, которыми обозначены в кодировочной инструкции те или иные подкатегории). Подобная пилотажная кодировка даёт возможность проверить надёжность методики, т.е. испытать её на обоснованность (соответствие задачам и теоретическим понятиям исследования) и устойчивость (воспроизводим ость результатов)

Обоснование полноты объёма выделяемых смысловых единиц доказывается следующим образом: выделяются все смысловые единицы из первого анализируемого текста, затем из второго текста - те же единицы плюс ранее не встречавшиеся, из третьего документа - те же, что встречались в двух предыдущих, плюс дополнительные и т.д. После изучения 3-5 очередных текстов, в которых не попадается ни одной новой единицы, ранее не фиксированной в предыдущих документах, можно полагать, что "поле" смысловых единиц из изучаемого материала исчерпано.

Устойчивость данных определяется при помощи повторного кодирования тех же документов тем же кодировщиком ("устойчивость во времени") или разными кодировщиками по единой инструкции ("устойчивость среди аналитиков").

4-й этап : Кодировка всего массива исследуемых текстов.

Осуществляется процесс квантификации, т.е. перевод в цифровое выражение всей совокупности исследуемых текстов. Регистрация частоты (и объёма) упоминания категорий и подкатегорий контент-анализа может производиться либо в заранее подготовленных таблицах, либо на отдельных карточках и перфокартах.

5-й этап: Статистическая обработка полученных количественных данных.

Эта обработка осуществляется вручную или на ЭВМ. Нередко оба эти способа используются одновременно в сочетании. Существуют специальные компьютерные программы, помогающие осуществить анализ более оперативно, такие как Контент-анализ 1.6, WINMAX, ATLAS/ ti, NUDIST, а также AQUAD, CAQDAS, ETHNOGRAPH.

Статистическая обработка цифрового материала, полученного в процессе кодировки, не отличается фактически по своим методам от статистической обработки данных, полученных в других видах социально-психологических исследований. Обычно используются процентные и частотные распределения, разнообразные коэффициенты корреляций и т.д. Вместе с тем используются и особые способы количественной обработки данных (см. формулу "удельного веса" смысловых категорий в общем объёме текста, предложенную А.Н. Алексеевым).

6 -й этап: Интерпретация полученных данных на основе задач и теоретического контекста исследования.

На данном, последнем этапе исследования, как и на первом, связанным с составлением программы, особенно ярко выступает качественная сторона контент-анализа в отличие от количественного аспекта, преобладающего на промежуточных этапах. Для адекватной интерпретации результатов и их соотнесения с данными, полученными с помощью других методов, особенно большое значение имеет учёт более широкого теоретического и социального контекста.

Формализованность, систематизированность и строгость контент-анализа проявляется в следующем. Прежде, чем непосредственно анализировать текст документа, исследователь определяет категории анализа, т.е. ключевые понятия (смысловые единицы), имеющиеся в тексте и соответствующие тем дефинициям и их эмпирическим индикаторам, которые зафиксированы в программе исследования. При этом желательно избежать крайностей. Если за категории анализа будут приняты слишком общие (абстрактные) понятия, то это предопределит поверхностность анализа текста, не позволит углубиться в его содержание. Если же категории анализа будут предельно конкретными, то их окажется слишком много, что приведет не к анализу текста, а к его сокращенному повторению (конспекту). Нужно найти золотую середину и постараться достичь того, чтобы категории анализа были: а) уместными, т.е. соответствовали решению исследовательских задач; б) исчерпывающими, т.е. достаточно полно отражали смысл основных понятий исследования; в) взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме); г) надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.

Единицы контент-анализа После определения системы категорий анализа выбирается соответствующая им единица анализа текста.

Богомолова Н.Н. И Стефаненко Т.Г. предлагают разделять единицы контент-анализа на две большие группы:

качественные

количественные .

Качественные единицы контент-анализа отвечают на вопрос, ЧТО надо считать в тексте, а количественные единицы отвечают на вопрос, КАК надо считать.

К качественным предлагают отнести категории и их референты в тексте (индикаторы). Следует обратить внимание на то, что для обозначения различных единиц контент-анализа используются разнообразные термины, лишь основная единица контент-анализа - категория - признаётся всеми авторами. Большой разнобой в терминологии при обозначении различных единиц контент-анализа в определённой степени затрудняет понимание процедуры данного метода.

Категории могут подразделяться на более мелкие качественные единицы - подкатегории. Индикаторами категорий называются те элементы текста, те единицы содержания, которые служат референтами, качественными признаками соответствующих категорий и подкатегорий. В зависимости от специфики исследования индикаторы категорий могут выражаться в виде отдельных слов, словосочетаний, суждений, тем и т.д.

За единицу анализа может быть принято: а) слово б) предложение в) тема г) идея д) автор е) персонаж ж) социальная ситуация з) часть текста, объединенная чем-то, что соответствует смыслу категории анализа

Когда контент-анализ выступает единственным методом информации, оперируют не одной, а сразу несколькими единицами анализа.

При использовании самой простой единицы анализа, слова, очень легко потерять контекст упоминания. Прямой подсчет количества упоминаний дает так называемые «простые частоты». Однако для сравнения, например, количества упоминаний такой показатель не подходит в силу того, что является нестандартизированным. Возникает необходимость использования «относительных частот», т.е. количество упоминаний на какую-либо единицу текста (общее число слов в публикациях, тысячу слов, количество предложений, абзацев, публикаций и т.д.).

Количественными единицами контент-анализа являются единицы счёта и единицы контекста.

Единицы контекста используются для обозначения того сегмента текста, в пределах которого определяется частота упоминания соответствующих категорий и подкатегорий. Единицей контекста может служить предложение, статья, ответ на вопрос анкеты, интервью и т.д. Затем устанавливаетсяединица счета , т.е. количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.

Богомолова Н.Н. И Стефаненко Т.Г. выделяют два вида подсчётов частоты упоминаний категорий и подкатегорий при квантификации: а) сплошной, терминологический, б) сегментарный, типологический.

При сплошном подсчёте регистрируются, а потом подсчитываются все появления индикаторов данной категории или подкатегории. При сегментарном, тематическом подсчёте упоминаний категорий регистрируется лишь первое появление данной категории в единице контекста, а повторные упоминания этой категории в данной единице контекста не учитываются.

Единицей счёта может быть объём - физическая протяженность или площадь текстов, заполненная смысловыми единицами. Объём упоминаний категорий может измеряться различными способами: подсчётом числа строк, печатных знаков, квадратных сантиметров площади, посвященных данной категории и т.д.

В основу системы кодирования должна быть заложена по крайней мере одна (или несколько) из следующих четырех характеристик содержания текста: частоты, направленности, интенсивности и пространства. Как уже отмечалось выше, чаще всего измеряют частоту и объём занимаемого пространства. В исследовательском проекте, основанном на контент-анализе, исследователь может замерить как одну, так и все четыре характеристики. Поясним, что собой представляет каждая из них.

Частота. Это всего лишь фиксация и подсчет, имеет ли нечто место или нет, а если да, то как часто. Например, сколько пожилых людей появляется в телевизионных программах на протяжении одной недели? Какова их доля среди всех персонажей? Или же какова доля этих программ среди остальных?

Направленность. Речь идет об указании направления сообщений внутри содержания некоего континуума (их позитивный или негативный, поддерживающий или опровергающий характер). Например, исследователь может разработать перечень способов показа ситуаций, в которых действуют пожилые люди. Способы эти могут быть позитивными (например, дружелюбный, мудрый, уравновешенный человек), либо негативными (например, непристойный, тупой, самовлюбленный).

Интенсивность. Это сила или мощь сообщения в заданной направленности. Например, негативная характеристика забывчивости может быть смягчена (забыл взять ключи, уходя из дома; не сразу вспомнил имя человека, которого не видел несколько лет) или преувеличена (не помнит, как его зовут, не узнает своих детей).

Пространство. Исследователь может зафиксировать размер сообщения или количественно охарактеризовать пространство, им занимаемое. Пространство письменного текста измеряется путем подсчета слов, предложений, абзацев или места, отведенного сообщению на странице (например, в квадратных дюймах или сантиметрах). Для измерения видео- и аудиотекстов можно использовать количественные характеристики времени. Например, персонаж может присутствовать в течение нескольких секунд или появляться периодически в каждой сцене двухчасовой программы.

В общем виде процедуры подсчёта при контент-анализе аналогичны стандартным приёмам классификации по выделенным группировка, ранжирования и шкального измерения. Для исчисления результатов контент -анализа используются и специально разработанные формулы.

А.Н. Алексеев предложил для оценки "удельного веса" смысловых категорий в общем объёме текста следующую формулу, указывающую на уровень интенсивности представленной в тексте определённой темы:

Укс - "удельный вес" данной смысловой единицы

Кгл - число случаев, когда смысловая единица оказалось главной

Квт - число случаев, когда та же единица оказывается второстепенной

E - сумма анализируемых текстов (документов)

Специальным способом, разработанным для нужд контент-анализа, является методика Ч. Осгуда анализа зависимости элементов для расчёта совместной встречаемости различных элементов в тексте. Процедура данной методики состоит в том, что после подсчёта совместной встречаемости единиц анализа, рассчитывается квадратная матрица возможных и фактических совместных появлений этих единиц в тексте.

» Контент-анализ социология

Контент-анализ - описание метода

Контент-анализ (от англ. contens содержание) - метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта - окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы - язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа - наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий - знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа - лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа - контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица - «предложение». Наконец, необходимо установить единицу счета - количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации - 12-16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Необходимым условием является разработка таблицы контент-анализа - основного рабочего документа, с помощью которого проводится исследование. Тип таблицы определяется этапом исследования. Например разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Для регистрации единиц анализа составляется другая таблица - кодировальная матрица. Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью таких матричных листов. Если выборка невелика (до 100 единиц), то можно проводить двумерный или многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Эта работа трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.

Важным условием контент-анализа является разработка инструкции кодировщику - системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, дается операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д. Процедура подсчета при количественном контент-анализе в общем виде аналогична стандартным приемам классификации по выделенным группировкам ранжирования и измерения ассоциации. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса, предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных,

BC/NW 2013, №2 (23):10

BC / NW 2013, №2 (23):10.4

ТЕХНОЛОГИИ СОЗДАНИЯ И ОБРАБОТКИ ЦИФРОВОГО МЕДИА КОНТЕНТА. СОВРЕМЕННЫЕ СТАНДАРТЫ 3D-ВИДЕОКОНТЕНТА

Кушелев И.Ю.

(ФГБОУ ВПО "Национальный исследовательский университет "МЭИ")

1. Введение.

Основные понятия. Типология медиа контента. Тенденции.

Наблюдения за развитием информационных технологий за последние двадцать лет дает основания констатировать тот факт, что сфера информационной медиа среды переживает период существенных изменений, в результате которых классическая древовидная система распространения информации радикально меняет свою топологию, превращаясь в многомерное сообщество, в котором каждый может общаться с каждым или с выборочной группой или со всем сообществом одновременно . Возникают совершенно новые формы общения: форумы, блоги, социальные сети и т.д. . Конечно, эти процессы необходимо изучать и всячески анализировать, чтобы выявить закономерности и прогнозировать дальнейшее развитие процесса. Применим классический способ изучения сложного процесса - разобъем сложное на элементарные составляющие и выявим закономерности их участия в общем процессе.

1.1. Контент .

С понятием «контент» мы сталкиваемся ежедневно. Однако не каждый может дать правильное определение этому понятию. Что же такое «контент».

Контентом называется все информационное наполнение какого-либо ресурса электронного (сайт, электронный журнал, форум и т.п.) или классического - печатного (книга, газета, научный труд и т.д.). В переводе с английского языка «content» означает «содержание». К контенту можно отнести любое информационное наполнение: тексты, таблицы, изображения, видеоряд и т.д. Например эта статья также является контентом.

1.2. Медиа контент.

Всемирная информационная сеть (world wide web) развивается очень быстро. Развитие новых технологий приводит к тому, что очень быстро начинают меняться и способы представления информации. Если в начале развития информационных сетей основным передаваемым контентом был текст, то в настоящее время более эффективным и наглядным способом ее подачи является использование медиа контента, определим это понятие.

Термин медиа (от английского media), в зависимости от контекста, может означать следующее: Медиа данные - совокупность различных видов данных, содержащих дополнительную звуковую и визуальную информацию - графику, видео, анимацию (т. н. мультимедиа). Разделение мультимедиа контента на компоненты позволяет структурировать его в общем виде, исходя из восприятия пользователя ,. Однако при разработке мультимедиа продуктов требуется детальное описание контента в специальной терминологии, однозначно определяющей структурные единицы с учетом их технологических особенностей и функциональных возможностей.

Минимальной структурной единицей (термом) мультимедиа контента является медиаэлемент. Медиа элементы это элементарные составляющие, комбинирование которых и рождает мультимедиа контент.

Типологически можно выделить две категории медиаэлементов: статические и динамические. Первая категория - текст (символьная информация), графическое неподвижное изображение. К группе динамических (меняющихся во времени) медиаэлементов относятся: звуковой ряд, видеоряд.

Цифровые кодировки медиаэлементов имеют множество форматов, так что каждый медиаэлемент может быть представлен в нескольких форматах (так например статическое цифровое изображение может быть сохранено в стандартизированных типах графических файлов: bmp - bit map picture, jpeg - joint photographic experts group). Медиаэлемент любого формата располагается в одном компьютерном файле.

Структурная единица мультимедиа контента следующего, более высокого уровня – медиа комбинация объединяет в одном файле несколько динамических медиаэлементов. Медиа комбинация – это синхронизированная совокупность одинаковых или разных динамических медиаэлементов, размещаемых в одном компьютерном файле. Типичные примеры медиа комбинаций – стереозвук (например: wav - wave form audio format, mp3 - более точно, от англ. MPEG-1/2/2.5 Layer 3; но не MPEG-3), озвученные видео или анимация (например: avi - Audio Video Interleave чередование аудио и видео, mov - Apple QuickTime Movie).

Не следует путать медиа комбинации с динамическими медиаэлементами, в которые включена имитация статических. Например, фрагментом видео может быть статическое изображение или текст, получаемые путем повтора идентичных видеокадров, что не мешает отнесению всего видеофайла к динамическим медиаэлементам. Управление воспроизведением линейной динамической последовательности путем перемещения по оси времени не является взаимодействием с контентом, иными словами – контент медиа комбинаций не является интерактивным.

Объединение медиаэлементов и/или медиа комбинаций для одновременного воспроизведения определяется как мультимедиа композиция. С технологический точки зрения основное отличие композиции от элемента и комбинации заключается в использовании группы файлов, каждый из которых содержит некоторый медиаэлемент или медиа комбинацию. К мультимедиа композициям относится также 3D анимация, составляющие которой располагаются в нескольких файлах.

Если существует согласованный алгоритм представления медиаэлементов и медиа кобинаций – то такое представление уже является программным компонентом, реализующим размещение элементов медиа контента на экране, распределение во времени демонстрации аудиовизуальных элементов или при наступлении определенного события, их синхронизацию и т.д. Для интерактивной медиа композиции программный алгоритм определяет также ответные реакции на действия пользователя (оператора интерактивного медиа контента) . Однако, допускаются и неинтерактивные мультимедиа композиции, например, слайд-шоу или 3D анимация происходящие полностью в автоматическом режиме.

Интегрирующей, содержательно и функционально завершенной единицей мультимедиа контента является сцена. Мультимедиа сцена – полноэкранный интегральный терм (образ), объединяющий единым замыслом и логическими связями медиа элементы, медиа комбинации и мультимедиа композиции для представления определенной совокупности объектов и процессов в интерактивном алгоритме .

Мультимедиа сцена полностью занимает отведенное данному программному приложению поле контента, для построения сцены используется множество файлов, обязательным условием является интерактивность всех или части представляемых в сцене объектов и/или процессов.

Динамично обновляемый медиа контент вызывает большой интерес для интернет-аудитории. Именно поэтому он широко используется для привлечения к интернет - ресурсам новых пользователей и удерживания уже имеющихся. Интерес пользователей к медиа контенту возрос еще и благодаря существенному увеличению скорости доступа к ресурсам интернета, стандартизации конечных пользовательских устройств и соответствующих программных сред разработчиков приложений и контента. В парке настольных персональных компьютерных систем – семейство OS Windows, Mac OS и Linux; на мобильных платформах – iOS, android и windows phone. Выдержки из статистики компании Apple на конец сентября 2013 года подтверждают высокий рост в процессе создания и дальнейшего потребления медиа контента: если на начало 2012 года в магазине AppStore было выложено 750 000 мобильных приложений то на сентябрь 2013 года их количество выросло до 950 000, что интересно 50 000 новых приложений появились лишь за два последних месяца . Общее количество загрузок приложений из AppStore превысило 40 миллиардов на январь 2013 года, из них 20 миллиардов скачиваний приходится на 2012 год.

В настоящее время, каждую минуту на ресурсе YouTube загружается 35 часов видеоконтента или более 50 000 часов в месяц. В месяц на Youtube загружается пользовательского видео больше, чем произведено всеми телевизионными каналами и студиями США с момента начала их работы. Для сравнения: в начале 2008 года в YouTube загружалось 10 часов в минуту. Объем рынка цифрового контента в мире в 2008 г. превышал 700 млрд. долл. США, в России - 2,5 млрд. долл. В 2011 г. объем мирового рынка оценивается более, чем в 1 трлн. долл. США, в России – 5 млрд. долл. США . Растет объем контента, передаваемого через сети мобильной связи: объем передаваемого трафика в российских сотовых сетях с введением формата 3G удвоился.

Таким образом, понимание закономерностей создания и распространения медиа контента является одной из основ для понимания того, как развиваются и будут развиваться массовые коммуникаци.

В следующем разделе мы более подробно рассматрим типология контента и его создателей, а также возможности распространения медиа контента.

(Продолжение следует )

Список литературы :

1. Capitalising on Convergence: Delivering Value and Driving Growth in the Digitally Converged World, Intellect, 2005.

2. The Network Society: A Shift in Cognitive Ecologies? by Mathew Wall-Smith, 2010.

3. The Death of “e” and the Birth of the Real New Economy, Peter Fingar and Ronald Aronica, 2000.

4. Digital Radio Broadcast Bureau, DAB Digital Sales Top 3 Million, 2 May 2006.

5. Computing: BBC’s IT outsourcing may be start of trend, Daniel Thomas, 2 March 2005.

6. Facing Piracy: Digital Theft in the Filmed Entertainment Industry, Deloitte MCS UK Ltd., 2004.

7. APP Empire, Chad Mureta, John Wiley & Sons, Inc., 2013.

8. iPhone and iPad APPS marketing, Jeffrey Hughes, QUE, 2012.

элементы логич. модели предмета контент-анлиза (см.). Содержание текста может быть измерено при помощи двух типов измерения (мер): единиц протяженности и единицы частоты. Единицы протяженности характеризуют содержание в целом, без учета его деления на элементы. В качестве таких единиц чаще всего используются квадратный сантиметр (дюйм), стандартные строки верстки, минута (час) эфирного времени. Использование таких единиц позволяет достаточно точно определить объем внимания коммуникатора к различн. категориям анализа. В силу своей объектности указанные единицы пригодны для измерения только тех свойств коммуникатора, к-рые непосредственно выражаются в его тексте. Единица частоты позволяет измерять поведение и на уровне содержания текста (в частности, измерять структуру тематич. содержания текста). Если мера протяженности представлена достаточно большим видом единиц измерения, то мера частоты представлена единственной единицей измерения - единичным присутствием элемента содержания. Применительно к тексту приведенные единицы исчерпывают арсенал единиц измерения, поскольку текст и его содержание характеризуются только двумя свойствами, к-рые могут быть измерены: протяженностью и дискретностью структуры этой протяженности. Поэтому выделение большого числа типов единиц измерения (мер) является признаком нестрогости или эклектизма. Все единицы анализа в зависимости от характера их связи с единицами измерения можно разбить на два типа: частотные и частотно-протяженные. К частотным в качестве меры приложима только единица частоты (напр., к ним относятся слово, суждение); к частотно-протяженным - оба типа единиц измерения (напр., сообщение). В том случае, когда возможно использование обоих типов единиц измерения, встает проблема оптимальности выбора, сущность к-рой состоит в том, чтобы ответить на вопрос: "Выражается ли данный признак наиболее адекватно при помощи протяженности или при помощи частоты?". Ответ на такой вопрос не является тривиальным и требует проведения специальных исследований. В принципе можно предположить, что число типов единиц анализа велико. Можно считать, что каждая из единиц содержания текста может быть потенциально единицей анализа. Введение новых единиц анализа определяется соответствующими теоретич. предпосылками. Поскольку запас языковых единиц содержания (как типов) ограничен, то и число единиц анализа, рекрутируемых из этой сферы, невелико. Значительный по объему источник потенциальных единиц анализа представляют тематич. элементы содержания текста. Единицы анализа могут быть классифицированы по следующим трем основаниям: языковые-тематич., объектные-необъектные, коммуникационные-структурные. Как правило, языковые единицы (элементы структуры языка) крайне редко используются в качестве единиц анализа в социологич. исследованиях. Тематич. единицы (элементы структуры содержания текста) в настоящее время занимают все большее место в контент-аналитич. исследованиях (напр., тема сообщения, герой, ситуация). Те единицы анализа, к-рые непосредственно представлены в тексте, являются объектными. К ним относятся единицы протяженности (сообщение, рубрика, слово, предложение). К необъектным единицам относятся все тематич. единицы. Противопоставление коммуникационных единиц структурным связано с онтологическим статусом единиц анализа. Естественно, что все языковые единицы обладают этим статусом (т. е. используются и при создании текста, и при его потреблении). Таким статусом обладают и нек-рые тематич. единицы (напр., тема сообщения). Наиболее часто используются следующие единицы анализа. Слово (словосочетание) - наименьшая единица анализа (из языковых), приемлемая в социологич. исследовании; используется в анализе политич. языка, исследовании стиля сообщений. Сообщение - одна из наиболее часто используемых единиц анализа. Характеризуется целостностью. Размер и структура сообщений зависят от типа коммуникации. Выделение сообщения в структуре текста обычно не требует к.-л. специальных инструкций. Герой (характер) - определенный тип деятеля, обладающего четко выраженными соц. чертами. Наиболее часто эта единица используется при анализе небольших произведений литературы (рассказ, очерк). Примером этой единицы является герой информации, выделяемый в содержании на основе рода его занятий. Тема - очень широко применяемая и очень плохо разработанная единица анализа. В амер. литературе термины "суждение" и "тема" употребляются как синонимы, причем чаще всего тема определяется через понятие суждения. Понятие темы используется в таких случаях в категориальном значении, т. е. говорится скорее о тематич. признаке, чем о единице анализа, ибо темы могут выделяться и в целых сообщениях, и в их частях различн. объема (абзацах, предложениях). Тема может быть выражена не только суждением, но и словом, и словосочетанием (напр., наименование рубрики в газете). Суждение - наиболее мощная и сложная в использовании единица анализа. В качестве его определения может быть принято определение суждения в логике с учетом двух особенностей использования этой единицы в контент-анализе. Во-первых, суждение обладает высокой степенью конструктивности и поэтому, вероятно, не является коммуникационной единицей. Во-вторых, структура суждения как единицы анализа обычно является более расчлененной и сложной, чем в логике. Чаще всего она состоит более чем из трех элементов (субъекта, предиката и связки). В общем виде структура суждения может быть представлена в фасетной форме, т. е. в виде ряда ячеек, в к-рых расположены однотипные элементы. Такое представление означает, что при конкретном наполнении такая структура порождает огромное число типов суждений (напр., при шести фасетах и числе элементов в каждом из них от 5 до 10 общее число типов суждений может достигать нескольких миллионов). Практически в исследуемых текстах на один тип суждения в среднем приходится 1-2 упоминания, следовательно, значительное число типов суждений вообще не встречается в содержании текста. Поэтому чаще всего информация анализируется не в виде суждений в целом, а в виде отдельных фасетов, т. е. единицей анализа практически является элемент суждений. При использовании ЭВМ можно выделить эмпирически наиболее значимые в статистич. отношении типы суждений и вести их анализ. Возможно также и такое решение: определить уровень отождествления суждений (напр., на основе их модальности), и различать суждения согласно этому уровню; при этом число типов суждений уменьшается до приемлемой величины (5-10 типов). Суждение является гибкой единицей анализа, может быть использовано для относительно небольших частей содержания текста. Ситуация - это единица, к-рая имеет целью представить содержание текста в виде структуры, отражающей фрагменты действительности. Фрагменты могут быть представлены не только в виде действующего лица, но и в виде мотивов, средств, целей деятельности. В состав структуры ситуации могут входить следующие элементы: субъект деятельности, локальность субъекта (сфера соц. жизни и т. п.), характер представления субъекта коммуникатором, знак отношения коммуникатора к субъекту, интересы субъекта, его цели, мотивы действий и т. п. Близкой по замыслу к ситуации является такая единица анализа, как единица действия, к-рая может быть использована как элемент ситуации. Классич. примером такой единицы является функция действующих лиц волшебных сказок, разработанная В.Я.Проппом. В большинстве контент-аналитич. исследований используется несколько единиц анализа. Это связано с кодировочной операцией в контент-анализе, где необходимо взаимодействие единиц анализа. Указанное взаимодействие может быть рассмотрено в связи с двумя процессами, во многом обеспечивающими получение аналитич. информации (т. е. информации о предмете исследования, получаемой в соответствии с задачами исследования): процессом кодирования и процессом структурирования закодированного материала. В процессе кодирования выделяются два аспекта: разбиение содержания текста на единицы (юнитизация) и их классифицирование по категориям анализа. В рамках разбиения содержания текста выделяются единицы: выборочн., наблюдения, фиксирующая, кодировочная контекста. Эти пять типов единиц представляют наиболее общий случай. В отдельных исследованиях число единиц может быть меньшим. Границы между типами единиц являются достаточно подвижными, т. е. возможен переход конкретных единиц из типа в тип. Выборочн. единица определяет объем исследуемого текста. Чаще для этого используется макросообщение (номер газеты, день вещания или программа вещания). Однако можно представить себе иерархич. структуру выборки, в к-рой в роли единиц последовательно выступают, напр., номер газеты, материал, суждение. Единицей наблюдения, т. е. единицей, в рамках к-рой производится семантич. анализ содержания текста с целью кодирования, обычно является сообщение (напр., статья, очерк и т. а). При иерархич. структуре выборки в роли единицы наблюдения могут выступать и части сообщения. Фиксирующая единица - это та часть содержания текста, в пределах к-рой происходит фиксация категорий анализа. Смысл введения этой единицы определяется спецификой частотного измерения (основанного на использовании единицы частоты). В границах фиксирующей единицы появление категории фиксируется только один раз. Выбор этой единицы сказывается на рез-тах анализа. Поэтому важно определение относительной протяженности единицы фиксирований. Пока часто используется механич. разбиение текста на фиксирующие единицы (напр., 50, 100, 150 строк). Однако следует признать, что механич. разбиение не является обоснованным и очень плохо связано с тематич. структурой содержания. По-видимому, объем указанной единицы должен определяться характером коммуникационного процесса. Кодировочная единица обеспечивает фиксирование категорий анализа и тем самым измерение интенсивности появления признаков объекта исследования. В качестве кодировочных обычно выступают такие единицы, как слово, тема, сообщение, суждение, ситуация, действие. Кодировоч. единица зависит от единицы контекста - части содержания текста, знание к-рой позволяет произвести классифицирование единицы содержания, релевантной принятой кодировочной единице, и соответствующую категорию анализа. Естественной единицей контекста выступает сообщение. (В этом случае может совпадать с единицей наблюдения; однако факт совпадения на означает, что не нужно функциональное разграничение этих типов жизнь ниц. ведь эти единицы выполняют различ. функции) Возможно использование меньших и больших, чем сообщение, единиц контекста (напр., абзаца, страницы). При использовании для измерения единиц протяженности фиксирующая единица сливается с кодировочной. В этом случае процесс кодирования осложняется необходимостью измерения протяженности единиц содержания, релевантных кодировочной единице. Основание классификации связано с выделением единицы анализа, при помощи к-рой производится структурирование закодированного материала, т. е. представление структуры ана-литич. информации. Здесь выделяются единицы классификации и единицы структурирования. В роли первых выступают единицы, используемые в качестве кодировочных. Единицы структурирования - это единицы, в терминах к-рых ведется анализ. Выбор единицы структурирования обосновывается целями исследования и часто существенно влияет на выводы аналитика. Существует еще одна возможность взаимодействия единиц, к-рая связана со стадиями анализа. Поскольку большая по объему единица анализа может быть охарактеризована при помощи меньших, то при использовании в качестве кодировочных наименьших (из приемлемых для проводимого исследования) единиц мы сохраняем возможность использовать закодированный материал для целей интегрирования на уровне единиц анализа. Так, возможен переход от слов и суждений к сообщениям. Конечно, возможность такого перехода определяется категориальной системой предмета исследования (т. к. иногда единицы анализа определенного объема могут быть нерелевантными принятым в исследовании категориям анализа). Наиболее оптимальным является вариант одновременного интегрирования категорий и единиц анализа. Он дает возможность измерения в одном исследовании различн. уровней содержания текста. Лит.: см. к ст. Контент-анализ. Е.Л. Гаршис.

1. ТИПЫ ИНФОРМАЦИОННЫХ МАССИВОВ И ЕДИНИЦЫ КОНТЕНТ-АНАЛИЗА

Основа контент-анализа – это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа – это выяснение того, что считать; иными словами, определение единиц анализа. Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано. Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. – иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации. Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива. В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов. Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки. Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп. Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении». Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)

1.1. «Физические» единицы. Под таковыми понимаются сущности с четко очерченными физическими, геометрическими или временными границами, как, скажем, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п. Идентификация и подсчет их не составляют особого труда, однако необходимость в таком подсчете возникает достаточно редко; подсчет, скажем, листовок или книг чаще всего осуществляется с целью оценки представленности какой-то тематики или оценки, т.е. реально используются единицы других, характеризуемых ниже типов единиц – обычно концептуальных, пропозициональных или тематических.

1.2. Структурно-семиотические единицы. Под таковыми имеются в виду основные элементы семиотических систем (см. СЕМИОТИКА). В случае естественного языка это:

– лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т.е. то, что фиксируется в словарях) и

– грамматические показатели (например, отрицательные частицы или показатели таких категорий, как, скажем, отглагольные имена).

Количественный подсчет встречаемости слов в тексте – это, пожалуй, самый простой вариант контент-анализа, который, однако, зачастую способен давать небезынтересные результаты. Чаще всего, конечно, подсчитываются «интересные», или «ключевые» слова и/или словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм; значимые атрибуты наподобие жесткий, решительный; эмоционально окрашенная оценочная лексика типа разрушительный, неудержимый, подлый, кошмарный, человеконенавистнический; слова-пароли (тоже зачастую эмоционально окрашенные) типа патриоты, коммунофашисты, мондиалисты или белопридурки; слова, сильно активизированные в конкретный момент времени, вроде «Семья» или «Мабетекс» в начале осени 1999 или все та же «Семья» и «Медиа-Мост» в конце весны 2000 в России, терроризм во множестве стран мира осенью 2001 и т.д.

Контент-анализ грамматических категорий представляет собой достаточно редкое исследовательское начинание, стимулом к которому является гипотеза (весьма правдоподобная) о том, что употребление грамматических форм в меньшей степени, чем употребление лексики, контролируется автором текста и поэтому может послужить источником таких сведений о нем, которые он сам вовсе не собирался делать доступными своим читателям. В политической психологии существует специальная исследовательская методика, так называемый анализ когнитивной сложности, которая на основе фактически контент-аналитической процедуры позволяет делать выводы о том, насколько простым (или, напротив, сложным) является видение политической ситуации автором текста и как оно меняется со временем. Единицами контент-анализа, лежащего в основе оценки когнитивной сложности, являются, например, относимые обычно к служебной лексике категорические квантификаторы типа всегда, никогда, всякий, которым противостоят квантификаторы типа иногда, некоторый и т.п.; категорические (вроде знаменитого однозначно) оценки истинности в противоположность осторожным возможно или не исключено, что; языковые средства дифференцированного рассмотрения ситуации наподобие с одной стороны... с другой стороны; упоминания взаимодействия, баланса, взаимозависимости, компромисса и т.д. Известны и примеры контент-анализа чисто грамматических средств, например исследования соотношения глагольных форм, обозначающих, соответственно, процессы и результаты, исследование номинализованных (с отглагольными именами типа построение, усиление и т.п.) конструкций в языке партийных документов брежневского времени, отрицания в политическом тексте и др. Поскольку объектами контент-анализа могут быть не только вербальные (естественноязыковые), но и другие виды текстов (например, карикатуры, фотоснимки, рекламные клипы), постольку в числе структурно-семиотических единиц контент-анализа могут присутствовать визуальные и звуковые (чаще всего музыкальные) образы и символы, которые могут анализироваться на тех же основаниях, что и единицы естественного языка.

1.3. Понятийно-тематические единицы. В большинстве случаев контент-аналитик интересуется не словами как таковыми и тем более не грамматическими категориями, а стоящими за словами значимыми для него понятиями, темами, проблемами – иными словами, тем, что можно назвать понятийно-тематическими единицами. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в анализируемом информационном массиве слова преступность, но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и проч. Тот, кого занимает проблема свободы, должен в своем анализе реагировать на упоминания давления на прессу, чиновничьего произвола, контролируемости СМИ, доступа к Internet и т.д. Интересующийся отношением общественного сознания к каким-то реалиям должен принимать во внимание самый широкий спектр позитивных, негативных и некоторых более конкретных оценок, которые могут быть даны этим реалиям, причем эти оценки вовсе не обязательно должны присутствовать в виде оценочных суждений.

1.4. Референциальные и квазиреференциальные единицы. К референциальным, точнее, конкретно-референциальным единицам относятся обозначения реальных личностей (как современных, так и исторических деятелей), событий, городов, стран, организаций и т.д.; это, так сказать, «энциклопедический» блок единиц анализа. Этот блок, особенно в части персоналий, весьма важен и диагностичен, поскольку позволяет определять личностные рейтинги и, что не менее существенно, оценивать идеологические системы с точки зрения присутствующих в них референтных «знаковых» фигур, своего рода «идеологических героев». Примером интересного исследования роли референтных фигур в российском оппозиционном дискурсе 1996–1997 может послужить работа А.В.Дуки. Способы обозначения в тексте конкретных фигур могут различаться (В.В.Жириновский, Владимир Вольфович, Вольфыч, Жирик, сын юриста, лидер ЛДПР, самый провосточный российский политик, главный либеральный демократ, либералиссимус), однако конкретно-референтная единица здесь во всех случаях одна. Квазиреференциальные единицы в политических текстах чаще всего бывают представлены обозначениями всякого рода «сил» – коллективных актеров политической сцены, референция которых может колебаться от реальной (типа КПРФ) через обобщенную (коммунисты, либералы, Запад, исламисты) к откровенно мифологизированной (мировая закулиса). Независимо от своей референции все эти персонажи присутствуют в идеологическом пространстве, им могут приписываться действия и оценки, и отношение к ним является немаловажным политико-идеологическим фактором. Грань между квазиреференциальными и некоторыми типами понятийно-тематических единиц размыта в силу того, что некоторые политические понятия способны и даже склонны (например, та же преступность) к метафорической персонификации. 1.5. Пропозициональные единицы и оценки. Их примеры приводились выше – Карфаген должен быть разрушен или Россия задыхается без инвестиций. Собственно говоря, это примеры высказываний, в основе которых лежат пропозиции – описания конкретных положений дел (ситуаций) безотносительно к их модальности (в первом примере – требование, во втором – констатация). Наряду с пропозициями для контент-анализа могут представлять (и очень часто представляют) большой интерес оценки (Это очень опасное решение). С логической точки зрения они обладают важными отличиями от пропозиций, однако для целей контент-анализа как собственно пропозиция, так и оценка могут рассматриваться как результат связывания некоторого объекта с некоторым атрибутом. Изучение динамики оценочных суждений, высказываемых в адрес тех или иных лиц, событий, институтов, – весьма распространенный тип контент-аналитического исследования.

1.6. Макроструктурные единицы. Под макроструктурными единицами понимаются достаточно сложные понятийные конструкции, образующие «верхние этажи» человеческих представлений о мире и, в частности, идеологических систем. Эти конструкции, как правило, носят характер сценариев и описывают стереотипные модели развития, с которыми сопряжены ожидания будущего, соображения о прошлом, эмоциональные ассоциации и т.д. Часто эти конструкции имеют литературные или фольклорные прототипы, что отражается в их названиях. Все они в очень сильной степени претендуют на объяснение действительности. Для обозначения таких конструкций чаще всего используется термин «идеологема»; в различных дисциплинах говорят также о мифологемах, кочующих образах и т.д. Среди подобного рода конструкций, присутствующих в общественном сознании современной России (и распределенных, порою причудливо, по разным идеологическим системам), имеются, например, следующие: Заговор, Оргия коррупции / Криминальная революция / Беспередел, Ограбление / Конверсия власти в собственность, Страна дураков / Город Глупов, «Нет, ребята, все не так», «Возвращение в цивилизацию» и др. Некоторые еще недавно значимые идеологемы (скажем, Борьба за власть, Естественный распад или Тотальная некомпетентность) в последние полтора-два года по различным причинам вышли из фокуса внимания средств массовой информации, а отчасти и населения.

1.7. Единицы, представляющие результаты концептуальных операций. Их довольно много, однако наибольший интерес для контент-анализа представляют метафоры, примеры и аналогии, которые в общем плане уже были охарактеризованы выше. Некоторые из метафор активно используются в политических текстах, и их использование считается диагностичным для характеристики как индивидуального сознания автора текста, так и состояния общественного сознания. Например, в политических текстах часто встречается упоминавшаяся «военная метафора» в варианте ПОЛИТИЧЕСКОЕ ПРОТИВОСТОЯНИЕ – ЭТО ВОЙНА, проявляющаяся в таких выражениях, как война с бедностью, удар по губернатору, атака со стороны оппозиции, разгромная публикация и т.д. При использовании такой метафоры политическое противостояние, независимо от того, в какой форме оно реально ведется, переживается как война, что может, кстати, иметь последствия и для реальных форм политического взаимодействия. Между тем «военная метафора» – это не единственный способ описания политического процесса (и, шире, жизни вообще); они могут описываться с помощью, например, «транспортной метафоры» и/или связанной с ней «метафоры пути» (Мы все вместе вступили на трудную дорогу), «архитектурной метафоры» (государственное строительство, выстраивание властной вертикали) и ряда других. Метафорика политических текстов достаточно подробно изучалась Дж.Лакоффом и его последователями, в том числе и в рамках контент-аналитической методологии (работы А.Н.Баранова); было показано, что, например, возрастание частотности военной метафоры является одним из коррелятов усиления напряженности в обществе.

Не менее диагностичным может быть исследование динамики примеров и аналогий – так, в российских политических текстах до недавнего времени настойчиво повторялась аналогия (принадлежащая В.Янову), в рамках которой Россия сравнивалась с Веймарской республикой.

1.8. «Поэтические» единицы. Под таковыми имеются в виду допускающие количественное измерение средства художественной выразительности – например, каламбуров, аллитераций и т.п.

2. ЧАСТОТНЫЕ И СИСТЕМНЫЕ ХАРАКТЕРИСТИКИ В КОНТЕНТ-АНАЛИЗЕ

2.1 Единицы, категории и признаки. При том, что контент-анализ является в своей основе количественным методом, в нем, как уже говорилось, почти всегда присутствует и значительная качественная составляющая. В принципе это верно уже постольку, поскольку единицы контент-анализа, как видно из предыдущего раздела, чаще всего все же являются содержательными и их выделение основывается на семантических (смысловых) критериях; многие из единиц представляют собой обобщенные категории (это относится прежде всего к темам и идеологемам). Иными словами, контент-аналитик занимается количественным анализом качественных категорий. Но этим дело не исчерпывается. Во многих контент-аналитических проектах осуществляется не только оценка степени представленности в тексте тех или иных единиц, но и одновременная оценка этих единиц по тем или иным градуированным качественным шкалам. В частности, это могут быть предложенные Ч.Осгудом шкалы абстрактности (фактически – трудности для восприятия) того или иного содержания; расстояния до индивидуума (какие-то содержательные компоненты могут непосредственно касаться читателя или читателей, а какие-то могут представлять лишь досужий интерес). В сочетании с результатами собственно контент-анализа оценка использованных единиц анализа (тематических) по указанным шкалам дает трехмерную схему типа, например, той, что была предложена французским культурологом А.Молем. Очевидно, что при анализе могут быть использованы и другие шкалы, кроме того, единицы контент-анализа могут объединяться в различные более широкие категории.

2.2 «Фронтальный» и «рейдовый» контент-анализ. Контент-аналитические исследования можно разделить на два больших класса, которые, пользуясь вышеупомянутой «военной метафорой», можно назвать фронтальными и рейдовыми. Задачей фронтального контент-аналитического исследования является составление максимально более полного представления об информационном потоке – либо на моментальном срезе, либо на протяжении некоторого периода с целью оценки динамики. Это, так сказать, попытка получить объективизированный ответ на вопрос «Что пишут?» Единицы такого анализа в принципе могут быть любыми, но чаще всего в таковом качестве выступают либо тематические единицы, либо ключевые слова, реже оценки и пропозиции и еще реже макроструктурные единицы. Такой анализ обычно носит сугубо прикладной характер и ведется в режиме мониторинга. Поскольку целью его является составление общего представления о содержании СМИ и через него – об общественном сознании, он должен в идеале стремиться к возможно более широкому охвату информационного потока. На практике, однако, полный охват чаще всего бывает невозможен, да зачастую и не нужен. Тем самым на повестку дня контент-аналитического исследования встает проблема составления репрезентативной выборки – традиционная проблема эмпирического социологического исследования, которая при неудачном решении может полностью дискредитировать его результаты. Решается она в случае контент-анализа традиционными социологическими методами.

Рейдовый анализ, в противоположность фронтальному, ориентирован на решение частных и порой довольно экзотических задач, вытекающих, как правило, из каких-то скорее исследовательских, нежели прикладных интересов, и применительно к нему проблема выборки решается в связи формулировкой этих исследовательских целей и определением единиц анализа. Обоснование выборки при этом производится с учетом стандартных социологических критериев, но может допускать и их нарушение; важно лишь, чтобы факт этого нарушения осознавался и необходимость нарушения специальным образом обосновывалась.

2.3 Обработка, презентация и интерпретация результатов. Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. (Проблема подготовки кодировщиков, очень важная в практическом плане, в настоящей статье не затрагивается.) Эта элементарная схема может быть усложнена многими разными способами. Прежде всего, наборы единиц с сопоставленными им количественными оценками, как правило, сопоставляются с другими количественными оценками тех же единиц. Это могут быть, например, результаты подсчета частотности упоминания одних и тех же тем для различных выпусков одного и того же печатного издания или одной и той же регулярно выходящей в эфир новостной программы (временные ряды); результаты аналогичного подсчета для различных изданий/программ или, скажем, обобщенных категорий изданий. Очевидно, что такие данные могут быть представлены с помощью разнообразных графических средств – диаграмм, графиков и т.д., обеспечивающих наглядность. Наглядность, следует заметить, важна не только для аналитика: наглядная диаграмма или впечатляющий график обладают большим потенциалом воздействия, особенно в обществе, привыкшем с почтением относиться к естественнонаучному инструментарию. Классификации зачастую бывают многомерными, и для представления это также могут использоваться различные формальные средства. На практике результаты контент-анализа чаще всего представляются рядами диаграмм, столбчатых или круговых, хотя понятно, что в распоряжении контент-аналитика имеется все разнообразие средств представления количественных данных. А также и качественных: для отображения отношений между единицами контент-анализа и результатов их категоризации используются такие стандартные средства отображения структур, как различные графы. Квантификация данных, естественно, создает необходимые предпосылки для применения к ним средств математического анализа. Помимо анализа частотного распределения, к ним относится анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ. Разумеется, весь этот инструментарий должен применяться корректно. Если при определении единиц контент-анализа и идентификации их в тексте добиться полной объективности возможно лишь в некоторых (как правило, не самых интересных) случаях, то при экспликации и обработке данных обеспечить следование строгим стандартам вполне возможно. Содержательная интерпретация результатов зависит от целей анализа; она является прежде всего творческим актом, результаты которого во многом предопределены политологической квалификацией и интуицией аналитиков. В ходе контент-аналитического исследования как для анализа текста, так и для последующей обработки его результатов может использоваться вычислительная техника. Второй тип использования не вызывает особых проблем: после квантификации, т.е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными средствами, в том числе стандартными статистическими пакетами типа SPSS. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований. В частности, анализ метафорики в русских политических текстах велся с помощью разработанной в Институте русского языка РАН программы Dialex, способной осуществлять составление частотных словарей и конкордансов, а также поиск лексических единиц с их контекстами и сохранять его результаты в базе данных; в настоящее время завершается работа над более совершенной системой, предназначенной для решения тех же задач. Некоторая подсистема контент-анализа входит составной частью в отечественную систему прикладного анализа текстов ВААЛ. Имеется также ряд зарубежных контент-аналитических компьютерных систем, а также систем, потенциально применимых для целей контент-анализа – такова, в частности, система KEDS, разработанная Ф.Шродтом в Канзасском университете и используемая для анализа потока политических событий, отображаемых на ленте информационного агентства «Рейтер».

В социологическом исследовании. – Во второй главе дается характеристика контент-анализу, возможности его использования и технике проведения. – В третьей главе изучаются основные преимущества и недостатки контент-анализа по сравнению с опросом. При написании курсовой работы были изучены учебные материалы, монографии, публикации на страницах периодической печати. 1. Природа метода опроса в...

... – это перевод в количественные, показатели массовой текстовой (или записанной на пленку) информации с последующей статистической ее обработкой. Его основные операции были разработаны американскими социологами X. Лассуэллом и Б. Берельсоном. Важный вклад в развитие процедур контент-анализа внесли российские и эстонские социологи, особенно А.Н. Алексеев, Ю. Вооглайд, П. Вихалемм, Б.Л. Грушин, Т.М. ...

В сферу педагогических исследований; 5. Контент-анализ не является универсальным средством получения информации и обладает как определенными достоинствами, так и ограничениями; 6. Контент-анализ вещания радиокорпорации «Авторадио» регистрирует ряд тенденций: а) наличие установок по шкале «Любовь-агрессия»; б) наличие установок по шкале «Толерантность – нонтолерантность» в сексуальной сфере, ...