Тезисы выступления Александра Матрунича на конференции “Социологические методы в современной исследовательской практике”.

Подавляющее большинство программного обеспечения (далее ПО), используемого социологами в исследовательских проектах, относятся к категории закрытых коммерческих продуктов. Текстовые документы верстаются в редакторе Word от компании Microsoft, статистический анализ производится в SPSS от компании IBM.
Подобные программы достаточно дорогостоящие, что требует выделения существенного бюджета на их приобретение. Использование нелегальных версий повышает риски исследователя, связанные с законом; в будущем, когда Россия вступит в ВТО, доступ к краденным версиям программного обеспечения станет более затруднительным и опасным. Широкая распространенность пиратских копий коммерческих закрытых продуктов способствует тому, что вне внимания российского исследователя остаётся целый пласт альтернативного программного обеспечения.

Понятие свободного программного обеспечения

Рассмотрим вехи зарождения свободного программного обеспечения1 (далее СПО). В период с 50-х до 70-х годов прошлого века для пользователей немногочисленных компьютеров обладание свободами в отношении ПО было нормальной практикой. Производители компьютерного оборудования предоставляли ПО в качестве бесплатного бонуса к основному товару. Пользователи свободно запускали программы, изучали их исходный код, изменили его и передавали модифицированные версии своим коллегам. Компьютерная программа была подобна научной статье, которая была доступна всем желающим, идеи из этой статьи можно использовать в других статьях и т.д.
В конце 60-х гг. в индустрии информационных технологий в связи с ростом специализации стало появляться всё больше компаний, которые занимались только разработкой ПО. Они требовали, чтобы производители оборудования перестали распространять свои программы бесплатно. В 1969 году суд США признал, что добавление компанией IBM к поставке своего оборудования бесплатного программного обеспечения является нарушением принципов конкуренции. В 1980 году в США авторское право было расширено на компьютерные программы. Свободное развитие ПО было приостановлено.
В 1983 году сотрудник лаборатории искусственного интеллекта Массачусетского технологического института Ричард Столман дал старт проекту GNU, который был нацелен на создание операционной системы и прикладных компьютерных программ, которые не защищены патентами и позволяют пользователям и разработчикам свободно получать, запускать, изучать, изменять и распространять это программное обеспечение.
Сегодня яркими представителями СПО являются веб-браузер Mozilla Firefox, офисный пакет OpenOffice.org, операционные системы на базе ядра Linux. Менее известным среди рядовых пользователей, но критически важным для сети Интернет является такой свободный программный продукт, как веб-сервер Apache, обеспечивающий работу 59% сайтов мира.
Особо актуальным СПО является для академической среды. При проведении математических расчётов учёный всегда может проверить корректность вычисления компьютерной программой того или иного показателя путём анализа исходного кода программы, а не полагаться на “черный ящик”, которым является закрытая программа. Пользуясь свободной программой учёный не заставляет своих коллег, которые хотят воспроизвести результаты его работы, тратить деньги на приобретение этой программы, тем самым расширяя круг лиц, которым доступны его выводы. Сохраняя свои тексты, исходные данные и прочие рабочие материалы в свободных электронных форматах, учёный может быть уверен, что его труды будут доступны будущим поколениям. Для закрытых программ и форматов гипотетически возможна такая ситуация, что в будущем будет невозможно открыть тот или иной файл, т.к. фирма, выпускавшая программу обанкротилась и версий этой программы для нового оборудования не создано.
Не меньшие перспективы СПО предоставляет для образования. Информатики могут заглядывать внутрь программы и изучать компьютерную науку на реальных примерах. Каждый студент может получить копию программы, которой его обучают – и это будет совершенно законно. Инициативный студент может включится в развитие любого, понравившегося ему проекта СПО, развивая свои навыки в предметной области, расширяя свою социальную сеть, улучшая свой английский язык и готовя хороший задел для поиска работы.

СПО для социологических исследований

Представим три свободных программных продукта, используемых непосредственно в процессе полевого социологического исследования.

Интернет-опросы

Всё более популярным становится проведение опросов через Интернет. Существует несколько свободных программ, предназначенных для анкетирования респондентов с помощью веб-технологий. Проект LimeSurvey стартовал в 2003 году в Австралии4 и быстро набрал популярность после того, когда в программу были добавлены возможности по вопросам-фильтрам, контролю доступа по приглашениям и созданию шаблонов. Наиболее значимым достижением LimeSurvey стало его использование для сбора сведений о нарушениях на президентских выборах в США в 2004 году. За первые 10 часов голосования с помощью системы LimeSurvey было собрано информации о более чем 13500 нарушениях. Сейчас центр разработки LimeSurvey находится в Германии.
LimeSurvey русифицирован, он обладает возможностью проводить один и тот же опрос на нескольких языках. Программа позволяет подсчитывать для данных опроса описательную статистику и диаграммы. Для дальнейшего анализа пользователь может экспортировать массив с данными в Excel, SPSS или любую другую программу по статобработке.
Помимо основного предназначения программы мы использовали LimeSurvey для организации ввода данных с бумажных анкет. Работа была распределена между несколькими операторами. Находясь в разных местах, они через Интернет вносили ответы в единую базу данных, что сняло необходимость объединять несколько файлов в один.

Дизайн-макет анкеты

Дизайн анкеты является важным фактором для снижения систематической ошибки наряду с формулировкой текста анкеты и нейтральностью шкал. Существует целая международная ассоциация6, в которой аккумулируется опыт по разработке эффективных бланков, в число которых входят и анкеты.
Австралийский социолог Адам Земит, следуя принципам, изложенным в книге7 консультанта по бизнес-бланкам Роберта Барнета, члена вышеупомянутой ассоциации, создал свободный формат для подготовки анкет queXML8. Использование данного формата позволяет исследователю снять с себя задачу по внешнему оформлению анкеты и полностью сконцентрироваться на её содержании. Особо ценным этот подход становится при использовании анкет на самозаполнение, когда у исследователя нет возможности проводить с респондентом полноценный инструктаж по работе с анкетой.
Используя формат queXML, исследователь автоматически оформляет свою анкету в соответствии с современными мировыми наработками в области дизайна бланков, тем самым повышая качество получаемых ответов. В queXML учитывается тип и размер шрифта, толщина обрамляющих линий, использование «путеводных» линий для взгляда респондента и пр. Мы использовали формат queXML в создании анкет для опросов в секторе B2B.
Формат queXML является частью свободного пакета queX Suite, который также включает в себя систему по сканированию и распознаванию бумажных анкет, систему для проведения телефонных опросов и систему для очистки и кодирования анкетных данных.

Статистический анализ данных

В апреле 2008 года компания SPSS выпустила шестнадцатую версию своего статистического пакета. Среди ряда обновлений в программу была добавлена поддержка языка R, что позволило пользователям SPSS «получить доступ к множеству статистических алгоритмов, созданных в R, и использовать их в SPSS как часть синтаксиса10». Что заставило разработчиков такого мощного пакета как SPSS включить поддержку некоего стороннего продукта?
R — это язык программирования, а также программная среда для статистического анализа и работы с графикой. R используется «растущим числом аналитиков в бизнесе и в науке. Он становится их общепринятым языком…». Среди корпоративных пользователей R такие компании как Google, Facebook, Pfizer, Bank of America.
Начало проекта было положено Росом Айхэкой и Робертом Джентельменом в университете Окленда (Новая Зеландия)12. Сейчас R предоставляет пользователю массу методов, включая линейное и нелинейное программирование, анализ временных рядов, классификацию и кластеризацию и пр. Преимущество R состоит в том, что это не монолитная программа, а ядро, расширяемое за счёт дополнений. Создание новых дополнений не требует знания никаких языков программирования кроме самого R. Это позволяет пользователям оперативно добавлять в среду R новейшие статистические методики и сразу же распространять это дополнение в сообществе. На конец января 2011 года в библиотеке R было зарегистрировано 2787 дополнений.
Существует целый ряд проектов по созданию графического интерфейса для R, чтобы приблизить работу в R к принципам хорошо знакомых пакетов наподобие SPSS. Несмотря на это, вся мощь R будет доступна только тем исследователям, которые изучат этот язык программирования и смогут работать через синтаксис. Дополнительную сложность в России составляет незначительное число литературы про R на русском языке.

Заключение

Свободное программное обеспечение несёт в себе широкие возможности для науки и образования. На сегодняшний день практически для любой задачи, с которой сталкивается исследователь, можно найти прикладную программу, распространяемую по условиям свободных лицензий. Пользователь может получить эту программу, использовать её для любых, в т.ч. коммерческих, целей, ознакомиться с её принципами действия, изменить эту программу под свои специфические требования, и распространить оригинальную или модифицированную версию в любых количествах.