1.4.1. Ввод данных в компьютер и кодирование переменных. Способы ввода данных в SPSS

Ввод данных в компьютер является четвертым шагом первого (подготовительно­го) этапа статистического анализа данных (см. рис. В.2). Он неразрывно связан со следующим шагом — кодированием переменных. В этом разделе мы последова­тельно рассмотрим эти две взаимосвязанные и взаимообусловленные процедуры.

Существует три основных способа формирования базы данных в формате SPSS (перечислены в порядке убывания популярности).

1. Импорт базы данных из других программных источников (Microsoft Access, Microsoft Excel, текстовых файлов и других).

2. Ввод данных непосредственно в SPSS при помощи специализированного про­граммного обеспечения (SPSS Data Entry).

3. Ручной ввод данных в SPSS.

Теперь рассмотрим каждый способ более подробно.

1.4.1.1. Импорт данных из других источников

Данный способ создания базы данных в формате SPSS является наиболее распро­страненным. Чаще всего он предполагает использование SPSS в качестве вспомо­гательного средства для статистического анализа данных. При этом построение линейных распределений в графическом виде (диаграмм по общим распределени­ям) может производиться, например, в Microsoft Excel. Также данный метод при­меним и если у вас есть программное обеспечение для автоматически сканируемого ввода бумажных анкет в компьютер. В этом случае специализированная програм­ма (например, ABBYY FormReader) создает особую базу данных в собственном формате (во внутреннем представлении).

Рассмотрим пример создания базы данных в SPSS при помощи перекачки данных из другой программы — Microsoft Access, как одной из наиболее распространен­ных систем управления базами данных (СУБД).

Чтобы осуществить импорт данных в SPSS, необходимо сформировать в соответ­ствующей программе (из которой будет осуществляться импорт) таблицу данных, отформатированную определенным способом. Файл данных SPSS напоминает рабочую книгу Microsoft Excel (электронную таблицу). Однако SPSS, к сожале­нию, не обладает функциональностью электронной таблицы, и схожесть этих двух программных продуктов заканчивается на внешнем виде. Общая схема построе­ния файла SPSS выглядит примерно так, как на рис. 1.1.

Таблица данных в сторонней программе, из которой будет осуществляться импорт, должна соответствовать именно такой схеме (заголовок переменной → значения переменной). Примеры таблиц из Microsoft Access Base. mdb, Microsoft Excel Base. xls, простого текстового файла MS DOS Base. txt и текстового файла с разделителями Base. csv представлены на рис. 1.2-1.5. Независимо от вида разделителей данных в таблицах их объединяет общая структура: заголовок переменной → данные (зна­чение переменной). Представим, что была создана база данных Microsoft Access Base. mdb, содержащая Таблицу данных.

После того как была создана подходящая для импорта таблица данных, следует от­крыть SPSS и вызвать диалоговое окно импорта данных при помощи меню File ► Open Database ► New Query. Откроется мастер Database Wizard (рис. 1.6); в его окне необхо­димо указать источник данных, из которого будет производиться импорт данных. Выберите в списке справа База данных MS Access и щелкните на кнопке Далее.

Следует отметить, что SPSS поддерживает импорт из любых источников данных, совместимых с технологией ODBC (соответствующие драйверы для них должны быть предварительно установлены в Microsoft Windows). Например, чтобы доба­вить возможность импорта из базы данных Microsoft Paradox (файлы типа *.db), необходимо щелкнуть на кнопке Add Data Source в диалоговом окне Database Wizard. На экране появится стандартное окно Microsoft Windows Администратор источни­ков данных ODBC (рис. 1.7). В этом диалоговом окне представлен список уже уста­новленных в SPSS источников данных. Чтобы добавить новый источник, отсут­ствующий в данном перечне, следует щелкнуть на кнопке Добавить.


Рис 1.1 Общая схема построения файла данных SPSS

 

Рис. 1.2. Таблицы данных, подходящие для импорта в SPSS: таблица MS Access

 
 


Рис. 1.3. Таблицы данных, подходящие для импорта

в SPSS: лист MS Excel


Рис. 1.4. Таблицы данных, подходящие для импорта в SPSS: текстовый файл с фиксированными столбцами


Рис. 1.5 Таблицы данных, подходящие для импорта SPSS: текстовый файл с разделителями

 

Рис. 1.5 Диалоговое окно Database Wizard

 

Рис. 1.7. Диалоговое окно Администратор источников данных ODBC

 


В открывшемся диалоговом окне Создание нового источника данных (рис. 1.8) содер­жится список всех источников данных, установленных в вашей системе Microsoft Windows. Кроме названий источников, в данном перечне вы можете увидеть но­мер версии и название файла соответствующего драйвера. Выберите драйвер Mi­crosoft Paradox Driver (*.db) и щелкните на кнопке Готово.

Рис. 1.8. Диалоговое окно Создание нового источника данных

 

При этом будет открыто новое диалоговое окно Установка драйвера ODBC для Paradox (рис. 1.9). Здесь в строке Имя источника данных следует ввести то название, которое будет в дальнейшем отображаться в диалоговом окне Database Wizard в SPSS (на­пример, База данных Paradox). В этом диалоговом окне можно установить дополни­тельные параметры. Чтобы вернуться в SPSS, следует закрыть все использован-

Ные диалоговые окна установки источника данных ODBC. Вы увидите, что в списке доступных источников в окне Database Wizard появится база данных Paradox.

Рис. 1.9. Диалоговое окно Установка драйвера ODBC для Paradox

 

Вернемся к рис. 1.6. Выберите соответствующий источник данных и щелкните на кнопке Далее, после чего на экране откроется диалоговое окно ODBC Driver Login (рис. 1.10). В этом окне следует указать полный путь к базе данных, из которой будет производиться импорт таблицы (в нашем случае это C:\Base. mdb). Щелкни­те на кнопке 0К для продолжения работы.


Рис. 1.10. Диалоговое окно ODBC Driver Login

 

Откроется новое диалоговое окно (рис. 1.11). В нем из левого списка всех таблиц, доступных в указанном источнике данных, выберите ту, которая содержит импор­тируемые данные (в нашем случае Таблица данных), и переместите ее в правый спи­сок. Затем щелкните на кнопке Готово, после чего в окне SPSS Data Editor появится импортированная таблица.

Следует отметить, что процедуры импорта данных для разных источников отлич­ны друг от друга. Однако эти различия несущественны, и поэтому мы не будем описывать все типы импорта. Как правило, для таблицы из базы данных Microsoft Access действия, показанные при помощи вышеописанных шагов, достаточны.

1.4.1.2. Ввод данных в SPSS при помощи Data Entry

Данная программа призвана упростить ввод данных в SPSS. При работе с ней ге­нерируются пользовательские формы, содержащие поля анкеты, куда и вводятся данные. Модуль SPSS Data Entry Builder позволяет создавать формы и правила для их заполнения, а модуль SPSS Data Entry Station — вводить анкеты в компью­тер в распределенном режиме (то есть с нескольких компьютеров одновременно). Детальное описание работы с программой Data Entry выходит за рамки настоящего пособия. Отметим лишь, что данная программа является самостоятельным при­ложением Microsoft Windows и не входит в комплект поставки SPSS. Кроме того, программные продукты SPSS достаточно дороги для большинства российских ком­паний, и поэтому рассматриваемый способ ввода данных не получил должного распространения в нашей стране.

Рис. 1.11. Диалоговое окно Database Wizard, шаг 2 из б

 

 

1.4.1.3. Ручной ввод данных в SPSS

Ручной ввод наиболее эффективен при малых размерах выборки, а также для до­стижения некоторых специфических целей (например, при вводе ранжированных списков в ходе расчета корреляции Спирмана; см. раздел 4.2.1). Как и в случае использования программы Data Entry, существует возможность распределенного ввода анкет с несколькими операторами. Когда все операторы закончат ввод своей части анкет, полученные базы данных сливаются в одну при помощи меню SPSS Data ► Merge files, в котором следует выбрать объект добавления анкеты (Add Cases) или переменных (Add Variables).

© 2011-2024 Контрольные работы по математике и другим предметам!