Статистический анализ данных на компьютере
Т98
Тюрин Ю.Н., Макаров А.А.
Статистический анализ данных на компьютере/Под ред.
В.Э.Фигурнова - М.: ИНФРА-М, 1998. - 528 с., ил.
ISBN 5-86225-662-8, ББК 517.8, 32.973
Книга является учебным пособием по анализу данных и статистике, рассчитанным на прикладных специалистов, менеджеров и студентов. Излагаются основные сведения, необходимые на практике для анализа данных, на наглядных примерах рассматриваются основные постановки задач, а затем эти же примеры решаются с использованием популярных статистических пакетов STADIA, STATGRAPHICS, SPSS и Эвриста. В приложении дается обзор других программных средств для анализа данных. Большое внимание в книге уделено средствам анализа временных рядов и других методам, часто используемым в прикладных задачах. |
|
ОГЛАВЛЕНИЕ | |
Об этой книге | 3 |
Предисловие редактора | 4 |
Как читать эту книгу | 11 |
Благодарности | 14 |
Глава 1. Основные понятия прикладной статистики | |
1.1. Случайная изменчивость | 15 |
1.2. События и их вероятности | 19 |
1.3. Измерения вероятности | 23 |
1.4. Случайные величины. Функции распределения | 24 |
1.5. Числовые характеристики распределения вероятностей | 30 |
1.6. Независимые и зависимые случайные величины | 34 |
1.7. Случайный выбор | 37 |
1.8. Выборки и их описание | |
1.8.1. Что такое выборка | 37 |
1.8.2. Выборочные характеристики | 39 |
1.8.3. Ранги и ранжирование | 42 |
1.8.4. Методы описательной статистики | 44 |
1.8.5. Наглядные методы описательной статистики | 46 |
1.9. Методы описательной статистики в пакетах STADIA и STATGRAPHICS | |
1.9.1. Пакет STADIA | 49 |
1.9.2. Пакет STATGRAPHICS | 55 |
Глава 2. Важные законы распределения вероятностей | 64 |
2.1. Биномиальное распределение | 65 |
2.2. Распределение Пуассона | 68 |
2.3. Показательное распределение | 71 |
2.4. Нормальное распределение | 73 |
2.5. Двумерное нормальное распределение | 76 |
2.6. Распределения, связанные с нормальным | |
2.6.1. Распределение хи-квадрат | 79 |
2.6.2. Распределение Стьюдента | 80 |
2.6.3. F-распределение | 81 |
2.7. Законы распределения вероятностей в пакетах STADIA и STATGRAPHICS | |
2.7.1. Пакет STADIA | 82 |
2.7.2. Пакет STATGRAPHICS | 86 |
Глава 3. Основы проверки статистических гипотез | |
3.1. Статистические модели | 92 |
3.2. Проверка статистических гипотез (общие положения) | 95 |
3.3. Примеры статистических моделей и гипотез | 101 |
3.4. Проверка статистических гипотез (прикладные задачи) | |
3.4.1. Схема испытаний Бернулли | 106 |
3.4.2. Критерий знаков для одной выборки | 110 |
3.5. Проверка гипотез в двухвыборочных задачах | 111 |
3.5.1. Критерий Манна-Уитни | 113 |
3.5.2. Критерий Уилкоксона | 117 |
3.6. Парные наблюдения | 123 |
3.6.1. Критерий знаков для анализа парных повторных наблюдений | 124 |
3.6.2. Анализ повторных парных наблюдений с помощью знаковых рангов (критерий знаковых ранговых сумм Уилкоксона) | 126 |
3.7. Проверка статистических гипотез в пакетах STADIA и STATGRAPHICS | |
3.7.1. Пакет STADIA | 128 |
3.7.2. Пакет STATGRAPHICS | 132 |
Глава 4. Начала теории оценивания | |
4.1. Введение | 140 |
4.2. Закон больших чисел | 141 |
4.3. Статистические параметры | |
4.3.1. Параметры распределения | 146 |
4.3.2. Параметры модели | 147 |
4.4. Оценивание параметров распределения по выборке | 148 |
4.5. Свойства оценок. Доверительное оценивание | 151 |
4.6. Метод наибольшего правдоподобия | 153 |
4.7. Оценивание параметров вероятностных распределений в пакетах STADIA и STATGRAPHICS | 156 |
4.7.1. Пакет STADIA | 157 |
4.7.2. Пакет STATGRAPHICS | 161 |
Глава 5. Анализ одной и двух нормальных выборок | |
5.1. Об исследовании нормальных выборок | 165 |
5.2. Глазомерный метод проверки нормальности | 167 |
5.3. Оценки параметров нормального распределения и их свойства | 169 |
5.4. Проверка гипотез, связанных с параметрами нормального распределения | |
5.4.1. Одна выборка | 174 |
5.4.2. Две выборки | 176 |
5.4.3. Парные данные | 178 |
5.5. Анализ нормальных выборок в пакетах STADIA и STATGRAPHICS | |
5.5.1. Пакет STADIA | 182 |
5.5.2. Пакет STATGRAPHICS | 184 |
Глава 6. Однофакторный анализ | |
6.1. Постановка задачи | 191 |
6.2. Непараметрические критерии проверки однородности | |
6.2.1. Критерий Краскела-Уоллиса (произвольные альтернативы) | 196 |
6.2.2. Критерий Джонкхиера (альтернативы с упорядочением) | 197 |
6.3. Практический пример | 198 |
6.4. Оценивание эффектов обработки (непараметрический подход) | 201 |
6.5. Дисперсионный анализ | 204 |
6.6. Оценивание эффектов обработки в нормальной модели | |
6.6.1. Доверительные интервалы | 206 |
6.6.2. Метод Шеффе множественных сравнений | 207 |
6.7. Однофакторный анализ в пакетах STADIA и STATGRAPHICS | |
6.7.1. Пакет STADIA | 209 |
6.7.2. Пакет STATGRAPHICS | 214 |
Глава 7. Двухфакторный анализ | |
7.1. Связь задач двухфакторного и однофакторного анализа | 224 |
7.2. Таблица двухфакторного анализа | 225 |
7.3. Аддитивная модель данных двухфакторного эксперимента при независимом действии факторов | 226 |
7.4. Непараметрические критерии проверки гипотезы об отсутствии эффектов обработки | |
7.4.1. Критерий Фридмана (произвольные альтернативы) | 227 |
7.4.2. Критерий Пейджа (альтернативы с упорядочением) | 229 |
7.5. Практический пример | 230 |
7.6. Двухфакторный дисперсионный анализ | 232 |
7.7. Двухфакторный анализ в пакетах STADIA и STATGRAPHICS | |
7.7.1. Пакет STADIA | 235 |
7.7.2. Пакет STATGRAPHICS | 238 |
Глава 8. Линейный регрессионный анализ | |
8.1. Модель линейного регрессионного анализа | 245 |
8.2. О стратегии, методах и проблемах регрессионного анализа | 247 |
8.3. Простая линейная регрессия | 250 |
8.4. О проверке предпосылок в задаче регрессионного анализа | 254 |
8.5. Непараметрическая линейная регрессия | 256 |
8.6. Практический пример | 262 |
8.7. Регрессионный анализ в пакетах STATGRAPHICS и STADIA | 267 |
8.7.1. Пакет STATGRAPHICS | 268 |
8.7.2. Пакет STADIA | 279 |
Глава 9. Независимость признаков | |
9.1. О шкалах измерений | 285 |
9.2. Инструменты и стратегия исследования связи признаков | 288 |
9.3. Связь номинальных признаков (таблицы сопряженности) | 289 |
9.4. Связь признаков, измеренных в шкале порядков | 298 |
9.5. Связь признаков в количественных шкалах | |
9.5.1. Коэффициент корреляции | 302 |
9.5.2. Нормальная корреляция | 305 |
9.6. Замечания о связи признаков, измеренных в разных шкалах | 308 |
9.7. Анализ таблиц сопряженности и коэффициенты корреляции в пакетах STADIA и STATGRAPHICS | |
9.7.1. Пакет STADIA | 308 |
9.7.2. Пакет STATGRAPHICS | 312 |
Глава 10. Критерии согласия | |
10.1. Введение | 317 |
10.2. Критерии согласия Колмогорова и омега-квадрат в случае простой гипотезы | 319 |
10.3. Практический пример (закон Менделя) | 322 |
10.4. Критерий согласия хи-квадрат К.Пирсона для простой гипотезы | 324 |
10.5. Критерии согласия для сложной гипотезы | 326 |
10.6. Критерий согласия хи-квадрат Фишера для сложной гипотезы | 329 |
10.7. Другие критерии согласия. Критерий согласия для Пуассоновского распределения | 333 |
10.8. Критерии согласия в пакетах STADIA и STATGRAPHICS | |
10.8.1. Пакет STADIA | 336 |
10.8.2. Пакет STATGRAPHICS | 341 |
Глава 11. Временные ряды: теоретические основы | |
11.1. Введение | 346 |
11.2. Анализ временных рядов и его разделы | 348 |
11.3. Цели, этапы и методы анализа временных рядов | 350 |
11.4. Детерминированная и случайная составляющие временного ряда | 352 |
11.5. Тренд, сезонная и циклическая компоненты | 354 |
11.6. Модели тренда | 357 |
11.7. Модели случайной компоненты | 360 |
11.8. Числовые характеристики временных рядов | 364 |
11.9. Процессы, стационарные в широком смысле | 366 |
11.10. Оценки числовых характеристик временных рядов | 368 |
Глава 12. Временные ряды: практический анализ | |
12.1. Порядок анализа временных рядов | 375 |
12.2. Графические методы анализа временных рядов | 376 |
12.3. Методы сведения к стационарности | |
12.3.1. Выделение тренда | 379 |
12.3.2. Выделение сезонных эффектов | 385 |
12.3.3. Метод скользящих средних | 392 |
12.3.4. Сезонные разностные операторы | 397 |
12.3.5. Преобразование шкалы | 399 |
12.4. Методы исследования структуры стационарного временного ряда | |
12.4.1. Цели и методы анализа | 402 |
12.4.2. Интерпретация графика коррелограммы | 403 |
12.4.3. Интерпретация графика частной автокорреляционной функции | 408 |
Глава 13. Анализ временных рядов на компьютере | |
13.1. О выборе пакетов для описания в этой книге | 411 |
13.2. Анализ временных рядов в SPSS | |
13.2.1. Обзор возможностей | 412 |
13.2.2. Подбор тренда и прогнозирование | 413 |
13.2.3. Устранение сезонной компоненты | 422 |
13.3. Анализ временных рядов в пакете ЭВРИСТА | |
13.3.1. Общие сведения о пакете | 425 |
13.3.2. Подбор тренда и прогнозирование | 427 |
13.2.3. Устранение сезонной компоненты | 434 |
13.2.4. Подбор модели авторегрессии и построение прогноза | 437 |
Глава 14. Линейные модели временных рядов | |
14.1. Авторегрессия первого порядка AR(1) | 443 |
14.2. Авторегрессия второго порядка AR(2) | 447 |
14.3. Авторегрессия порядка р — AR(p) | 450 |
14.4. Процессы скользящего среднего MA(q) | 454 |
14.5. Комбинированные процессы авторегрессии-скользящего среднего ARMA(p, q) | 457 |
14.6. Линейные модели и операторы сдвига | 458 |
Глава 15. Многомерный анализ и другие статистические методы | |
15.1. Введение | 461 |
15.2. Многомерный статистический анализ | 461 |
15.3. Факторный анализ | 463 |
15.4. Дискриминантный анализ | 464 |
15.5. Кластерный анализ | 465 |
15.6. Многомерное шкалирование | 465 |
15.7. Методы контроля качества | 467 |
15.8. Использование статистических пакетов | 467 |
Приложение 1. Средства анализа данных на персональных компьютерах | |
П1.1. Введение | 468 |
П1.2. Виды статистических пакетов | 469 |
П1.3. Возможности табличных процессоров и баз данных | 470 |
П1.4. Требования к статистическим пакетам общего назначения | 471 |
П1.5. Состояние и особенности российского рынка | 472 |
П1.6. Статистические пакеты в среде Windows | 479 |
П1.7. Документация статистических пакетов | 482 |
П1.8. Встроенный справочник и экспертная поддержка | 484 |
П1.9. Делая выбор | 487 |
Приложение 2. Возможности пакетов STADIA и STATGRAPHICS | |
П2.1. Введение | 489 |
П2.2. О пакетах STADIA и STATGRAPHICS | 489 |
П2.3. Статистические методы | 491 |
П2.4. Архитектура пакетов | 492 |
П2.5. Интерфейсы пользователя | 494 |
П2.6. Работа с данными | 496 |
П2.7. Графические возможности | 501 |
П2.8. Подготовка отчетов | 504 |
П2.9. Документация | 504 |
П2.10. Справочник и экспертная поддержка | 505 |
П2.11. Технические характеристики | 506 |
П2.12. Ошибки | 507 |
Приложение 3. Где приобрести статистические пакеты | |
ПЗ.1. Универсальные статистические пакеты | 508 |
П3.2. Специализированные пакеты | 510 |
ПЗ.З. Цены и телефоны фирм | 512 |
П3.4. Консультации и обучение | 513 |
Литература | 514 |