Чтобы получить представление о том или ином явлении, сделать выводы, необходимо провести статистическое исследование. Предме­том статистического исследования в здравоохранении и медицине мо­гут быть здоровье населения, организация медицинской помощи, раз­личные разделы деятельности лечебно-профилактических учреждений, факторы внешней среды, оказывающие влияние на состояние здоровья.

Методическая последовательность выполнения статистического исследования складывается из определенных этапов.

1 этап. Составление плана и программы исследования.

2 этап. Сбор материала (статистическое наблюдение).

3 этап. Разработка материала, статистическая группировка и сводка

4 этап. Статистический анализ изучаемого явления, формулировка выводов.

5 этап. Литературная обработка и оформление полученных результатов.

По завершении статистического исследования разрабатываются ре­комендации и управленческие решения, проводится внедрение ре­зультатов исследования в практику, оценивается эффективность.

В проведении статистического исследования важнейшим элементом является соблюдение строгой последовательности в осуществлении названных этапов.

Первый этап статистического исследования - составление плана и программы - является подготовительным, на котором определяется цель и задачи исследования, составляется план и программа иссле­дования, разрабатывается программа сводки статистического мате­риала и решаются организационные вопросы.

Приступая ж статистическому исследованию, следует точно и чет­ко сформулировать цель и задачи исследования, изучить по данной теме литературу.

Цель определяет основное направление исследования и носит, как правило, не только теоретический, но и практический характер. Цель формулируется ясно, четко, недвусмысленно.

Для раскрытия поставленной цели определяются задачи исследова­ния.

Важным моментом подготовительного этапа является разработка организационного плана. Организационный план исследования предус­матривает определение места (административно-территориальных границ наблюдения), время (конкретных сроков осуществления наблю­дения, проведения разработки и анализа материала) и субъекта ис­следования (организаторов, исполнителей, методического и органи­зационного руководства, источников финансирования исследования).

Пл ан иссле дов ания включает:

Определение объекта исследования (статистической совокупнос­ти);

Объема исследования (сплошное, несплошное);

Видов (текущее, единовременное);

Способов сбора статистической информации. Программа исследования включает:

Определение единицы наблюдения;

Перечень вопросов (учетных признаков), подлежащих регистра­ции в отношении каждой единицы наблюдения*

Разработку индивидуального учетного (регистрационного) блан­ка с перечнем вопросов и признаков, подлежащих учету;

Разработку макетов таблиц, в которые затем вносятся результа­ты исследования.

На каждую единицу наблюдения заполняется отдельный бланк, он содержит паспортную часть, четко сформулированные, поставленные в определенной последовательности вопросы программы и дату заполне­ния документа.

В качестве учетных бланков могут быть использованы применяе­мые в практике лечебно-профилактических учреждений учетные меди­цинские Формы.

Источниками получения информации могут служить другие медицин­ские документы (истории болезни, и индивидуальные карты амбула­торного больного, истории развития ребенка, истории родов), от­четные формы лечебно-профилактических учреждений и др.

Для обеспечения возможности статистической разработки данных из этих документов производят выкопировку сведений на специально разработанные учетные бланки, содержание которых определяется в каждом отдельном случае в соответствии с задачами исследования.

В настоящее время в связи с машинной обработкой результатов наблюдения с использованием ЭВМ вопросы программы могут быть формализованы, когда вопросы в учетном документе ставятся в виде альтернативы (да, нет), или предлагаются уже готовые ответы, из которых следует выбрать определенный ответ.

На первом этапе статистического исследования наряду с програм­мой наблюдения составляется программ* сводки полученных данных, которая включает установление принципов группировки, выделение группировочных признаков, определение комбинаций этих признаков, составление макетов статистических таблиц.

Второй этап - сбор статистического материала (статистическое наблюдение) - заключается в регистрации отдельных случаев изу­чаемого явления и характеризующих их учетных признаков в регис­трационные бланки. Перед и в ходе выполнения этой работы прово­дится инструктаж (устный или письменный) исполнителей наблюде­ния, обеспечение их формами регистрации.

По времени статистическое наблюдение может быть текущим и еди­новременным.

При текущем набл юдении явление изучается за какой-то от­дельный период времени (неделю, квартал, год и т.д.) путем пов­седневной регистрации явления по мере возникновения каждого слу­чая. Примером текущего наблюдения является учет числа родившихся, умерших, заболевших, выписанных из стационара и т. п. Так учиты­ваются быстро меняющиеся явления.

При единовременном набл юдении статистические данные собирают­ся на определенный (критический) момент времени. Единовремен­ным наблюдением являются: перепись населения, изучение физического развития детей, учет больничных коек на коней года, паспорти­зация лечебно-профилактических учреждений и т. д. К этому же виду относятся профилактические осмотры населения. Единовременная ре­гистрация отражает состояние явления на момент изучения. Этот вид наблюдения используется для изучения медленно меняющихся явлений.

Выбор вид наблюдения по времени определяется целью и задачами исследования. Например, характеристику госпитализированных больных можно получить в результате текущей регистрации выбывших из стационара (текущее наблюдение) или путем однодневной перепи­си больных, находящихся в стационаре (единовременное наблюдение).

В зависимости от полноты охвата изучаемого явления различают сплошное и несплошное исследование.

При сплошном исследовании изучаются все входящие в состав со­вокупности единицы наблюдения, т.е. генеральная совокупность. Сплошное исследование проводят с целью установления абсолютных размеров явления, например, общей численности населения, общего количества родившихся или умерших, общего числа заболевших тем или иным заболеванием и др. Сплошной метод применяется и в тех случаях, когда сведения необходимы для оперативной работы (учет инфекционной заболеваемости, нагрузка врачей и др.)

При несплошном исследовании изучается лишь часть генеральной совокупности. Оно подразделяется на несколько видов: анкетное, монографическое, основного массива, выборочное. Самым распростра­ненным в медицинских исследованиях является выборочный метод.

Монографический метод - дает детальное описание отдельных ха­рактерных в каком-либо отношении единиц совокупности и глубокое, всестороннее описание объектов.

Метод основного массива - предполагает изучение тех объектов, в которых сосредоточено значительное большинство единиц наблюде­ния. Недостатком этого метода является то, что остается неохва­ченной исследованием часть совокупности, хотя и небольшая по размерам, но которая может значительно отличаться от основного мас­сива.

Анкетный метод - это сбор статистических данных с помощью спе­циально разработанных анкет, адресованных определенному кругу лиц. Это исследование основано на принципе добровольности, поэто­му возврат анкет зачастую бывает неполным. Нередко ответы на пос­тавленные вопросы носят отпечаток субъективности и случайности. Этот метод применяется для получения приблизительной характеристики изучаемого явления.

Выборочный метод - сводится к исследованию некоторой спе­циально отобранной части единиц наблюдения для характеристики всей генеральной совокупности. Преимуществом этого метода являет­ся получение результатов высокой степени надежности, а также зна­чительно более низкая стоимость. В исследовании занято меньшее число исполнителей, кроме того он требует меньших затрат времени.

В медицинской статистике роль и место выборочного метода осо­бенно велики, поскольку медицинские работники имеют дело обычно только с частью изучаемого явления: изучают группу больных с тем или иным заболеванием, анализируют работу отдельных подразделе­ний и медицинских учреждений, оценивают качество определенных ме­роприятий и т. д.

По способу получения сведений в ходе проведения статистическо­го наблюдения и характеру его осуществления выделяют несколько видов:

1) непосредственное наблюдение (клинический осмотр больных, проведение лабораторных, инструментальных исследований, антропо­метрические измерения и т. п.)

2) социологические методы : метод интервью (очный опрос), анке­тирование (заочный опрос - анонимный или неанонимный) и др.;

3) документальное исследов ание (выкопировка сведений из учет­но-отчетных медицинских документов, сведения официальной статис­тики учреждений и организаций.)

Третий этап - группировка и сводка материала - начинается с проверки и уточнения числа наблюдений, полноты и правильности по­лученных сведений, выявлении и устранении ошибок, дубликатов за­писей и т. д.

Для правильной разработки материала применяется шифровка пер­вичных учетных документов, т.е. обозначение каждого признака и его группы знаком - буквенным или цифровым. Шифровка - это техни­ческий прием, облегчающий и ускоряющий разработку материала, по­вышающий качество, точность разработки. Шифры - условные обозна­чения - вырабатываются произвольно. При шифровке диагнозов реко­мендуется пользоваться международной номенклатурой и классифика­цией болезней; при шифровке профессий - словарем профессий.

Преимуществом шифровки является то, что при необходимости пос­ле окончания основной разработки можно вернуться к материалу для разработки с целью выяснения новых связей и зависимостей. Зашиф­рованный учетный материал позволяет сделать это легче и быстрее, чем незашифрованный. После проверки проводится группировка призна­ков.

Группировка - расчленение совокупности изучаемых данных на од­нородные, типичные группы по наиболее существенным признакам. Группировка может проводиться по качественным и количественным признакам. Выбор группировочного признака зависит от характера изучаемой совокупности и задач исследования.

Типологическая группировка производится по качественным (опи­сательным, атрибутивным) признакам, например, по полу, профессии, группам болезни, тяжести течения болезни, послеоперационным ос­ложнениям и т. д.

Группировка по количественным (вариационным) признакам прово­дится на основании числовых размеров признака, например, по воз­расту, длительности заболевания, продолжительности лечения и т.д. Количественная группировка требует решения вопроса о величине группировочного интервала: интервал может быть равным, а в ряде случаев - неравный, даже включать так называемые открытые группы.

Например, при группировке по возрасту могут быть определены открытые группы: до 1 года. 50 лет и старше.

При определении числа групп исходят из цели и задач исследова­ния. Необходимо, чтобы группировки могли вскрыть закономерности изучаемого явления. Большое число групп может привести к чрезмер­ному дроблению материала, ненужной детализации. Малое число групп приводит к затушевыванию характерных черт.

Закончив группировку материала, приступают к сводке.

Сводка - обобщение единичных случаев, полученных в результате статистического исследования, в определенные группы, их подсчет и внесение в макеты таблиц.

Сводку статистического материала проводят при помощи статисти­ческих таблиц. Таблица, не заполненная цифрами, называется макетом.

Статистические таблицы бывают перечневые, хронологические, тер­риториальные.

Таблица имеет подлежащее и сказуемое. Статистическое подлежа­щее обычно размещается по горизонтальным строкам в левой части таблицы и отражает главный, основной признак. Статистическое ска­зуемое размещается слева направо по вертикальным графам и отра­жает дополнительные учетные признаки.

Статистические таблицы делятся на простые, групповые и комби­национные.

В простых таблицах представлено числовое распределение мате­риала по одному признаку, составных частей его (табл.1). Простая таблица содержит обычно простой перечень или итог по всей сово­купности изучаемого явления.

Таблица 1

Распределение умерших в больнице Н. по возрасту

В групповых таблицах представлено сочетание двух признаков в связи друг с другом (табл.2).

Таблица 2

Распределение умерших в больнице Н. по полу и возрасту

В комбин аци онных таблицах дается распределение материала по трем и более взаимосвязанным признакам (Таблица 3).

Таблица 3

Распределение умерших в больнице Н. при разных заболеваниях по возрасту и полу

Диагноз основного заболевания Возраст
0-14 15-19 20-39 40-59 60 и > Всего
м ж м ж м ж м ж м ж м ж м+ж
Болезни сис­темы кровооб. - - - -
Травмы и отравления - - -
Злокачеств. новообразов. - - - - - -
Другие заб. - - - -
Все заболев. - -

При составлении таблиц должны соблюдаться определенные требо­вания:

Каждая таблица должна иметь заголовок, отражающий ее содержание;

Внутри таблицы все графы также должны иметь четкие краткие наз­вания;

При заполнении таблицы все клетки таблицы должны содержать соответствующие числовые данные. Оставшиеся незаполненными из-за отсутствия данной комбинации клетки таблицы прочеркивают­ся ("-"), а при отсутствии сведений в клетке проставляется "н.с." или "...";

После заполнения таблицы в нижней горизонтальном ряду и в пос­леднем справа вертикальном столбце подводятся итоги верти­кальных граф и горизонтальных строк.

Таблицы должны иметь единую последовательную нумерацию.

В исследованиях, имеющих небольшой объем наблюдений, сводка проводится вручную. Все учетные документы раскладываются на груп­пы в соответствии с шифром признака. Далее проводится подсчет и запись данных в соответствующую клетку таблицы.

В настоящее время в проведении сортировки и сводки материала широко используются ЭВМ. которые позволяют не только отсортиро­вать материал по изучаемым признакам, но выполнить расчеты пока­зателей.

Четвертый этап - статистический анализ - является ответствен­ным этапом исследования. На этом этапе проводится вычисление ста­тистических показателей (частоты, структуры, средних размеров изучаемого явления),дается их графическое изображение, изучает­ся динамика, тенденции, устанавливаются связи между явлениями. даются прогнозы и т.д. Анализ предполагает интерпретацию получен­ных данных, оценку достоверности результатов исследования. В зак­лючение делаются выводы.

Пятый этап - литературная обработка является заключительным. Он предполагает окончательное оформление результатов статистичес­кого исследования. Результаты могут быть оформлены в виде статьи, отчета, доклада, диссертации и др. Для каждого вида оформления существуют определенные требования, которые должны соблюдаться при литературной обработке результатов статистического исследования.

Результаты медико-статистического исследования внедряются в практику здравоохранения. Возможны различные варианты использова­ния результатов исследования: ознакомление с результатами широ­кой аудитории медицинских и научных работников; подготовка ин­структивно-методических документов; оформление рационализаторско­го предложения и другие.

СТАТИСТИЧЕСКИЕ ВЕЛИЧИНЫ

Для сравнительного анализа статистических данных используется статистические величины: абсолютные, относительные, средние.

Абсолютные величины

Абсолютные величины, полученные в сводных таблицах в ходе ста­тистического исследования, отражают абсолютный размер явления (число лечебно-профилактических учреждений, число коек в больнице, численность населения, число умерших, родившихся, заболевших и т.д.). Ряд статистических исследований завершается получением аб­солютных величин. В некоторых случаях они могут быть использова­ны для анализа изучаемого явления, например, при изучении редких явлений, при необходимости знать точный абсолютный размер явле­ния, при необходимости обратить внимание на отдельные случаи изу­чаемого явления и др. При малом числе наблюдений, в том случае, когда не требуется определения закономерности, также могут ис­пользоваться абсолютные числа.

В значительной части случаев абсолютные величины не могут быть использованы для сравнения с данными других исследований. Для этого служат относительные и средние величины.

Относительные величины

Относительные величины (показатели, коэффициенты) получают­ся в результате отношения одной абсолютной величины к другой. Наиболее часто используются следующие показатели: интенсивные, экстенсивные, соотношения, наглядности.

Интенсивные - показатели частоты, интенсивности, распростра­ненности явления в среде, продуцирующей данное явление. В здравоохранении изучаются заболеваемость, смертность, инвалидность, рождаемость и другие показатель здоровья населения. Средой, в ко­торой происходят процессы, является население в целом или его от­дельные группы (возрастные, половые, социальные, профессио­нальные и др.). В медико-статистических исследованиях явление представляет собой как бы продукт среды. Например, население (среда) и заболевшие (явление); больные (среда) и умершие (яв­ление) и т. д.

Величина основания выбирается в соответствии в величиной пока­зателя - на 100, 1000, 10000, 100000, в зависимости от этого показатель выражается в процентах, промилле, продецимилле,просан­тимилле.

Вычисление интенсивного показателя производится следующим об­разом: например, в Иране в 1995г. проживало 67283 тыс. жителей, в течение года умерло 380200 человек.

Интенсивные показатели могут быть общими и специальными.

Общие интенсивные показатели характеризуют явление в целом. например, общие показатели рождаемости, смертности, заболеваемос­ти, вычисленные ко всему населению административной территории.

Специальные интенсивные показатели (погрупповые) применяются для характеристики частоты явления в различных группах (заболе­ваемость по полу, возрасту, смертность среди детей в возрасте до 1 года, летальность по отдельным нозологическим Формам и т.д.).

Интенсивные показатели применяются: для определения уровня. частоты, распространенности явления; для сравнения частоты явле­ния в двух различных совокупностях; для научения изменений часто­ты явления в динамике.

Экстенсивные - показатели удельного веса, структуры, характе­ризуют распределение явления на составные части, его внутреннюю структуру. Вычисляются экстенсивные показатели отношением частиявления к целому и выражаются в процентах или долях единицы.

Вычисление экстенсивного показателя производится следующим образом: например, в Греции в 1997 г. функционировало 719 больниц, в том числе 214 - больниц общего профиля.

Экстенсивные показатели используются для определения структу­ры явления и сравнительной оценки соотношения составляющих его частей. Экстенсивные показатели всегда взаимосвязаны между собой, т. к. их сумма всегда равна 100 процентам: так, при изучении структуры заболеваемости удельный вес отдельного заболевания мо­жет возрасти при его истинном росте; при одном и том же его уров­не, если число других заболеваний снизилось; при снижении числа данного заболевания, если уменьшение числа других заболеваний происходит более быстрыми темпами.

Соотношения - представляют собой соотношение двух самостоя­тельных, независимых друг от друга, качественно разнородных вели­чин. К показателям соотношения относятся показатели обеспеченнос­ти населения врачами, средними медицинскими работниками, больнич­ными койками и др.

Вычисление показателя соотношения производится следующим обра­зом: например, в Ливане с численностью населения 3789 тыс. жите­лей в медицинских учреждениях в 1996 году работали 3941 врачей.

Наглядности - применяются с целью более наглядного и дос­тупного сравнения статистических величин. Показатели наглядности представляют удобный способ преобразования абсолютных, относи­тельных или средних величин в легкую для сравнения Форму. При вы­числении этих показателей одна из сравниваемых величин приравни­вается к 100 (или 1), а остальные величины пересчитываются соответственно этому числу.

Вычисление показателей наглядности производится следующим об­разом: например, численность населения Иордании составила: в 1994г. - 4275 тыс. человек, в 1995г. - 4440 тыс. человек, в 1996г.- 5439 тыс. человек.

Показатель наглядности: 1994г.-100%;

1995г. = 4460 *100 = 103.9%;
1996г. = 5439*100 = 127.2%

Показатели наглядности указывают, на сколько процентов или во сколько раз произошло увеличение или уменьшение сравниваемых ве­личин. Показатели наглядности используются чаше всего для сравне­ния данных в динамике, чтобы представить закономерности изучае­мого явления в более наглядной форме.

При пользовании относительными величинами могут быть допущены некоторые ошибки. Приведем наиболее частые из них:

1. Иногда судят об изменении частоты явления на основе экстенсив­ных показателей, которые характеризуют структуру явления, а не его интенсивность.

3. При расчете специальных показателей следует правильно выби­рать знаменатель для расчета показателя: например, показатель послеоперационной летальности необходимо рассчитывать по отно­шению к оперированным, а не всем больным.

4. При анализе показателей следует учитывать Фактор времени:

нельзя сравнивать между собой показатели, вычисленные за раз­личные периоды времени: например, показатель заболеваемости за год и за полугодие, что может привести к ошибочным суждениям. 5. Нельзя сравнивать между собой общие интенсивные показатели, вычисленные из неоднородных по составу совокупностей, пос­кольку неоднородность состава среды может влиять на величину показателя.

Средние величины

Средние величины дают обобщающую характеристику статистичес­кой совокупности по определенному изменяющемуся количественному признаку.

Средняя величина характеризует весь ряд наблюдений одним чис­лом, выражающим общую меру изучаемого признака. Она нивелирует случайные отклонения отдельных наблюдений и дает типичную харак­теристику количественного признака.

Одним из требований при работе со средними величинами являет­ся качественная однородность совокупности, для которой рассчиты­вается средняя. Только тогда она будет объективно отображать ха­рактерные особенности изучаемого явления. Второе требование зак­лючается в том, что средняя величина только тогда выражает типич­ные размеры признака, когда она основывается на массовом обобще­нии изучаемого признака, т.е. рассчитывается на достаточном чис­ле наблюдений.

Средние величины получаются из рядов распределения (вариа­ционных рядов).

Вариационный ряд - ряд однородных статистических величин, ха­рактеризующих один и тот же количественный учетный признак, отли­чающихся друг от друга по своей величине и расположенных в опре­деленном порядке (убывания или возрастания).

Элементами вариационного ряда являются:

Варианта - v - числовое значение изучаемого меняющегося коли­чественного признака.

Частота - p (pars) или f (frequency) - повторяемость вариант в вариационном ряду, показывающая, как часто встречается та или иная варианта в составе данного ряда.

Общее число наблюдений - n (numerus) - сумма всех частот: n=ΣΡ. Если общее число наблюдений более 30,статистическая выборка считается большой, если n меньше или равно 30 - малой.

Вариационные ряды бывают прерывные (дискретные), состоящие из целых чисел, и непрерывные, когда значения вариант выражены дроб­ным числом. В прерывных рядах смежные варианты отличаются друг от друга на целое число, например: число ударов пульса, число дыха­ний в минуту, число дней лечения и т.д. В непрерывных рядах ва­рианты могут отличаться на любые дробные значения единицы. Вариационные ряды бывают трех видов. Простой - ряд, в котором каждая варианта встречается один раз, т.е. частоты равны единице.

Обычный - ряд, в котором варианты встречаются более одного ра­за.

Сгруппиров анный - ряд. в котором варианты объединены в группы по их величине в пределах определенного ин­тервала с указанием частоты повторяемости всех вариант, входящих в группу.

Сгруппированный вариационный ряд используют при большом числе наблюдений и больном размахе крайних значений вариант.

Обработка вариационного ряда заключается в получении парамет­ров вариационного ряда (средней величины, среднего квадратичес­кого отклонения и средней ошибки средней величины).

Виды средних величин.

В медицинской практике наиболее часто используются следующие средние величины: мода, медиана, средняя арифметическая. Реже применяются другие средние величины: средняя геометрическая (при обработке результатов титрования антител, токсинов, вакцин); средняя квадратическая (при определении среднего диаметра среза клеток, результатов накожных иммунологических проб); средняя кубическая (для определения среднего объема опухолей) и другие.

Мода (Mo) - величина признака, чаще других встречающаяся в со­вокупности. За моду принимают варианту, которой соответствует наибольшее количество частот вариационного ряда.

Медиана (Me) - величина признака, занимающая срединное значе­ние в вариационном ряду. Она делит вариационный ряд на две рав­ные, части.

На величину моды и медианы не оказывают влияния числовые зна­чения крайних вариант, имеющихся в вариационном ряду. Они не всегда могут точно характеризовать вариационный ряд и применяют­ся в медицинской статистике относительно редко. Более точно ха­рактеризует вариационный ряд средняя арифметическая величина.

Средняя арифметическая (М, или ) - рассчитывается на осно­ве всех числовых значений изучаемого признака.

В простом вариационном ряду, где варианты встречаются только по одному разу, вычисляется средняя арифметическая простая по формуле:

Где V - числовые значения вариант,

n - число наблюдений,

Σ - знак суммы

В обычном вариационном ряду вычисляется средняя арифметичес­кая взвешенная по формуле:

Где V - числовые значения вариант.

Ρ - частота встречаемости вариант.

n - число наблюдений.

S - знак суммы

Пример расчета средней арифметической взвешенной приведен в таблице 4.

Таблица 4

Определение средней длительности лечения больных в специализированном отделении больницы

В приведенном примере модой является варианта, равная 20 дням, поскольку она повторяется чаще других - 29 раз. Мо = 20. Порядковый номер медианы определяется по формуле:

Место медианы приходится на 48-ю варианту, числовое значение ко­торой равно 20. Средняя арифметическая, рассчитанная по формуле, равна также 20.

Средние величины являются важными обобщающими характеристика­ми совокупности. Однако за ними скрываются индивидуальные значе­ния признака. Средние величины не показывают изменчивости, колеб­лемости признака.

Если вариационный ряд более компактен, менее рассеян и все от­дельные значения расположены вокруг средней, то средняя величина дает более точную характеристику данной совокупности. Если вариа­ционный ряд растянут, отдельные значения значительно отклоняются от средней, т.е. имеется большая вариабельность количественного признака, то средняя менее типична, хуже отражает в целом весь ряд.

Одинаковые по величине средние могут быть получены из рядов с различной степенью рассеяния. Так, например, средняя длительность лечения больных в специализированной отделении больницы также бу­дет равна 20, если все 95 больных находились на стационарном ле­чении по 20 дней. Обе вычисленные средние равны между собой, но получены из рядов с разной степенью колеблемости вариант.

Следовательно, для характеристики вариационного ряда, помимо средней величины, необходима другая характеристика, позволяющая оценить степень его колеблемости.


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-13

Государственное общеобразовательное учреждение

Высшего профессионального образования

«Алтайский государственный медицинский университет»

Федерального агентства по здравоохранению и социальному развитию

Кафедра экономики и менеджмента

Контрольная работа

по дисциплине «Медицинская статистика»

на тему: «Этапы статистического исследования»

Выполнил

Проверил:

Барнаул - 2009

Введение…………………………………………………………………………….3

1.1 Статистическое наблюдение……………………………………….........5

1.1.1 Классификация статистического наблюдения по различным признакам……………………………………………………………………………7

1.1.2 Программно-методические вопросы статистического наблюдения………………………………………………………………………....12

2 Сводка и группировка материалов статистического наблюдения. Понятие о статистической сводке, ее задачи и содержание……………………..15

3 Рациональные формы изложения статистического материала…...…….18

3.1 Статистическая таблица и ее элементы……………...…………………18

3.2 Графический метод к изучению коммерческой деятельности…….....19

4 Решение задачи…………………………………………………………….20

Заключение………………………………………………………………………….21

Список использованной литературы………………………………………...……22

Введение

Санитарная (медицинская) статистика изучает вопросы, связанные с медициной, гигиеной, здравоохранением. Она является важной частью социальной гигиены и организации здравоохранения и в то же время составляет одну из отраслей статистики.

В санитарной статистике различают три основных раздела: статистику здоровья населения, статистику здравоохранения и статистику клиническую.

Задачи санитарной статистики:

выявление особенностей состояния здоровья населения и факторов, определяющих его;

изучение данных о сети, деятельности и кадрах ЛПУ, а также данных о результатах лечебно-оздоровительных мероприятий;

применение методов санитарной статистики в экспериментальных, клинических, гигиенических и лабораторных исследованиях.

Материалы санитарной статистики направлены на поиск путей улучшения здоровья населения и совершенствования системы здравоохранения.

Статистика в здравоохранении используется для:

1). В настоящее время развитие углубленных медико-биологических, физических и др. методов исследования, внедрение новой диагностической техники приводит к накоплению числовых данных, характеризующих состояние организма и окружающей среды. Принимая во внимание объем информации об организме можно понять необходимость синтеза данных с использованием статистических методов;

2). Определение норм санитарно-гигиенического характера, расчета доз лекарственных препаратов, определение стандартов физического развития, оценки эффективности применяемых методов профилактики и лечения.

Учетно-оценочные показатели отражают объем или уровень изучаемого явления; аналитические показатели используются для характеристики особенностей развития явления, распространенности в пространстве, соотношения его частей, взаимосвязи с другими явлениями.

Статистическая методология представляет собой совокупность общих правил (принципов) и специальных приемов и методов статистического исследования. Общие правила статистического исследования исходят из положений социально-экономической теории и принципа диалектического метода познания. Они составляют теоретическую базу статистики. Опираясь на теоретическую базу, статистика применяет специфические методы цифрового освещения явления, которые находят свое выражение в трех этапах (стадиях) статистического исследования:

1. Массовое научно-организованное наблюдение, с помощью которого получают первичную информацию об отдельных единицах (факторах) изучаемого явления.

2. Группировка и сводка материала, представляющие собой расчленения всей массы случаев (единиц) на однородные группы и подгруппы, подсчет итогов по каждой группе и подгруппе и оформление полученных результатов в виде статистической таблицы.

3. Обработка статистических показателей, полученных при сводке, и анализ результатов для получения обоснованных выводов о состоянии изучаемого явления и закономерностях его развития. Это и есть понятие науки - Статистика. Предметом статистики, как науки, является изучение количественной стороны массовых общественных явлений в неразрывной связи с их качественной характеристикой. Из этого определения можно выделить три основные черты статистики:

1. исследуется количественная сторона явлений;

2. исследуются массовые общественные явления;

3. дается количественная характеристика массовых явлений на основе изучения качественных параметров.

Статистика предполагает использование совокупности диалектических методов познания. В процессе статистического исследования применяются и специальные методы, изобретенные для лучшего представления статистических совокупностей.

Статистическая совокупность - это масса единиц, объединенных единой качественной основой, но различающихся между собой по ряду варьирующих признаков. Варьирование (изменение) признаков (чаще количественных) может происходить во времени, в пространстве, во взаимном изменении одного признака от другого. Например, размера заработной платы рабочего от количества выпущенной им продукции.

1.1 Статистическое наблюдение

Статистическим наблюдением называется планомерный научно обоснованный сбор данных или сведений о социально-экономических явлениях и процессах. Статистическое наблюдение – начальная стадия экономико-статистического исследования.

1) Статистическое наблюдение должно отвечать следующим требованиям: наблюдаемые явления должны иметь научную или практическую ценность, выражать определенные социально-экономические типы явлений;

2) непосредственный сбор массовых данных должен обеспечить полноту фактов, относящихся к данному вопросу, так как явления находятся в постоянном изменении, развитии. Если отсутствуют полные данные, анализ и выводы могут быть ошибочными;

3) для обеспечения достоверности статданных необходима тщательная и всесторонняя проверка качества собираемых фактов, что является одной из важнейших характеристик статистического наблюдения;

4) научная организация статнаблюдения необходима для того, чтобы создать наилучшие условия для получения объективных материалов.

Стоящие перед менеджером задачи определяют цель наблюдения. Общая цель статнаблюдения состоит в информационном обеспечении управления. цель определяет объект статнаблюдения – совокупность явлений, предметов, охватываемых наблюдением. Объект наблюдения состоит из определенных единиц. Единицей совокупности может выступать человек, факт, предмет, процесс и т.п. Единица наблюдения является первичным элементом объекта статистического наблюдения. Этот элемент является носителем регистрируемых при наблюдении признаков. Единица наблюдения представляет собой элемент совокупности, по которому собираются необходимые данные. Выбор объекта и единиц наблюдения зависит от конкретных условий. Единицы наблюдения обладают множеством различных признаков. Правильность, проявляющаяся не в индивидуальном явлении, а в массе однородных явлений, при обобщении данных статистической совокупности называется статистической закономерностью. Для изучения статистической закономерности фундаментальное значение имеет закон больших чисел. В большом числе наблюдений взаимно погашаются случайные разнонаправленные отклонения. В процессе наблюдения, чтобы зарегистрировать данные, используют наиболее существенные или взаимосвязанные признаки. Четкость при определении единицы наблюдения дает возможность обоснованно определить регистрируемые признаки наблюдения при минимальном количестве признаков, имеющих отношение к изучаемой проблеме, явлению. Уточнение и формирование признаков единицы наблюдения производится на основании следующих общих правил: Эти общие подходы при определении признаков единицы наблюдения дополняются конкретными особенностями изучаемых процессов.

Единицу наблюдения не следует путать с отчетной единицей. Отчетной является такая единица, от которой получают в условном порядке отчетные данные по утвержденным формам. Если наблюдение проводится путем представления отчетности, то отчетная единица, в основном, может совпадать с единицей наблюдения. Отчетная единица называется также информирующей. Она может не совпадать с единицей наблюдения.

После определения объекта исследователь должен выделить границы, определяющие изучаемую совокупность, явление. Для ограничения объекта устанавливаются конкретные значения или пределы признаков. Такие количественные ограничения признаков называются цензом. Это ряд признаков, количественное значение которых при проведении статистического наблюдения служит основанием для учета (или неотнесения) единицы в изучаемой совокупности.

Момент или период наблюдения – это время, по состоянию на которое регистрируются данные. Момент наблюдения устанавливается в соответствии с целью, особенностями явления. На практике его называют также критическим моментом. Некоторые явления, процессы имеют сезонные или другие циклические компоненты.

1.1.1 Классификация статистического наблюдения по различным признакам

Статистическое наблюдение подразделяется:

1) по виду наблюдений на 2 группы:

По охвату единиц совокупности на сплошное и несплошное;

Статистическая методология – система приемов, способов и методов, направленных на изучение количественных закономерностей, которые проявляются в структуре, динамике и взаимосвязях социально-экономических явлений. Методология является основой статистического исследования .

Этапы статистического исследования :

1. статистическое наблюдение, или сбор информации;

2. сводка и группировка результатов статистического наблюдения, или обработка информации;

3. анализ полученной информации.

Статистическое наблюдение – это массовое, планомерное, научно-организованное наблюдение за явлениями социальной и экономической жизни, которое заключается в регистрации отобранных признаков у каждой единицы совокупности.

Процесс проведения статистического наблюдения включает следующие этапы:

1) подготовка наблюдения;

2) проведение массового сбора данных;

3) подготовка данных к автоматизированной обработке;

4) разработка предложений по совершенствованию статистического наблюдения.

Сводка – комплекс последовательных операций по обобщению данных статистического наблюдения для характеристики статистической совокупности в целом и отдельных ее частей (подсчет промежуточных и общих итогов). Группировка – разграничение общей статистической совокупности на группы качественно однородных единиц. Результаты статистической сводки и группировки излагаются в виде статистических таблиц.

Анализ или исследование сущности изучаемых явлений, исследует структуру, динамику и взаимосвязи общественных явлений и процессов.

Имеет следующие этапы:

1) констатация фактов и их оценка;

2) установление характерных черт и причин каждого явления;

3) сопоставление одного явления с другими (в том числе с эталоном);

4) формулирование гипотез, выводов и предложений.

5) Статистическая проверка выдвинутых гипотез с помощью специальных статистических показателей

38.Статистические методы прогнозирования на основе показателей ряда динамики. Процесс прогнозирования, опирающийся на статистические методы, распадается на два этапа. Первый, индуктивный , заключается в обобщении данных, наблюдаемых за более или менее продолжительный период времени, и в представлении соответствующих статистических закономерностей в виде модели. Статистическую модель получают или в виде аналитически выраженной тенденции развития, или же в виде уравнения зависимости от одного или нескольких факторов-аргументов. В ряде случаев – при изучении сложных комплексов экономических показателей – прибегают к разработке так называемых взаимозависимых систем уравнений, состоящих в основном опять-таки из уравнений, характеризующих статистические зависимости. Процесс построения и применения статистической модели для прогнозирования, какой бы вид последняя не имела, обязательно включает выбор формы уравнения, описывающего динамику или взаимосвязь явлений, и оценивание его параметров с помощью того или иного метода. Второй этап, собственно прогноз, является дедуктивным . На этом этапе на основе найденных статистических закономерностей определяют ожидаемое значение прогнозируемого признака.

Следует подчеркнуть, что полученные результаты не могут рассматриваться как нечто окончательное. При их оценке и использовании должны приниматься во внимание факторы, условия или ограничения, которые не были учтены при разработке статистической модели, должна осуществляться корректировка обнаруженных статистических характеристик в соответствии с ожидаемым изменением обстоятельств их формирования. Короче говоря, найденные с помощью статистических методов прогностические оценки являются важным материалом, который, однако, должен быть критически осмыслен. При этом главным является учет возможных изменений в самих тенденциях развития экономических явлений и объектов

39.Статистические таблицы, их виды, составные элементы и правила построения таблиц. Статистическая таблица - форма наиболее рационального изложения полученных в результате статистической сводки и группировки числовых (цифровых) данных. По внешнему виду она представляет собой комбинацию вертикальных и горизонтальных строк, содержащую боковые и верхние заголовки. Статистическая таблица содержит подлежащее и сказуемое.

Подлежащее таблицы представляет ту статистическую совокупность, о которой идет речь в таблице, т. е. перечень отдельных или всех единиц совокупности либо их групп. Чаще всего подлежащее помещается в левой части таблицы и содержит перечень строк.

41.СТРУКТУРНАЯ СРЕДНЯЯ МОДА И ЕЕ ОПРЕДЕЛЕНИЕ. Величина средней определяется всеми значениями признака, встречающимися в данном ряду распределения. Различают такие структурные средние, как: (1) мода (2) медиана (3) квартиль (4) дециль (5) перцентиль Мода - это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является варианта, обладающая наибольшей частотой. При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем - значение модальной величины признака по формуле: где:

Сказуемое таблицы - показатели, с помощью которых дается характеристика явления, отображаемого в таблице.

Если в подлежащем таблицы содержится простой перечень каких-либо объектов, таблица называется простой. В подлежащем простой таблицы нет каких-либо группировок статистических данных. Если подлежащее простой таблицы содержит перечень территорий, то такая таблица называется территориальной.

Простая таблица содержит только описательные сведения, ее аналитические возможности ограничены. Глубокий анализ исследуемой совокупности, взаимосвязей признаков предполагает построение более сложных таблиц - групповых и комбинационных.

Групповые таблицы содержат в подлежащем группировку единиц объекта наблюдения по одному существенному признаку. Простейшим видом групповой таблицы являются таблицы, в которых представлены ряды распределения. Групповая таблица может быть более сложной, если в сказуемом приводится не только число единиц в каждой группе, но и ряд других важных показателей, количественно и качественно характеризующих группы подлежащего. Такие таблицы часто используются в целях сопоставления обобщающих показателей по группам, что позволяет сделать определенные практические выводы.

Комбинационными называются статистические таблицы, е подлежащей которых группы единиц, образованные по одному признаку, подразделяются на подгруппы по одному или нескольким признакам. В отличие от простых и групповых таблиц, комбинационные позволяют проследить зависимость показателей сказуемого от нескольких признаков, которые легли в основу комбинационной группировки в подлежащем.

Основные правила построения статистических таблиц:

1) в заголовке должны быть отражены объект, признак, время и место совершения события;

2) графы и строки следует нумеровать;

3) графы и строки должны содержать единицы измерения;

4) сопоставляемую в ходе анализа информацию располагают в соседних графах (либо одну под другой);

5) числа в таблице проставляют в середине граф, строго одно под другим; числа целесообразно округлять с одинаковой степенью точности;

6) отсутствие данных обозначается знаком умножения ( ), если данная позиция не подлежит заполнению, отсутствие сведений обозначается многоточием (...), либо н.д., либо н. св., при отсутствии явления ставится знак тире (-);

7) для отображения очень малых чисел используют обозначение 0.0 или 0.00; если число получено на основании условных расчетов, то его берут в скобки, сомнительные числа сопровождают вопросительным знаком, а предварительные - знаком (*).

40.Структурная средняя медиана и ее определение. Медиана - это численное значение признака у той единицы совокупности, которая находится в середине ранжированного ряда (построенного в порядке возрастания, либо убывания значений изучаемого признака). Медиану иногда называют серединной вариантой , т.к. она делит совокупность на две равные части таким образом, чтобы по обе ее стороны находилось одинаковое число единиц совокупности. Если всем единицам ряда присвоить порядковые номера, то порядковый номер медианы будет определяться по формуле (n+1):2 для рядов, где n – нечетное . Если же ряд с четным числом единиц, то медианой будет являться среднее значение между двумя соседними вариантами, определенными по формуле: n:2, (n+1):2, (n:2)+1.

В дискретных вариационных рядах с нечетным числом единиц совокупности – это конкретное численное значение в середине ряда.

Нахождение медианы в интервальных вариационных рядах требует предварительного определения интервала, в котором находится медиана, т.е. медианногоинтервала – этот интервал характеризуется тем, что его кумулятивная (накопленная) частота равна полусумме или превышает полусумму всех частот ряда.

X Me -нижняя граница медианного интервала

h Me -величина медианного интервала;

S Me-1 -сумма накопленных частот интервала, предшествующего медианному интервалу;

  • f Me -локальная частота медианного интервала.

Частота интервала, следующего за модальным

42.Сущность и значение графиков, их основные элементы. В статистике графиком называют наглядное изобр ажение статистических величин и их соотношений при помощи геометрических точек, линий, фигур или географических картосхем.

Графики придают изложению статистических данных большую наглядность , чем таблицы, выразительность, облегчают их восприятие и анализ . Позволяет зрительно оценить характер изучаемого явления, присущие ему закономерности, тенденции развития, взаимосвязи с другими показателями, географическое разрешение изучаемых явлений. Еще в древности китайцы говорили, что одно изображение заменяет тысячу слов.При любой возможности анализ статистических данных рекомендуется всегда начинать с их графического изображения. График позволяет сразу получить общее представление обо всей совокупности статистических показателей. Графический метод анализа выступает как логическое продолжение табличного метода и служит целям получения обобщающих статистических характеристик процессов, свойственных массовым явлениям.
При помощи графического изображения стат.данных решаютсязадачи стат.исследования:

1) наглядное представление величины показателей (явлений) в сравнении друг с другом;

2) характеристика структуры какого-либо явления;

3) изменение явления во времени;

4) ход выполнения плана;

5) зависимость изменения одного явления от изменения другого;

6) распространенность или размещение каких-либо величин по территории

В каждом графике выделяют (различают) следующие основные элементы :

  • 1) пространственные ориентиры (систему координат);
  • 2) графический образ;
  • 3) поле графика;
  • 4) масштабные ориентиры;
  • 5) экспликация графика;
  • 6) наименование графика

43.Сущность и значение средних величин. Средняя величина – обобщенная характеристика уровня значений признака, полученная в расчете на единицу совокупности. Средняя величина вычисляется для признаков качественно однородных и различных только количественно, которые присущи всем явлениям в данной совокупности.

Средние величины бывают общими (отражают совокупность в целом) и групповыми (отражают особенность по группам). Делятся на 2 категории – степенные и структурные .

К степенным относятся – средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадратическая. Самая распространенная – ср.арифметическая . Ср.гармоническую используют как обратную ср.арифметической. Ср.квадратическая используется при расчете показателей вариации, ср.геометрическая – при анализе динамики.

К структурным относятся – мода и медиана. Мода – значение изучаемого признака с наибольшей частотой. Медиана – значение признака, приходящее на середину ранжированного ряда. Мода применяется в коммерческой практике для изучения покупательского спроса и регистрации цен. В дискретном ряду мода - это варианта с наибольшей частотой. В интервальном вариационном ряду модой считают центральный вариант интервала, который имеет наибольшую частоту. Применение медианы позволяет получить более точные результаты, чем при использовании других форм средних. Свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины.Порядок нахождения медианы в интервальном вариационном ряду следующий: располагаем индивидуальные значения признака по ранжиру; определяем для данного ранжированного ряда накопленные частоты; по данным о накопленных частотах находим медианный интервал.

2.1 Схема проведения статистического исследования

Системы статистического анализа данных – это современный эффективный инструмент статистического исследования. Широкие возможности для обработки статистических данных имеют специальные системы статистического анализа, а также универсальные средства – Excel, Matlab, Mathcad и др..

Но даже самый совершенный инструмент не может заменить исследователя, который должен сформулировать цель исследования, провести сбор данных, выбрать методы, подходы, модели и средства проведения обработки и анализа данных, а также интерпретировать полученные результаты.

На рисунке 2.1 представлена схема проведения статистического исследования.

Рис.2.1 - Принципиальная схема статистического исследования

Исходным пунктом статистического исследования является формулировка проблемы. При ее определении учитывается цель исследования, определяется, какая информация необходима и как она будет использоваться при принятии решения.

Само статистическое исследование начинается с подготовительного этапа. В ходе подготовительного этапа аналитики изучают техническое задание – документ, составляемый заказчиком исследования. В техническом задании должны быть четко сформулированы цели исследования:

    определен объект исследования;

    перечислены предположения и гипотезы, которые в ходе исследования должны быть подтверждены или опровергнуты;

    описано то, как будут использоваться результаты исследования;

    сроки, в которые исследование должно быть проведено и бюджет исследования.

На основе технического задания разрабатывается структура аналитического отчета - то, в каком виде должны быть представлены результаты исследования, а также программа статистического наблюдения . Программа представляет собой перечень признаков, подлежащих регистрации в процессе наблюдения (или вопросов на которые должны быть получены достоверные ответы по каждой обследуемой единице наблюдения). Содержание программы определяется как особенностями наблюдаемого объекта и целями исследования, так и методами, выбранными аналитиками для дальнейшей обработки собранной информации.

Основной этап статистического исследования включает сбор необходимых данных и их анализ.

Финальным этапом исследования является составление аналитического отчета и предоставление его заказчику.

На рис. 2.2 представлена схема статистического анализа данных.

Рис.2.2 – Основные этапы статистического анализа

2.2 Сбор статистической информации

Сбор материалов подразумевает анализ технического задания исследования, определение источников необходимой информации и (при необходимости) разработку анкет. При исследовании источников информации все требуемые данные разделяют на первичные (данные, которых нет в наличии и которые должны быть собраны непосредственно для данного исследования), и вторичные (собранные ранее для иных целей).

Сбор вторичных данных часто называют "кабинетным" или "библиотечным" исследованием.

Примеры сбора первичных данных: наблюдения за посетителями магазина, анкетирование пациентов больницы, обсуждение проблемы на совещании.

Вторичные данные делят на внутренние и внешние.

Примеры источников внутренних вторичных данных:

    информационная система организации (включающая в себя бухгалтерскую подсистему, подсистему управления продажами, CRM (CRM-система, сокращение от англ. Customer Relationship Management) - прикладное программное обеспечение для организаций, предназначенное для автоматизации стратегий взаимодействия с заказчиками) и другие);

    ранее проведенные исследования;

    письменные отчеты сотрудников.

Примеры источников внешних вторичных данных:

    отчеты органов статистики и других государственных учреждений;

    отчеты маркетинговых агентств, профессиональных ассоциаций и т.п.;

    электронные базы данных (адресные справочники, ГИС и т.п.);

    библиотеки;

    средства массовой информации.

Основными выходными данными на этапе сбора данных являются:

    планируемый объем выборки;

    структура выборки (наличие и размер квот);

    вид статистического наблюдения (сбор данных опрос, анкетирование, измерение, эксперимент, экспертиза, др.);

    информация о параметрах опроса (например, возможность факта фальсификации анкет);

    схема кодировки переменных в базе данных программы, выбранной для обработки;

    план-схема преобразования данных;

    план-схема используемых статистических процедур.

Этот же этап включает непосредственно процедуру анкетирования. Разумеется, анкеты разрабатываются только для получения первичной информации.

Полученные данные должны быть соответствующим образом отредактированы и подготовлены. Каждая анкета или форма наблюдения проверяется и, если нужно, корректируется. Каждому ответу присваиваются числовые или буквенные коды – производится кодировка информации. Подготовка данных включает в себя редактирование, расшифровку и проверку данных, их кодирование и необходимые преобразования.

2.3 Определение характеристик выборки

Как правило, данные, собранные в результате статистического наблюдения для проведения статистического анализа являются выборочной совокупностью. Последовательность преобразования данных в процесс статистического исследования можно схематично представить следующим образом (рис. 2.3)

Рис 2.3 Схема преобразования статистических данных

Анализируя выборку, можно делать выводы о генеральной совокупности, представленной выборкой.

Окончательное определение общих параметров выборки производят, когда все анкеты собраны. Оно включает:

    определение реального количества респондентов,

    определение структуры выборки,

    распределение по месту опроса,

    установление доверительного уровня статистической надежности выборки,

    расчет статистической ошибки и определение репрезентативности выборки.

Реальное количество респондентов может оказаться большим либо меньшим запланированного. Первый вариант лучше для анализа, но невыгоден заказчику исследования. Второй может отрицательно сказаться на качестве исследования, а, следовательно, невыгоден ни аналитикам, ни заказчикам.

Структура выборки может быть случайной или неслучайной (респонденты отбирались на основе заранее известного критерия, например методом квотирования). Случайные выборки априори являются репрезентативными. Неслучайные выборки могут быть намерено нерепрезентативными относительно генеральной совокупности, но давать важную информацию для исследований. В этом случае также следует внимательно отнестись к фильтрационным вопросам анкеты, которые предназначены специально для отсеивания неподходящих под требования респондентов.

Для определения точности оценивания , прежде всего, необходимо установить уровень доверительной вероятности (95% или 99%). Тогда максимальная статистическая ошибка выборки рассчитывается как

или
,

где - объем выборки,- вероятность наступления исследуемого события (попадание респондента в выборку),- вероятность обратного события (непопадания респондента в выборку),- коэффициент доверительной вероятности,
- дисперсия признака.

В таблице 2.4 приведены наиболее употребляемые значения доверительной вероятности и коэффициентов доверительной вероятности.

Таблица 2.4

2.5 Обработка данных на компьютере

Анализ данных с применением компьютера включает выполнение ряда необходимых шагов.

1. Определение структуры исходных данных.

2. Ввод данных в компьютер в соответствии с их структурой и требованиями программы. Редактирование и преобразование данных.

3. Задание метода обработки данных в соответствии с задачами исследования.

4. Получение результата обработки данных. Его редактирование и сохранение в нужном формате.

5. Интерпретация результата обработки.

Шаги 1 (подготовительный) и 5 (заключительный) не способна выполнить ни одна компьютерная программа - их исследователь делает сам. Шаги 2-4 выполняются исследователем с использованием программы, но именно исследователь определяет необходимые процедуры редактирования и преобразования данных, методы обработки данных, а также формат представления результатов обработки. Помощь компьютера (шаги 2–4) заключается, в конечном итоге, в переходе от длинной последовательности чисел к более компактной. На «вход» компьютера исследователь подает массив исходных данных, который недоступен осмыслению, но пригоден для компьютерной обработки (шаг 2). Затем исследователь дает программе команду на обработку данных в соответствии с поставленной задачей и структурой данных (шаг 3). На «выходе» он получает результат обработки (шаг 4) - тоже массив данных, только уже меньший, доступный осмыслению и содержательной интерпретации. При этом исчерпывающий анализ данных обычно требует многократной их обработки с применением разных методов.

2.6 Выбор стратегии анализа данных

Выбор стратегии анализа собранных данных основывается на знании теоретических и практических аспектов исследуемой предметной области, специфики и известных характеристик информации, свойств конкретных статистических методов, а также на опыте и взглядах исследователя.

Необходимо помнить, что анализ данных - это вовсе не конечная цель исследования. Его цель - получить информацию, которая поможет решить определенную проблему и принять адекватные управленческие решения. Выбор стратегии анализа должен начинаться с исследования итогов предыдущих этапов процесса: определение проблемы и разработка плана исследования. В качестве "черновика" используется предварительный план анализа данных, разработанный как один из элементов плана исследования. Затем, в ходе поступления на последующих стадиях процесса исследования дополнительной информации, может понадобиться внесение определенных изменений.

Статистические методы делятся на одно- и многомерные. Одномерные методы(univariatetechniques) используются тогда, когда все элементы выборки оцениваются одним показателем, либо если этих показателей несколько для каждого элемента, но каждая переменная анализируется при этом отдельно ото всех остальных.

Многомерные методы (multivariate techniques) прекрасно подходят для анализа данных, если для оценки каждого элемента выборки используется два или больше показателей и эти переменные анализируются одновременно. Такие методы применяются для определения зависимостей между явлениями.

Многомерные методы отличаются от одномерных прежде всего тем, что при их использовании центр внимания смещается с уровней (средних показателей) и распределений (дисперсий) явлений и сосредотачивается на степени взаимосвязи (корреляции или ковариации) между этими явлениями.

Одномерные методы можно классифицировать на основе того, какие данные анализируются: метрические или неметрические (рис. 3). Метрические данные (metric data) измеряются по интервальной шкале или относительной шкале. Неметрические данные (nonmetric data) оцениваются по номинальной или порядковой шкале

Кроме того, эти методы делят на классы на основе того, сколько выборок - одна, две или более - анализируется в ходе исследований.

Классификация одномерных статистических методов представлена на рис.2.4.

Рис. 2.4 Классификация одномерных статистических методов в зависимости от анализируемых данных

Число выборок определяется тем, как ведется работа с данными для конкретного анализа, а не тем, каким способом собирались данные. Например, данные по лицам мужского и женского пола можно получить в пределах одной выборки, но если их анализ нацелен на выявление разницы в восприятии, основанной на разнице полов, исследователю придется оперировать двумя разными выборками. Выборки считаются независимыми, если они экспериментально не связаны между собой. Измерения, проведенные в одной выборке, не оказывают влияния на значения переменных в другой. Для анализа данные, относящиеся к разным группам респондентов, например собранные от лиц женского и мужского пола, обычно обрабатываются как независимые выборки.

С другой стороны, если данные по двум выборкам относятся к одной и той же группе респондентов, выборки считаются объединенными в пары - зависимыми.

Если существует только одна выборка метрических данных, может использоваться z- и t-критерий. Если же независимых выборок две или больше, в первом случае можно воспользоваться z- и t-критерием для двух выборок, в во втором - методом однофакторного дисперсионного анализа. Для двух связанных выборок используется парный t-критерий. Если речь идет о неметрических данных по одной выборке, исследователь может воспользоваться критериями частотного распределения, хи-квадратом, критерием Колмогорова-Смирнова (K~S), критерием серий и биномиальным критерием. Для двух независимых выборок с неметрическими данными можно прибегнуть к следующим методам анализа: хи-квадрат, Манна-Уитни, медианы, К-С, однофакторным дисперсионным анализом Крускала-Уоллиса (ДА К-У). В отличие от этого, если существует две или больше взаимосвязанных выборок, следует воспользоваться критериями знаков, Мак-Немара и Уилкоксона.

Многомерные статистические методы нацелены на выявление существующих закономерностей: взаимозависимости переменных, взаимосвязи или последовательности событий, межобъектного сходства.

Достаточно условно можно выделить пять стандартных типов закономерностей, исследование которых представляет существенный интерес: ассоциация, последовательность, классификация, кластеризация и прогнозирование

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и "кока-колу", а при наличии скидки за такой комплект "колу" приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации выделяют различные однородные группы данных.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в виде временных рядов. Если удается построить найти закономерности, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.

Многомерные статистические методы можно разделить на методы анализа взаимосвязи и классификационный анализ (рис. 2.5).

Рис.2.5 – Классификация многомерных статистических методов

Обработка собранных первичных данных, включающая их группировку, обобщение и оформление в таблицах, составляет второй этап статистического исследования, который называется сводкой .

Существует 3 основных формы представления обработанных статистических данных: текстовая, табличная и графическая .

На третьем этапе статистического исследования на основе итоговых данных сводки осуществляется научный анализ исследуемых явлений : рассчитываются различные обобщающие показатели в виде средних и относительных величин, выявляются определенные закономерности в распределениях, динамике показателей и т. п. На основе выявленных закономерностей делаются прогнозы на будущее.

Статистическое наблюдение – первая стадия статистического исследования. Почти всегда, в соответствии, конечно, с целями и задачами исследования начинают работу с учета фактов и сбора первичного материала. Первичный материал – это фундамент статистического исследования. От качества статистического наблюдения зависит успех всего исследования в целом. Оно должно быть организовано таким образом, чтобы в результате были получены объективные, точные данные об изучаемом явлении. Неполные, неточные данные, недостаточно хорошо характеризующие процесс, тем более искажающие его приводят к ошибкам. И анализ, проведенный на такой основе – будет ошибочным. Отсюда следует, что учет фактов и сбор первичного материала должны быть тщательно продуманы и организованы.

Необходимо еще раз отметить, что статистические наблюдения – всегда массовые. В силу вступает закон больших чисел - чем больше совокупность, тем объективнее будут полученные результаты.

В статистическом наблюдении можно выделить три этапа: 1. Подготовка наблюдения. Это формулировка программы наблюдения, определение показателей, сгруппированных в макеты конечных статистических таблиц.

Вопросы, составляющие содержание программы, должны вытекать из цели исследования или гипотезы, подтверждению которой предполагается посвятить исследование. Важным элементом являются макеты конечных статистических таблиц. Именно они являются проектом разработки результатов наблюдения и только при их наличии можно выявить все вопросы, которые необходимо включить в программу и избежать включения ненужной информации.

2. Непосредственный сбор материала . Это самая трудоемкая стадия исследования. Статистическая отчетность, как особая форма организации сбора данных, присуща только государственной статистике. Вся иная информация собирается посредством разнообразного статического инструментария. Необходимо указать на два основных требования к собранным данным: достоверность и сопоставимость. И крайне желаемое (в условиях рынка оно возрастает многократно) – своевременность.



3. Контроль материала перед его анализом. Как бы тщательно не был составлен инструментарий наблюдения, проведен инструктаж исполнителей, всегда материалы наблюдения нуждаются в контроле. Это объясняется массовым характером статистических работ и сложностью их содержания.

Объектом любого статистического исследования является совокупность единиц изучаемого явления. Объектом может быть население при переписи, предприятия, города, персонал фирмы и т.д. Словом, объект наблюдения – исследуемая статистическая совокупность. Очень важно определить и границы изучаемой совокупности, которые четко определяют изучаемую совокупность. Например, если ставится цель изучить деятельность малых предприятий области, то следует определить, к какой форме собственности оно относится (государственное, частное, совместное и т.д.), по какому критерию будут отбираться предприятия: отраслевые особенности, объем реализации, время с момента регистрации, состояние (действующее, бездействующее, во временном простое) и т.д. Совокупность должна быть однородной, иначе в процессе анализа возникнут дополнительные сложности и почти всегда неминуемы ошибки.

Наряду с определением объектом наблюдения и границ важно определить единицу совокупности и единицу наблюдения. Единица совокупности – индивидуальный составной элемент статистической совокупности. Единица наблюдения – это то явление, объект, признаки которого подлежат регистрации. Совокупность единиц наблюдения составляет объект наблюдения. Например, цель: исследовать влияние разных факторов на производительность труда рабочих на шахтах ОАО «Испат-Кармет». В этом случае – совокупность определена самой целью – шахтеры, работающие на шахтах «Испат-Кармет», единицей совокупности является шахтер, как носитель информации, а единицей наблюдения является шахта. Кратко: единица совокупности – то, что подвергается обследованию, единица наблюдения – источник сведений.
Для осуществления статистического наблюдения необходимо произвести сбор данных по заданному признаку, а именно: обозначить статистическую совокупность, которая состоит из материально существующих объектов, единицу и цель единовременного обследования объекта, составить программу статистического наблюдения.



На первом этапе формируется выборка собранных данных по обозначенным признакам, данные упорядочиваются по возрастанию. Затем следует составить таблицу распределения частот с последовательным заполнением соответствующих столбцов в таблице.

На втором этапе для обработки собранных первичных данных необходимо произвести группировку и обобщение отобранных элементов по заданному признаку, обозначить числовые характеристики выборки. Этот этап статистического исследования называется сводка . Сводка – научная обработка первичных данных в целях получения обобщенных характеристик изучаемого явления по ряду существенных для него признаков, т. е. первичные материалы сводятся вместе, образуют статистические совокупности, которые характеризуются итоговыми абсолютными обобщающими показателями. На стадии сводки мы переходим от характеристики отдельных варьирующих признаков единиц совокупности – к характеристике всей совокупности в целом или к характеристике их общего проявления в массе.

Следует найти размах по формуле:

R=x(max) – x(min);

моду M(0), которая показывает значение, встречающееся чаще других, медиану M(e), которая характеризует среднее значение (его не превышает половина членов ряда) соответствует варианте, стоящей в середине ранжированного вариационного ряда. Положение медианы определяется ее номером:Nме = (n+1) /2 , где n – число единиц в совокупности и среднее арифметическое значение для обозначенной группы, которая вычисляется по формуле:

Результаты работы могут быть представлены графически в виде гистограммы и полигона распределения частот.

Полученные данные отражают то общее, что присуще всем единицам исследуемой совокупности. В результате статистического наблюдения должна быть получена объективная, сопоставимая, полная информация, позволяющая на последующих этапах исследования обеспечить научно-обоснованные выводы о характере и закономерностях развития изучаемого явления.

Практическое задание

Провести статистическое исследование, выяснив сведенья о росте 2 5 случайным образом выбранных студентовТомского политехнического университета.

Составить таблицу распределения частот, найти размах, моду, медиану и среднее арифметическое значение роста (в см) для обозначенных юношей.