РЕФЕРАТ
По эконометрике:
Основы теории измерений
Теория измерений (в дальнейшем сокращенно ТИ) является однойиз составных частей эконометрики. Она входит в состав статистики объектовнечисловой природы. Необходимость использования ТИ при анализе экономическихданных рассмотрим на примере экспертного оценивания, в частности, в связи сагрегированием мнений экспертов, построением обобщенных показателей ирейтингов.
Использование чисел в жизни и хозяйственной деятельностилюдей отнюдь не всегда предполагает, что эти числа можно складывать и умножать,производить иные арифметические действия. Что бы вы сказали о человеке, которыйзанимается умножением телефонных номеров? И отнюдь не всегда 2+2=4. Если вывечером поместите в клетку двух животных, а потом еще двух, то отнюдь не всегдаможно утром найти в этой клетке четырех животных. Их может быть и много больше- если вечером вы загнали в клетку овцематок или беременных кошек. Их можетбыть и меньше — если к двум волкам вы поместили двух ягнят. Числа используютсягораздо шире, чем арифметика.
Так, например, мнения экспертов часто выражены в порядковойшкале (подробнее о шкалах говорится ниже), т.е. эксперт может сказать (и обосновать),что один показатель качества продукции более важен, чем другой, первыйтехнологический объект более опасен, чем второй, и т.д. Но он не в состояниисказать, во сколько раз или на сколько более важен, соответственно, болееопасен. Экспертов часто просят дать ранжировку (упорядочение) объектовэкспертизы, т.е. расположить их в порядке возрастания (или убывания)интенсивности интересующей организаторов экспертизы характеристики. Ранг — этономер (объекта экспертизы) в упорядоченном ряду значений характеристики уразличных объектов. Такой ряд в статистике называется вариационным. Формальноранги выражаются числами 1, 2, 3,..., но с этими числами нельзя делатьпривычные арифметические операции. Например, хотя в арифметике 1 + 2 = 3, нонельзя утверждать, что для объекта, стоящем на третьем месте в упорядочении,интенсивность изучаемой характеристики равна сумме интенсивностей объектов срангами 1 и 2. Так, один из видов экспертного оценивания — оценки учащихся.Вряд ли кто-либо будет утверждать, что знания отличника равны сумме знанийдвоечника и троечника (хотя 5 = 2 + 3), хорошист соответствует двум двоечникам(2 + 2 = 4), а между отличником и троечником такая же разница, как междухорошистом и двоечником (5 — 3 = 4 — 2). Поэтому очевидно, что для анализа подобногорода качественных данных необходима не всем известная арифметика, а другаятеория, дающая базу для разработки, изучения и применения конкретных методоврасчета. Это и есть ТИ. (При чтении литературы надо иметь в виду, что внастоящее время термин «теория измерений» применяется для обозначенияцелого ряда научных дисциплин: классической метрологии (науки об измеренияхфизических величин), рассматриваемой здесь ТИ, некоторых других направлений,например, алгоритмической теории измерений. Обычно из контекста понятно, окакой конкретно теории идет речь))
Краткая история теории измерений. Сначала ТИ развивалась кактеория психофизических измерений. В послевоенных публикациях американскийпсихолог С.С. Стивенс основное внимание уделял шкалам измерения. Во второйполовине ХХ в. сфера применения ТИ стремительно расширяется. Посмотрим, как этопроисходило. Один из томов выпущенной в США в 1950-х годах «Энциклопедиипсихологических наук» назывался «Психологические измерения».Значит, составители этого тома расширили сферу применения РТИ с психофизики напсихологию в целом. А в основной статье в этом сборнике под названием, обратитевнимание, «Основы теории измерений», изложение шло на абстрактно-математическомуровне, без привязки к какой-либо конкретной области применения. В этой статье[1] упор был сделан на «гомоморфизмах эмпирических систем с отношениями вчисловые» (в эти математические термины здесь вдаваться нет необходимости),и математическая сложность изложения возросла по сравнению с работами С.С.Стивенса.
Уже в одной из первых отечественных статей по РТИ (конец1960-х годов) было установлено, что баллы, присваиваемые экспертами при оценкеобъектов экспертизы, как правило, измерены в порядковой шкале. Отечественныеработы, появившиеся в начале 1970-х годов, привели к существенному расширениюобласти использования РТИ. Ее применяли к педагогической квалиметрии (измерениюкачества знаний учащихся), в системных исследованиях, в различных задачахтеории экспертных оценок, для агрегирования показателей качества продукции, всоциологических исследованиях, и др.
Итоги этого этапа были подведены в монографии [2]. Вкачестве двух основных проблем РТИ наряду с установлением типа шкалы измеренияконкретных данных был выдвинут поиск алгоритмов анализа данных, результатработы которых не меняется при любом допустимом преобразовании шкалы (т.е.является инвариантным относительно этого преобразования).
Метрологи вначале резко возражали против использования термина«измерение» для качественных признаков. Однако постепенно возражениясошли на нет, и к концу ХХ в. ТИ стала рассматриваться как общенаучная теория. Основные шкалы измерения
В соответствии с ТИ при математическом моделированииреального явления или процесса следует прежде всего установить типы шкал, вкоторых измерены те или иные переменные. Тип шкалы задает группу допустимыхпреобразований шкалы. Допустимые преобразования не меняют соотношений междуобъектами измерения. Например, при измерении длины переход от аршин к метрам неменяет соотношений между длинами рассматриваемых объектов — если первый объектдлиннее второго, то это будет установлено и при измерении в аршинах, и приизмерении в метрах. Обратите внимание, что при этом численное значение длины варшинах отличается от численного значения длины в метрах — не меняется лишьрезультат сравнения длин двух объектов.
Укажем основные виды шкал измерения и соответствующие группыдопустимых преобразований.
В шкале наименований (другое название этой шкалы — номинальная; это — переписанное русскими буквами английское название шкалы)допустимыми являются все взаимно-однозначные преобразования. В этой шкале числаиспользуются лишь как метки. Примерно так же, как при сдаче белья в прачечную,т.е. лишь для различения объектов. В шкале наименований измерены, например,номера телефонов, автомашин, паспортов, студенческих билетов. Номера страховыхсвидетельств государственного пенсионного страхования, медицинскогострахования, ИНН (индивидуальный номер налогоплательщика) измерены в шкаленаименований. Пол людей тоже измерен в шкале наименований, результат измеренияпринимает два значения — мужской, женский. Раса, национальность, цвет глаз,волос — номинальные признаки. Номера букв в алфавите — тоже измерения в шкаленаименований. Никому в здравом уме не придет в голову складывать или умножатьномера телефонов, такие операции не имеют смысла. Сравнивать буквы и говорить,например, что буква П лучше буквы С, также никто не будет. Единственное, длячего годятся измерения в шкале наименований — это различать объекты. Во многихслучаях только это от них и требуется. Например, шкафчики в раздевалках длявзрослых различают по номерам, т.е. числам, а в детских садах используютрисунки, поскольку дети еще не знают чисел.
В порядковой шкале числа используются не только дляразличения объектов, но и для установления порядка между объектами. Простейшимпримером являются оценки знаний учащихся. Символично, что в средней школеприменяются оценки 2, 3, 4, 5, а в высшей школе ровно тот же смысл выражаетсясловесно — неудовлетворительно, удовлетворительно, хорошо, отлично. Этимподчеркивается «нечисловой» характер оценок знаний учащихся. Впорядковой шкале допустимыми являются все строго возрастающие преобразования.
Установление типа шкалы, т.е. задания группы допустимыхпреобразований шкалы измерения — дело специалистов соответствующей прикладнойобласти. Так, оценки привлекательности профессий мы в монографии [2], выступаяв качестве социологов, считали измеренными в порядковой шкале. Однако отдельныесоциологи не соглашались с нами, полагая, что выпускники школ пользуются шкалойс более узкой группой допустимых преобразований, например, интервальной шкалой.Очевидно, эта проблема относится не к математике, а к наукам о человеке. Для еерешения может быть поставлен достаточно трудоемкий эксперимент. Пока же он непоставлен, целесообразно принимать порядковую шкалу, так как это гарантирует отвозможных ошибок.
Оценки экспертов, как уже отмечалось, часто следует считатьизмеренными в порядковой шкале. Типичным примером являются задачи ранжированияи классификации промышленных объектов, подлежащих экологическому страхованию.
Почему мнения экспертов естественно выражать именно впорядковой шкале? Как показали многочисленные опыты, человек более правильно (ис меньшими затруднениями) отвечает на вопросы качественного, например,сравнительного, характера, чем количественного. Так, ему легче сказать, какаяиз двух гирь тяжелее, чем указать их примерный вес в граммах.
В различных областях человеческой деятельности применяетсямного других видов порядковых шкал. Так, например, в минералогии используетсяшкала Мооса, по которому минералы классифицируются согласно критерию твердости.А именно: тальк имеет балл 1, гипс — 2, кальций — 3, флюорит — 4, апатит — 5,ортоклаз — 6, кварц — 7, топаз — 8, корунд — 9, алмаз — 10. Минерал с большимномером является более твердым, чем минерал с меньшим номером, при нажатиицарапает его.
Порядковыми шкалами в географии являются — бофортова шкалаветров («штиль», «слабый ветер», «умеренныйветер» и т.д.), шкала силы землетрясений. Очевидно, нельзя утверждать, чтоземлетрясение в 2 балла (лампа качнулась под потолком — такое бывает и вМоскве) ровно в 5 раз слабее, чем землетрясение в 10 баллов (полное разрушениевсего на поверхности земли).
В медицине порядковыми шкалами являются — шкала стадийгипертонической болезни (по Мясникову), шкала степеней сердечнойнедостаточности (по Стражеско-Василенко-Лангу), шкала степени выраженностикоронарной недостаточности (по Фогельсону), и т.д. Все эти шкалы построены посхеме: заболевание не обнаружено; первая стадия заболевания; вторая стадия;третья стадия… Иногда выделяют стадии 1а, 1б и др. Каждая стадия имеетсвойственную только ей медицинскую характеристику. При описании группинвалидности числа используются в противоположном порядке: самая тяжелая — первая группа инвалидности, затем — вторая, самая легкая — третья.
Номера домов также измерены в порядковой шкале — онипоказывают, в каком порядке стоят дома вдоль улицы. Номера томов в собраниисочинений писателя или номера дел в архиве предприятия обычно связаны схронологическим порядком их создания.
При оценке качества продукции и услуг, в т. н. квалиметрии(буквальный перевод: измерение качества) популярны порядковые шкалы. А именно,единица продукции оценивается как годная или не годная. При более тщательноманализе используется шкала с тремя градациями: есть значительные дефекты — присутствуют только незначительные дефекты — нет дефектов. Иногда применяют четыреградации: имеются критические дефекты (делающие невозможным использование) — есть значительные дефекты — присутствуют только незначительные дефекты — нетдефектов. Аналогичный смысл имеет сортность продукции — высший сорт, первыйсорт, второй сорт,…
При оценке экологических воздействий первая, наиболееобобщенная оценка — обычно порядковая, например: природная среда стабильна — природная среда угнетена (деградирует). Аналогично в эколого-медицинской шкале:нет выраженного воздействия на здоровье людей — отмечается отрицательноевоздействие на здоровье.
Порядковая шкала используется и во многих иных областях. Вэконометрике это прежде всего различные методы экспертных оценок (см.посвященную им главу 12).
Все шкалы измерения делят на две группы — шкалы качественныхпризнаков и шкалы количественных признаков.
Порядковая шкала и шкала наименований — основные шкалыкачественных признаков. Поэтому во многих конкретных областях результатыкачественного анализа можно рассматривать как измерения по этим шкалам.
Шкалы количественных признаков — это шкалы интервалов,отношений, разностей, абсолютная. По шкале интервалов измеряют величинупотенциальной энергии или координату точки на прямой. В этих случаях на шкаленельзя отметить ни естественное начало отсчета, ни естественную единицуизмерения. Исследователь должен сам задать точку отсчета и сам выбрать единицуизмерения. Допустимыми преобразованиями в шкале интервалов являются линейныевозрастающие преобразования, т.е. линейные функции. Температурные шкалы Цельсияи Фаренгейта связаны именно такой зависимостью: 0С = 5/9 (0F — 32), где 0С — температура (в градусах) по шкале Цельсия, а 0F — температура по шкалеФаренгейта.
Из количественных шкал наиболее распространенными в науке ипрактике являются шкалы отношений. В них есть естественное начало отсчета — нуль, т.е. отсутствие величины, но нет естественной единицы измерения. По шкалеотношений измерены большинство физических единиц: масса тела, длина, заряд, атакже цены в экономике. Допустимыми преобразованиями шкале отношений являютсяподобные (изменяющие только масштаб). Другими словами, линейные возрастающиепреобразования без свободного члена. Примером является пересчет цен из однойвалюты в другую по фиксированному курсу. Предположим, мы сравниваем экономическуюэффективность двух инвестиционных проектов, используя цены в рублях. Пустьпервый проект оказался лучше второго. Теперь перейдем на валюту самойэкономически мощной державы мира — юани, используя фиксированный курспересчета. Очевидно, первый проект должен опять оказаться более выгодным, чемвторой. Это очевидно из общих соображений. Однако алгоритмы расчета необеспечивают автоматически выполнения этого очевидного условия. Надо проверять,что оно выполнено. Результаты подобной проверки для средних величин описаныниже.
В шкале разностей есть естественная единица измерения, нонет естественного начала отсчета. Время измеряется по шкале разностей, если год(или сутки — от полудня до полудня) принимаем естественной единицей измерения,и по шкале интервалов в общем случае. На современном уровне знанийестественного начала отсчета указать нельзя. Дату сотворения мира различныеавторы рассчитывают по-разному, равно как и момент рождества Христова. Так,согласно новой статистической хронологии, разработанной группой акад. РАН А.Т.Фоменко, Господь Иисус Христос родился примерно в 1054 г. по принятому нынелетоисчислению в Стамбуле (он же — Царьград, Византия, Троя, Иерусалим, Рим).
Только для абсолютной шкалы результаты измерений — числа вобычном смысле слова. Примером является число людей в комнате. Для абсолютнойшкалы допустимым является только тождественное преобразование.
В процессе развития соответствующей области знания тип шкалыможет меняться. Так, сначала температура измерялась по порядковой шкале(холоднее — теплее). Затем — по интервальной (шкалы Цельсия, Фаренгейта,Реомюра). Наконец, после открытия абсолютного нуля температуру можно считатьизмеренной по шкале отношений (шкала Кельвина). Надо отметить, что средиспециалистов иногда имеются разногласия по поводу того, по каким шкалам следуетсчитать измеренными те или иные реальные величины. Другими словами, процессизмерения включает в себя и определение типа шкалы (вместе с обоснованиемвыбора определенного типа шкалы). Кроме перечисленных шести основных типовшкал, иногда используют и иные шкалы. Инвариантные алгоритмы и средние величины
Основное требование к алгоритмам анализа данныхформулируется в ТИ так: выводы, сделанные на основе данных, измеренных в шкалеопределенного типа, не должны меняться при допустимом преобразовании шкалыизмерения этих данных. Другими словами, выводы должны быть инвариантны поотношению к допустимым преобразованиям шкалы.
Таким образом, одна из основных целей теории измерений — борьба с субъективизмом исследователя при приписывании численных значенийреальным объектам. Так, расстояния можно измерять в аршинах, метрах, микронах,милях, парсеках и других единицах измерения. Массу (вес) — в пудах,килограммах, фунтах и др. Цены на товары и услуги можно указывать в юанях,рублях, тенге, гривнах, латах, кронах, марках, долларах США и других валютах(при условии заданных курсов пересчета). Подчеркнем очень важное, хотя и вполнеочевидное обстоятельство: выбор единиц измерения зависит от исследователя, т.е.субъективен. Статистические выводы могут быть адекватны реальности толькотогда, когда они не зависят от того, какую единицу измерения предпочтет исследователь,т.е. когда они инвариантны относительно допустимого преобразования шкалы.
Оказывается, сформулированное условие является достаточносильным. Из многих алгоритмов эконометрического анализа данных емуудовлетворяют лишь некоторые. Покажем это на примере сравнения средних величин.
Пусть Х1, Х2,…, Хn — выборка объема n. Часто используютсреднее арифметическое
/>
Использование среднего арифметического настолько привычно,что второе слово в термине часто опускают. И говорят о средней зарплате,среднем доходе и других средних для конкретных экономических данных,подразумевая под «средним» среднее арифметическое. Такая традицияможет приводить к ошибочным выводам. Покажем это на примере расчета среднейзаработной платы (среднего дохода) работников условного предприятия (табл.1).
Табл.1. Численность работников различных категорий, ихзаработная плата и доходы (в условных единицах). № п/п Категория работников Число работников Заработная плата Суммарные доходы 1 Низкоквалифицированные рабочие 40 100 4000 2 Высококвалифицированные рабочие 30 200 6000 3 Инженеры и служащие 25 300 7500 4 Менеджеры 4 1000 4000 5 Генеральный директор (владелец) 1 18500 18500 6 Всего 100 40000
Первые тристроки в табл.1 вряд ли требуют пояснений. Менеджеры — это директора понаправлениям, а именно, по производству (главный инженер), по финансам, помаркетингу и сбыту, по персоналу (по кадрам). Владелец сам руководит предприятиемв качестве генерального директора. В столбце «заработная плата»указаны доходы одного работника соответствующей категории, а в столбце«суммарные доходы» — доходы всех работников соответствующейкатегории.
Фонд оплатытруда составляет 40000 единиц, работников всего 100, следовательно, средняязаработная плата составляет 40000/100 = 400 единиц. Однако эта средняя арифметическаявеличина явно не соответствует интуитивному представлению о «среднейзарплате». Из 100 работников лишь 5 имеют заработную плату, еепревышающую, а зарплата остальных 95 существенно меньше средней арифметической.Причина очевидна — заработная плата одного человека — генерального директора — превышает заработную плату 95 работников — низкоквалифицированных ивысококвалифицированных рабочих, инженеров и служащих.
Ситуациянапоминает описанную в известном рассказе о больнице, в которой 10 больных, изних у 9 температура 40 0С, а один уже отмучился, лежи в морге с температурой 00С. Между тем средняя температура по больнице равна 36 0С — лучше не бывает!
Сказанноепоказывает, что среднее арифметическое можно использовать лишь для достаточнооднородных совокупностей (без больших выбросов в ту или иную сторону). А какиесредние использовать для описания заработной платы? Вполне естественноиспользовать медиану. Для данных табл.1 медиана — среднее арифметическое 50-гои 51-го работника, если их заработные платы расположены в порядке неубывания.Сначала идут зарплаты 40 низкоквалифицированных рабочих, а затем — с 41-го до70-го работника — заработные платы высококвалифицированных рабочих.Следовательно, медиана попадает именно на них и равна 200. У 50-ти работниковзаработная плата не превосходит 200, и у 50-ти — не менее 200, поэтому медианапоказывает «центр», около которого группируется основная массаисследуемых величин. Еще одна средняя величина — мода, наиболее частовстречающееся значение. В рассматриваемом случае это заработная платанизкоквалифицируемых рабочих, т.е.100. Таким образом, для описания зарплатыимеем три средние величины — моду (100 единиц), медиану (200 единиц) и среднееарифметическое (400 единиц). Для наблюдающихся в реальной жизни распределенийдоходов и заработной платы справедлива та же закономерность: мода меньшемедианы, а медиана меньше среднего арифметического.
Для чего вэкономике используются средние величины? Обычно для того, чтобы заменитьсовокупность чисел одним числом, чтобы сравнивать совокупности с помощьюсредних.
Пусть,например, Y1, Y2,...,Yn — совокупность оценок экспертов,«выставленных» одному объекту экспертизы (например, одному извариантов стратегического развития фирмы), Z1, Z2,...,Zn — второму (другому вариантутакого развития). Как сравнивать эти совокупности? Очевидно, самый простойспособ — по средним значениям.
А каквычислять средние? Известны различные виды средних величин: среднееарифметическое, медиана, мода, среднее геометрическое, среднее гармоническое,среднее квадратическое. Напомним, что общее понятие средней величины введенофранцузским математиком первой половины ХIХ в. академиком О. Коши. Оно таково:средней величиной является любая функция f(X1, X2,...,Xn) такая, что при всехвозможных значениях аргументов значение этой функции не меньше, чем минимальноеиз чисел X1, X2,...,Xn, и не больше, чем максимальное из этих чисел. Всеперечисленные выше виды средних являются средними по Коши.
Придопустимом преобразовании шкалы значение средней величины, очевидно, меняется.Но выводы о том, для какой совокупности среднее больше, а для какой — меньше,не должны меняться (в соответствии с требованием инвариантности выводов,принятом как основное требование в ТИ). Сформулируем соответствующую математическуюзадачу поиска вида средних величин, результат сравнения которых устойчивотносительно допустимых преобразований шкалы.
Пусть f(X1,X2,...,Xn) — среднее по Коши. Пусть среднее по первой совокупности меньшесреднего по второй совокупности:
f(Y1,Y2,...,Yn)
Тогдасогласно ТИ для устойчивости результата сравнения средних необходимо, чтобы длялюбого допустимого преобразования g из группы допустимых преобразований всоответствующей шкале было справедливо также неравенство
f(g(Y1),g(Y2),...,g(Yn))
т.е. среднеепреобразованных значений из первой совокупности также было меньше среднегопреобразованных значений для второй совокупности. Причем сформулированноеусловие должно быть верно для любых двух совокупностей Y1, Y2,...,Ynи Z1,Z2,...,Zn и, напомним, любого допустимого преобразования. Средние величины,удовлетворяющие сформулированному условию, назовем допустимыми (всоответствующей шкале). Согласно ТИ только такими средними можно пользоватьсяпри анализе мнений экспертов и иных данных, измеренных в рассматриваемой шкале.
С помощьюматематической теории, развитой в монографии [2], удается описать виддопустимых средних в основных шкалах. Сразу ясно, что для данных, измеренных вшкале наименований, в качестве среднего годится только мода. Средние величины в порядковой шкале
Рассмотрим обработку мнений экспертов, измеренных впорядковой шкале. Справедливо следующее утверждение.
Теорема 1. Из всех средних по Коши допустимыми средними впорядковой шкале являются только члены вариационного ряда (порядковыестатистики).
Теорема 1 справедлива при условии, что среднее f(X1,X2,...,Xn) является непрерывной (по совокупности переменных) и симметрическойфункцией. Последнее означает, что при перестановке аргументов значение функцииf(X1, X2,...,Xn) не меняется. Это условие является вполне естественным, ибосреднюю величину мы находим для совокупности (множества), а не дляпоследовательности. Множество не меняется в зависимости от того, в какойпоследовательности мы перечисляем его элементы.
Согласно теореме 1 в качестве среднего для данных,измеренных в порядковой шкале, можно использовать, в частности, медиану (принечетном объеме выборки). При четном же объеме следует применять один из двухцентральных членов вариационного ряда — как их иногда называют, левую медиануили правую медиану. Моду тоже можно использовать — она всегда является членомвариационного ряда. Но никогда нельзя рассчитывать среднее арифметическое,среднее геометрическое и т.д.
Приведем численный пример, показывающий некорректностьиспользования среднего арифметического f(X1, X2) = (X1 + X2) /2 в порядковойшкале. Пусть Y1= 1, Y2 = 11, Z1= 6, Z2= 8. Тогда f(Y1, Y2) = 6, что меньше, чемf(Z1, Z2) = 7. Пусть строго возрастающее преобразование g таково, что g(1) = 1,g(6) = 6, g(8) = 8, g(11) = 99. Таких преобразований много. Например, можноположить g(x) = x при x, не превосходящих 8, и g(x) = 99(x-8) /3 + 8 для х,больших 8. Тогда f(g(Y1), g(Y2)) = 50, что больше, чем f(g(Z1), g(Z2)) = 7. Каквидим, в результате допустимого, т.е. строго возрастающего преобразования шкалыупорядоченность средних изменилась.
Таким образом, ТИ выносит жесткий приговор среднемуарифметическому — использовать его с порядковой шкале нельзя. Однако же те, ктоне знает теории измерений, используют его. Всегда ли они ошибаются?Оказывается, можно в какой-то мере реабилитировать среднее арифметическое, еслиперейти к вероятностной постановке и к тому удовлетвориться результатами длябольших объемов выборок. В монографии [2] получено также следующее утверждение.
Теорема 2. Пусть Y1, Y2,...,Ym — независимые одинаковораспределенные случайные величины с функцией распределения F(x), а Z1,Z2,...,Zn — независимые одинаково распределенные случайные величины с функциейраспределения H(x), причем выборки Y1, Y2,...,Ym и Z1, Z2,...,Zn независимымежду собой и МY1 > MZ1. Для того, чтобы вероятность события
/>
стремилась к 1 при /> для любой строго возрастающейнепрерывной функции g, удовлетворяющей условию
/>
необходимо и достаточно, чтобы при всех x выполнялосьнеравенство F(x)
Примечание. Условие с верхним пределом носит чистовнутриматематический характер. Фактически функция g — произвольное допустимоепреобразование в порядковой шкале.
Согласно теореме 2 средним арифметическим можно пользоватьсяи в порядковой шкале, если сравниваются выборки из двух распределений,удовлетворяющих приведенному в теореме неравенству. Проще говоря, одна изфункций распределения должна всегда лежать над другой. Функции распределения немогут пересекаться, им разрешается только касаться друг друга. Это условиевыполнено, например, если функции распределения отличаются только сдвигом:
F(x) = H(x+b)
при некотором b. Последнее условие выполняется, если двазначения некоторой величины измеряются с помощью одного и того же средстваизмерения, у которого распределение погрешностей не меняется при переходе отизмерения одного значения рассматриваемой величины к измерению другого. Средние по Колмогорову
Обобщением нескольких из перечисленных выше средних являетсясреднее по Колмогорову. Для чисел X1, X2,...,Xn среднее по Колмогоровувычисляется по формуле
G{(F(X1) +F(X2) +… F(Xn)) /n},
где F — строго монотонная функция (т.е. строго возрастающаяили строго убывающая), G — функция, обратная к F. Среди средних по Колмогорову- много хорошо известных персонажей. Так, если F(x) = x, то среднее поКолмогорову — это среднее арифметическое, если F(x) = ln x, то среднеегеометрическое, если F(x) = 1/x, то среднее гармоническое, если F(x) = x2, тосреднее квадратическое, и т.д. Среднее по Колмогорову — частный случай среднегопо Коши. С другой стороны, такие популярные средние, как медиана и мода, нельзяпредставить в виде средних по Колмогорову. В монографии [2] доказаны следующиеутверждения.
Теорема 3. При справедливости некоторых внутриматематическихусловий регулярности в шкале интервалов из всех средних по Колмогоровудопустимым является только среднее арифметическое.
Таким образом, среднее геометрическое или среднееквадратическое температур (в шкале Цельсия) или расстояний не имеют смысла. Вкачестве среднего надо применять среднее арифметическое. А также можноиспользовать медиану или моду.
Теорема 4. При справедливости некоторых внутриматематическихусловий регулярности в шкале отношений из всех средних по Колмогоровудопустимыми являются только степенные средние с F(x) = xс, />исреднее геометрическое.
Замечание. Среднее геометрическое является пределомстепенных средних при />
Есть ли средние по Колмогорову, которыми нельзя пользоватьсяв шкале отношений? Конечно, есть. Например, с F(x) = ex.
Аналогично средним величинам могут быть изучены и другиестатистические характеристики — показатели разброса, связи, расстояния и др.(см., например, [2]). Нетрудно показать, например, что коэффициент корреляциине меняется при любом допустимом преобразовании в шкале интервалов, как иотношение дисперсий, дисперсия не меняется в шкале разностей, коэффициентвариации — в шкале отношений, и т.д.
Приведенные выше результаты о средних величинах широкоприменяются, причем не только в экономике, менеджменте, теории экспертныхоценок или социологии, но и в инженерном деле, например, для анализа методовагрегирования датчиков в АСУ ТП доменных печей. Велико прикладное значение ТИ взадачах стандартизации и управления качеством, в частности, в квалиметрии.Здесь есть и интересные теоретические результаты. Так, например, любоеизменение коэффициентов весомости единичных показателей качества продукцииприводит к изменению упорядочения изделий по средневзвешенному показателю (этатеорема доказана проф.В.В. Подиновским).
Литература
1. Суппес П., Зинес Дж. Основы теории измерений. — В сб.: Психологическиеизмерения. — М.: Мир, 1967. С.9-110.
2. Орлов А.И. Устойчивость в социально-экономических моделях. — М.: Наука,1979. — 296 с.
3. Пфанцагль И. Теория измерений. — М.: Мир, 1976. — 165 с.