Статус инвестора гарантии

После формирования массива исходных данных результат Рейтинга рассчитывается и представляется на четырех уровнях:

Уровень показателей – это сведенные и обработанные исходные данные, приведенные для каждого показателя к единой шкале от 0 до 100, где 0 – наихудшее возможное измерение, 100 – наилучшее.  

Уровень факторов – это взвешенные средние значения баллов по показателям, входящим в факторы. Например, балл за эффективность процедуры регистрации предприятий формируется на основании трех показателей: среднее время регистрации юридических лиц, среднее количество процедур, необходимых для регистрации юридических лиц, удовлетворенность деятельностью по государственной регистрации юридических лиц». 

Уровень направлений – это взвешенные средние значения факторов (баллов по показателям), входящим в направление. Например, балл за регуляторную среду формируется из пяти факторов: эффективность процедур регистрации предприятий, эффективность процедур по выдаче разрешений на строительство, эффективность процедур по регистрации прав собственности, эффективность процедур по выдаче лицензий, эффективность процедур по подключению электроэнергии». 

Уровень интегрального индекса – это сумма баллов по всем четырем направлениям Рейтинга.

Переходы от одного уровня представления данных к другому осуществляются путем агрегирования.Все переходы агрегирования можно разделить на два качественно разных этапа.

Этап 1: переход от собранных исходных данных к полному набору показателей по всем субъектам РФ в единой шкале (переход от уровня исходных данных к уровню показателей).

В собранных исходных данных может быть несколько характерных проблем:

  • В них могут быть выбросы;
  • Некоторые данные могут быть пропущены (быть недостаточного качества для использования).

Также области значений всех показателей достаточно сильно статус инвестора гарантии различаются и после всех дополнительных преобразований для удобства восприятия все их нужно привести к одной шкале 0-100-баллов:

  • 0 – самый плохой, 100 – самый хороший;
  • В случаях, когда для показателя требовалось нормирование с использованием восстановленной плотности, ни один регион может не получить значения 0 или 100. 

Таким образом, для перехода от собранных исходных данных к полному набору показателей по всем регионам в единой шкале необходимо пройти следующую последовательность шагов, стандартную для работы с данными в рейтингах:

Обработка выбросов в исходных данных.

Расчет показателей.  

Восстановление пропущенных данных.

Изменение шкалы с учетом плотности распределения (для статистических и опросных числовых параметров) и приведение всех показателей к единой шкале пропорциональным масштабированием.

 

Обработка выбросов в исходных данных

Проверка на наличие выбросов осуществляется только для типа данных "опрос-числовые параметры". К таким показателям, например, относится среднее время регистрации юридических лиц или среднее количество процедур, необходимых для получения разрешений на строительство.  Выбросами считаются ответы отдельных респондентов, которые отклоняются от медианного ответа больше чем на 2 сигма, что соответствует попаданию в 2% хвост стандартного нормального распределения. Расчет стандартных отклонений от медианы ответов респондентов, а не от среднего, обусловлен тем, что при малом количестве ответов и экстремальных выбросах среднее значение заметно смещается в сторону выбросов. Это приводит к тому, что ответы, которые явно являются выбросами, могут не попадать в 2% хвост распределения.

Попадание в 2% хвост распределения не является жестким требованием для определения выбросов и может меняться в зависимости от характера полученных данных. Например, если при определении выбросов изначальным методом систематически обнаруживаются ответы, которые, явно являются выбросами, но не попадают в 2% хвост распределения, то имеет смысл увеличить зону выбросов, например, до 3% и оценить результат.

 

Расчет показателей

После обработки выбросов в опросных числовых данных, ответы респондентов агрегируются для получения единой оценки по показателю. Так, например, среднее время подключения к электросетям рассчитывается по отдельным ответам респондентов. Ответы в натуральных величинах на вопрос о времени подключения к электросетям агрегируются в одну цифру для субъекта РФ – среднее время подключения к электросетям. По показателям удовлетворенности для каждого респондента, считается средняя оценка по различным критериям удовлетворенности. Затем аналогичные оценки, полученные для всех респондентов, усредняются и получается средняя оценка удовлетворенности по региону в целом. Более подробное описание см. в документе «Таблица расчёта показателей».

 

Восстановление пропущенных данных

Исходные данные по некоторым субъектам РФ /показателям могут быть недостаточно качественными (например, количество респондентов в регионе ниже целевых значений, что серьезно повышает процент погрешности результата, большое количество ошибок в ответах респондентов и экспертов) или могут быть пропущены. Такие случаи необходимо обрабатывать особым образом.

Для расчета Рейтинга в случае отсутствия данных, их недостаточного количества или их низкого качества используется восстановление значения. Возможны четыре типа восстановлений: 1) по наихудшему значению для данного показателя по всем регионам, 2) по средней перцентиле данного региона по всем показателям, 3) по прошлому году для данной пары регион-показатель, 4) для парных показателей «среднее время – среднее количество процедур» пропущенное значение восстанавливается по наихудшему значению группы парного показателя, если оно имеется. Тип восстановления задается экспертно.

Восстановленное значение используется исключительно для целей расчета Рейтинга, однако оно не является результатом региона по пропущенному  показателю. Восстановленное значение не сообщается региону при раскрытии результатов Рейтинга (т.е. по пропущенному показателю в карточке региона ставится прочерк).

Для восстановления пропущенных данных по среднему перцентилю необходимо пройти следующие шаги.

Сначала для региона А, у которого имеются пропущенные данные, определяются все показатели с имеющимися данными. По каждому такому показателю Х рассчитывается перцентиль региона А. Он равен отношению количества регионов с результатами, которые хуже чем у региона А по показателю Х, к количеству регионов с имеющимися данными по показателю Х (за исключением региона А). Таким образом, если у региона наилучший результат по показателю, то его перцентиль по этому показателю равен 100%. В противоположной ситуации, если регион показал самый низкий результат, то его перцентиль по рассматриваемому показателю будет равен 0%.

После определения перцентиля по каждому показателю с имеющимися данными для региона А рассчитывается средний перцентиль как среднее арифметическое по перцентилям отдельных показателей.

Далее средний перцентиль используется для восстановления данных. По всем пропущенным показателям региона А данные восстанавливаются таким образом, чтобы перцентиль региона А по каждому пропущенному показателю равнялся его среднему перцентилю.

Приведение всех показателей к единой шкале пропорциональным масштабированием

В последнем шаге первого этапа агрегирования все значения показателей приводятся к шкале от 0 до 100 при помощи пропорционального линейного масштабирования. При этом 100 баллов соответствует наилучшему результату, а 0 – наихудшему. Если по показателю известны теоретические границы (т.е. минимально и максимально возможные значения), то к нему применяется преобразование

x_norm=100∙(x-x_min)/(x_max-x_min ),

если показатель является возрастающим, и преобразование

x_norm=100-100∙(x-x_min)/(x_max-x_min ),

если показатель является убывающим. Обычно данное преобразование применяется к показателям типа "опрос-удовлетворенность" и "экспертная оценка".

Если же по показателю теоретические границы не известны, то к нему применяется несколько иное линейное преобразование

x_norm= 100((x-minX)/(maxX-minX )∙(¯x-▁x)+▁x),

если показатель является возрастающим, и преобразование

x_norm= 100-100((x-minX)/(maxX-minX )∙(¯x-▁x)+▁x),

если показатель является убывающим.

Здесь minX и maxX - выборочные минимум и максимум значений показателя (по всем регионам), а ▁x и ¯x – значения оцененной функции распределения показателя в точках  minX и maxX соответственно. Данное преобразование обычно применяется для показателей типа "опрос - числовые параметры" и для статистических показателей

 

Этап 2:  переход между уровнями представления информации (от показателей к факторам, от факторов к направлениям, от направлений к интегральному индексу).

Факторы рассчитываются как средние значения, входящих в него показателей. Направления – как средние значения, входящих в него факторов. Интегральный индекс рассчитывается как сумма индексов по направлениям, и таким образом, ограничен шкалой от 0 до 400.  


Источник: http://asi.ru/investclimate/rating/


Закрыть ... [X]

Национальный рейтинг состояния инвестиционного Горький шоколад на подарок

Статус инвестора гарантии Статус инвестора гарантии Статус инвестора гарантии Статус инвестора гарантии Статус инвестора гарантии Статус инвестора гарантии