Модель скоринга. Виды скоринговых моделей. Недостатки скоринговой системы

Рассмотрим модели банкротства предприятия, и более детально методы оценки платежеспособности предприятия.

Что такое скоринговая модель оценки предприятия?

Скоринговый подход к оценке платежеспособности предприятия заключается в анализе статистики по предприятиям по их исполнению обязательств перед кредиторами, информация о которых содержится в бюро кредитных историй. Поэтому скоринговые модели иногда в литературе называют кредитные скоринговые модели (credit- score ) или кредитные оценочные модели. Таким образом, можно сказать, что кредитные скоринговые модели – статистические модели оценки платежеспособности предприятия.

История скорингового подхода к оценке

Ранее скоринговые модели разрабатывались исключительно для оценки кредитоспособности физических лиц в целях выдачи кредитов банками. Данный подход был впервые предложен Д. Дюраном в 1941 году для классификации клиентов банков по двум классам: кредитоспособные и некредитоспособные. Для определения класса рассчитывались показатели, позволяющие сделать вывод о его риске банкротства. Баллы для скоринговых моделей рассчитываются с помощью инструмента логистической регрессии. На ее основе, к слову, также строятся logit-модели оценки риска банкротства физических лиц и предприятий.

Задача скорингового подхода оценки платежеспособности предприятия

Задача скоринговой модели оценки платежеспособности предприятия заключается в классификации его по степени финансового риска. Скоринговый подход схож с рейтинговым подходом оценки предприятия, так как в нем также присутствует рейтинг (класс) у предприятия, помимо этого присутствуют балльная оценка и присвоение рейтинга финансовым показателям.

Отличие заключается в том, что в результате присваивается рейтинг и предприятие относится к классу платежеспособности, т.е. производится помимо оценки еще и классификация. Также в результате скоринга получается рейтинг у предприятия и рейтинг у финансовых коэффициентов, описывающих предприятие.

Скоринговые модели оценки платежеспособности предприятия

Рассмотрим отечественные скоринговые модели оценки платежеспособности предприятия. Проанализируем две отечественные скоринговые модели Донцовой-Никифоровой и Савицкой. Данные модели предназначены для оценки риска банкротства отечественных предприятий. Итак, начнем.

Скоринговая модель Донцовой-Никифоровой (1999 г.)

Донцова Л.В.

Экономисты Донцова Л.В. и Никифорова Н.А. предлагают скоринговую модель оценки платежеспособности предприятия, которая позволяет отнести предприятие к одному из шести классов платежеспособности, на основании оценки шести финансовых коэффициентов.

Показатель 1 класс (балл) 2 класс (балл) 3 класс (балл) 4 класс (балл) 5 класс (балл) 6 класс (балл)
Коэффициент абсолютной ликвидности 0.25 и больше (20) 0.216 0.15(12) 0.1(8) 0.05(4) Меньше 0.05(0)
Коэффициент быстрой ликвидности 1 и больше(18) 0.9(15) 0.8
(12)
0.7(9) 0.6(6) Меньше 0.5(0)
2 и больше(16.5) 1.7(120 1.4(7.5) 1.1(3) 1(1.5) Меньше 1(0)
0.6 и больше(17) 0.54(12) 0.43(7.4) 0.41(1.8) 0.4(1) Меньше 0.4(0)
Коэффициент обеспеченности собственными оборотными средствами 0.5 и больше(15) 0.4(12) 0.3(9) 0.2(6) 0.1(3) Меньше 0.1(0)
Коэффициент обеспеченности запасов 1 и больше(15) 0.9(12) 0.8(9) 0.7(6) 0.6(3) Меньше 0.6(0)
Минимальное значение границы в баллах 100 64 50 28 18
1 класс>100 баллов Предприятие имеет хороший запас финансовой прочности
2 класс>64 баллов Предприятие имеет незначительную вероятность погашения долгов, в целом риск есть
3 класс>50 баллов Проблемное предприятие
4 класс>28 баллов Предприятие имеет высокий риск банкротства
5 класс>18 баллов Предприятие имеет очень высокий риск банкротства, меры по оздоровлению, скорее всего, не помогут
6 класс<18 баллов Предприятие финансово несостоятельно

Примечание:

В модели оценки основной упор делается на коэффициенты ликвидности (, коэффициент быстрой ликвидности, коэффициент абсолютной ликвидности), а также на коэффициенты оборачиваемости (коэффициент обеспеченности собственными оборотными средствами, коэффициент обеспеченности запасов).

Коэффициенты Формула Расчет

Коэффициент абсолютной ликвидности

(Денежные средства + Краткосрочные финансовые вложения) / Краткосрочные обязательства стр.1250 / (стр.1510+стр1520)

Коэффициент быстрой ликвидности

(Оборотные активы – Запасы) / Краткосрочные обязательства (стр.1250+стр.1240) / (стр.1510+ стр.1520)

Коэффициент текущей ликвидности

Коэффициент финансовой независимости

Собственный капитал / Активы стр.1300 / стр.1600

Коэффициент обеспеченности собственными оборотными средствами

(Собственный капитал – Внеоборотные активы) / Оборотные активы (стр.1300-стр.1100) / стр.1200

Коэффициент обеспеченности запасов

Коэффициент оборачиваемости запасов = Выручка от продаж / Средняя величина запасов стр.2110 / (стр.1210 нп.+стр.1210 кп.)*0.5

н.п. и к.п. – значение строки баланса на начало периода и конец периода соответственно.

Скоринговая модель Савицкой (2007 г.)

Савицкая Г.В.

Профессор Г.В. Савицкая предлагает свою скоринговую кредитную модель оценки финансового состояния предприятия. Отличие заключается в том, что в модели классификация предприятия происодит по пяти классам и для этого используются три финансовых коэффициента.

Показатель 1 класс 2 класс 3 класс 4 класс 5 класс
Рентабельность совокупного капитала, % 30 и выше(50 баллов) 29.9-20(49.9-35 баллов) 19.9-10(34.9-20 баллов) 9.9-1(19.9-5 баллов) Меньше 1(0 баллов)
Коэффициент текущей ликвидности 2 и больше(30 баллов) 1.99-1.7(29.9-20 баллов) 1.69-1.4(19.9-10 баллов) 1.39-1.1(9.9-1) 1 и ниже(0 баллов)
0.7 и больше(20 баллов) 0.69-0.45(19.9-10 баллов) 0.44-0.3(9.9-5 баллов) 0.29-0.2(4.9-1 баллов) Меньше 0.2(0 баллов)
Границы классов 100 баллов 99-65 64-35 34-6 0 баллов
1 класс>100 баллов Предприятие с хорошей финансовой прочностью
2 класс65-99 баллов Предприятие имеет небольшой риск невозврата долгов
3 класс35-64 баллов Проблемное предприятие
4 класс6-34 баллов Предприятие имеет высокий риск банкротства. Кредиторы рискую потерять вложенные средства
5 класс0 баллов Предприятие несостоятельно

Примечание:

Два из трех финансовых коэффициента определяют платежеспособность предприятия, где коэффициент текущей ликвидности определяет краткосрочную ликвидность, а коэффициент финансовой независимости – долгосрочную ликвидность предприятия.

Коэффициент финансовой независимости = коэффициент автономии.

Расчет финансовых коэффициентов в скоринговой модели

Коэффициенты Формула Расчет

Рентабельность совокупного капитала

Прибыль до налогообложения / Пассивы стр.2300 / стр.1700

Коэффициент текущей ликвидности

Оборотные активы / Краткосрочные обязательства стр.1200 / (стр.1510+стр.1520)

Коэффициент финансовой независимости

Собственный капитал / Активы стр.1300 / стр.1600

Резюме

Подведем итоги разбора кредитных скоринговых моделей оценки платежеспособности предприятия. Один из неоспоримых плюсов заключается в том, что данные модели были разработаны для отечественных предприятий. Одна из трудностей оценки по таким моделям заключается в большой громоздкости расчетов и зачастую непонятности в использовании балльной оценки финансовых коэффициентов. Использование их хорошо сочетать с другими методиками оценки финансового состояния.

Спасибо за внимание! Удачи!

Скоринг (от английского score, счет) - это способ оценки кредитоспособности. Вам как заемщику скоринг интересен для самодиагностики: узнать причины отказа в кредитовании или оценить шансы на будущий кредит. В статье расскажем, как узнать свой скоринговый балл и как его увеличить.

Принцип работы скоринга

Для оценки кредитоспособности скорингу нужны данные. Данные могут быть из разных источников: кредитной истории, анкеты заемщика, социальных сетей и т. д. Скоринг обрабатывает данные и выставляет оценку в баллах. Чем выше скоринговый балл, тем выше шансы получить кредит на выгодных условиях.

Скоринговый балл — величина непостоянная. Он меняется в зависимости от действий заемщика. Например, заемщик взял кредит — выросла кредитная нагрузка и скоринговый балл снизился. Просрочил платеж — балл упал еще ниже. Если заемщик аккуратно без просрочек выплатит кредит — балл увеличится.

Виды скоринга

Банки используют заявочные, поведенческие и мошеннические скоринги.

Заявочный скоринг делится на социодемографический и кредитный. Первый анализирует анкету заемщика: возраст и пол, работу, стаж, размер доходов. Второй анализирует кредитную историю: сколько кредитов брал заемщик, как платил, сколько платит сейчас и т. д.

Поведенческий скоринг предсказывает, как заемщик будет выплачивать кредит: равномерно, с опережением или с просрочками. Поведенческий скоринг может провести, например, зарплатный банк — он знает, как заемщик пользуется картой, сколько денег и на что тратит.

Мошеннический скоринг борется с намеренными невыплатами кредитов. Этот скоринг анализирует базы МВД, ФССП, внутренней службы безопасности, а также подозрительные данные в кредитной истории, например, частую смену адресов и телефонов.

Вы как заемщик можете оценить себя двумя видами скоринга: кредитным и социодемографическим.

Кредитный скоринг

Кредитный скоринг используется для оценки заемщиков, которые уже брали кредиты. Скоринговый балл рассчитывается на основе анализа кредитной истории.

Пример отчета кредитного скоринга

Социодемографический скоринг

Социодемографический скоринг предназначен для заемщиков с пустой или отсутствующей кредитной историей. Он анализирует возраст, пол, семейное положение, наличие иждивенцев, образование, профессию, трудовой стаж, доходы и регион проживания.

Соцдем скоринг сверяет данные проверяемого заемщика с предыдущими клиентами банка, чтобы оценить благонадежность. Например, по статистике банка люди старше 30 лет вносят платежи по кредитам стабильнее, чем молодежь. Поэтому заемщики от 30 лет при прочих равных условиях получают более высокий скоринговый балл.


Пример отчета социодемографического скоринга

Расшифровка скоринговых баллов

Кредитный Социодемогр. Расшифровка
690-850 1000-1200 Максимальный результат. Вы относитесь к категории надежных заемщиков. Таким банки охотно одобряют кредиты на лучших условиях
650-690 750-1000 Хороший результат. Высокая вероятность получить кредит на стандартных условиях.
600-650 500-750 Приемлемый результат. Банк потребует дополнительные справки для подтверждения платежеспособности, например, 2-НДФЛ.
500-600 250-500 Слабый результат. С таким баллом вы вряд ли получите кредит в крупных банках. Обратитесь в небольшие региональные банки или кредитные кооперативы.
300-500 0-250 Худший результат. В банках кредит вряд ли одобрят. Обращайтесь в МФО или КПК. Предложите кредитору залог.

Как повысить скоринговый балл

Если у вас низкий кредитный скоринг, вариант его повышения один — улучшать кредитную историю. Для этого:

  • и проверьте, все ли в ней соответствует действительности. Иногда кредитные организации передают данные с большим опозданием, а то и вовсе не передают. Например, вы кредит погасили, а в кредитной истории он числится открытым. Это снижает скоринговый балл.
    Читайте статью
  • Закройте просрочки платежей и необязательные кредиты: кредитные карты, микрозаймы, кредиты на технику. Чем меньше открытых кредитов, тем выше скоринговый балл.
  • Если за последние два года у вас были кредиты с просрочками, нужно восстановить репутацию надежного заемщика. Для этого берите новые кредиты и аккуратно их выплачивайте. Не дают кредит без обеспечения — предоставьте залог, найдите созаемщика. Воспользуйтесь услугой . Через полгода-год скоринговый балл увеличится.

Чтобы увеличить балл социально-демографического скоринга, изучите «факторы» из отчета и постарайтесь их исправить. Например, если вы ИП, трудоустройтесь и проработайте полгода в найме. Найдите созаемщика, съездите за границу, найдите источник дополнительного дохода.

Запомнить

Скоринг помогает заемщикам оценить собственную кредитоспособность и разобраться в причинах банковских отказов.

Скоринги бывают разные: одни анализируют кредитную историю, другие анкету, третьи ищут признаки мошенничества. Вам доступны два вида скоринга — и социодемографический. Первый актуален для заемщиков с опытом кредитования, второй — для тех, кто никогда не брал кредиты.

Скоринговый балл меняется в зависимости от кредитного поведения. Балл можно снизить или повысить.


Для построения скоринговых моделей (причем независимо от выбранного математического подхода) берется репрезентативная выборка из предыдущих заявителей (от нескольких тысяч до сотен тысяч - что не проблема для отрасли, обслуживающей десятки миллионов клиентов). Для каждого заявителя из выборки извлекается полная информация из анкеты-заявления и информация из его кредитной истории за фиксированный период времени (обычно 12, 18 или 24 мес.). Затем принимается экспертное решение, какую историю считать приемлемой, т.е. является ли клиент "хорошим" или "плохим". Чаще всего "плохим" считается клиент, не выплативший по кредиту 3 месяца подряд. Всегда оказывается некоторое число клиентов, которых нельзя отнести ни к "хорошим", ни к "плохим", поскольку
они либо недостаточно давно получили кредит (прошло слишком мало времени), либо их кредитная история "неясна" (например, были задержки по 3 месяца, но не подряд). Как правило, такие "промежуточные" клиенты исключаются из выборки.
Эмпирические требования к базе данных, используемых для построения скоринговой модели:
размер выборки - не менее 1500 всего, не менее 500 плохих;
четкое определение критерия "плохой"/"хороший". Далеко не всегда ясно, на каком этапе кредитной истории, по какому признаку и на каком уровне разделять "плохих" и "хороших";
четкое определение временного отрезка - периода жизни продукта (зависит от самого продукта и может меняться от месяца - мобильный телефон до десятилетий - ипотека);
стабильность состава клиентской группы - демография, миграции, сохранение привычек потребления;
неявное, но обязательное требование: стабильность экономических, политических, социальных и прочих условий.
При построении кредитных моделей существенным является выбор временного горизонта - отрезка времени между подачей заявления (выдачей кредита) и классификацией "плохой"/"хороший". Анализ показывает, что процент дефолта как функция длительности нахождения клиента с организацией поначалу растет и только через 12 месяцев (кредитные карты) и даже более (разовые займы) начинает стабилизироваться. Таким образом, меньший временной горизонт приводит к недооценке и не учитывает полностью всех характеристик, предсказывающих дефолт. С другой стороны, временной горизонт более двух лет оставляет модель подверженной к сдвигам в составе клиентской группы в течение этого времени, т.к. как состав клиентов в выборке в начале временного горизонта может оказаться существенно отличным от состава клиентов, приходящих в настоящее время. Фактически используются два единовременных среза (в начале и в конце временного горизонта) для создания модели, которая стабильна по времени (за пределами начального временного отрезка). Это и диктует выбор длины временного отрезка - временного горизонта при моделировании.
Другим чрезвычайно важным и дискутируемым вопросом остается соотношение "хороших" и "плохих" в выборке. Должно ли оно отражать реальное соотношение их в составе населения или их должно быть равное число (такое соотношение резко облегчает построение модели с математической точки зрения)?
Далее построение скоринговой модели превращается в классификационную проблему, где входными характеристиками (или параметрами) являются ответы на вопросы анкеты-заявления и параметры (или данные), получаемые в результате проверок из различных организаций (например, полиции, судов, местных советов, кредитных бюро и т.д.), а выходными характеристиками (ответом) - искомым результатом - является разделение клиентов на "хороших" и плохих" согласно имеющимся кредитным историям, сопоставленным по этим входным характеристикам.
Собственно рейтинговая таблица (scorecard) - это система придания численных баллов (счета) характеристикам (или параметрам) заемщика для получения искомого числового значения, которое отражает, с какой вероятностью у заемщика по отношению к другим заемщикам произойдет некое событие или он совершит определенное действие (аспект "по отношению" в определении очень важен).
Кредитная рейтинговая таблица, например, не показывает, какой уровень риска следует ожидать (скажем, какой процент кредитов данного типа, вероятно, не будет возвращен); вместо этого она показывает, как данный заем, скорее всего, будет вести себя по отношению к другим займам. Например, ожидается ли, что процент невозвратов или дефолтов для кредитов с данным набором атрибутов будет больше или меньше, чем у кредитов с другим набором.
Большинство рейтинговых таблиц построены с помощью расчета регрессионной модели - статистической модели, которая проверяет, как отдельный параметр (характеристика) влияет на другой параметр или (чаще всего) на целый набор других параметров.
Регрессионная модель дает в результате своего применения набор коэффициентов (factors), называемых регрессионными, которые можно интерпретировать как корреляцию между искомыми параметрами (которые необходимо определить) и объясняющими параметрами, сохраняя неизменными все остальные воздействия на искомые параметры. Эти коэффициенты превращаются в веса баллов (point weights) в рейтинговой таблице.
Самый часто используемый метод построения рейтинговых таблиц
Чаще всего для построения рейтинговых таблиц используется статистический метод логистической регрессии. Однако для объяснения этого подхода стоит начать с простой линейной регрессии, а потом перейти к логистической - как особого случая линейной.
В простейшем случае линейная регрессия пытается найти линейную связь между двумя переменными: X и К Переменная Y, которую пытаются спрогнозировать, определяется как зависимая (поскольку она зависит от X). Переменная X является объясняющей, поскольку она "объясняет", почему У меняется от одного индивидуума к другому.
С помощью линейной регрессии пытаются выяснить следующее: если меняется X, то насколько

вероятно, что в результате этого также изменится и К Для того чтобы это сделать, необходим набор данных, в котором можно наблюдать множество пар X и соответствующих ему К Когда они будут отложены на плоскости XY и будет получено некое множество, может оказаться, что оно ложится на некую прямую, т.е. есть определенная связь между X и Y, которую можно попытаться аппроксимировать с помощью уравнения:
Y = B_0 + B_1 x X_1
где
B0 - это величина Y, когда X = 0;
B1 - наклон прямой линии.
Эти В. являются коэффициентами регрессии. На практике, скорее всего, окажется несколько объясняющих переменных:
Y = B_0 + B_1 x X_1 + B_2 x X_2 + ... + B_n x X_n.
Логистическая регрессия в сравнении с линейной регрессией
При использовании скоринга, как правило, зависимая переменная принимает значения в очень небольшом диапазоне. Чаще всего работают с бинарной переменной, т.е. такой, которая принимает только два целых значения: так, например, по кредиту дефолт или произошел, или нет; клиент, получивший каталог по почте или ответил, или нет. Как правило, в таком случае дефолту приписывают значение "1", а выплаченному кредиту - значение "0".
Модель в итоге должна оценить вероятность дефолта по кредиту (или ответа клиента на каталог).
И хотя линейная модель иногда используется для расчета рейтинговой таблицы, логистическая регрессия оказывается много удобнее, поскольку она специально построена для случаев, когда зависимая переменная - бинарная (т.е. принимает, как мы уже говорили, только два значения).
Линейная регрессия может давать значения вероятности и меньше нуля, и больше единицы, что лишено смысла. Логистическая модель избегает этого, поскольку работает не с самим бинарным значением зависимой переменной, а с вероятностью или шансами (odds), что это значение действительно реализуется. Логарифм отношения вероятности реализации к вероятности нереализации называют логитом (logit), который может принимать любые значения, как отрицательные, так и положительные. Поэтому для логитов вполне можно использовать модель линейной регрессии (отсюда и название "логистическая").
В модели логистической регрессии объясняющие переменные, умноженные на свои коэффициенты, предполагаются линейными по отношению не к Y, как в линейной регрессии, а к логиту - натуральному логарифму отношения шансов:
ln (p/(1 - p)) = B_0 + B_1 x X_1 + B_2 x B_2 + X_2 + ... + B_n x X_n, где
р - вероятность того, что V произойдет;
р/(1 - р) - отношение шансов.
Шансы и соотношение шансов
Соотношение шансов позволяет сравнивать уровни рисков для разных кредитов. Так, если для одного р1/(1 - p_1) = 0,11, а для другого р2/(1 - р2) = 0,052, то их отношение составит 0,46, т.е. риск невозврата по одному кредиту составляет чуть меньше половины риска невозврата по второму кредиту.
Самые важные выводы из этого следующие: необходимо получать сами шансы и их отношения для разных кредитов из логистических регрессий, т.к. только так удается прямо сопоставить и учесть как влияние отдельных характеристик на уровень риска, так и относительный риск одного кредита по отношению к другому. Попытки обойтись одной рейтинговой таблицей не позволяют оценить рисковость одного кредита относительно другого в силу возможного влияния характеристик, которые были учтены для одного и не учтены для другого.
Вычисление относительных весов отдельных характеристик рейтинговой таблицы
Построив и оценив логистическую модель, можно подставить величины X для любого заявителя или кредита и вычислить счет (score), используя уравнение:

Однако этот счет представлен в шкале натуральных логарифмов, что неудобно для интерпретации. Поэтому счет переводится в линейную шкалу, где определенное число баллов выбирается так, чтобы это число обеспечивало удвоение шансов того, что определенное событие произойдет. Для этого необходимо умножить счет на множитель, равный числу баллов, которое должно представлять удвоение шансов, а затем поделить на 1n(2):
счет по линейной шкале = (В 1 х Х 1 + ... + Вп х Хп) х (20/1п(2)),
если желаемое число баллов, необходимое для удвоения шансов, равно 20.
Иначе, если надо узнать, сколько именно баллов дает каждая характеристика, можно умножить каждое В_1 на (20/(1n(2)), а затем умножить на значение параметра X_1.
Использование КС-статистики для оценки полученной рейтинговой таблицы
Скоринговая таблица конструируется так, чтобы ранжировать различные кредиты в терминах шансов по отношению к определенному событию. Необходимо, чтобы такая скоринговая таблица приписывала кредитам, с которыми происходит некое событие, и кредитам, с которыми оно не происходит, различные счета.
Например, кредитная скоринговая таблица (скоринговая карта) приписывает меньший счет тем кредитам, которые впоследствии испытают серьезные трудности с возвратом или перейдут в дефолт, так что в целом группа плохих кредитов должна иметь меньшие счета, чем группа хороших кредитов.
Для определения качества полученной таблицы строятся графики - кривые распределения процентов хороших и процентов плохих кредитов (от соответствующего общего числа хороших и плохих) в зависимости от величины счета, и качество скоринговой таблицы (карты) характеризуется тем, насколько эти две кривые разделяются.
Именно для численного определения качества разделения и используется статистика Колмогорова-Смирнова (K-S statistics), которая дает числовую меру этого разделения. Статистика КС вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" и кумулятивным процентом распределения "плохих". Теоретически статистика КС может принимать значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75.
Примерная градация выглядит так:
меньше 20 - наверное, скоринговая таблица непригодна к применению;
20-40 - неплохая таблица;
41-50 - хорошая таблица;
51-60 - очень хорошая таблица; />61-75 - поразительно хорошая таблица;
больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то неправильно* (128).
Следует отметить, что качество скоринговых моделей следует постоянно проверять и мониторинг является обязательной процедурой в процессе эксплуатации. Со временем могут меняться как экономические условия, так и поведенческие особенности заемщиков, и только своевременная подстройка или даже замена скоринговых моделей обеспечат эффективное управление кредитными рисками.


Для построения скоринговых моделей (причем независимо от выбранного математического подхода) берется репрезентативная выборка из предыдущих заявителей (от нескольких тысяч до сотен тысяч - что не проблема для отрасли, обслуживающей десятки миллионов клиентов). Для каждого заявителя из выборки извлекается полная информация из анкеты-заявления и информация из его кредитной истории за фиксированный период времени (обычно 12, 18 или 24 мес.). Затем принимается экспертное решение, какую историю считать приемлемой, т.е. является ли клиент "хорошим" или "плохим". Чаще всего "плохим" считается клиент, не выплативший по кредиту 3 месяца подряд. Всегда оказывается некоторое число клиентов, которых нельзя отнести ни к "хорошим", ни к "плохим", поскольку
они либо недостаточно давно получили кредит (прошло слишком мало времени), либо их кредитная история "неясна" (например, были задержки по 3 месяца, но не подряд). Как правило, такие "промежуточные" клиенты исключаются из выборки.
Эмпирические требования к базе данных, используемых для построения скоринговой модели:
размер выборки - не менее 1500 всего, не менее 500 плохих;
четкое определение критерия "плохой"/"хороший". Далеко не всегда ясно, на каком этапе кредитной истории, по какому признаку и на каком уровне разделять "плохих" и "хороших";
четкое определение временного отрезка - периода жизни продукта (зависит от самого продукта и может меняться от месяца - мобильный телефон до десятилетий - ипотека);
стабильность состава клиентской группы - демография, миграции, сохранение привычек потребления;
неявное, но обязательное требование: стабильность экономических, политических, социальных и прочих условий.
При построении кредитных моделей существенным является выбор временного горизонта - отрезка времени между подачей заявления (выдачей кредита) и классификацией "плохой"/"хороший". Анализ показывает, что процент дефолта как функция длительности нахождения клиента с организацией поначалу растет и только через 12 месяцев (кредитные карты) и даже более (разовые займы) начинает стабилизироваться. Таким образом, меньший временной горизонт приводит к недооценке и не учитывает полностью всех характеристик, предсказывающих дефолт. С другой стороны, временной горизонт более двух лет оставляет модель подверженной к сдвигам в составе клиентской группы в течение этого времени, т.к. как состав клиентов в выборке в начале временного горизонта может оказаться существенно отличным от состава клиентов, приходящих в настоящее время. Фактически используются два единовременных среза (в начале и в конце временного горизонта) для создания модели, которая стабильна по времени (за пределами начального временного отрезка). Это и диктует выбор длины временного отрезка - временного горизонта при моделировании.
Другим чрезвычайно важным и дискутируемым вопросом остается соотношение "хороших" и "плохих" в выборке. Должно ли оно отражать реальное соотношение их в составе населения или их должно быть равное число (такое соотношение резко облегчает построение модели с математической точки зрения)?
Далее построение скоринговой модели превращается в классификационную проблему, где входными характеристиками (или параметрами) являются ответы на вопросы анкеты-заявления и параметры (или данные), получаемые в результате проверок из различных организаций (например, полиции, судов, местных советов, кредитных бюро и т.д.), а выходными характеристиками (ответом) - искомым результатом - является разделение клиентов на "хороших" и плохих" согласно имеющимся кредитным историям, сопоставленным по этим входным характеристикам.
Собственно рейтинговая таблица (scorecard) - это система придания численных баллов (счета) характеристикам (или параметрам) заемщика для получения искомого числового значения, которое отражает, с какой вероятностью у заемщика по отношению к другим заемщикам произойдет некое событие или он совершит определенное действие (аспект "по отношению" в определении очень важен).
Кредитная рейтинговая таблица, например, не показывает, какой уровень риска следует ожидать (скажем, какой процент кредитов данного типа, вероятно, не будет возвращен); вместо этого она показывает, как данный заем, скорее всего, будет вести себя по отношению к другим займам. Например, ожидается ли, что процент невозвратов или дефолтов для кредитов с данным набором атрибутов будет больше или меньше, чем у кредитов с другим набором.
Большинство рейтинговых таблиц построены с помощью расчета регрессионной модели - статистической модели, которая проверяет, как отдельный параметр (характеристика) влияет на другой параметр или (чаще всего) на целый набор других параметров.
Регрессионная модель дает в результате своего применения набор коэффициентов (factors), называемых регрессионными, которые можно интерпретировать как корреляцию между искомыми параметрами (которые необходимо определить) и объясняющими параметрами, сохраняя неизменными все остальные воздействия на искомые параметры. Эти коэффициенты превращаются в веса баллов (point weights) в рейтинговой таблице.
Самый часто используемый метод построения рейтинговых таблиц
Чаще всего для построения рейтинговых таблиц используется статистический метод логистической регрессии. Однако для объяснения этого подхода стоит начать с простой линейной регрессии, а потом перейти к логистической - как особого случая линейной.
В простейшем случае линейная регрессия пытается найти линейную связь между двумя переменными: X и К Переменная Y, которую пытаются спрогнозировать, определяется как зависимая (поскольку она зависит от X). Переменная X является объясняющей, поскольку она "объясняет", почему У меняется от одного индивидуума к другому.
С помощью линейной регрессии пытаются выяснить следующее: если меняется X, то насколько

вероятно, что в результате этого также изменится и К Для того чтобы это сделать, необходим набор данных, в котором можно наблюдать множество пар X и соответствующих ему К Когда они будут отложены на плоскости XY и будет получено некое множество, может оказаться, что оно ложится на некую прямую, т.е. есть определенная связь между X и Y, которую можно попытаться аппроксимировать с помощью уравнения:
Y = B_0 + B_1 x X_1
где
B0 - это величина Y, когда X = 0;
B1 - наклон прямой линии.
Эти В. являются коэффициентами регрессии. На практике, скорее всего, окажется несколько объясняющих переменных:
Y = B_0 + B_1 x X_1 + B_2 x X_2 + ... + B_n x X_n.
Логистическая регрессия в сравнении с линейной регрессией
При использовании скоринга, как правило, зависимая переменная принимает значения в очень небольшом диапазоне. Чаще всего работают с бинарной переменной, т.е. такой, которая принимает только два целых значения: так, например, по кредиту дефолт или произошел, или нет; клиент, получивший каталог по почте или ответил, или нет. Как правило, в таком случае дефолту приписывают значение "1", а выплаченному кредиту - значение "0".
Модель в итоге должна оценить вероятность дефолта по кредиту (или ответа клиента на каталог).
И хотя линейная модель иногда используется для расчета рейтинговой таблицы, логистическая регрессия оказывается много удобнее, поскольку она специально построена для случаев, когда зависимая переменная - бинарная (т.е. принимает, как мы уже говорили, только два значения).
Линейная регрессия может давать значения вероятности и меньше нуля, и больше единицы, что лишено смысла. Логистическая модель избегает этого, поскольку работает не с самим бинарным значением зависимой переменной, а с вероятностью или шансами (odds), что это значение действительно реализуется. Логарифм отношения вероятности реализации к вероятности нереализации называют логитом (logit), который может принимать любые значения, как отрицательные, так и положительные. Поэтому для логитов вполне можно использовать модель линейной регрессии (отсюда и название "логистическая").
В модели логистической регрессии объясняющие переменные, умноженные на свои коэффициенты, предполагаются линейными по отношению не к Y, как в линейной регрессии, а к логиту - натуральному логарифму отношения шансов:
ln (p/(1 - p)) = B_0 + B_1 x X_1 + B_2 x B_2 + X_2 + ... + B_n x X_n, где
р - вероятность того, что V произойдет;
р/(1 - р) - отношение шансов.
Шансы и соотношение шансов
Соотношение шансов позволяет сравнивать уровни рисков для разных кредитов. Так, если для одного р1/(1 - p_1) = 0,11, а для другого р2/(1 - р2) = 0,052, то их отношение составит 0,46, т.е. риск невозврата по одному кредиту составляет чуть меньше половины риска невозврата по второму кредиту.
Самые важные выводы из этого следующие: необходимо получать сами шансы и их отношения для разных кредитов из логистических регрессий, т.к. только так удается прямо сопоставить и учесть как влияние отдельных характеристик на уровень риска, так и относительный риск одного кредита по отношению к другому. Попытки обойтись одной рейтинговой таблицей не позволяют оценить рисковость одного кредита относительно другого в силу возможного влияния характеристик, которые были учтены для одного и не учтены для другого.
Вычисление относительных весов отдельных характеристик рейтинговой таблицы
Построив и оценив логистическую модель, можно подставить величины X для любого заявителя или кредита и вычислить счет (score), используя уравнение:

Однако этот счет представлен в шкале натуральных логарифмов, что неудобно для интерпретации. Поэтому счет переводится в линейную шкалу, где определенное число баллов выбирается так, чтобы это число обеспечивало удвоение шансов того, что определенное событие произойдет. Для этого необходимо умножить счет на множитель, равный числу баллов, которое должно представлять удвоение шансов, а затем поделить на 1n(2):
счет по линейной шкале = (В 1 х Х 1 + ... + Вп х Хп) х (20/1п(2)),
если желаемое число баллов, необходимое для удвоения шансов, равно 20.
Иначе, если надо узнать, сколько именно баллов дает каждая характеристика, можно умножить каждое В_1 на (20/(1n(2)), а затем умножить на значение параметра X_1.
Использование КС-статистики для оценки полученной рейтинговой таблицы
Скоринговая таблица конструируется так, чтобы ранжировать различные кредиты в терминах шансов по отношению к определенному событию. Необходимо, чтобы такая скоринговая таблица приписывала кредитам, с которыми происходит некое событие, и кредитам, с которыми оно не происходит, различные счета.
Например, кредитная скоринговая таблица (скоринговая карта) приписывает меньший счет тем кредитам, которые впоследствии испытают серьезные трудности с возвратом или перейдут в дефолт, так что в целом группа плохих кредитов должна иметь меньшие счета, чем группа хороших кредитов.
Для определения качества полученной таблицы строятся графики - кривые распределения процентов хороших и процентов плохих кредитов (от соответствующего общего числа хороших и плохих) в зависимости от величины счета, и качество скоринговой таблицы (карты) характеризуется тем, насколько эти две кривые разделяются.
Именно для численного определения качества разделения и используется статистика Колмогорова-Смирнова (K-S statistics), которая дает числовую меру этого разделения. Статистика КС вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" и кумулятивным процентом распределения "плохих". Теоретически статистика КС может принимать значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75.
Примерная градация выглядит так:
меньше 20 - наверное, скоринговая таблица непригодна к применению;
20-40 - неплохая таблица;
41-50 - хорошая таблица;
51-60 - очень хорошая таблица; />61-75 - поразительно хорошая таблица;
больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то неправильно* (128).
Следует отметить, что качество скоринговых моделей следует постоянно проверять и мониторинг является обязательной процедурой в процессе эксплуатации. Со временем могут меняться как экономические условия, так и поведенческие особенности заемщиков, и только своевременная подстройка или даже замена скоринговых моделей обеспечат эффективное управление кредитными рисками.

Скоринг - используемая банками система оценки клиентов, в основе которой заложены статистические методы. Как правило, это компьютерная программа, куда вводятся данные потенциального заёмщика. В ответ выдается результат - стоит ли предоставлять ему кредит. Название скоринг происходит от английского слова score, то есть «счет».

Существуют четыре вида скоринга:

application-scoring (дословный перевод с английского - «скоринг заявки, обращения») - оценка кредитоспособности заемщиков при выделении кредита. Это самый распространенный и известный клиентам вид скоринга. В его основе лежат первичный сбор анкетных данных заемщика, их обработка компьютером и вывод результата: предоставлять заем или нет;

collection-scoring - система скоринга на стадии работы с невозвращенными займами. Определяет приоритетные действия сотрудников банка для возврата «плохих» кредитов. Фактически программа позволяет предпринять ряд шагов по работе с невозвращенными долгами, например от первичного предупреждения до передачи дела коллекторскому агентству. Считается, что в процессе такой обработки порядка 40% клиентов ссылаются на забывчивость и возвращают кредит;

behavioral-scoring, «скоринг поведения» - оценка наиболее вероятных финансовых действий заемщика. Такая система дает возможность прогнозировать изменение платежеспособности заемщика, корректировать установленные для него лимиты. Основой анализа могут служить действия клиента за определенный период, например операции по кредитной карте;

fraud-scoring - статистическая оценка вероятности мошеннических действий со стороны потенциального заемщика. Такой скоринг, как правило, используется совместно с другими видами исследования клиентов. При этом считается, что до 10% невозвратов по кредитам связаны в России с откровенным мошенничеством и этот показатель растет.

Многие скоринговые системы не только обрабатывают введенные данные, но и способны к самообучению: они учитывают модель поведения уже принятых на обслуживание клиентов, чтобы корректировать свою оценку будущих заемщиков.

На рынке программного обеспечения для банков существуют готовые решения. Самые известные западные программы - SAS Credit Scoring, EGAR Scoring, Transact SM (Experian-Scorex), K4Loans (KXEN), Clementine (SPSS). Среди российских разработчиков выделяются Basegroup Labs, «Диасофт», известна украинская компания "Бизнес Нейро-Системы". В то же время многие банки разрабатывает свои собственные системы.

Скоринговые системы позволяют снизить издержки и минимизировать операционный риск за счет автоматизации принятия решения, сокращают время обработки заявок на предоставление кредита, дают возможность банкам проводить свою кредитную политику централизованно, обеспечивают дополнительную защиту финансовых организаций от мошенничества. В то же время скоринг имеет и ряд недостатков: часто решение системы основано на анализе данных, предоставленных исключительно самим заемщиком. Кроме того, скоринговые системы необходимо постоянно дорабатывать и поддерживать, т. к. они учитывают только прошлый опыт и реагируют на изменения социально-экономической ситуации с запозданием.

mob_info