WWW.WIKI.PDFM.RU
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - Собрание ресурсов
 

«Практики Альфа-Банка СЕГОДНЯ МЫ ПОГОВОРИМ • О больших данных и технологиях машинного обучения • О жизненном цикле заёмщика банка • О том, на что похожа работа аналитика ...»

«Действуй, чтобы победить!» СТРАНИЦА 1

Анализ данных и розничные кредиты

Практики Альфа-Банка

СЕГОДНЯ МЫ ПОГОВОРИМ

• О больших данных и технологиях машинного обучения

• О жизненном цикле заёмщика банка

• О том, на что похожа работа аналитика (данных)

• О том, что можете сделать в Альфа-Банке лично вы

job.alfabank.ru vk.com/alfabank_career

2 facebook.com/AlfaBankCareer

ДАВАЙТЕ ПОЗНАКОМИМСЯ

Давид Дале Ведущий риск-аналитик в Альфа-Банке Окончил экономический факультет ВШЭ Окончил Школу анализа данных (Яндекс) Работал в Nike, Accenture, Газпромнефти Преподавал в НИУ ВШЭ теорию игр Победитель CL Cup Technical 2014, финалист CL Cup Russia 2014, победитель универсиады по эконометрике Сооснователь Кейс-школы Феникс job.alfabank.ru vk.com/alfabank_career 3 facebook.com/AlfaBankCareer

А ЧТО ТАКОЕ БОЛЬШИЕ ДАННЫЕ?

Рабочее определение:

Большие данные – это база данных, которая не помещается на один компьютер

Более мягкое определение:

Большие данные – это база данных, которая не помещается в оперативную память

Типичные свойства:

Их много 1 .

Они поступают быстро 2 .

Они разнообразные 3 .

Анализ данных - процесс исследования, фильтрации, преобразования и моделирования данных с целью извлечения полезной информации и принятия решений .



Википедия job.alfabank.ru vk.com/alfabank_career 4 facebook.com/AlfaBankCareer

ТАК ЧТО ПРОИСХОДИТ?

По сути, ещё одна технологическая революция Данные и их обработка с каждым годом дешевле

Закон Мура:

мощность компьютеров удваивается за два года Бизнес не успевает менять процессы так же быстро Значит, вам есть что оптимизировать!

Пока не оптимизировали вас… job.alfabank.ru vk.com/alfabank_career 5 facebook.com/AlfaBankCareer

КАК БОЛЬШИЕ ДАННЫЕ КАСАЮТСЯ ВАС

Сколько различных сфер бизнеса вы можете назвать, облик которых стремительно меняется или изменится благодаря анализу данных?

Финансы Маркетинг

–  –  –

• Возможно, в один прекрасный день вас заменят моделью

• Чтобы вас не «оптимизировали», оптимизируйте сами!

• Вы уже имеете хорошую базу (по крайней мере, если не забивали на учёбу)

• Вы не обязаны быть аналитиком, но… .

• Любое серьёзное решение основано на данных

• Любой важный проект критически зависит от работы аналитиков

–  –  –

Допустим, вы устроились в банк, который выдаёт кредиты частным лицам

Первая задача, которую даёт вам босс:

снизить долю «плохих» заёмщиков, (которые не возвращают кредит) используя данные из социальной сети LinkedIn Работа аналитика (1/3) Общение с бизнесом Заказчик (внутренний или внешний) часто не до конца понимает, чего хочет и что можно сделать Сбор данных Нет, гуглить придётся мало. Скорее всего – данные в вашем бизнесе есть, просто их нужно найти Возможно, они не поместятся у вас на жёстком диске Создание признаков Требуется знание бизнеса «Мышление вширь»

Именно это – главный вклад вашего мозга Результат подготовки

– таблица с обработанными данными:

Признаки вы придумываете сами

–  –  –





Построение («обучение») моделей Обычно есть софт, который делает это достаточно быстро и просто Но профи часто кодят собственные алгоритмы Выбор наилучшей модели Это может занять много времени Сделать «что-нибудь» - просто. Но хочется дожать .

Проверка на адекватность Насколько хорошо согласуется результат со здравым смыслом?

Будет ли модель адекватно работать в будущем?

Начало моделирования – набор данных

–  –  –

Как и везде, работу надо презентовать На основе модели необходимо строить стратегию принятия решений Это не всегда очевидно «Вероятность дефолта 10%» - это хорошо или плохо?

Модель нужно внедрять Наверное, это будут делать программисты Но аналитик даёт инструкции За моделью нужно следить Мониторить, чинить, обновлять, и однажды заменить Работа аналитика (3/3) Работа аналитика (3/3) Ещё советы

• Важна единица наблюдения (id) – есть дубликаты и т.п .

• Порядковые текстовые признаки кодируются цифрами

• Непорядковые можно кодировать уровнем дефолта

• Денежные признаки логарифмируются - log10(x+1)

• Даты удобно оформлять как разность с датой заявки

• Нормализация (StandardScaler – среднее 0, дисперсия 1)

• Выборку делят на 3 части – обучение, тест, валидация

• Если мало данных, кросс-валидация (cross_val_score)

• Подбор параметров модели по сетке (GridSearchCV)

• Смешивайте успешные решения друг с другом!

Результат работы – повышение эффективности бизнеса!

Новая модель точнее прежней на 15% Снижение доли плохих заёмщиков с 2.7% до 2.3% Число заявок – 100 тысяч в год, одобренных – 30 тысяч Плохой заёмщик приводит к убыткам 20 тыс. рублей Выгода?

120 человек в год = 2.4 млн рублей Проблема: стоимость данных – 10 рублей на заявку Теряем 1 млн в год, прибыль 1.4 млн, всё равно неплохо Чего это стоит?

Месяц на разработку, месяц на внедрение

ИЗ ЧЕГО ЕЩЁ СОСТОИТ РАБОТА АНАЛИТИКА?

Задача:

• одобрять побольше заявок

• кредитные потери поменьше

• стоимость ручных проверок поменьше

–  –  –

SQL (+Hadoop?) - выгрузить данные Матстат - проверять гипотезы Визуализация – понимать и объяснять

ИССЛЕДОВАНИЕ ПРОГНОЗИРОВАНИЕ ОПТИМИЗАЦИЯ

Эконометрика + машинное обучение Построение моделей в Python/R/SAS

–  –  –

Подавайтесь на практики/стажировки/позиции job.alfabank.ru Регистрируйтесь на все аналитические мероприятия goo.gl/7w5KdD Решите задачи и пройдите бесплатный курс по предсказательным моделям в Python goo.gl/FcfhGF (ссылка на задачи появится позднее)

–  –  –

Что: программа оплачиваемых годовых стажировок Кому: студенты выпускных курсов, магистранты, выпускники График: гибкий (от 20 часов в неделю)

Направления:

• операционный блок

• бизнес-линии: Розничный Бизнес, Массовый Бизнес, КИБ

• BI

• Риски

• Казначейство

• IT и Электронный Бизнес

• Стратегия

• финансы changellenge.com/AlfaBank/iChooseAlfa

–  –  –

job.alfabank vk.com/alfabank_c facebook.com/AlfaBank.ru areer Career Приложение: онлайн-курсы по теорверу и математической статистике • «Теория вероятностей для начинающих» от МФТИ и Андрея Райгородского • «Математика и Python для анализа данных» краткое введение в матан, линейную алгебру, оптимизацию и теорвер для целей анализа данных от МФТИ и Yandex Data Factory • «Introduction to Probability and Data» - азы ТВ и МС с приложениями на языке R от Duke University Приложение: литература по теорверу и математической статистике • «Голая статистика. Самая интересная книга о самой скучной науке», Чарльз Уилан – для тех, кто хочет узнать больше про статистику, но не любит учебники • «Statistics for Business and Economics» by Paul Newbold, William Carlson, Betty Thorne – одна из лучших англоязычных книг для начинающих по ТВ и МС • «Теория вероятностей и математическая статистика» Шведова (в магазине Вышки) – хороший русскоязычный учебник для начинающих • «Теория вероятностей и математическая статистика», Гмурман В.Е. – хороший скачивабельный учебник • «Introduction to Probability» by Charles M. Grinstead, J. Laurie Snell – более детальный учебник для начинающих (только по ТВ) • «Вероятность», Ширяев А.Н. – мехматовский учебник для настоящих ценителей высокого • «Probability Theory: The Logic of Science» by E. T. Jaynes, G. Larry Bretthorst – вывод классической теории вероятностей (и не только) из нескольких аксиом .

Осторожно: автор предвзят в сторону байесовского подхода .

Приложение: литература по управлению рисками • «Теория риска. Выбор при неопределенности и моделирование риска», Шоломицкий А.Г. – теоретические основы риск-менеджмента и приложения для финансовых отраслей • «Основы риск-менеджмента», М. Круи, Д. Галай, Р .

Марк - подробный путеводитель по философии и методом управления рисками, преимущественно для банков • «Quantitative Risk Management: A Practical Guide to Financial Risk», by Thomas S. Coleman • «Энциклопедия финансового риск-менеджмента»

А.А. Лобанов, А.В. Чугунов Приложение: литература и курсы по машинному обучению

• Hastie, Tibshirani: The Elements of Statistical Learning (лежит на http://statweb.stanford.edu/~tibs/ElemStatLearn/ )

• Mirkin: Core Concepts in Data Analysis: Summarization, Correlation and Visualization

• Лекции и слайды Воронцова (http://www.machinelearning.ru/wiki/index.php?title=Мо)

• Курсы на Курсере:

• От Andrew Ng https://www.coursera.org/learn/machine-learning

• От Воронцова https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie

• Документация Scikit-learn scikit-learn.org/stable/documentation.html



Похожие работы:

«Инновационная карта. Тема инновации: Развитие ключевых компетенций обучающихся через новые формы организации внеучебнойной деятельности. № Характеристика нововведения Классификация нововведения 1.1. По сфере обновления 1.1.1. Содержание образования: 1.1.2. Методики обучения (технологии) 1.1.3. Орган...»

«BMW Financial Services “БМВ Банк” ООО Общество с ограниченной ответственностью ”БМВ Банк” 141407, г. Химки, Московская область, ул . Панфилова 19, строение 1 Программа кредитования новых мотоциклов марки BMW с остаточным платежом “BMW Motorrad Select” Программа “BMW Motorrad Select” позволяет приобрес...»

«Президентские выборы 2018 г. в Сьерра-Леоне В марте 2018 г. в Сьерра-Леоне состоялись выборы президента страны, проходившие в два тура: первый – 7 марта, второй – 31 марта. В соответствии с Конституцией в первом туре кандидат, чтобы быть и...»

«5. ChaudhuriD. China-Pakistan Railway Project. URL: http://www.vifindia. org/China-Pakistan-Railway-Project (mode of access: 20.02.2013).6. Ван Шаахуэй. Особенности экономического развития Северо-Запад­ ного Кит...»

«ПРОЕКТ Институт Развития Интернета Предложения по формированию долгосрочной программы развития российской части информационно-коммуникационной сети "Интернет" и связанных с ней отраслей эк...»

«Программа Mastercard Rewards в России Условия Программы Введение – Продвижение и управление Программой Mastercard Rewards в России осуществляются 1. бельгийской частной компанией с ограниченной ответственностью "Мастеркард Европа", зарегистрированной Коммерческим судом...»

«Проект Методическое руководство по реализации Программы "Ты – предприниматель" в субъектах Российской Федерации Москва, 2017 Содержание Введение Раздел 1. Проведение игровых, тренинговых и иных проектов, образовательных курсов...»

«ДВАС АЛЕКСАНДР ГРИГОРЬЕВИЧ ОСОБЕННОСТИ ФОРМИРОВАНИЯ ЛОГИСТИЧЕСКОЙ СИСТЕМЫ ПРЕДПРИЯТИЯ С ВЫСОКОЙ СТЕПЕНЬЮ ВЛИЯНИЯ ФАКТОРА СЕЗОННОСТИ Специальность 08.00.05 – Экономика и управление народным хозяйством (логистика) ДИССЕРТАЦИЯ на соискание ученой степени кандидата...»








 
2018 www.wiki.pdfm.ru - «Бесплатная электронная библиотека - собрание ресурсов»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.