详情

基于机器学习的信用卡违约风险预测

申报人:朱振宇 申报日期:2021-12-07

基本情况

2022校院级项目管理
基于机器学习的信用卡违约风险预测 学生申报
创新训练项目
工学
计算机类
学生自主选题
一年期
现代社会,越来越多的人使用信用卡进行消费,大部分人使用信用卡之后会按时还款,但仍然有少部分人不能在约定时间进行还款,这大大的增加了银行或者金融机构的风险。 本项目根据kaggle上的某一历史数据进行建模分析,对客户的还款能力进行评估,以预测新客户是否有信用卡的违约风险,从而决定是否贷款给新客户使用。

近三年主持项目
1 PP视频智能推荐系统一期研发         2018.5~2019.1 苏宁人工智能研究院 600万 主持 已完成且应用于PPTV
2 基于多模型融合的千里传音项目研发 2018.9~2019.2 苏宁人工智能研究院 300万 主持 已完成且应用于苏宁易购APP
3 基于GBDT+LR的用户流失预警模型研发 2018.9~2019.2 苏宁人工智能研究院 300万 主持 已完成且应用于苏宁易购APP
4 PP视频智能推荐系统二期研发         2019.2~2019.10 苏宁人工智能研究院 800万 主持 已完成且应用于PPTV
5 PP体育智能推荐项目研发             2019.9~2020.9 苏宁人工智能研究院 800万 主持 已完成且应用于PP体育
6 苏宁易购电商APP内容推荐(图文、视频、直播等)研发 2020.9~2021.4 苏宁人工智能研究院 1000万 主持 已完成且应用于苏宁易购APP
7 基于多模态融合(NLP+CV)的智能打标项目研发          2020.10~2021.4  苏宁人工智能研究院  300万 主持 已完成且应用于PPTV/苏宁易购APP

选题和技术可行性方案指导
校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
朱振宇 计算机科学与工程学院(软件学院) 计算机科学与技术(本科) 2020 数据清洗、特征工程、算法模型调优、模型效果评估、模型的搭建与算法优化、汇报材料编写
庄浩 计算机科学与工程学院(软件学院) 计算机科学与技术(本科) 2020 算法模型优化
白健璋 计算机科学与工程学院(软件学院) 计算机科学与技术(本科) 2020 设计文档
杨博文 计算机科学与工程学院(软件学院) 计算机科学与技术(本科) 2020 设计文档

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
许良武 计算机科学与工程学院(软件学院)

立项依据

随着小额贷款行业的兴起,还款逾期问题越发严峻,银行和金融机构对于借贷风险控制的需求越来越高,而传统人力筛选借贷人选的方法面临着成本较高,排查问题困难的问题,难以满足现代社会的需求,如何评估客户还贷风险以及借贷金额成为一个难题。使用机器学习进行风险预测可以有效解决上述问题。本项目进行基于机器学习的信用卡违约风险预测研究,目的在于解决上述问题,提升企业业务效率,降低违约风险,节约成本。

1.通过建立模型以及相关训练来实现对于信用卡违规风险的预测

2.对随机森林模型进行优化

国内:21世纪大数据信息和互联网金融得到了前所未有的巨大发展,个人消费经济市场空间也得到了拓展,与此同时,人们提前消费经济观念的转变导致全球个人信贷规模急剧扩大,我国的一些大城市居民债务比率已经达到甚至超过美国等发达国家的平均水平,为有效应对这一趋势的发展,我国已经采取措施对商业银行加强信用风险管理,并改进管理技术。截至2006年底我国已经全面实现了金融业对外开放,面对全球的激烈竞争,我国若想要保住全球的经济地位并使之发扬壮大,需要自身依靠内部评级体系的建设和发展。然而近几年,我国涌现出了很多研究数据科学的高端人才,对于模型的建立和探索已经在国内外取得了不小的成就,在未来的数据科学以及商业应用中,预测模型也会应用到我们生活中的方方面面,并且会得到空前的发展和巨大的进步。
国外:近年来,大型数据集的可用性、算法的改进以及计算能力的指数级增长导致了对机器学习主题的兴趣空前高涨。如今,机器学习算法被成功地用于分类、回归、聚类或大规模高维输入数据的降维任务。通过Leo Breiman推论出的随机森林算法,大量简单的风险预测可以以此实现
发展动态:Adversarial Networks、Full-stack Deep Learning、Machine Learning Operationalization Management、Reinforcement Learning等是未来机器学习研究的重要发展方向,相关算法等正在被越来越多的人研究和开发。

1.使用逻辑回归和随机森林预测信用卡违约风险

2.在现有理论基础上,对随机森林模型进行结构的优化与算法的优化

技术路线:
    先对机器学习有初步的了解并且入门,然后基于理论的基础构建预测模型,通过对现有模型的分析进行数据的预处理,特征工程等工作,并且提出优化算法,最后进行实际的测试

拟解决的问题:
    模型建设,数据处理,机器训练等。

预期成果:
    1.一个效率更高,数据更加准确的模型,实现对算法的优化,能够通过输入个人信息进行对信用卡违约风险的预测。
    2.一份该模型的需求文档。
    3.一份该模型的设计文档。
    4.一份风险预测报告
    

分成三个阶段,如下:

    1.第一阶段预计为期两个月,进行机器学习的入门学习。

    2.第二阶段预计为期两个月,进行模型的搭建。

    3.第三阶段预计为期两个月,进行对模型的优化。

有一定的python编程和机器学习基础

对相关数学知识有了一定范围的掌握

已经具备一定的语言基础以及对于机器学习的了解,尚未有足够的能力完成实验,在未来半年内,会通过kaggle平台以及网上学习的方法进行学习,从而达成目标。

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 1500.00 购置相关设备以及人员修整 1500.00 0.00
1. 业务费 0.00 0.00 0.00
(1)计算、分析、测试费 0.00 0.00 0.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 0.00 0.00 0.00
(4)文献检索费 0.00 0.00 0.00
(5)论文出版费 0.00 0.00 0.00
2. 仪器设备购置费 1500.00 1500.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 0.00 0.00 0.00
结束