本帖主要收集一些基本概念知识放在这里,便于回顾
风控系统中主要分为信用风险与欺诈风险
信用风险多指一个用户消费还款能力与意愿的风险评估
欺诈风险多指团体行为的,比如中介之类等类似群体进行批注、盗号、薅羊毛、养号、套现等诸多行为。
风控系统模型 https://www.zhihu.com/question/37405102
三大模型分类:
1.反欺诈模型
2.二元好坏模型
3.资产包风控模型
https://www.zhihu.com/question/37405102
大数据风控
满足基本需求:
1.高对抗性现在黑产非常庞大,刷单、薅羊毛、密码爆破、扫号、发帖机、灌水等等时时刻刻都在发生,无时无刻不在攻防。
2.灵活性攻击者不断变化特征和行为,风控策略每天都需要更新,必须要保证风控策略的灵活性。
3.准确性风控策略首先需要保证准确性,在保证准确性的同时再去提高召回率,准确性太低肯定会引起大量用户投诉。
挑战:
1.模型的泛化能力(多维度对抗,不能依赖比较少的维度指标)
2.模型的可解释性(客诉方面)
3.模型的更新速度(快速迭代)
长尾征信:
用户碎片化的行为,进行长期收集,形成用户画像。比如互联网巨头间信息互通或想方设法采集用户的各种信息行为,例如浏览器上、各类app上、微博等社交上等等一切在互联网上的零碎行为。不仅仅只是自身公司业务服务行为的搜集。对公司是方便,但可能涉及用户隐私权利。
资产包
分清“数据公司”与“征信公司”区别
进件评分卡模型 (授信准入阶段)
常用模型包含LR、Xgboost、FFM等。不同模型的选取由是否需要在线更新、可解释性、线上部署环境等多种因素决定。LR的研究非常成熟,有完整的工业分布式解决方案和在线增量学习的理论基础,包括各种带正则项的变种,是非常理想的建模方法,很多时候它还会作为基准型,用于评价复杂模型的提升效果。
概念漂移
随着公司扩张,客户群增大,或是市场导向客群发生变化,导致机器学习模型某些特征倾向概念过时
失联修复和催收评分卡 (催收阶段)
刻画用户经过一定的催收动作后还款的可能性。
行为评分卡 (用户生命周期阶段)
IPC模式 https://www.jianshu.com/p/7d63d5c099e7
IPC模式起源于德国邮储银行,该模式重视实地调查和信息验证,主要通过对客户经理调查走访、信息交叉验证等方面。需要对客户经理进行至少2个月以上的专业技术培训,提升客户经理辨别虚假信息能力和编制财务报表的技能,从而防范信用风险。 IPC公司信贷技术的核心,是评估客户偿还贷款的能力。主要包括三个部分:一是考察借款人偿还贷款的能力,二是衡量借款人偿还贷款的意愿,三是银行内部操作风险的控制。每个部分,IPC都进行了针对性的设计。运用:主要运用于数据缺失、不具备财务管理环境、银行流水不完整,信用记录空白等的小微企业,其中,信贷员负责整个过程,从接受客户的申请到信用检查、现场信用、风险评估再到匹配贷款、付款催收和逾期付款。对信贷员的专业技能要求较高,信贷员对贷款全流程把关,一定程度上确保了项目的真实性。但又因为是以信贷员为核心,以信贷员的判断为依据,有一定的操作风险与道德风险。
信贷工厂模式
信贷工厂模式是新加坡淡马锡控股公司(Temasek Holdings)为解决小微企业信贷流程的弊端,推出了一种改善小微企业信贷流程的“信贷工厂”模式,“信贷工厂”意指银行像工厂标准化制造产品一样对信贷进行批量处理。具体而言,就是银行对中小企业贷款的设计、申报、审批、发放、风控等业务按照“流水线”作业方式进行批量操作。在信贷工厂模式下,信贷审批发放首先要做到标准化,每个流程都有确定的人员分工,如客户经理、审批人员和贷后监督人员专业化分工。并且为了监控风险采用产业链调查方法,从不同角度对借贷企业进行交叉印证。信贷工厂模式的特点是效率高,可以进行量化审核。过程之间环环相扣,对每个环节都有专人把控具体的把控。正因为这样,意味着需要消耗大量的人力成本,每个流程都需要对口的人员做支撑。
大数据模式:
大数据风控模式是指通过对海量的、多样化的、实时的、有价值的数据进行采集、整理、分析和挖掘,并运用大数据技术重新设计征信评价模型算法,多维度刻画信用主体的“画像”,向信息使用者呈现信用主体的违约率和信用状况。
Logistic回归做评分卡 https://www.zhihu.com/question/37405102
目前国内90%以上的建模团队都使用Logistic回归做评分卡,当然还有少数人使用决策树,神经网络和机器学习目前还没在此行业有显著成果。Logistic制作评分卡模型的衡量标准是K-S值的大小,依据数据质量和建模能力在0-0.5之间,一般在0.3以上才可用,好的模型可以达到0.35。芝麻分模型的K-S值在0.32左右。
KS值,GINI系数,ROC等都是评价模型区分好坏客户的能力。
WOE编码
WOE叫做证据权重(Weightof Evidence),表示的其实是自变量取某个值的时候对违约比例的一种影响。
信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量 WOE 编码方式离散化之后运用 logistic 回归模型进行的一种二分类变量的广义线性模型。
联网金融公司Zest Finance 风控图模型
APT 攻击 (高级持续性威胁”Advanced Persistent Threat)
https://www.zhihu.com/question/28881041
猫池与猫池黑名单
安全产品服务公司名
(有些可能本身涉黑,即即卖安全服务与设备,又卖出黑灰产服务与设备,采购中需注意各种猫腻)
数美
顶向
威胁猎人
极验
铜盾
网易
360
腾讯云
华为云