返回列表 发帖

一起来破解银行的风控规则

很多人都在讨论银行风控,但很多人也觉得风控完全不可理解,似乎没有规则。
其实风控的

1 银行通过大数据和机器学习的方法来识别风险,我们也可以用类似的方法来破解银行的规则
  银行的优点是能够获得大量精确地数据提供支撑,
  而我们则是零星的各自为战,信息不通。
  最靠谱的破解是人肉破解,就是找到银行内部风控机构的人员获得详细的信息。
  但这个往往并不可行。

2 先澄清一个误解。 很多人玩家总觉得是自己某一次或某几次独立的行为,使得银行认为自己某个独立的行为可能触发风控。
   这个并不完全正确。
   某些高风险操作(比如一次套空  多次逾期)确实会触发风控。这类问题比较容易察觉,个人也容易避免,
   但这不属于我们要讨论的内容。

   还有很多消费习惯虽然并不会立刻触发风控,会使得系统把你认定为高风险用户。
   所以有些人觉得自己平时刷卡挺小心的,最后还是被风控了。 这才是是我们所要关心的。
   因为这个风控没有固定的规则,让人觉得无法捉摸,就像猴子扔飞镖一样很随机。
   事实上也确实是没有固定规则说明哪些行为会导致风控;但是银行又是怎么做的呢?

3 首先, 银行的风控不可能针对每个人的每笔消费记录都做一遍检查,这个计算量太大,更多的是靠机器学习。
  我简单的普及一下机器学习的思想。
  机器学习的思想是
   a) 先把用户的消费行为用若干个特征进行描述,每个用户得到一个特征向量(可以理解为一串数字)
   b) 把已经确定的风险用户的特征向量进行分析, 找出风险用户的共同特征
   c) 再把每个用户的特征向量 和风险用户的特征进行对比,得到一个风险值;风险值高的则为高风险用户。
   d) 把确认的风险用户特征再放到b)中,更新风险特征

   这个过程并不难理解。
   风险用户的特征,是机器通过大量案例计算出来的,至于计算的结果,通常也是很难用人类的语言和规则描述的。
   这也就是我们常说的,风控规则无法捉摸。
   这三个步骤中, 只有b)是人类无法准确描述和表达的。c)则是最后的结果,无法干预。
   只有步骤a)是银行规定的,也是我们可以预测和控制的。 这也是我们的下手的重点。

   为了方便理解, 我先举一个例子(当然这个例子不具有实际代表意义)
   用户甲和乙都是1万额度,本月消费如下:
   甲:  买了一个苹果手机8000; 吃饭 90次,每次消费20;
   乙:  套两次,每次5000;

   假定银行的特征向量由两个值组成:
    大额消费的金额占比;   大额消费的次数占比

   那么甲的特征向量是(0.8, 0.011), 低风险
          乙的特征向量是(1,  1), 高风险;

    虽然二人消费的额度相似, 但是得到了两个截然不同的特征向量。
    假定银行以甲乙作为标准模板,

    如果丙的消费是: 套8000, 套1000, 特征向量就是(0.8, 0.5)
                     丁的消费是: 套7000,                 特征向量就是(1, 1)

     机器拿丙丁的特征和甲乙分别对比,可以发现丙介于甲乙之间,风险度中;
    而 丁虽然比丙套的还少, 但他的消费习惯被标定为高风险。

    当然如果风险特征的规则稍微改变下,可能结果又不同  。
   而且银行确实也在不断地改变添加新的特征完善检测机制;而且随着识别的风险用户增加,d)步骤也会反过来影响特征计算。
    这个例子很简单,也是说明了风控规则在机器学习下有很多难以判定的结果。


  我们要做的是什么呢?
  就是设法找出银行的风险特征计算方法。

  未完待续

占楼1111111111111111111111

TOP

占楼2222222222222222

有疑问的可以在后面跟
愿意共享数据的也欢迎跟贴
但是切记,为了保证分析的正确性,一定要提供真实的数据

TOP

231111111111111111111111

TOP

认识了我爱卡才发现信用卡的奥妙如此美妙。但是等级权限限制,想要学习好深心得,就要拼命回帖升级。遇贴就回。拿分学习一起

TOP

牛人!学习!

TOP

确实,很多人都是交通风控严,tx容易死。我已经tx很多年,交通反而额度最高升了白金。

TOP

近段时间交通F了一批卡,找共同点发现根本没有套路!正常消费,评分在750分的照样F!

TOP

返回列表