雷锋开奖,www.700711.com,王中王特马资,曾道201712期中特玄机,壮元红高手论坛567722,636370.com,www.6831.com
当前位置: 主页 > 曾道201712期中特玄机 >
向前金服智能风控平台听风者30迭代实录——模型篇www.98433.com
发布日期:2019-10-12 22:55   来源:未知   阅读:

  在向前金服迭代升级“听风者”3.0的过程中,向前金服CRO金可冶的方法是任务分解。为模型、策略、技术等不同模块分别设置针对性目标,通过统筹协作让整艘“战舰”朝着智能化的大方向前进,更进一步加固了金融科技的安全生命线。

  对模型与应用团队负责人杨林来说,这个任务是“稳定性”。这是牵引3.0模型的“北极星”指标,从数据质量、衍生变量、模型架构铺陈展开。

  其中,特征工程是保证数据质量的关键,也就是通过对底层数据的清洗、衍生,提取对训练模型有价值的特征这一过程。

  所以,大量的数据筛选、测试工作是整个项目的开端,也是奠定基础的一步。然而,“两个月过去了,我们却发现有些数据准确率不符合要求。”面对这些数据和一天天过去的时间进度条,杨林的恼火和着急无法言说。“但底线是不能妥协的”,不得已,杨林选择更换方案,重新换了一批数据样本。

  当初的煎熬过后,现在回看,杨林并不认为这部分工作是浪费。“数据是核心,我们测了双倍的量,在评估效果、检测稳定性上可选择的余地更多了。”任何事都有利有弊,这个变数反而对之后的数据处理和变量选取起了不少帮助。

  金可冶曾在接受媒体采访时说,“大数据听起来很高大上,实际上梳理起来是一个非常累、接地气的体力活”。

  在数据处理中,不同来源的数据格式都不一样,模型团队要把它们做标准化处理,这个过程就是数据清洗。“慢慢地,你会看到干净的数据集市。”杨林把这个过程,比喻成做菜中给食材改刀的阶段。在数据清洗过程中,一些有价值的数据,像是自带闪光点,让他眼前一亮,他就赶紧打好标记以备之后使用。

  同时,数据获取方式要规范,不仅严格筛选技术手段合规的数据源,而且在数据传输全流程采用不可逆的加密算法进行脱敏处理。遵守操作规范,“菜品”才不至于变质。

  接下来,还需要一个“腌制入味”的过程。数据清洗后,“我们在基础字段上做衍生,对数据互相之间做加工,让它们产生不同的关系”。当从无数个变量中找到特别有力的变量时,杨林会格外兴奋。这是最让他有成就感的时刻,因为觉得“离自己夸下的海口更近了”。

  事实上,www.98433.com,在项目启动之初,杨林就跟金可冶提出,这次模型会实现突破性进阶,“要稳定,精确度要高,要定制化建模”。而那个时候,数据清洗结果如何都尚待揭晓,他心里多少有点打鼓。

  而之所以敢拍下胸脯,一方面源自公司掌握的具备一定规模且多元的数据量;另一方面则来自于对专业团队的信心。

  当数据处理完毕、变量提取结束,一个规模上万的衍生变量池呈现出来。杨林心里才觉得,“稳了”。接下来,就进入建模环节,开始“脑力劳动”。

  3.0模型与此前模型面对的任务截然不同,1.0作为向前金服智能风控的开山鼻祖,承担着“用户教育”的使命,需要向相关部门展示模型的运行方式和作用。

  1.0、2.0相继投入使用后,算法模型的威力已经生动地展现在了大家面前,大家对于模型的作用有了认识和信任。这让3.0模型有了挑战更高级的机器学习算法的基础,“我们采用了XGBoost、随机森林等算法,可解释性相对弱一些,但是精度更高”。杨林说。在线炒股配资公司旭胜配资线上股

雷锋开奖 www.700711.com 王中王特马资 曾道201712期中特玄机 壮元红高手论坛567722 636370.com www.6831.com

Power by DedeCms