学习理财博客空间

理财鱼

您现在的位置是:理财鱼 > 今日热点 >

今日热点

化腐朽为神奇,看萨摩耶数科如何用目标编码打造智能风控

发布时间:2021-07-23 15:00今日热点 评论

  AI领域的科学家,越来越像手艺人。

  手艺人可以将在外人看来无用的东西,加工成一件件颇具价值的工艺品;而AI科学家则可以把字符、类别特征,变成智能风控系统中的重要一环。二者的区别在于,手艺人只能以人力一件一件地创作,而科学家们通过科技的手段,直接让“量变”变成“质变”。

  “外行看热闹,内行看门道”,科技公司的AI科学家们究竟是如何化腐朽为神奇的?本文将以萨摩耶数科在目标编码上的应用为例,揭开智能风控一隅。

  目标编码:让类别特征和字符特征变成数值

  在聊目标编码前,我们先聊聊全民都在参与的垃圾分类。

  1吨废塑料可回炼600公斤无铅汽油和柴油;回收1500吨废纸,可避免砍伐用于生产1200吨纸的林木。因此,垃圾回收既环保,又节约资源。同时,垃圾回收也可以减少环境污染。废弃的电池等含有金属汞等有毒物质,会对人类产生严重的威胁,废塑料进入土壤,会导致农作物减产。

  过去,居民生活产生的废纸、废塑料等可回收垃圾将与厨余垃圾、有害垃圾一并扔进垃圾桶,14亿人日复一日将带来多大的资源浪费?垃圾分类是在终端环节,将生活垃圾的价值最大化,做好垃圾分类,就能让垃圾回收及处理等配套系统更高效地运转。

  目标编码在智能风控中的价值也是如此,甚至目标编码更进一步,让没有太多价值的“其他垃圾”变成可以创造价值的“可回收垃圾”。

  具体而言,智能风控的3个重要方向:模型、策略、架构。在机器学习模型的构建和使用过程中,模型处理的信息通常都是数值型。但在风控场景下,特别是贷前审批流程中,用户信息通常存在大量的字符型或类别特征。

  比如1000名样本中,有15名样本在30天内坐过动车,这种数据必须经过转换后,才能进入到风控模型中,而转换后的特征表达效果,直接影响到模型的最终预测效果,因此针对类别特征或字符型特征的处理方法,其作用便尤为重要。

  在风控场景下,由于更注重模型与变量的可解释性,对于类别特征或字符型特征常用的处理方式就是目标编码。

  萨摩耶数科人工智能团队表示:“智能风控机器学习模型的构建和使用过程中,目标编码起到非常重要的作用,如在信贷风控场景下,通过目标编码可以实现模型与变量的可解释性,从而提升模型的效果。”

  目标编码,也称为均值编码,是特征编码的一种非常有效的方法。该方法是统计每个类别标签对应目标值,每个类别标签都被该类别的平均目标值替代。上文提到的1000名样本,其中男性600名,女性400名,“在30天内坐过动车”标签为1,相应的男性有10名标签为1的样本,女性有5名标签为1的样本,则对应的男性标签目标编码值为10/600 = 0.0167,女性标签的目标编码值为5/400 = 0.0125。

  “将字符型数据或类别特征通过目标编码变成目标值后,就可以进行风控建模。看上去和风控无关的数据,就变成了风控模型中的一颗‘螺丝钉’。”萨摩耶数科人工智能团队总结道。

共3页: 上一页下一页

>相关《化腐朽为神奇,看萨摩耶数科如何用目标编码打造智能风控》内容:


1、 萨摩亚代表表示美国是五核国中唯一拒绝批准《南太平洋无核区条约》议定书的国家,外交部回应

2021年10月15日外交部发言人赵立坚主持例行记者会 总台央视记者:据报道,萨摩亚常驻联合国代表表示,美国是五核国中唯一拒绝批准《南太平洋无核区条约》议定书的国家。此前,基里巴斯总统也表示,作为美英核试验的受害者和太平洋岛国成员,基里巴斯对澳发...【继续阅读】


2、 萨摩耶云:将持续发展AI决策应用业务

中证网讯(记者 董添)9月26日,萨摩耶云宣布,公司入选深圳市工业和信息化局2021年质量品牌双提升扶持计划资助项目名单。公司将持续发展AI决策应用业务,推动下游产业实现数字化转型。同时,利用项目资助,进一步提升产品品牌知名度,开展质量管理体系建...【继续阅读】


3、 萨摩耶云AI平台的进击之道

今天,人工智能已经成为科技界的时尚代名词。 2016年,自从阿尔法狗战胜世界围棋手李世石之后,人工智能逐渐跃入眼帘,并且成为世界各国竞相布局的着力点。 不少西方国家已经启动实施国家智能战略计划,“德国工业4.0”等国家战略计划开始运营,中国也提出...【继续阅读】