第四范式CEO戴文渊曾是百度凤巢系统的负责人,他将目前自己在做的事情归为人工智能,在他看来,人工智能的本质就是汇集到足够多的有效数据,再利用算法对这些数据进行处理,而做企业服务是让数据实现价值的一种渠道。
机器人的感官都是很独立的,比如说做人脸识别的就只能先基于人脸维度进行学习然后再识别应用,没有听觉和触觉。戴文渊举例,假设有两个长得很像的人取钱,分别在深圳和河北,单一依靠人脸一个维度判断,出错概率很大,但如果结合这两个人所在的地理位置,则可自动排除其一。而第四范式正在做这样多维度学习的事情。
选择企业服务这条路,是因为越来越多的企业开始拥有并重视数据,第四范式可以将多渠道的数据做一个综合学习,帮企业创造更大的价值。
公司目前主要做的产品是把机器学习能力带到金融、电信等领域,做这件事情的主要方式是通过把解决方案、 UI 、机器学习算法、分布式系统、底层基础设施融合成一个有机的整体,做一个商用的大规模机器学习平台,让更多的不懂得编程和算法的专业人士,能够通过他们的经验提升其所在领域的价值。
第四范式在金融领域的应用较多,比如在信贷方面,此前银行都是一刀切政策,对于风险不达标的客户不与贷款,但其实风险高的客户可以抬高利息发放贷款的,不过银行没有一套成熟的体系去做评估每个人的风险。而第四范式可以结合个人信贷历史,分析出风险,帮助银行差异化定价。核心技术就是分析出每个人的不同点,不仅来自银行内部的数据,还整合、挖掘了其他多维度、多渠道的信息。
例如在过去,银行可能会把5千万人分几个客群,每个客群的策略是一样的,第四范式却可以将这5千万人分成1千万个客群,每个群体只有5个人,根据这5个人去制定一套策略。
过去做不到这件事情是由于数据量很小,而现在已经有数十亿的样本可以使用,因此可以将人群的颗粒度打磨得很细。
至于分析的准确性,戴文渊介绍,一般采用ABtest的方法,把人群分为两份,一份继续沿用原来的策略,而另一份使用第四范式的策略,比对最后的效果差异。至于数据的隐私化处理,第四范式将数据转换成人看不懂、机器能看懂的符号,从而保证了数据的价值。
除了金融领域,第四范式在获客、精准营销等方面都有涉及,目前已服务10多家银行机构。