Quantcast
Channel: 36氪
Viewing all articles
Browse latest Browse all 115001

智树科技:在大数据平台管理领域做一个“递锤子的人”

$
0
0

大数据平台二级市场毕竟跟一级市场不同。一级市场基础平台建设可以赌赛道,但是二级市场技术服务有时候更倾向于逆向思维,找到“递锤子的人”,不论行业竞争如何、市场集中度如何,只要行业仍然兴盛,递锤子的角色就永远立于不败之地。好比直播平台撕逼,抢主播、抢宽带速度,但只要CDN服务供给商能够做到尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳定,不管最后直播平台谁撕赢了,CDN还是能赚到钱。

大数据的应用领域太广太泛了,精准营销、互联网金融的征信、反欺诈都能用到,各个领域如火如荼、百花齐放。但随着数据量的庞杂,许多问题也会暴露出来。比如说用户的数据量过大,搭建完数据处理平台之后,使用流式计算等处理方法使数据更快地经由节点分流,处理速度提升。原本的数据流转路径是:oracle的数据提取出来之后将原有的场景应用对接到基础平台,表面上这几个步骤的数据流转没有问题,但是实际的稳定性不太好,流式计算经常出现数据分布不合理,过多数据滞留在某一节点的问题。

因此,位于上海的智树科技解决的就是,基于自动化工具平台帮助企业解决大数据平台的数据管理、应用系统对接、运维调优等日常任务的困扰,确保Hadoop/Spark集群及数据的安全性、稳定性和高效性,以保障大数据平台及数据的安全稳定、并能高效的检测、分析、调优等。

智树科技创始人陈诚表示,大数据平台的管理服务需要解决几件事情以检测平台是不是正常运行,如果出现问题基本上可以拆分成两种情况来解决:监控正在流动数据和监控平台。主要处理要点总结如下:

第一,监控正在流动数据所做的工作就是监测数据存储或者流动过程是不是合理,能否合理的分布到各个节点,数据的流动造成的资源过度消耗预防等。比如一万条数据分布到五个节点,每个节点流过两千条数据是最佳状态。但实际上有的节点很多数据,有的节点数据非常少。智树科技主要负责“平均去分配数据”这个过程。其难点在于智树必须提前预测数据分配是否合理,做数据分配指令的时候就预测数据会集中在哪些节点,有的放矢地去解决。

第二,有时候平台会宕机,可能是数据的问题,可能是应用软件和模型、基础数据平台的对接出现了问题。应用软件意指企业用以完成诸如精准营销等功能的工具软件,相当于搭建在基础平台之上的软件,智树科技就是做基础软件和应用软件的顺利对接和运行,让应用开发的团队一眼就能了解平台正发生的问题,并简单的处理掉这些问题。

智树科技原本的服务模式相对较依赖人力,随着服务的用户数增长,智树科技自行研发的Saas系统也逐步升级成带有机器智能的自动化管理工具平台。智树科技一开始需要派人到客户现场服务,尽管使用的也是智树自行开发的自动化的工具,但许多大数据的指令仍然需要技术人员完成。用户现场遇到问题的次数越多,问题沉淀之后形成多种标准解决方案,很多客户可能遇到同一个问题,智树大数据平台管理服务(ABM) 也会随之越来越智能化,利润率也会随着业务量增长而提升。

关于行业的未来,陈诚认为随着数据量的极速增长,Saas等大数据应用领域仍然具有未被挖掘的长尾市场。Hadoop平台厂商主要是国内外厂商发力于基础产品组件的完善和云计算适配,提升产品的市场占有率,从国外发源,而Hadoop在国内从2012年左右形成商业产品慢慢地被接受。

国内大数据的平台诞生的背景下,很长一段时间数据量是TB级别。而现在数据量增长量庞大,有些企业沉淀的数据数量级达到了PB,Hadoop本身能解决数据存储和结构化、半结构化,也能解决计算问题,数据处理量在PB级以下是“很轻松的”。

当数据量在PB级以上,高于Hadoop的技术又会慢慢诞生。正如陈诚所说,“未来几年以Hadoop为核心大数据存储的技术是没有问题,现在只有facebook和BAT数据量较大,一般的中小企业数据量连TB都没有,可能只有几十个GB”。更何况,在国内有很多中小企业现在连oracle数据处理平台都没有,未来生态的拓展空间越来越长。

智树科技于2014年组建团队,创始人陈诚拥有12年IBM和富士通的产品经理经验,对知识库、非结构化数据处理、大数据平台管理等方面有着深刻理解和实践经验,已经成功服务过用户包括公安、海关、银行以及征信等行业多家的大数据平台建设及管理运维项目。目前该团队在寻求天使轮融资中。

本文作者叶妙玉,关注文化娱乐领域,也看 SaaS 及其他有趣的领域。如果你想跟我聊聊,微信号:yeats1101,期待创业者与我交流。


Viewing all articles
Browse latest Browse all 115001

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>