山西天测科技有限公司

数据标注平台

发表时间:2019-11-21 00:00

  目前数据的重要性,已是人工智能行业的共识,从最初小作坊式生产,到目前各大科技巨头公司纷纷成立自营的数据服务平台,再一次印证了行业规模的增长,以及数据安全性、标注数据精度的要求不断提高。各地政府相继出台文件,更是对处在成长中的行业进行了框架性地指导,大数据标注平台成立之初,主要是为集团公司内部的需求部门服务,随着市场的发展,已逐步发展成为开放的运营生产平台,如百度众测、京东众智等,数据平台依靠强大的数据生产组织能力,健全的数据安全性保障体系,服务了众多外部企业,推动了人工智能产业的发展。

640.webp (3).jpg


    由于公司文化的不同,互联网巨头的数据服务平台风格也各不相同,发展思路也不同,大致可以分为两类:代理商模式以及合作商模式。

1. 代理商模式,类似于传统建筑行业的分包转包模式,即数据服务平台如百度众测(test.baidu.com),在对接到甲方客户后,通过自身的技术、硬件等优势将客户需求分解,制定出符合客户需求的非标准化生产方案,然后将生产需求分包至代理商,平台留取一部分利润。这部分利润构成主要为:甲方资源、客户需求分解、生产方案制定、平台标注工具维护。

640.webp (4).jpg


2. 合作商模式,类似于零售行业的网上商城开店模式,即数据服务平台如京东众智(biao.jd.com),推出了wise开放平台,主要的发展思路是需求方可以直接与平台上开店的生产队伍对接,数据服务平台作为中间商,保障双方的结算安全、甲方的数据安全、需求方可以在开放平台上自己挑选生产记录良好的标注队伍,标注队伍可以直接与甲方议价,但需要标注队伍自身来分解客户需求制定生产方案,同时付给平台工具使用费用。

640.webp (5).jpg


    未来如果能将两种模式融合会不会更好,模式1的优势是,数据服务平台可以集中力量办大事,相当于是拥有强大的政府财政,面对大体量的项目,具备优势,但是同样面临需要处理零散的小的需求,而此时模式2可以很好地弥补,生产标注队伍可以直接对接小的需求方,因为对平台而言体量越大,机会成本越大,小的需求分流到合作商模式去做,可以节省成本将管理人力等更高效地投入到高利润项目。同时也可以涵养储备队伍,减少队伍流失的情况。

    对实际的数据标注生产团队来说,可以选择平台化发展,也可以选择下沉细分标注领域做平台的生产队伍。


1.平台化发展的定位将会是和以上的数据平台成为竞争关系,未来发展的空间大,同时困难也大,最现实的问题是怎样独立承接源头需求方的订单,后起的数据生产平台队伍无论从技术实力,队伍规模,数据安全方面都有可能处于劣势,客户也更想与有集团公司做背书的数据平台合作,数据安全、交付周期更有保障;通过竞标降低报价、细化管理降低营运成本等会不会是一条突围的路,暂不可知。

2.专注生产的队伍,同样面临尴尬的境遇,由于不拥有数据生产计划分配权,往往面临加大人力生产后,项目断档的风险,甚至是前期投入培训成本,后期成熟后被降价。人工成本的增加逐步降低企业的利润空间,可谓是困难重重。

分享到: