如果AI是“学生”,那这项最高数据标准就在教他正确认识世界
【版权声明】本作品著作权归腾讯数码独家所有,授权深圳市腾讯计算机系统有限公司独家享有信息网络传播权,任何第三方未经授权,不得转载。
当下,人工智能和大数据已经发展到爆发增长的阶段,作为5G的新生元年,AI、IoT、VR/AR等技术已经开始多元化的场景应用。其中,作为人工智能的三要素之一的重要产业——AI数据服务,是人工智能是否能实现产业化落地的关键。
为解决产业化落地的现实问题,助力AI企业占领未来发展高地。在9月6日的北京服贸会上,数据标注行业的头部企业——云测数据的服务成果正式发布,并向外界展示了最高交付精准度达99.99%这一傲人成果。这是目前数据标注领域可达到的最高服务标准,成为AI数据服务迈入更高质时代的一大里程碑。
借着云测数据在服贸会上 “无数据不AI,云测数据服务标准发布” 成果发布的契机,我们对云测数据进行了专访,以更好向大家展示高质量AI数据能够带来何种未来智能生活上的改变以及人工智能行业意义。
人工智能和机器学习领域国际的权威学者吴恩达曾发表过以“AI is the new electricity”为主题的演讲,在其阐述AI的时候,重点强调了数据的重要性,“AI的崛起正改变着公司的竞争格局。公司的壁垒不再是算法,而是数据,让算法利用足够的数据,使得产品运行起来......”
对此,云测数据表示:随着神经网络、深度学习等技术的高速发展,人工智能应用层面出现爆发式增长,其推动经济增长与时代进步的"新引擎"角色已经成为共识。人工智能产业落地的发展离不开AI数据的支撑,从智能家居到无人商店,从无人驾驶到农作物监测,数据在其中发挥着不可或缺的作用。数据越多、越精准,算法训练后获得的AI应用也就越智能、越好用。
作为人工智能的三要素之一,“数据”从本质上决定了人工智能的落地水平。通常来说,数据标注得越准确,数量越多,模型效果越好,最后的AI产品效果就越好。随后,云测数据还为我们举了一些相关的例子。
首先,以语音助手中使用的NLP技术为例,“订机票”、“有去上海的航班么”、“要出差,帮我查下机票”、“查下航班,下周二出发去上海”等等情况都属于语音信息的组合。如果没有数据标注员对大量的句子进行标注,比如提炼出主题、标出实体、进行意图分类、情感分类等等,给AI提供详尽高质的“教材”,那么AI即使有了算法和算力,也无法训练出任何“智能”。
在云测数据内部,以智能客服单个场景的意图标注,就分为10-20个大类,上百个子类,根据业务需求可能还会有进一步的标注细分。无论是图像、文本、视频,还是语音类型的AI数据,云测数据都能在具体项目的数据需求上做到最佳。“而且,以上所举的例子也只是一小部分而已。”
云测数据表示,目前其覆盖行业包括:智慧城市、智能家居、智能驾驶、智慧金融、新零售等领域,包含互联网企业、科技企业和众多智能化转型的传统企业。可以说,有人工智能的地方,就有云测数据。
虽然看起来,AI数据不直接作用于我们的生活,但AI数据与我们智能生活的体验好坏与否密不可分。通过算法和高质量AI数据的有效配合,人工智能不再是高高在上的概念,而是变为一个个持续落地的产品,并发挥出巨大的商用价值。从这个层面来说,质与量兼得的AI数据将是推动人工智能产业新一轮落地爆发的巨大助力。
采访的最后,云测数据用一句话表述了自己:“如果把AI产品比作成学生,那么老师就是实现AI产品的算法工程师,云测数据就是生产高质量教材的企业。教材的好坏决定了学生的学习成果。”希望,在未来云测数据能够继续致力于提供更高质量的场数据标注服务,并一直推动数据行业的场景化、精细化和提升数据隐私安全性,并引领着行业规范发展。
首页推荐
热门推荐
图集
点击排行