NLP领军企业紫平方股份:从木桶效应说起

21.12.2018  17:50

银行场景中询问如何选择理财、教育场景中找到适合孩子的课程、餐厅场景点一杯自己喜欢的咖啡……智能交互机器人在上述场景中开始发挥重要作用,因为智能交互机器人的存在,用户可以脱离简单的一问一答,甚至获得超乎真人质量的个性化服务。在这其中,机器人听懂并理解人类说话的关键即自然语言处理——NLP技术。国内领先的技术创新型人工智能企业北京紫平方信息技术股份有限公司(以下简称紫平方股份),凭借其在NLP技术领域的绝对优势,成为人工智能产业中的一匹黑马。

  NLP技术,是一门融合语言学、计算机科学、数学于一体的科学,能实现计算机与人之间的自然语言交流,目前NLP已经成为解决人工智能完备(AI-complete)的核心问题之一,是人工智能诸多支撑技术中最重要的一环。正如微软副总裁指出:“感知智能发展到一定阶段的时候,大家就会很自然地把目光投射到认知智能,思考如何处理人类的抽象表达。”

  在中国人工智能的诸多技术支撑中,NLP的发展势头相对落后。在紫平方股份看来,NLP技术的突破,意味着中国人工智能产业整体水平的突破。这就好比一只木桶能盛多少水,并不取决于最长的那块木板,而是取决于最短的那块木板。填补上NLP技术这块“短板”,才能扩展“人工智能木桶”的容量。

  因此,自2012年成立以来,紫平方股份便着力于NLP技术领域的研发,历经6年时间的打磨,紫平方股份的NLP技术打破原有智能交互局限,获得了新的突破。据悉,紫平方股份NLP技术是基于大数据海量训练样本的分词、词性标注、命名实体识别,定位基本语言元素,消除歧义,支撑自然语言的准确理解,从而提高模型在复杂多变的应用场景下的效果稳定性和适配性。目前,该技术在多个实际项目实践中,已达到97%的准确率,一举超越国内众多竞争对手,达到行业顶尖水平。

  在落地该技术方面,紫平方股份也颇有心得。目前,其依托自身ASR语音识别增强、NLP自然语义理解、TTS合成、大规模GPU训练系统四项技术优势打造出智能交互机器人——小紫机器人。其中小紫机器人的NLP自然语义理解技术能够对智能问答过程所涉及的知识库建设、客户意图理解、知识库管理、语义模型自学习等各个环节进行了全面优化,不但提升了语义理解的精准度,更有效减少了智能知识库话术的加工量,进一步将人类从冗长重复的工作中解放出来。

  更值得一提的是,以NLP语义理解技术为关键所形成的“知识图谱”将成为紫平方赋能企业最有价值的一环。知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

  为何知识图谱如此重要?

  随着大数据红利的消失殆尽,以深度学习为代表的感知智能水平日益接近“天花板”。以深度学习为代表的统计学习严重依赖大样本,这些方法只能习得数据中的统计模式。然而,现实世界很多实际问题的解决单单依靠统计模式是不够的,还需要自身对知识拥有一种理解模型。很多从事自然语言处理的研发人员普遍有个深刻的感受:即便数据量再大,模型再先进,很多自然语言处理任务,比如中文分词、情感分析达到一定准确率之后,就很难再改进了。这一现象的根本原因在于,当前的机器缺乏诸如知识图谱这样的背景知识,机器理解大数据的手段有限,限制了大数据的精准与精细分析,从而大大降低了大数据的潜在价值。

  而依托知识图谱,以小紫机器人为例,其能更轻松地识别用户句子当中包含的实体、概念、属性、关系、事件等有效信息,并对这些信息进行采集收录、智能分析等,实现机器人知识的存储积累,形成一套针对于当下情景的独特逻辑储备。也就是说拥有了知识图谱的机器人就拥有了理解能力、判断能力、自学能力,可以满足市场上更加智能化的需求。

  为了将所拥有的技术更好的赋能企业,紫平方股份面向企业端打造了人工智能解决方案。该方案是一个集成了深度学习、大数据训练、NLP自然语言理解、TTS语音合成技术服务的整体解决方案,能够帮助用户简单、快捷的实现从数据的采集、缓存到分析建模以及应用与可视化的全过程,最后帮助企业获得专属于自己的知识图谱,不断降低人工智能技术在企业中应用的门槛,更帮助企业构建起难以被模仿的技术壁垒。目前,紫平方股份已经与中国联通、中国电信、航天科工集团等行业标杆企业进行合作,并成功助力各企业的智能化转型。

  近年来,人工智能地位迅速上升,从国务院发布的“十三五”战略强调推动人工智能的规模化应用,到美国白宫接连发布的多份相关报告来看,人工智能已然成为各国打造国家竞争力的关键,抓住人工智能意味着抓住了未来发展的关键。

  对于紫平方股份来说,以技术创新撬动产业升级已被写入企业的发展战略。下一步紫平方股份意欲与政府共同建设人工智能软件产业园,以智能商业服务机器人和智能政务服务机器人为产业核心定位,规划上下游产业入驻,形成集聚效应,助力人工智能全面落地应用,推动中国人工智能产业的加速升级。