自然语言理解与行业知识图谱:概念、方法与工程落地
上QQ阅读APP看书,第一时间看更新

1.2 商业曙光

自然语言理解的目的是什么呢?当然是服务人们的生活,带来商业收益!因此逐渐衍生出自然语言行业,成为认知智能应用落地的先导行业,它的兴衰一定程度上决定了AI商业应用的成败。作为认知智能的钥匙,自然语言理解技术本身有很多需要研究的问题。但是作为一种商业产品,它已经能够为各行各业赋能,带来价值输出。因为几乎所有行业都涉及人与机器的交互、机器与机器的交互,输入输出之间少不了自然语言(文本和语音)的参与。“技术-产品”相辅相成,自然语言行业也确实成为商业领域关注的热点。据估算,2025年全球自然语言行业规模将超过2000亿美元。

目前智能文本和智能语音两大块内容共同支撑起整个自然语言行业。从智能文本子方向来看,因为行业内缺少可以直接成型的文本类产品,所以智能文本方向基本上以提供中间件或平台服务为主,少数如机器翻译、输入法、推荐搜索等已经形成直接面向应用的产品,总体上看很少有不结合语音而形成独立的产品。从智能语音子方向来看,国内外市场均已相对集中,2018年智能语音市场全球前五位占据88%的市场份额,市场格局日益清晰。有机构分析预测,2017~2024年的7年间,智能语音子领域的全球市场规模年增长率将达到34.9%。

如图1-8所示,上述两块内容的核心技术包括基础技术、算法与模型、接口服务、应用四个部分:

①基础技术是智能文本和智能语音处理的基础。语音分析将人类语言转化为文本,侧重于分析语法的规律和类型,以便进行转录和翻译;进一步结合发音词典、统计声学模型、语言模型构建解码器,给出识别结果,然后通过语音合成形成自然语音输出。文本分析则是侧重于归纳上下文语境和说话者的意图,围绕分词、词性标注、语义分析、篇章分析等不同层次的自然语言处理。

②算法与模型主要依托于语言模型和语义模型,特别是基于统计学习来设计面向语言理解任务的各类智能处理程序。

③接口服务通过应用程序接口(Application Programming Interface,API)封装等形式调用,提供包括机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成和语音识别等服务。

④应用层面分为2B和2C[1]两类。C端的应用主要是智能设备,包括移动设备、智能汽车、智能家居等,改变了传统的人机交互方式。B端应用则主要来源于垂直行业的需求,目的是提升人工效率。除了传统呼叫中心的对话系统应用外,智能文本和智能语音在教育、医疗、金融、政务等多个行业都有广泛应用。

图1-8 自然语言行业内容和核心技术

从另一个角度看,自然语言行业属于产业链式行业,形成了上中下游分布的特征,行业在逐渐创造需求,在2B和2C端挖掘新的商业模式。以文本和语音两大平台为基础,主要的商业模式涵盖了上游的数据、芯片提供商和研究机构,中游的平台和技术服务商以及下游的2C应用和2B应用提供商,如表1-1所示。目前的应用行业主要集中在社交网络、人力资源与招聘、金融、保险、零售、广告、物流、通信、信息技术、制造业、传媒、医疗、电子商务和物流等领域。主要的玩家大致可以分为两类:一类是科技巨头,另一类是创业公司。创业公司又可以细分为两类:一类专注于单一领域,另一类则是选择多个垂直领域同时推进。

表1-1 不同产业链位置的企业类型及其代表机构

上游的芯片领域基本已被国外的科技巨头企业如NVIDIA、ARM、Intel、Google等垄断,国产的芯片厂商虽然也逐渐进入语音市场,但上游芯片领域壁垒高且资金堆积大,短期内很难脱颖而出。中下游需求较为多样化,进入门槛较低,有望培育出一批优质的初创企业。目前初创企业的商业形态主要包括智能语音、机器翻译类终端产品(交互智能雏形)、技术服务和通用平台、底层智能器件等。

中游主要是平台和技术服务。通用平台服务打造自然语言处理生态,一是宣传教育市场,可以真正使用API和SaaS技术为大家服务,二是做开放平台,通过获得用户的使用数据来不断迭代和优化系统。由于科技巨头不会把垂直服务做得很深入,这就为教育、金融、客服等行业定制领域带来了机会。技术服务商布局重点专业赛道,通过专业领域和细分场景进行布局,专业市场对技术的准确性和可靠性要求更高。

从下游的应用服务来看,消费级需求广泛,包括衣食住行等生活场景,因此在智能家居、可穿戴设备、智能车载和手机终端处于快速发展阶段。B端商业模式更为靠谱,通过软件许可以及软件系统的销售、运营和服务来获得收入,不需要积累用户以投放广告来变现,从而增加了现金流的稳定性。

目前的状况是科技巨头有流量、技术、平台和资本等优势,但也有专业理解不深、行业进入难度较大的劣势;传统行业的玩家在行业内耕耘时间较长,专业技术和平台搭建较为完善,拥有较多的一体化解决方案,能够形成品牌效应和用户黏性,但是面临着巨头蚕食和初创企业的竞争压力;初创企业往往更适合于B端客户挖掘,在细分领域和场景中建立壁垒。

综上可知,自然语言行业是朝阳行业,有着巨大的发展潜力,成为国内外群雄逐鹿的战场。正因为如此,自然语言理解的技术成果也是其他行业的巨大福音,促进了其他行业认知能力的提高。

[1] 2B指to Business,面向企业;2C指to Customer,面向消费者。——编辑注