新研究揭示了医疗,金融服务和其他垂直市场在自然语言处理中的采用,挑战和实践
Spark NLP库的开发者John Snow Labs宣布了首次自然语言处理(NLP)行业调查的结果,探讨了公司如何使用NLP技术。该调查由独立数据科学分析和见解提供商Gradient Flow进行。
调查结果将在首届NLP峰会上以“ NLP行业调查分析:2020年自然语言使用案例的行业格局”为主题演讲。由John Snow Labs主办的有史以来第一次应用NLP会议将于10月6日至16日在线举行。
尽管全球调查包括来自各个行业,公司规模,采用NLP的阶段以及地理位置的反馈,但调查结果表明NLP预算一直在增长。实际上,有53%的技术领导者表示他们的NLP预算比2019年至少高出10%,其中31%的人表示他们的预算比上一年高出至少30%。同样的趋势也适用于大型公司(员工人数超过5,000人的公司),其中61%的受访者表示2020年预算增加。鉴于调查是在全球大流行期间进行的,这一发现尤其重要。大多数IT支出处于低迷状态。
三分之一的受访者表示他们使用Spark NLP库,使其成为本次调查中最受欢迎的NLP库。这在特定行业中略有不同:医疗保健(Spark NLP),技术(spaCy),金融服务(nltk)。
超过40%的受访者指出准确性是评估NLP库的最重要标准。
在所有被调查者中,有77%表示他们使用所列的四种NLP云服务(Google,AWS,Azure,IBM)中的至少一种,而Google的服务获得了最多的用户。
尽管基于云的服务非常流行,但是成本和准确性是公司使用它们时面临的主要挑战。
来自文件(例如pdf,txt,docx等)和数据库的数据在NLP项目中使用的数据源列表中排名最高(61%)。
NLP的四个最流行的应用是文档分类,命名实体识别(NER),情感分析和知识图。医疗保健业的受访者将取消身份识别作为另一种常见的NLP用例。