百度百科版本

命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。

查看详情

 

维基百科版本

命名实体识别(NER)(也称为实体识别,实体分块和实体提取)是信息提取的子任务,旨在将非结构化文本中的命名实体提及定位和分类为预定义的类别,例如人名,组织,地点,医疗法规,时间表达,数量,货币价值,百分比等 大多数关于NER系统的研究都是采用未经注释的文本块,例如:

Jim于2006年购买了300股Acme Corp.股票。

并生成带注释的文本块,突出显示实体的名称:

吉姆【人】在2006【时间】买了300股Acme Corp.【组织】。

在该示例中,已经检测到并且分类了由一个令牌,双令牌公司名称和时间表达组成的人名。

最先进的英语NER系统产生近乎人性化的表现。例如,进入MUC-7的最佳系统得分为F-measure的 93.39%,而人类注释者得分为97.60%和96.95%。

查看详情