试题详情
简答题举例说明什么叫汉语信息处理中的自动分词。
  • 和英语不同,人们在用汉字记录汉语的时候,并不实行分词连写。书面汉语是以字为单位的,字与字之间有间隔,词与词之间没有空档做标志。而汉语的字与词又不是对应的,一个字,有时是一个词,有时仅是一个语素,有时连语素也算不上,如“巧”“灵巧”“巧克力”中的“巧”。但我们理解句子不是以字为单位,而是以词为单位的。如“中国经济发展迅速”,应该分成“中国/经济/发展/迅速”。因此,让计算机把以字为单位的书面语流串变成以词为单位的形式就叫做汉语的自动分词。
  • 关注下方微信公众号,在线模考后查看

热门试题