试题详情
- 简答题论述聚类检索算法的基本思想。
- 1)建立检索系统数据库中文档的向量表示,并进行聚类处理,形成聚类文档。2)接受用户检索请求,并将检索请求表示或转换为提问向量;3)确定相似度计算函数,并计算提问向量与聚类文档中各文档类向量之间的相似度。4)根据系统中预定义的相似度阈值,选择与提问向量相似度值大于阈值的类向量作为下一步进行检索的文档范围;或者,只选择与提问向量最相似的类向量中的文档作为继续检索匹配的对象。5)在选中的类向量所包含的文档集合中,逐一计算提问向量与各文档向量的相似度,并将相似度值大于指定阈值的文档作为命中结果排序输出。
关注下方微信公众号,在线模考后查看
热门试题
- 检索钙(calcium)用于食品(foo
- 检索“论法律的渊源”(on source
- 查找“基于光声光谱传感技术的变压器油中溶
- 域名后缀gov代表()
- ISSN0023-1231.是()
- 用google搜索中文企业组织类网站上查
- 下列选项中哪一项属于“国内统一刊号”()
- 用维普《中文科技期刊数据库》查询刊物《图
- 如果用维普《中文科技期刊数据库》检索文献
- 论述系统分析的方法。
- 查全率和查准率是可以同步提高同时达到10
- 用IEEE检索系统检索computerp
- 检索课题“饲料机械制造及其自动化”,中文
- 国际专利分类法有多少个部()
- 可以检索color或者colour的最常
- 检索治疗乙型肝炎的重要信息,用《中文科技
- 信息的统计分析主要包括统计关键词、分类号
- 查找“土壤重金属生物活性调控技术”的中文
- 刘志强.我国农业生态环境可持续发展评价及
- 属于普及性和专业性兼备的工具书,它涵概各