广西农业信息地理匹配引擎设计与实现
Design and implementation of geographic matching engine for Guangxi agricultural information
-
摘要: 目的研究高并发、大流量农业信息地理匹配引擎,改进其算法,解决广西区内壮语地名匹配问题,实现农业信息的自动匹配与空间定位,以满足农业大数据平台高并发、大流量的地理匹配需求..方法通过改造开源的Solr全文搜索引擎,结合广西地名中的少数民族语言特点,扩充地名词典、设计数据组织方式与逆向分词算法、改进TF-IDF算法.结果在改进方法的基础上设计并实现了农业地理信息地理匹配引擎.经过第三方15484条数据测试,能够准确切分壮语地名,引擎在500并发下仍具有良好的响应速度,匹配准确率达98.43%.地理匹配引擎目前已应用到糖业发展大数据平台中,并取得了良好的效果.建议针对测试中出现的问题,建议在下一步工作中扩充并完善词库内容、增强语义推理能力、研究基于空间语义的定位算法,提高广西农业信息的定位精度.