中教数据库 > 宁波职业技术学院学报 > 文章详情

一种基于属性权值分组聚类的相似重复记录检测方法

更新时间:2015-09-28

【摘要】为了提高数据集中相似重复记录的检测效率,提m -种基于属性权值的分组聚类算法。该方法在记录集中选取特征属性,通过设定的权值对记录进行聚类,在形成的数据子集中进行字段匹配和记录匹配,来识别相似重复记录,并给jLIJ了相关算法。实验表明,该方法能减少字段的匹配次数和记录的匹配范围,节省运行时间,具有较高的查全率和查准率。

【关键词】

11 2页 免费

发表评论

登录后发表评论 (已发布 0条)

点亮你的头像 秀出你的观点

0/500
以上留言仅代表用户个人观点,不代表中教立场
相关文献

推荐期刊

Copyright © 2013-2016 ZJHJ Corporation,All Rights Reserved

京ICP备2021022288号-1

京公网安备 11011102000866号