基于决策树算法的专利发明人姓名消歧研究
发布时间:2025-12-09
点击次数:
- 所属单位:
- 西安建筑科技大学管理学院;西安交通大学管理学院;
- 发表刊物:
- 科学与管理
- 关键字:
- 发明人;姓名消歧;半监督学习;决策树C4.5
- 摘要:
- 为了实现高质量的数据清洗,提升专利数据构建网络的准确性,发明人的姓名消歧已经成为目前国内外众多研究者重视的关键性问题。本文根据中文姓名的特殊性,选取专利数据中分层抽样采集到的400个姓名对,使用半监督学习算法,以特征向量(如分类号相似度)为信息提取源,构造基于决策树C4.5算法的分类模型,识别姓名歧义问题,并对分类模型的准确率与可靠性进行了评估。以国内通讯行业专利数据为实例的研究表明:采用该分类模型进行清洗能够有效提升数据清洗的效率和精确度。
- 期号:
- 04
- 页面范围:
- 85-94
- ISSN号:
- 1003-8256
- 是否译文:
- 否
- 发表时间:
- 2022-11-17



