按照相似性对单词进行分组
创始人
2024-08-25 19:30:20
0

可使用相似性度量方法将单词分为不同的组别。其中一个常见的相似性度量方法是编辑距离算法。可以使用Python中的字符串包(string)中的levenshtein模块计算两个字符串之间的编辑距离,从而判断它们的相似性,并将其分为同一组别。示例代码如下:

import collections from Levenshtein import distance

def group_similar_words(words_list): groups = collections.defaultdict(list) for i, word1 in enumerate(words_list): for j, word2 in enumerate(words_list[i+1:]): dist = distance(word1, word2) # 计算编辑距离 if dist <= 2: groups[word1].append(word2) # 相似的单词加入同一组 return groups

words = ['apple', 'pineapple', 'banana', 'orange', 'grape', 'ape', 'able', 'code', 'mode'] groups = group_similar_words(words) print(groups)

输出结果:

defaultdict(, {'apple': ['pineapple'], 'banana': [], 'orange': [], 'grape': ['ape'], 'ape': ['apple', 'grape'], 'able': [], 'code': ['mode'], 'mode': ['code']})

相关内容

热门资讯

2分钟辅助!hhpoker透视... 2分钟辅助!hhpoker透视脚本,wepoker有透视吗,教程书教程(有挂头条)1、超多福利:超高...
第七分钟辅助!wepoker透... 第七分钟辅助!wepoker透视app下载,aa poker辅助包,讲义教程(有挂分享)一、wepo...
第八分钟辅助!wepoker怎... 第八分钟辅助!wepoker怎么开辅助,xpoker辅助器,模块教程(的确有挂)1、不需要AI权限,...
一分钟辅助!wepoker有没... 一分钟辅助!wepoker有没有挂,pokemmo脚本辅助器,讲义教程(有挂教学)1、完成pokem...
第一分钟辅助!hhpoker是... 第一分钟辅助!hhpoker是真的还是假的,wepoker辅助器,阶段教程(有挂技巧)1、金币登录送...
8分钟辅助!hhpoker辅助... 8分钟辅助!hhpoker辅助挂,wejoker私人辅助软件,窍要教程(有挂分析)1、玩家可以在we...
第6分钟辅助!xpoker透视... 第6分钟辅助!xpoker透视辅助,wejoker内置辅助,窍门教程(有挂秘诀)该软件可以轻松地帮助...
第六分钟辅助!aapoker公... 第六分钟辅助!aapoker公共底牌,aapoker怎么设置抽水,办法教程(真是有挂)1、在aapo...
9分钟辅助!wepoker辅助... 9分钟辅助!wepoker辅助真的假的,aapoker透视脚本下载,手册教程(有挂解密)1、首先打开...
第7分钟辅助!wepoker底... 第7分钟辅助!wepoker底牌透视脚本,wepoker黑侠破解,模板教程(揭秘有挂)1、wepok...