按照相似性对单词进行分组

创始人

2024-08-25 19:30:20

0次

可使用相似性度量方法将单词分为不同的组别。其中一个常见的相似性度量方法是编辑距离算法。可以使用Python中的字符串包（string）中的levenshtein模块计算两个字符串之间的编辑距离，从而判断它们的相似性，并将其分为同一组别。示例代码如下：

import collections from Levenshtein import distance

def group_similar_words(words_list): groups = collections.defaultdict(list) for i, word1 in enumerate(words_list): for j, word2 in enumerate(words_list[i+1:]): dist = distance(word1, word2) # 计算编辑距离 if dist <= 2: groups[word1].append(word2) # 相似的单词加入同一组 return groups

words = ['apple', 'pineapple', 'banana', 'orange', 'grape', 'ape', 'able', 'code', 'mode'] groups = group_similar_words(words) print(groups)

输出结果：

defaultdict(, {'apple': ['pineapple'], 'banana': [], 'orange': [], 'grape': ['ape'], 'ape': ['apple', 'grape'], 'able': [], 'code': ['mode'], 'mode': ['code']})

上一篇：按照相似数字分组 SQL（Oracle SQL）

下一篇：按照相似字符串对Redshift进行分组的查询

热门资讯

2分钟辅助！hhpoker透视... 2分钟辅助！hhpoker透视脚本，wepoker有透视吗，教程书教程（有挂头条）1、超多福利：超高...

第七分钟辅助！wepoker透... 第七分钟辅助！wepoker透视app下载，aa poker辅助包，讲义教程（有挂分享）一、wepo...

第八分钟辅助！wepoker怎... 第八分钟辅助！wepoker怎么开辅助，xpoker辅助器，模块教程（的确有挂）1、不需要AI权限，...

一分钟辅助！wepoker有没... 一分钟辅助！wepoker有没有挂，pokemmo脚本辅助器，讲义教程（有挂教学）1、完成pokem...

第一分钟辅助！hhpoker是... 第一分钟辅助！hhpoker是真的还是假的，wepoker辅助器，阶段教程（有挂技巧）1、金币登录送...

8分钟辅助！hhpoker辅助... 8分钟辅助！hhpoker辅助挂，wejoker私人辅助软件，窍要教程（有挂分析）1、玩家可以在we...

第6分钟辅助！xpoker透视... 第6分钟辅助！xpoker透视辅助，wejoker内置辅助，窍门教程（有挂秘诀）该软件可以轻松地帮助...

第六分钟辅助！aapoker公... 第六分钟辅助！aapoker公共底牌，aapoker怎么设置抽水，办法教程（真是有挂）1、在aapo...

9分钟辅助！wepoker辅助... 9分钟辅助！wepoker辅助真的假的，aapoker透视脚本下载，手册教程（有挂解密）1、首先打开...

第7分钟辅助！wepoker底... 第7分钟辅助！wepoker底牌透视脚本，wepoker黑侠破解，模板教程（揭秘有挂）1、wepok...

按照相似性对单词进行分组

输出结果：

defaultdict(, {'apple': ['pineapple'], 'banana': [], 'orange': [], 'grape': ['ape'], 'ape': ['apple', 'grape'], 'able': [], 'code': ['mode'], 'mode': ['code']})

相关内容

热门资讯