Python如何使用k-means方法将列表中相似的句子归类

脚本专栏 2024/9/20 佚名

3 1 2

前言

由于今年暑假在学习一些自然语言处理的东西，发现网上对k-means的讲解不是很清楚，网上大多数代码只是将聚类结果以图片的形式呈现，而不是将聚类的结果表示出来，于是我将老师给的代码和网上的代码结合了一下，由于网上有许多关于k-means算法基础知识的讲解，因此我在这里就不多讲解了，想了解详细内容的，大家可以自行百度，在这里我只把我的代码给大家展示一下。

k-means方法的缺点是k值需要自己找，大家可以多换换k值，看看结果会有什么不同

代码

# coding: utf-8
import sys
import math
import re
import docx
from sklearn.cluster import AffinityPropagation
import nltk
from nltk.corpus import wordnet as wn
from nltk.collocations import *
import numpy as np
reload(sys)
sys.setdefaultencoding('utf8')
from sklearn.feature_extraction.text import CountVectorizer
#要聚类的数据
corpus = [
 'This is the first document.',#0
 'This is the second second document.',#1
 'And the third one.',#2
 'Is this the first document"cluster centroids:",centroid_list
print labels
max_centroid = 0
max_cluster_id = 0
cluster_menmbers_list = []
for i in range(0, n_clusters_):
 menmbers_list = []
 for j in range(0, len(labels)):
  if labels[j] == i:
   menmbers_list.append(j)
 cluster_menmbers_list.append(menmbers_list)
# print cluster_menmbers_list

#聚类结果
for i in range(0,len(cluster_menmbers_list)):
 print '第' + str(i) + '类' + '---------------------'
 for j in range(0,len(cluster_menmbers_list[i])):
  a = cluster_menmbers_list[i][j]
  print corpus[a]

运行结果：

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

python,k-means,归类

风云阁资源网 Design By www.bgabc.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

风云阁资源网 Design By www.bgabc.com

评论“Python如何使用k-means方法将列表中相似的句子归类”

暂无评论...

更新日志

2024年09月20日

Python如何使用k-means方法将列表中相似的句子归类

python笔记_将循环内容在一行输出的方法

python实现图像检索的三种(直方图/OpenCV/哈希法)

评论“Python如何使用k-means方法将列表中相似的句子归类”

更新日志

友情链接