from sklearn.datasets import load_sample_image
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt #读取一张示例图片或自己准备的图片,观察图片存放数据特点
china = load_sample_image("china.jpg")
plt.imshow(china)
plt.show()
print(china.shape)
#根据图片的分辨率,适当降低分辨率
image = china[::3,::3] #行列分别按step为3的距离取
x = image.reshape(-1,3) #生成行数自填充,列数为3的二维数组
plt.imshow(image)
plt.show()
print(image.shape,x.shape) #用k均值聚类算法,将图片中所有颜色值做聚类。
n_color = 64
model = KMeans(n_color)
labels = model.fit_predict(x) #每个点的颜色分类
color = model.cluster_centers_ #64个聚类中心,颜色值 #用聚类中心的颜色代替原来颜色,形成新图片
color[labels]
images = image.reshape(143, 214, 3)
print(images.shape)
plt.imshow(images)
plt.show()
2.贝叶斯
- M桶:7红3黄
- N桶:1红9黄
- 现在:拿出了一个红球
- 试问:这个红球是M、N桶拿出来的概率分别是多少?
解: 设:事件A为拿到一个红球,事件M是在M桶中拿到红球;事件N为在N桶里拿到红球。
1) P(M|B) = P(B|M) · P(M) /P(B) = (7/10 · 1/2)/ (8/20) = 7/8
2) P(N|B) = 1 - P(M|B) = 1/8