tensorflow+k-means聚类简单猫狗图像分类的实现方法

内容摘要

这篇文章主要为大家详细介绍了tensorflow+k-means聚类简单猫狗图像分类的实现方法，具有一定的参考价值，可以用来参考一下。

文章正文

这篇文章主要为大家详细介绍了tensorflow+k-means聚类简单猫狗图像分类的实现方法，具有一定的参考价值，可以用来参考一下。

感兴趣的小伙伴，下面一起跟随php教程的雯雯来看看吧！

一、前言

本文使用的是 kaggle 猫狗大战的数据集：https://www.kaggle.com/c/dogs-vs-cats/data

训练集中有 25000 张图像，测试集中有 12500 张图像。作为简单示例，我们用不了那么多图像，随便抽取一小部分猫狗图像到一个文件夹里即可。

通过使用更大、更复杂的模型，可以获得更高的准确率，预训练模型是一个很好的选择，我们可以直接使用预训练模型来完成分类任务，因为预训练模型通常已经在大型的数据集上进行过训练，通常用于完成大型的图像分类任务。

tf.keras.applications中有一些预定义好的经典卷积神经网络结构（Application应用），如下所示：

我们可以直接调用这些经典的卷积神经网络结构（甚至载入预训练的参数），而无需手动来构建网络结构。

例如，本文将要用到的模型是由谷歌开发的 MobileNetV2 网络结构，该模型已经在 ImageNet 数据集上进行过预训练，共含有 1.4M 张图像，而且学习了常见的 1000 种物体的基本特征，因此，该模型具有强大的特征提取能力。

代码如下：

1 2	`<code>` `model = tf.keras.applications.MobileNetV2()</code>`

tensorflow+k-means聚类简单实现猫狗图像分类的方法

当执行以上代码时，TensorFlow会自动从网络上下载 MobileNetV2 网络结构，运行代码后需要等待一会会儿~~。MobileNetV2模型的速度很快，而且耗费资源也不是很多。

二、k-means聚类

k-means聚类算法以 k 为参数，把 n 个对象分成 k 个簇，使簇内具有较高的相似度，而簇间的相似度较低。其处理过程如下：

随机选择 k 个点作为初始的聚类中心
对于剩下的点，根据其与聚类中心的距离，将其归入最近的簇。
对每个簇，计算所有点的均值作为新的聚类中心。
重复步骤2、3直到聚类中心不再发生改变

k-means的算法原理比较非常简洁、易于理解，但是这里面有个问题需要解决：

如何确定 k 值？

在 k-means 算法实现过程中，首先面临的问题就是如何确定好 K 值。因为在实际应用中，我们也不知道这些数据到底会有多少个类别，或者分为多少个类别会比较好，所以在选择 K 值的时候会比较困难，只能根据经验预设一个数值。
比较常用的一个方法：肘部法。就是去循环尝试 K 值，计算在不同的 K 值情况下，所有数据的损失，即用每一个数据点到中心点的距离之和计算平均距离。可以想到，当 K=1 的时候，这个距离和肯定是最大的；当 K=m 的时候，每个点也是自己的中心点，这个时候全局的距离和是0，平均距离也是0，当然我们不可能设置成K=m。
而在逐渐加大 K 的过程中，会有一个点，使这个平均距离发生急剧的变化，如果把这个距离与 K 的关系画出来，就可以看到一个拐点，也就是我们说的手肘。

要确定 K 值确实是一项比较费时费力的事情，但是也是 K-Means 聚类算法中必须要做好的工作。

三、图像分类

现在进入正题，实现我们的猫狗图像分类。

导入需要的依赖库

代码如下：

<code>
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
import cv2 as cv
import os, shutil
from pathlib import Path</code>

tensorflow+k-means聚类简单实现猫狗图像分类的方法

获取 animals 文件夹下所有 jpg 猫狗图像

代码如下：

<code>
# 获得该文件夹下所有jpg图片路径
p = Path(r"C:\Users\Administrator\DeepLearning\animals")
files = list(p.glob("**/*.jpg"))</code>

tensorflow+k-means聚类简单实现猫狗图像分类的方法

opencv读取图像，并将图像大小 resize 为（224，224），以匹配模型输入层的大小以进行特征提取。图像数组转换为 float32 类型并reshape，然后做归一化。

代码如下：

<code>
# opencv读取图像 并resize为（224，224）
images = [cv.resize(cv.imread(str(file)), (224, 224)) for file in files]
paths = [file for file in files]
# 图像数组转换为float32类型并reshape  然后做归一化
images = np.array(np.float32(images).reshape(len(images), -1) / 255)</code>

tensorflow+k-means聚类简单实现猫狗图像分类的方法

加载预训练模型 MobileNetV2 来实现图像分类

代码如下：

<code>
# 加载预先训练的模型MobileNetV2来实现图像分类
model = tf.keras.applications.MobileNetV2(include_top=False,
weights="imagenet", input_shape=(224, 224, 3))
predictions = model.predict(images.reshape(-1, 224, 224, 3))
pred_images = predictions.reshape(images.shape[0], -1)</code>

tensorflow+k-means聚类简单实现猫狗图像分类的方法

k-means聚类算法

代码如下：

<code>
k = 2   # 2个类别
# K-Means聚类
kmodel = KMeans(n_clusters=k, n_jobs=-1, random_state=888)
kmodel.fit(pred_images)
kpredictions = kmodel.predict(pred_images)
print(kpredictions)   # 预测的类别
# 0：dog    1：cat</code>

tensorflow+k-means聚类简单实现猫狗图像分类的方法

将分类后的图像保存到不同文件夹下

代码如下：

<code>
for i in ["cat", "dog"]:
    os.mkdir(r"C:\Users\Administrator\DeepLearning\picture_" + str(i))
 
# 复制文件，保留元数据 shutil.copy2('来源文件', '目标地址')
for i in range(len(paths)):
    if kpredictions[i] == 0:   
        shutil.copy2(paths[i], r"C:\Users\Administrator\DeepLearning\picture_dog")
    else:
        shutil.copy2(paths[i], r"C:\Users\Administrator\DeepLearning\picture_cat")</code>

到此这篇关于tensorflow+k-means聚类简单实现猫狗图像分类的文章就介绍到这了,更多相关tensorflow实现猫狗图像分类内容请搜索php教程以前的文章或继续浏览下面的相关文章希望大家以后多多支持php教程！

注：关于tensorflow+k-means聚类简单猫狗图像分类的实现方法的内容就先介绍到这里，更多相关文章的可以留意

代码注释

上一篇 php自定义函数截取汉字长度的实现方法下一篇 python爬虫之bs4数据的功能实例

作者：喵哥笔记

学的不仅是技术，更是梦想！