我为我的一个班级写了一个图像识别代码。我将“好”和“坏”的心脏超声图像分类。我遇到的问题是分类器始终预测图像是“良好”的。我目前没有太多图像可以分类,因此准确率仅为50%,但是我不确定为什么机器总是认为图像质量很好。

图片示例:

Here is a bad image

Here is a good image

有小费吗?我提供了以下代码:

#required imports

#using sequential from tensorflow

from keras.models import Sequential

from keras.layers import Conv2D

from keras.layers import MaxPooling2D

from keras.layers import Flatten

from keras.layers import Dense


#classification model to be sequential
classifier = Sequential()

classifier.add(Conv2D(32, (3, 3), input_shape = (64, 64, 3), activation = 'relu'))
classifier.add(MaxPooling2D(pool_size = (2, 2)))
classifier.add(Flatten())
classifier.add(Dense(units = 128, activation = 'relu'))

#output layer
classifier.add(Dense(units = 1, activation = 'sigmoid'))

#compilation
classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

#training
from keras.preprocessing.image import ImageDataGenerator

train_datagen = ImageDataGenerator(rescale = 1./255, shear_range = 0.2,
zoom_range = 0.2, horizontal_flip = True)

test_datagen = ImageDataGenerator(rescale = 1./255)

training_set = train_datagen.flow_from_directory("/home/jovyan/dataset/training_set/", target_size = (64, 64), batch_size = 32, class_mode = 'binary')

test_set = test_datagen.flow_from_directory("/home/jovyan/dataset/test_set/", target_size = (64, 64), batch_size = 32, class_mode = 'binary')

classifier.fit_generator(training_set, steps_per_epoch = 85, epochs = 25, validation_data=test_set, validation_steps=2000)

#predictions
import numpy as np
from keras.preprocessing import image
test_image=image.load_img("/home/jovyan/dataset/test_set/test_bad_1.jpg", target_size=(64, 64))
test_image=image.img_to_array(test_image)
test_image=np.expand_dims(test_image, axis=0)
result=classifier.predict(test_image)
training_set.class_indices

if result[0][0]==1:
    prediction='good'
else:
    prediction='bad'

print(prediction)`

最佳答案

我对Keras并不熟悉,所以我只假设您的代码中没有问题,并尝试在您的问题上给我2美分。

首先要检查的是数据集是否平衡。如果数据中的“好”图像相对过多,该模型将仅输出“好”,因为它产生的性能要比“正常”二进制交叉熵损失方面的实际预测要好。

因此,您可以尝试的一件事是为两个标签赋予不同的权重(我们称其为加权交叉熵损失):对标记为“好”的错误答案进行惩罚,以便模型现在可以尝试预测“差”。 “ 图片。

如果这不起作用,则可以尝试other ways处理这种不平衡的数据集情况。

08-24 23:28