我一直在尝试使以下神经网络起一个简单的AND门的作用,但似乎无法正常工作。以下是我的代码:
import numpy as np
def sigmoid(x,derivative=False):
if(derivative==True):
return x*(1-x)
return 1/(1+np.exp(-x))
np.random.seed(1)
weights = np.array([0,0,0])
training = np.array([[[1,1,1],1],
[[1,1,0],0],
[[1,0,1],0],
[[1,0,0],0]])
for iter in xrange(training.shape[0]):
#forwardPropagation:
a_layer1 = training[iter][0]
z_layer2 = np.dot(weights,a_layer1)
a_layer2 = sigmoid(z_layer2)
hypothesis_theta = a_layer2
#backPropagation:
delta_neuron1_layer2 = a_layer2 - training[iter][1]
Delta_neuron1_layer2 = np.dot(a_layer2,delta_neuron1_layer2)
update = Delta_neuron1_layer2/training.shape[0]
weights = weights-update
x = np.array([1,0,1])
print weights
print sigmoid(np.dot(weights,x))
上面的程序不断返回奇怪的值作为输出,而输入X返回的值比数组[1,1,1]高。每个训练/测试“输入”的第一个元素代表偏差单位。该代码基于Andrew Ng在他的Coursera机器学习课程中的视频:https://www.coursera.org/learn/machine-learning
提前感谢你的帮助。
最佳答案
一些提示:
NN需要大量数据。您无法通过它提供一些样本,并且期望它学习很多。
您正在使用列表和一维数组而不是二维数组。对于numpy来说这很危险,因为它将在不假定任何形状的地方盲目广播,这在某些情况下可能很危险。
您在反向传播中没有像使用Sigmoid导数那样
我调整了数组的形状,并增加了输入量。
import numpy as np
def sigmoid(x,derivative=False):
if(derivative==True):
return x*(1-x)
return 1/(1+np.exp(-x))
np.random.seed(1)
weights = np.random.randn(1, 3)
training = np.array([[np.array([0, 0, 0]).reshape(1, -1), 1],
[np.array([0,0,1]).reshape(1, -1), 0],
[np.array([0,1,0]).reshape(1, -1), 0],
[np.array([0,1,1]).reshape(1, -1), 0],
[np.array([1, 0, 0]).reshape(1, -1), 1],
[np.array([1,0, 1]).reshape(1, -1), 0],
[np.array([1,1,0]).reshape(1, -1), 0],
[np.array([1,1,1]).reshape(1, -1), 1],
])
for iter in xrange(training.shape[0]):
#forwardPropagation:
a_layer1 = training[iter][0]
z_layer2 = np.dot(weights,a_layer1.reshape(-1, 1))
a_layer2 = sigmoid(z_layer2)
hypothesis_theta = a_layer2
#backPropagation:
delta_neuron1_layer2 = (a_layer2 - training[iter][1] ) * sigmoid(a_layer2 , derivative=True)
Delta_neuron1_layer2 = np.dot(delta_neuron1_layer2 , a_layer1)
update = Delta_neuron1_layer2
weights = weights - update
x = np.array([0,0, 1])
print sigmoid(np.dot(weights,x.reshape(-1, 1)))
x = np.array([0,1,1])
print sigmoid(np.dot(weights,x.reshape(-1, 1)))
x = np.array([1,1,1])
print sigmoid(np.dot(weights,x.reshape(-1, 1)))
输出:
[[ 0.34224604]]
[[ 0.19976054]]
[[ 0.52710321]]
这不干净,并且肯定还有改进的空间。但是至少,您现在有了一些东西。预期产生理论0的输入比应该产生理论1的输入更接近0。