numpy网络编程
本文参考于:书本《Make Your Own Neural Network》 中文《Python神经网络编程》
书中源代码
本文代码托管github
通过此次实践对于神经网络的认识更加深刻,通过数学推导到代码实践让自己有了比较大的收获
一、数学推导
构造三层神经网络

1.前向传播

2.反向传播


3.更新权重




二、代码实现
1.网络实现以及训练过程(Network.py
)
该部分对上述数学推导过程进行代码实现,构建一个三层的神经网络,其中隐含层的节点self.hnodes
可以自己进行设置,因为网络主要使用的MNIST手写数字数据集,输入为(28,28)的灰度图片,但是要对其进行展平,变为784个输入数据;输出为10个节点,因为预测结果有0到9 十种可能
网络实现:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73
| """ 创建三层神经网络模型 用于训练 MNIST 数据集 书中的源码:https://github.com/makeyourownneuralnetwork/makeyourownneuralnetwork/blob/master/part2_neural_network_mnist_data.ipynb """ import numpy # Sigmod() 函数定义在scipy包里面,其输入可以直接 为矩阵 import scipy.special # 绘图 import matplotlib.pyplot as plt
class neuralNetwork: def __init__(self,inputnodes,hiddennodes,outputnodes,learningrate): self.inodes = inputnodes self.hnodes = hiddennodes self.onodes = outputnodes
# learning rate self.lr = learningrate
# 隐藏层与输入层之间wih 以及 隐藏层与输出层之间 的初始权重矩阵 self.wih = numpy.random.normal(0.0,pow(self.inodes,-0.5),(self.hnodes,self.inodes)) self.who = numpy.random.normal(0.0,pow(self.hnodes,-0.5),(self.onodes,self.hnodes))
# 激活函数 self.activation_function = lambda x: scipy.special.expit(x)
# train the neural network def train(self,inputs_list,targets_list): # 将输入转为2d 矩阵 inputs = numpy.array(inputs_list,ndmin=2).T targets = numpy.array(targets_list,ndmin=2).T
# 计算隐藏层的信号加权和 hidden_inputs = numpy.dot(self.wih,inputs) # 对加权和的值 使用激活函数 hidden_outputs = self.activation_function(hidden_inputs)
# 计算输出层的信号加权和 final_inputs = numpy.dot(self.who,hidden_outputs) # 对加权和的值 使用激活函数 final_outputs = self.activation_function(final_inputs)
# output layer error is the (target - actual) output_errors = targets - final_outputs # 隐藏层的误差 是对输出层误差按照权重进行分割重组得到的 hidden_errors = numpy.dot(self.who.T,output_errors)
# 更新隐含层与输出层之间的权重 self.who += self.lr * numpy.dot((output_errors * final_outputs * (1.0 - final_outputs)), numpy.transpose(hidden_outputs)) # 更新隐含层与输入层之间的权重 self.wih += self.lr * numpy.dot((hidden_errors * hidden_outputs * (1.0 - hidden_outputs)), numpy.transpose(inputs))
return final_outputs
# 测试网络 def query(self,inputs_list): # 将输入转化为2D 矩阵 inputs = numpy.array(inputs_list,ndmin=2).T
# 将输入信号的加权和 输入之隐藏层 hidden_inputs = numpy.dot(self.wih,inputs) # 是 加权使用 激活函数 hidden_outputs = self.activation_function(hidden_inputs)
# 对隐藏层的输出信号进行加权和 final_inputs = numpy.dot(self.who,hidden_outputs) # 对加权和的信号 使用激活函数 final_outputs = self.activation_function(final_inputs)
return final_outputs
|
主程序
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88
| if __name__ == '__main__': # 输入为 28*28 = 784 单通道 input_nodes = 784 hidden_nodes = 200 # 输出为 0-9 10 个预测数字 output_nodes = 10
# 学习率 learning_rate = 0.1
# 创建网络实例 n = neuralNetwork(input_nodes,hidden_nodes,output_nodes,learning_rate)
# 加载 MNIST 训练的数据集 training_data_file = open("/home/zxz/Proj/deeplearning/Create_neural_network/Mnist_dateset/mnist_train.csv",'r') # 在csv 类型文本中 mnist 数据集 每一行 代表一张单通道图片 其中的内容为 图片像素矩阵的各个像素值,并且存入列表 training_data_list = training_data_file.readlines() training_data_file.close()
# 加载mnist 测试数据集 test_data_file = open("/home/zxz/Proj/deeplearning/Create_neural_network/Mnist_dateset/mnist_test.csv",'r') test_data_list = test_data_file.readlines() test_data_file.close()
# 训练神经网络 print("Training ...................................") epochs = 5 for epoch in range(epochs): scorecard = [] # 用于存储每一轮的训练正确与否的结果 # 遍历训练数据(列表)并对其进行 数据处理 --- 对数据仅仅训练了一轮 for recode in training_data_list: # 每一行数据 之间的像素值 以 “,“ 分割开来 # 以 “,” 将每一行的 像素矩阵的值进行分割,并且将值存入列表 all_values = recode.split(',') # 正确的标签是 数组中的第一个元素 correct_label = int(all_values[0]) # 对数据进行归一化以及偏移0.01 防止0输入导致权值无法更新 inputs = (numpy.asfarray(all_values[1:]) / 255.0 * 0.99) + 0.01 # 创建期望输出值 (所有的都为0.01 只有期望的标签对应的值 为 0.99) targets = numpy.zeros(output_nodes) + 0.01 # 列表的第一个元素all_values[0]为 每一个图片的 标签 targets[int(all_values[0])] = 0.99 # 使用训练函数进行训练 outputs = n.train(inputs, targets) # 得到输出结果中得分最好的索引 result = numpy.argmax(outputs) if(result == correct_label): scorecard.append(1) else: scorecard.append(0) # 计算本轮训练中的正确率 scorecard_array = numpy.asarray(scorecard) print(r"Epoch {} Training performance = {}".format((epoch+1),scorecard_array.sum() / scorecard_array.size))
print("Testing ................................") # 测试神经网络 scorecard = [] # 用于存储每一轮的预测正确与否的结果 for recode in test_data_list: all_values = recode.split(",") # 正确的标签是 数组中的第一个元素 correct_label = int(all_values[0]) inputs = (numpy.asfarray(all_values[1:]) / 255.0 * 0.99) + 0.01 # 测试网络 outputs = n.query(inputs) # 得到输出结果中 得分最高的索引位置 label = numpy.argmax(outputs) if(label == correct_label): scorecard.append(1) else: scorecard.append(0)
# 计算 该论测试中的 正确率 scorecard_array = numpy.asarray(scorecard) print("Testing performance = ",scorecard_array.sum() / scorecard_array.size)
""" # 可视化数据集中的图片 all_v = test_data_list[0].split(",") image_array = ((np.asfarray(all_values[1:])/255.0 * 0.99) + 0.01).reshape(28,28) plt.imshow(image_array,cmap='Greys',interpolation='None') plt.show() """
|
运行结果:测试的正确率可以达到97%左右

2.构建自己的手写数字数据集
将自己手写的数字,进行数据处理变为合适网络的输入
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
| """ 将自己手写的数字(PNG存储在my_image中)进行处理并且进行数据存储(存储到training_data_list中) 1.书中的源码:https://github.com/makeyourownneuralnetwork/makeyourownneuralnetwork/blob/master/part3_load_own_images.ipynb 2.将自己创建的数字图片存储在 my_image,每张图片对应的label为图片的上层文件夹,图片格式为xxx.PNG 文件结构; my_image ├── 0 └── 0.png ├── 1 └── 1.png ├── 2 └── 2.png ├── 3 └── 3.png ├── 4 └── 4.png ├── 5 └── 5.png ├── 6 └── 6.png ├── 7 └── 7.png ├── 8 └── 8.png └── 9 └── 9.png """
import numpy import matplotlib.pyplot as plt import PIL import os import torchvision
def my_image(file_path): # 将图片放缩至 (28,28) ReSize = torchvision.transforms.Resize((28, 28)) # 用于存储数据的列表 training_data_list = [] # 将路径下的文件转化 列表 --- 图片的标签列表 num_class = [cla for cla in os.listdir(file_path)] for cla in num_class: # 每一个标签文件夹 cla_path = os.path.join(file_path,cla) # 每一个标签文件夹下的图片列表 images = os.listdir(cla_path) for image in images: # 每一张图片的路径 image_path = os.path.join(cla_path,image)
# 开始对数据进行处理 # 将图片转为灰度图片 image_array = PIL.Image.open(image_path).convert('L') # 将图片的大小缩放到 (28,28) image_array_crop = ReSize(image_array) # 将 PIL.Image.Image 数据类型变为 ndarry 二维数组类型 ---- 并将其展平为一维数组(784)列 ---网络中输入数据的固定格式 image_data = numpy.asfarray(image_array_crop).reshape(784) # 像素值0表示黑色 255表示白色 但是 MNIST 中相反因此需要用 255-image_data image_data = 255 - image_data # 数据归一化并且进行偏移0.01,防止0输入造成梯度消失 image_data = (image_data/255.0 * 0.99) + 0.01 record = numpy.append(float(cla),image_data) train_data_list.append(record)
return training_data_list
# 与 Network.py中的 train_data_list 效果一致 training_data_list = my_image("/home/zxz/Proj/deeplearning/Create_neural_network/my_image") print(training_data_list[0])
""" # 可视化图片 plt.imshow(image_data.reshape(28,28), cmap='Greys', interpolation='None') plt.show() """
|