😠 🛎️ 🧝🏽 Jaringan saraf tiruan. Bagian 3 🧑🏾‍🤝‍🧑🏾 🛤️ 🖖🏾

Pelatihan jaringan saraf

Pada bagian artikel tentang pengembangan jaringan saraf paling sederhana ini, kita akan belajar cara melatih jaringan saraf.

Jaringan syaraf tiruan akan kami latih untuk memecahkan masalah menemukan pola dalam sejumlah angka. Untuk mempermudah, ini adalah angka 0 dan 1.

Untuk melatih jaringan saraf, seseorang harus memiliki kondisi masalah dan solusi, masalah harus menyelesaikan satu masalah.

Data pelatihan terlihat seperti ini

Kondisi		Menjawab
satu	0	satu
0	0	0
0	satu	0

Anda dapat melihat masalah ini di hampir semua artikel tentang menulis jaringan saraf dari awal.

Sebagai hasil dari pelatihan, jaringan saraf menemukan koneksi logis antara kondisi dan respons.

Solusi untuk masalah ini adalah dengan memasukkan angka pertama.

Seperti kondisi masalah yang akan dipecahkan oleh jaringan syaraf tiruan

Kondisi		Menjawab
satu	satu	satu

Pelatihan jaringan saraf adalah tentang mengurangi kerugian.

Semakin sedikit kerugian semakin baik dan lebih tepat hasilnya.

Untuk menghindari rumus yang rumit, saya tidak akan menjelaskan secara rinci prinsip-prinsip pelatihan, saya akan memberi Anda kode yang lebih atau kurang jelas dan menjelaskan fungsi-fungsi yang diperlukan untuk melatih jaringan saraf.

Untuk pelatihan, kita membutuhkan turunan dari sigmoid.

Anda dapat melihat apa itu turunan di Wikipedia, dan turunan dari sigmoid terlihat seperti ini:

$f` (x) = \ frac {e ^ {- x}} {(1 + e ^ {- x}) ^ 2} = f (x) * (1-f (x))$

Implementasi Python terlihat seperti ini:

def deriv_sig(x):
    return sig(x) * (1 - sig(x))

Mari tulis kode ini ke file Math.py

Kami juga membutuhkan 2 konstanta untuk pelatihan:

rate - learning rate

count_learn - jumlah pengulangan pelatihan

count_learn , . rate .

rate = 0.1

count_learn = 10000

, 0 count_learn, , .

, :

def learn(self, inputs, answers):
        
        rate = 0.1
        count_learn = 10000

        for o in range(count_learn):
            for inputt, answer in zip(inputs, answers):

                sum_n1 = self.n[0].w[0] * inputt[0] + self.n[0].w[1] * inputt[1] + self.n[0].b
                n1 = sig(sum_n1)

                sum_n2 = self.n[1].w[0] * inputt[0] + self.n[1].w[1] * inputt[1] + self.n[1].b
                n2 = sig(sum_n2)

                sum_n3 = self.n[2].w[0] * n1 + self.n[2].w[1] * n2 + self.n[2].b
                n3 = sig(sum_n3)
                out_res = n3

                err = -2 * (answer - out_res)

                err_rate = rate * err

                deriv_sig_n1 = deriv_sig(sum_n1)
                deriv_sig_n2 = deriv_sig(sum_n2)
                deriv_sig_n3 = deriv_sig(sum_n3)

                self.n[0].w[0] -= err_rate * self.n[2].w[0] * deriv_sig_n3 * inputt[0] * deriv_sig_n1
                self.n[0].w[1] -= err_rate * self.n[2].w[0] * deriv_sig_n3 * inputt[1] * deriv_sig_n1
                self.n[0].b -= err_rate * self.n[2].w[0] * deriv_sig_n3 * deriv_sig_n1

                self.n[1].w[0] -= err_rate * self.n[2].w[1] * deriv_sig_n3 * inputt[0] * deriv_sig_n2
                self.n[1].w[1] -= err_rate * self.n[2].w[1] * deriv_sig_n3 * inputt[1] * deriv_sig_n2
                self.n[1].b -= err_rate * self.n[2].w[1] * deriv_sig_n3 * deriv_sig_n2

                self.n[2].w[0] -= err_rate * n1 * deriv_sig_n3
                self.n[2].w[1] -= err_rate * n2 * deriv_sig_n3
                self.n[2].b -= err_rate * deriv_sig_n3

NeuronNet.

NeuronNet.py :

from Neuron import *

class NeuronNet:
    def __init__(self):

        self.n = []

        for i in range(3):
            self.n.append(Neuron(2))

    def activate(self, inputs):
        return self.n[2].activate(np.array([self.n[0].activate(inputs), self.n[1].activate(inputs)]))

    def learn(self, inputs, answers):
        
        rate = 0.1
        count_learn = 10000

        for o in range(count_learn):
            for inputt, answer in zip(inputs, answers):

                sum_n1 = self.n[0].w[0] * inputt[0] + self.n[0].w[1] * inputt[1] + self.n[0].b
                n1 = sig(sum_n1)

                sum_n2 = self.n[1].w[0] * inputt[0] + self.n[1].w[1] * inputt[1] + self.n[1].b
                n2 = sig(sum_n2)

                sum_n3 = self.n[2].w[0] * n1 + self.n[2].w[1] * n2 + self.n[2].b
                n3 = sig(sum_n3)
                out_res = n3

                err = -2 * (answer - out_res)

                err_rate = rate * err

                deriv_sig_n1 = deriv_sig(sum_n1)
                deriv_sig_n2 = deriv_sig(sum_n2)
                deriv_sig_n3 = deriv_sig(sum_n3)

                self.n[0].w[0] -= err_rate * self.n[2].w[0] * deriv_sig_n3 * inputt[0] * deriv_sig_n1
                self.n[0].w[1] -= err_rate * self.n[2].w[0] * deriv_sig_n3 * inputt[1] * deriv_sig_n1
                self.n[0].b -= err_rate * self.n[2].w[0] * deriv_sig_n3 * deriv_sig_n1

                self.n[1].w[0] -= err_rate * self.n[2].w[1] * deriv_sig_n3 * inputt[0] * deriv_sig_n2
                self.n[1].w[1] -= err_rate * self.n[2].w[1] * deriv_sig_n3 * inputt[1] * deriv_sig_n2
                self.n[1].b -= err_rate * self.n[2].w[1] * deriv_sig_n3 * deriv_sig_n2

                self.n[2].w[0] -= err_rate * n1 * deriv_sig_n3
                self.n[2].w[1] -= err_rate * n2 * deriv_sig_n3
                self.n[2].b -= err_rate * deriv_sig_n3

Math.py :

import numpy as np

def sig(x):
    return 1 / (1 + np.exp(-x)) 

def deriv_sig(x):
    return sig(x) * (1 - sig(x))

main.py :

learn_inputs = np.array([[1, 0], [0, 0], [0, 1]])
learn_answers = np.array([1, 0, 0])

net.learn(learn_inputs, learn_answers)

x = np.array([1, 1])

if (net.activate(x) < 0.5):
    print("0")
else:
    print("1")

main.py :

import numpy as np

from NeuronNet import *

net = NeuronNet()

learn_inputs = np.array([[1, 0], [0, 0], [0, 1]])
learn_answers = np.array([1, 0, 0])

net.learn(learn_inputs, learn_answers)

x = np.array([1, 1])

if (net.activate(x) < 0.5):
    print("0")
else:
    print("1")

python main.py


1	1	1


0	1	0

github.

, .

Jaringan saraf tiruan. Bagian 3

Pelatihan jaringan saraf

More articles: