Wie berechnet Lstm die Anzahl der Parameter?
Wie berechnet Lstm die Anzahl der Parameter?

Video: Wie berechnet Lstm die Anzahl der Parameter?

Video: Wie berechnet Lstm die Anzahl der Parameter?
Video: Deep Learning: Long Short-Term Memory Networks (LSTMs) 2024, Kann
Anonim

Also nach deinen Werten. Die Eingabe in die Formel ergibt:->(n=256, m=4096), total Anzahl der Parameter ist 4*((256*256) + (256*4096) + (256)) = 4*(1114368) = 4457472 Nummer von Gewichten ist 28 = 16 (num_units * num_units) für die wiederkehrenden Verbindungen + 12 (input_dim * num_units) für die Eingabe.

Auch gefragt, wie finden Sie die Anzahl der Parameter?

Zu Berechnung das Erlernbare Parameter hier müssen wir nur die mit der Form der Breite m, der Höhe n multiplizieren und alle solchen Filter k berücksichtigen. Vergessen Sie nicht den Bias-Term für jeden der Filter. Anzahl Parameter in einer CONV-Schicht wäre: ((m * n) + 1) * k), addiert 1 wegen des Vorspannungsterms für jeden Filter.

Ebenso, wie viele versteckte Einheiten hat Lstm? Ein LSTM Netzwerk. Das Netzwerk hat fünf Eingänge Einheiten , ein versteckte Schicht bestehend aus zwei LSTM Speicherblöcke und drei Ausgänge Einheiten . Jeder Speicherblock hat vier Eingänge, aber nur einen Ausgang.

Anschließend kann man sich auch fragen, wie findet man die Anzahl der Parameter im RNN?

1 Antwort. Die Entitäten W, U und V werden von allen Schritten des geteilt RNN und das sind die einzigen Parameter in dem in der Abbildung beschriebenen Modell. Somit Anzahl Parameter während des Trainings zu lernen = dim(W)+dim(V)+dim(U). Basierend auf den Daten in der Frage ist dies = n2+kn+nm.

Wie viele Schichten hat Lstm?

Im Allgemeinen 2 Schichten haben sich als ausreichend erwiesen, um komplexere Merkmale zu erkennen. Mehr Schichten kann besser, aber auch schwieriger zu trainieren sein. Als Faustregel gilt: 1 versteckt Schicht mit einfachen Problemen wie diesem arbeiten, und zwei reichen aus, um einigermaßen komplexe Funktionen zu finden.

Empfohlen: