0:28:22–0:28:30
Genau. Und das Interessante ist ja dann oft, dass das Interessante für die weitere Forschung oft nicht was klappt, sondern was nicht klappt.
0:28:31–0:28:32
Das soll dann zum Beispiel.
0:28:35–0:28:43
Bei Bilderkennung, also solchen Sachen. Dann hast du 100.000 Ampeln, die du gerendert hast und dann geht eine Ampel nicht.
0:28:43–0:28:46
Und wird dann keine Ahnung. Wird dann als.
0:28:49–0:29:03
Das ist für Saurier erkannt oder was weiß ich. Es ist halt manchmal wirklich so, dass Fehler entstehen, wo man auch merkt, in dem Moment, wo diese diese von von dem Material abstrahierte Netzwerk an Information, dass das halt.
0:29:06–0:29:13
Dass das halt so auch nicht mehr verstanden werden kann. Was man ja auch gemacht hat, dass es halt mit dem Super nicht zu lernen.
0:29:13–0:29:17
Du hast zum Beispiel bei vielen Bilder kein Programm, dann nehmen die also Stockfotos.
0:29:17–0:29:24
Stockfoto ist halt voll von irgendwelchen hübschen Tomaten, hübschen Menschen, hübschen Wohnungen und so was.
0:29:24–0:29:35
Das heißt, das ist Trainingsmaterial. Und nicht von ungefähr erkennt man dann, dass diese entstehenden Netzwerke einen eingebauten Bias haben,
0:29:36–0:29:43
dass diese scheinbare Vorliebe haben für Palmen und blaues Wasser gegenüber all dem anderen Schaum oder der auch noch Wasser ist.
0:29:43–0:29:57
Und und diese Bias wiederum, die sollen dann irgendwie teilweise nachträglich rausgerechnet werden, sodass man diese Millionen, die man da reingesteckt hat, um das zu trainieren, weil das ist halt auch noch eine ganz wichtige Frage finde ich was?
0:29:58–0:30:08
Also was auch dann noch mal den Mensch von diesen Netzwerken unterscheidet Wie viel Energie brauche ich überhaupt, so was herzustellen und aufrecht zu erhalten? Wäre es nicht interessanter.
0:30:10–0:30:23
Zu gucken, wie energieeffizient man das machen kann und das als Indikator für Erfolg zu nehmen, als die Erkennungsraten oder erfolgreichen Turingtests?
0:30:27–0:30:32
Diese Bikes, die entstehen natürlich auch im Super Weiß Learning.
0:30:32–0:30:35
Zum Beispiel war es so bei dem CTBT, da kann ich einen Link machen.
0:30:35–0:30:40
OpenAI hat da selber einen Artikel drüber geschrieben, wo das drin vorkommt, dass zum Beispiel die,
0:30:43–0:30:57
dieses Modell, das ist noch der nächste Schritt reinforced oder non reinforced learning. Also wird einfach das losgelassen und dann kriegt es auch ein Feedback, dann kriegt es halt quasi gesagt gutes Ergebnis, nicht so gutes Ergebnis.
0:30:57–0:31:01
Und das wird dann wieder in dem neuronalen Netzen mit abgebildet.
0:31:01–0:31:15
Und da und da war es so, dass anfangs bei diesem ZGP längere Sätze von den Leuten als positiver bewertet wurden, was irgendwie intelligenter klang oder wahrhafter Klang.
0:31:15–0:31:25
Das heißt auch, du kriegst dann auch über über Feedbackschleifen die Menschen wieder reinbringen, die die Ergebnisse eigentlich verbessern soll. Kriegst du auch wieder Beißer eingebaut?
0:31:26–0:31:29
Das ist ja auch noch mal ganz wichtig. Und.
0:31:33–0:31:40
Dann gibt es noch die Möglichkeit, wenn man zum Beispiel Non Super Learning einfach macht.
0:31:41–0:31:47
Da könnte man sich auch vorstellen, dass da trotzdem relativ komplexe Fragestellungen bearbeitet werden könnten.
0:31:48–0:31:55
Man könnte sich zum Beispiel vorstellen, was ein Schachspiel. Und du siehst nur diese Position und weißt Weiß muss jetzt ziehen.
0:31:56–0:32:05
Und du kennst aber die Regeln des Schachs gar nicht. Aber ähnlich wie bei diesem Bild Generation generieren.
0:32:06–0:32:08
Wenn ich über dem Bild generieren, kann es halt sein.
0:32:08–0:32:20
Bist du trotzdem einfach in der Summe der Position auf dem Schach und der Bilder, die dir gegeben werden. Verstehst du? Wenn ich jetzt hin ziehe, dann führt das öfter zum Sieg.
0:32:21–0:32:27
Bei Schach ist es jetzt vielleicht schwierig, weil man da unglaublich viele komplexe Situationen herstellen kann auf dem Feld.
0:32:28–0:32:32
Aber es gibt immerhin auch einfach eine Möglichkeit zu sagen okay, ich habe keine Ahnung, worum es hier geht.
0:32:32–0:32:42
Ich weiß nur, wenn jetzt dieses Feld mit dem besetzt ist, dann ist die Wahrscheinlichkeit, das hinten raus eine Belohnung kriegt, deutlich größer.
0:32:43–0:32:47
Und das ist dann wirklich ohne Model.
0:32:47–0:32:53
Also Model heißt halt quasi. Man kann natürlich auch am Computer erst mal Schach beibringen und die Regeln geben.
0:32:53–0:33:00
Das heißt, er kann nur Züge machen, die da drin in dem Regelheft abgebildet sind. Und das ist dann.
0:33:03–0:33:03
Mit einem Model.