Die Anwendung ChatGPT ist ein Programm, welches Text als Antwort auf eine vom Benutzer gestellte Frage oder Aufforderung generiert. Wir sprechen hier von einer generativen KI. Dazu gehören Modelle, die zum Beispiel Text, natürliche Sprache, Bilder oder Videos erstellen können.
Wichtigste Grundlage der Anwendung ist ein Sprachmodel, d.h. ein riesiges auf Deep Learning basiertes neuronales Netz, das Milliarden von Neuronen besitzt. In der ersten Version von ChatGPT wurde ein Sprachmodell namens GPT-3 eingesetzt. GPT-3 steht für Generative Pre-trained Transformer 3 (GPT-3): T= Transformer ist die Architektur des neuronalen Netzes, P= Pre-trained bedeutet, dass es vortrainiert ist, und damit für verschiedene Anwendungen genutzt werden kann, und G=Generative heißt, dass mit dem Modell natürliche Sprache erzeugt werden kann.
Diese Sprachmodelle werden immer weiterentwickelt. Wie in einer von Menschen geführten Unterhaltung merkt sich ChatGPT vorangegangene Fragen und Aufforderungen, die ihm im selben Gespräch gegeben wurden.
Julian Wörmann ist stellvertretender Leiter des Kompetenzfeldes Maschinelles Lernen bei der fortiss GmbH. Seine Forschungsinteressen im Bereich des Repräsentationslernens konzentrieren sich auf Anwendungen in der Signalverarbeitung, Computer Vision und Bildverarbeitung sowie der Mustererkennung. Die Anwendungsgebiete reichen vom autonomen Fahren, über Smart Energy bis hin zu Business Analytics. An sein Bachelorstudium der Medientechnik knüpfte er seinen Masterabschluss in Elektrotechnik und Informationstechnik an der Technischen Universität München an, wo er 2019 zum Dr.-Ing. promoviert wurde.