Small Language Model
Was ist ein SLM und wozu kann es eingesetzt werden? Wie unterscheidet sich ein SLM von einem LLM? Hier finden Sie die Antworten.
Was ist ein SLM?
Merkmale und Vorteile
Kleine Sprachmodelle werden gezielt mit kuratieren Datenquellen trainiert, die für eine bestimmte Anwendung relevant sind. Beispielsweise könnte ein SLM ausschließlich auf juristischen Texten trainiert werden, um als Helfer für Rechtsanwälte zu dienen. Einige Merkmale sind:
Anwendungsfälle
SLM vs. LLM
Small Language Models stehen in Relation zu Large Language Models. Es gibt keine feste Grenze, was „small“ genau heißt – es ist kontextabhängig. In einer Zeit, wo Milliardenparameter-Modelle üblich sind, könnte man Modelle mit einigen hundert Millionen oder weniger schon als „small“ bezeichnen. Wichtig ist: größer ist nicht immer besser. Wenn die Aufgabe eng umrissen ist, kann ein schlankeres Modell mit Fokusdatensatz genauere Ergebnisse liefern, weil es nicht von irrelevanten allgemeinen Trainingsdaten abgelenkt wird. Zudem sind SLMs oft kosteneffizienter in Betrieb und umweltfreundlicher (geringerer Stromverbrauch). In der KI-Strategie setzen daher viele darauf, große Modelle zu trainieren und dann zu distillieren oder feintunen, um praktische SLMs für den realen Einsatz zu erhalten.