Large Language Model (LLM)

Large Language Models sind fortschrittliche KI-Systeme, die auf großen Mengen von Textdaten trainiert werden, um komplexe Sprachverarbeitungsaufgaben zu bewältigen. Durch die Anwendung von Transformer-Architekturen können LLMs menschenähnlichen Text generieren, Fragen beantworten, Inhalte zusammenfassen und zahlreiche weitere sprachbezogene Aufgaben ausführen. Ihre Fähigkeit, sich ohne spezifische Anpassungen an unterschiedliche Aufgaben anzupassen, macht sie vielseitig einsetzbar. Aufgrund ihrer Größe und Rechenintensität erfordern LLMs jedoch erhebliche Rechenressourcen, was ihre Nutzung anspruchsvoll gestaltet und Optimierungen nötig macht, um Effizienz und Zugänglichkeit zu verbessern.

Quelle:

Naveed, H., Khan, A. U., Qiu, S., Saqib, M., Anwar, S., Usman, M., … & Mian, A. (2023). A comprehensive overview of large language models. arXiv preprint arXiv:2307.06435.

Kasneci, E., Seßler, K., Küchemann, S., Bannert, M., Dementieva, D., Fischer, F., … & Kasneci, G. (2023). ChatGPT for good? On opportunities and challenges of large language models for education. Learning and individual differences, 103, 102274.