Build a Large Language Model (From Scratch) /

Contiene: 1) Comprensión de los modelos de lenguaje grande; 2) Trabajar con datos de texto; 3) Codificación de mecanismos de atención; 4) Implementación de un modelo GPT desde cero para generar texto; 5) Preentrenamiento con datos sin etiquetar; 6) Ajuste fino para clasificación; 7) Ajuste fino para...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Raschka, Sebastian (autor)
Format: Buch
Sprache:Englisch
Veröffentlicht: Nueva York, EUA : Manning, 2025, c2025
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie das erste Tag hinzu!
Beschreibung
Zusammenfassung:Contiene: 1) Comprensión de los modelos de lenguaje grande; 2) Trabajar con datos de texto; 3) Codificación de mecanismos de atención; 4) Implementación de un modelo GPT desde cero para generar texto; 5) Preentrenamiento con datos sin etiquetar; 6) Ajuste fino para clasificación; 7) Ajuste fino para seguir instrucciones.
Beschreibung:XX, 343 p.
Zielpublikum:Peticiones 2025
ISBN:978-1-63343-716-6