mirror of
https://github.com/pese-git/simple-llm.git
synced 2026-01-24 05:26:02 +00:00
Документация и примеры: унификация путей, стабильная работа на CPU, расширенный корпус для токенизатора, end-to-end пайплайн обучения и генерации. Исправлены все ошибки с устройствами и индексами, добавлены проверки и диагностика prompt.
This commit is contained in:
@@ -1,5 +1,24 @@
|
||||
# Документация по GPT модели
|
||||
|
||||
> **Документ актуален для Simple-LLM v1.0 (июль 2025)**
|
||||
|
||||
---
|
||||
|
||||
**Краткое summary:**
|
||||
Этот документ подробно описывает архитектуру и практическое применение GPT (Generative Pre-trained Transformer) — авторегрессивной языковой модели, реализованной в Simple-LLM. Документ предназначен для разработчиков и исследователей, желающих понять детали реализации и настройки GPT-модели.
|
||||
|
||||
---
|
||||
|
||||
**Структура документа:**
|
||||
- Общее описание
|
||||
- Архитектура и алгоритм
|
||||
- Практическое использование
|
||||
- Особенности генерации
|
||||
- Обучение модели
|
||||
- Типовые ошибки и их решения
|
||||
|
||||
---
|
||||
|
||||
## 1. Общее описание
|
||||
GPT (Generative Pre-trained Transformer) - это авторегрессивная модель генерации текста на основе архитектуры трансформера.
|
||||
|
||||
|
||||
Reference in New Issue
Block a user