mirror of
https://github.com/pese-git/simple-llm.git
synced 2026-01-23 13:03:55 +00:00
2f390145cf4d2bd25f6ab7a3efce27a963350387
- Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации
Simple LLM Framework
Унифицированный фреймворк для NLP, включающий:
- 🎯 Токенизацию на основе BPE
- 📊 Векторные представления
- 🧠 Механизмы внимания
Оглавление
Быстрый старт
from simple_llm import SimpleBPE, TokenEmbeddings, HeadAttention
# 1. Токенизация
bpe = SimpleBPE().fit(text)
tokens = bpe.encode("Привет мир")
# 2. Эмбеддинги
emb_layer = TokenEmbeddings(10000, 256)
embeddings = emb_layer(tokens)
# 3. Внимание
attention = HeadAttention(256, 64)
output = attention(embeddings)
Архитектура
graph TD
A[Текст] --> B(Tokenizer)
B --> C[Токены]
C --> D[TokenEmbeddings]
D --> E[HeadAttention]
E --> F[Выход модели]
Модули
Токенизация
SimpleBPE- базовая реализация BPEOptimizeBPE- оптимизированная версия
Эмбеддинги
TokenEmbeddings- обучаемые векторные представленияPositionalEmbeddings- позиционное кодирование
Transformer
HeadAttention- механизм внимания одной головы
Примеры
| Файл | Описание |
|---|---|
| example_bpe.py | Базовая токенизация |
| head_attention_example.py | Визуализация внимания |
Установка
git clone https://github.com/pese-git/simple-llm.git
cd simple-llm
pip install -e .
Разработка
# Запуск тестов
pytest tests/ -v
# Форматирование кода
black .
Languages
Python
100%