simple-llm/README.md

# Simple LLM Framework

[![Python 3.9+](https://img.shields.io/badge/python-3.9+-blue.svg)]()
[![PyTorch 2.0+](https://img.shields.io/badge/PyTorch-2.0+-red.svg)]()

## Основные компоненты

### Токенизация
- `SimpleBPE` - алгоритм Byte Pair Encoding
- `OptimizeBPE` - оптимизированная версия

### Эмбеддинги
- `TokenEmbeddings` - векторные представления токенов
- `PositionalEmbeddings` - позиционное кодирование

### Transformer Layers
- `HeadAttention` - механизм внимания одной головы
- `MultiHeadAttention` - многоголовое внимание (4-16 голов)
- `FeedForward` - двухслойная FFN сеть (расширение → сжатие)

## Быстрый старт

```python
from simple_llm import SimpleBPE, MultiHeadAttention, FeedForward

# 1. Токенизация
bpe = SimpleBPE().fit(text_corpus)
tokens = bpe.encode("Пример текста")

# 2. Полный пайплайн
model = nn.Sequential(
    TokenEmbeddings(10000, 256),
    PositionalEmbeddings(256, 512),
    MultiHeadAttention(8, 256, 32),
    FeedForward(256)
)
```

## Документация
- [Токенизация](/doc/bpe_algorithm.md)
- [MultiHeadAttention](/doc/multi_head_attention_ru.md)
- [FeedForward](/doc/feed_forward_ru.md)

## Примеры
```bash
# Запуск примеров
python -m example.multi_head_attention_example  # Визуализация внимания
python -m example.feed_forward_example         # Анализ FFN слоя
```

## Установка
```bash
git clone https://github.com/pese-git/simple-llm.git
cd simple-llm
pip install -e .
```
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`# Simple LLM Framework`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`[![Python 3.9+](https://img.shields.io/badge/python-3.9+-blue.svg)]()`
			`[![PyTorch 2.0+](https://img.shields.io/badge/PyTorch-2.0+-red.svg)]()`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Обновление README: добавлена полная архитектура Transformer - Добавлен пример полного пайплайна - Структурированы компоненты (токенизация, эмбеддинги, слои) - Обновлены команды для примеров 2025-07-20 14:34:17 +03:00			`## Основные компоненты`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Обновление README: добавлена полная архитектура Transformer - Добавлен пример полного пайплайна - Структурированы компоненты (токенизация, эмбеддинги, слои) - Обновлены команды для примеров 2025-07-20 14:34:17 +03:00			`### Токенизация`
			- `SimpleBPE` - алгоритм Byte Pair Encoding
			- `OptimizeBPE` - оптимизированная версия

			`### Эмбеддинги`
			- `TokenEmbeddings` - векторные представления токенов
			- `PositionalEmbeddings` - позиционное кодирование

			`### Transformer Layers`
			- `HeadAttention` - механизм внимания одной головы
			- `MultiHeadAttention` - многоголовое внимание (4-16 голов)
			- `FeedForward` - двухслойная FFN сеть (расширение → сжатие)
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
			`## Быстрый старт`
Обновление README: добавлена полная архитектура Transformer - Добавлен пример полного пайплайна - Структурированы компоненты (токенизация, эмбеддинги, слои) - Обновлены команды для примеров 2025-07-20 14:34:17 +03:00
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00			```python
Обновление README: добавлена полная архитектура Transformer - Добавлен пример полного пайплайна - Структурированы компоненты (токенизация, эмбеддинги, слои) - Обновлены команды для примеров 2025-07-20 14:34:17 +03:00			`from simple_llm import SimpleBPE, MultiHeadAttention, FeedForward`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`# 1. Токенизация`
Обновление README: добавлена информация о MultiHeadAttention - Добавлен пример использования MultiHeadAttention - Обновлена схема архитектуры - Добавлены новые команды разработки - Улучшена структура документации 2025-07-19 22:20:12 +03:00			`bpe = SimpleBPE().fit(text_corpus)`
			`tokens = bpe.encode("Пример текста")`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Обновление README: добавлена полная архитектура Transformer - Добавлен пример полного пайплайна - Структурированы компоненты (токенизация, эмбеддинги, слои) - Обновлены команды для примеров 2025-07-20 14:34:17 +03:00			`# 2. Полный пайплайн`
			`model = nn.Sequential(`
			`TokenEmbeddings(10000, 256),`
			`PositionalEmbeddings(256, 512),`
			`MultiHeadAttention(8, 256, 32),`
			`FeedForward(256)`
Обновление README: добавлена информация о MultiHeadAttention - Добавлен пример использования MultiHeadAttention - Обновлена схема архитектуры - Добавлены новые команды разработки - Улучшена структура документации 2025-07-19 22:20:12 +03:00			`)`
docs(readme): add encode/decode examples and output samples 2025-07-13 01:08:37 +03:00			```

Обновление README: добавлена полная архитектура Transformer - Добавлен пример полного пайплайна - Структурированы компоненты (токенизация, эмбеддинги, слои) - Обновлены команды для примеров 2025-07-20 14:34:17 +03:00			`## Документация`
			`- [Токенизация](/doc/bpe_algorithm.md)`
			`- [MultiHeadAttention](/doc/multi_head_attention_ru.md)`
			`- [FeedForward](/doc/feed_forward_ru.md)`
Обновление README: добавлена информация о модулях эмбеддингов - Описание TokenEmbeddings и PositionalEmbeddings - Пример использования векторных представлений - Ссылки на документацию 2025-07-18 00:31:08 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`## Примеры`
Обновление README: добавлена информация о MultiHeadAttention - Добавлен пример использования MultiHeadAttention - Обновлена схема архитектуры - Добавлены новые команды разработки - Улучшена структура документации 2025-07-19 22:20:12 +03:00			```bash
			`# Запуск примеров`
Обновление README: добавлена полная архитектура Transformer - Добавлен пример полного пайплайна - Структурированы компоненты (токенизация, эмбеддинги, слои) - Обновлены команды для примеров 2025-07-20 14:34:17 +03:00			`python -m example.multi_head_attention_example # Визуализация внимания`
			`python -m example.feed_forward_example # Анализ FFN слоя`
Обновление README: добавлена информация о MultiHeadAttention - Добавлен пример использования MultiHeadAttention - Обновлена схема архитектуры - Добавлены новые команды разработки - Улучшена структура документации 2025-07-19 22:20:12 +03:00			```

Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`## Установка`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00			```bash
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`git clone https://github.com/pese-git/simple-llm.git`
			`cd simple-llm`
			`pip install -e .`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00			```