simple-llm/README.md

# Simple LLM Framework

[![Python 3.9+](https://img.shields.io/badge/python-3.9+-blue.svg)]()
[![PyTorch 2.0+](https://img.shields.io/badge/PyTorch-2.0+-red.svg)]()

Унифицированный фреймворк для NLP, включающий:
- 🎯 Токенизацию на основе BPE
- 📊 Векторные представления
- 🧠 Механизмы внимания

## Оглавление
- [Быстрый старт](#быстрый-старт)
- [Архитектура](#архитектура)
- [Модули](#модули)
- [Примеры](#примеры)
- [Установка](#установка)
- [Разработка](#разработка)

## Быстрый старт
```python
from simple_llm import SimpleBPE, TokenEmbeddings, HeadAttention

# 1. Токенизация
bpe = SimpleBPE().fit(text)
tokens = bpe.encode("Привет мир")

# 2. Эмбеддинги
emb_layer = TokenEmbeddings(10000, 256)
embeddings = emb_layer(tokens)

# 3. Внимание
attention = HeadAttention(256, 64)
output = attention(embeddings)
```

## Архитектура
```mermaid
graph TD
    A[Текст] --> B(Tokenizer)
    B --> C[Токены]
    C --> D[TokenEmbeddings]
    D --> E[HeadAttention]
    E --> F[Выход модели]
```

## Модули
### Токенизация
- `SimpleBPE` - базовая реализация BPE
- `OptimizeBPE` - оптимизированная версия

### Эмбеддинги
- `TokenEmbeddings` - обучаемые векторные представления
- `PositionalEmbeddings` - позиционное кодирование

### Transformer
- `HeadAttention` - механизм внимания одной головы

## Примеры
| Файл | Описание |
|-------|----------|
| [example_bpe.py](/example/example_bpe.py) | Базовая токенизация |
| [head_attention_example.py](/example/head_attention_example.py) | Визуализация внимания |

## Установка
```bash
git clone https://github.com/pese-git/simple-llm.git
cd simple-llm
pip install -e .
```

## Разработка
```bash
# Запуск тестов
pytest tests/ -v

# Форматирование кода
black .
```
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`# Simple LLM Framework`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`[![Python 3.9+](https://img.shields.io/badge/python-3.9+-blue.svg)]()`
			`[![PyTorch 2.0+](https://img.shields.io/badge/PyTorch-2.0+-red.svg)]()`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`Унифицированный фреймворк для NLP, включающий:`
			`- 🎯 Токенизацию на основе BPE`
			`- 📊 Векторные представления`
			`- 🧠 Механизмы внимания`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`## Оглавление`
			`- [Быстрый старт](#быстрый-старт)`
			`- [Архитектура](#архитектура)`
			`- [Модули](#модули)`
			`- [Примеры](#примеры)`
			`- [Установка](#установка)`
			`- [Разработка](#разработка)`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
			`## Быстрый старт`
			```python
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`from simple_llm import SimpleBPE, TokenEmbeddings, HeadAttention`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`# 1. Токенизация`
			`bpe = SimpleBPE().fit(text)`
			`tokens = bpe.encode("Привет мир")`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`# 2. Эмбеддинги`
			`emb_layer = TokenEmbeddings(10000, 256)`
			`embeddings = emb_layer(tokens)`
docs(readme): add encode/decode examples and output samples 2025-07-13 01:08:37 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`# 3. Внимание`
			`attention = HeadAttention(256, 64)`
			`output = attention(embeddings)`
docs(readme): add encode/decode examples and output samples 2025-07-13 01:08:37 +03:00			```

Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`## Архитектура`
			```mermaid
			`graph TD`
			`A[Текст] --> B(Tokenizer)`
			`B --> C[Токены]`
			`C --> D[TokenEmbeddings]`
			`D --> E[HeadAttention]`
			`E --> F[Выход модели]`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00			```

Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`## Модули`
			`### Токенизация`
			- `SimpleBPE` - базовая реализация BPE
			- `OptimizeBPE` - оптимизированная версия
Обновление README: добавлена информация о модулях эмбеддингов - Описание TokenEmbeddings и PositionalEmbeddings - Пример использования векторных представлений - Ссылки на документацию 2025-07-18 00:31:08 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`### Эмбеддинги`
			- `TokenEmbeddings` - обучаемые векторные представления
			- `PositionalEmbeddings` - позиционное кодирование
Обновление README: добавлена информация о модулях эмбеддингов - Описание TokenEmbeddings и PositionalEmbeddings - Пример использования векторных представлений - Ссылки на документацию 2025-07-18 00:31:08 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`### Transformer`
			- `HeadAttention` - механизм внимания одной головы
Обновление README: добавлена информация о модулях эмбеддингов - Описание TokenEmbeddings и PositionalEmbeddings - Пример использования векторных представлений - Ссылки на документацию 2025-07-18 00:31:08 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`## Примеры`
			`\| Файл \| Описание \|`
			`\|-------\|----------\|`
			`\| [example_bpe.py](/example/example_bpe.py) \| Базовая токенизация \|`
			`\| [head_attention_example.py](/example/head_attention_example.py) \| Визуализация внимания \|`
Обновление README: добавлена информация о модулях эмбеддингов - Описание TokenEmbeddings и PositionalEmbeddings - Пример использования векторных представлений - Ссылки на документацию 2025-07-18 00:31:08 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`## Установка`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00			```bash
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`git clone https://github.com/pese-git/simple-llm.git`
			`cd simple-llm`
			`pip install -e .`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00			```

			`## Разработка`
			```bash
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`# Запуск тестов`
			`pytest tests/ -v`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00
Рефакторинг документации: новая структура README - Добавлены badges Python/PyTorch - Включена Mermaid-схема архитектуры - Улучшена навигация с оглавлением - Добавлена таблица примеров - Унифицирован стиль документации 2025-07-19 12:05:20 +03:00			`# Форматирование кода`
			`black .`
feat: implement bpe algorithm 2025-07-11 12:21:33 +03:00			```