Полная реализация FeedForward

- Основной класс FeedForward - Тесты для всех функций - Пример использования с визуализацией - Документация с блок-схемой
2026-01-23 21:14:17 +00:00 · 2025-07-20 14:28:18 +03:00
parent 03b245a126
commit e5fc85f336
5 changed files with 198 additions and 0 deletions
--- a/example/feed_forward_example.py
+++ b/example/feed_forward_example.py
@@ -0,0 +1,74 @@
+"""
+Пример использования FeedForward слоя из архитектуры Transformer
+
+Демонстрирует:
+1. Базовое применение
+2. Разницу между режимами train/eval
+3. Визуализацию изменений внутри сети
+"""
+
+import torch
+import matplotlib.pyplot as plt
+import os
+from simple_llm.transformer.feed_forward import FeedForward
+
+def plot_layer_outputs(outputs, titles, filename):
+    """Визуализация выходов разных слоев"""
+    plt.figure(figsize=(15, 5))
+    for i, (out, title) in enumerate(zip(outputs, titles)):
+        plt.subplot(1, len(outputs), i+1)
+        plt.imshow(out[0].detach().numpy(), cmap='viridis', aspect='auto')
+        plt.title(title)
+        plt.colorbar()
+    plt.tight_layout()
+    
+    # Создаем папку если нет
+    os.makedirs('example_output', exist_ok=True)
+    plt.savefig(f'example_output/{filename}')
+    plt.close()
+
+def main():
+    # Конфигурация
+    emb_size = 128
+    dropout = 0.1
+    
+    # Инициализация
+    ff = FeedForward(emb_size, dropout)
+    print(f"Архитектура сети:\n{ff.net}")
+
+    # Тестовые данные
+    x = torch.randn(1, 20, emb_size)  # [batch, seq_len, emb_size]
+    
+    # 1. Базовый forward pass
+    output = ff(x)
+    print(f"\nФорма входа: {x.shape} -> Форма выхода: {output.shape}")
+
+    # 2. Сравнение режимов train/eval
+    ff.train()
+    train_out = ff(x)
+    ff.eval()
+    eval_out = ff(x)
+    diff = torch.abs(train_out - eval_out).max().item()
+    print(f"\nМаксимальное расхождение (train vs eval): {diff:.6f}")
+
+    # 3. Визуализация преобразований
+    with torch.no_grad():
+        # Получаем выходы каждого слоя
+        layer1_out = ff.net[0](x)
+        relu_out = ff.net[1](layer1_out)
+        layer2_out = ff.net[2](relu_out)
+        
+        plot_layer_outputs(
+            outputs = [x, layer1_out, relu_out, layer2_out],
+            titles = [
+                'Входные данные', 
+                'После первого Linear', 
+                'После ReLU', 
+                'После второго Linear'
+            ],
+            filename = 'feed_forward_layers.png'
+        )
+
+if __name__ == "__main__":
+    main()
+    print("\nГотово! Результаты сохранены в example_output/feed_forward_layers.png")