├── FULL_LAUNCH.ipynb ├── README.md ├── README_.md ├── Screencast.gif ├── Screencast.mp4 ├── Screencast2.gif ├── best_model_dataset_1_39.pth ├── best_model_dataset_1_47.pth ├── dataset.py ├── leaderboard.jpg ├── model.py ├── screenshot.jpg ├── speed_detection.jpg ├── speed_test.ipynb ├── train_run.py └── whisper.ipynb /FULL_LAUNCH.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "code", 5 | "execution_count": 1, 6 | "metadata": {}, 7 | "outputs": [ 8 | { 9 | "name": "stdout", 10 | "output_type": "stream", 11 | "text": [ 12 | "Requirement already satisfied: gdown in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (5.2.0)\n", 13 | "Requirement already satisfied: beautifulsoup4 in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from gdown) (4.12.3)\n", 14 | "Requirement already satisfied: filelock in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from gdown) (3.13.4)\n", 15 | "Requirement already satisfied: requests[socks] in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from gdown) (2.32.3)\n", 16 | "Requirement already satisfied: tqdm in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from gdown) (4.66.4)\n", 17 | "Requirement already satisfied: soupsieve>1.2 in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from beautifulsoup4->gdown) (2.6)\n", 18 | "Requirement already satisfied: charset-normalizer<4,>=2 in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from requests[socks]->gdown) (3.3.2)\n", 19 | "Requirement already satisfied: idna<4,>=2.5 in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from requests[socks]->gdown) (2.10)\n", 20 | "Requirement already satisfied: urllib3<3,>=1.21.1 in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from requests[socks]->gdown) (2.1.0)\n", 21 | "Requirement already satisfied: certifi>=2017.4.17 in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from requests[socks]->gdown) (2023.11.17)\n", 22 | "Requirement already satisfied: PySocks!=1.5.7,>=1.5.6 in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from requests[socks]->gdown) (1.7.1)\n", 23 | "Requirement already satisfied: colorama in c:\\users\\pasha\\appdata\\local\\programs\\python\\python311\\lib\\site-packages (from tqdm->gdown) (0.4.6)\n" 24 | ] 25 | }, 26 | { 27 | "name": "stderr", 28 | "output_type": "stream", 29 | "text": [ 30 | "\n", 31 | "[notice] A new release of pip available: 22.3 -> 24.3.1\n", 32 | "[notice] To update, run: python.exe -m pip install --upgrade pip\n" 33 | ] 34 | } 35 | ], 36 | "source": [ 37 | "!pip install gdown" 38 | ] 39 | }, 40 | { 41 | "cell_type": "code", 42 | "execution_count": 2, 43 | "metadata": {}, 44 | "outputs": [ 45 | { 46 | "name": "stderr", 47 | "output_type": "stream", 48 | "text": [ 49 | "c:\\Users\\pasha\\AppData\\Local\\Programs\\Python\\Python311\\Lib\\site-packages\\tqdm\\auto.py:21: TqdmWarning: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html\n", 50 | " from .autonotebook import tqdm as notebook_tqdm\n" 51 | ] 52 | }, 53 | { 54 | "name": "stdout", 55 | "output_type": "stream", 56 | "text": [ 57 | "Файл best_93.pt уже существует.\n", 58 | "Файл segformer_model уже существует.\n", 59 | "Используется устройство: cuda\n" 60 | ] 61 | }, 62 | { 63 | "name": "stderr", 64 | "output_type": "stream", 65 | "text": [ 66 | "Downloading: \"https://github.com/ultralytics/yolov5/zipball/master\" to C:\\Users\\pasha/.cache\\torch\\hub\\master.zip\n", 67 | "YOLOv5 2024-11-10 Python-3.11.0 torch-2.0.1+cu117 CUDA:0 (NVIDIA GeForce RTX 4060, 8188MiB)\n", 68 | "\n", 69 | "Fusing layers... \n", 70 | "YOLOv5s summary: 224 layers, 7167184 parameters, 0 gradients\n", 71 | "Adding AutoShape... \n", 72 | "Using cache found in C:\\Users\\pasha/.cache\\torch\\hub\\ultralytics_yolov5_master\n", 73 | "YOLOv5 2024-11-10 Python-3.11.0 torch-2.0.1+cu117 CUDA:0 (NVIDIA GeForce RTX 4060, 8188MiB)\n", 74 | "\n", 75 | "Fusing layers... \n", 76 | "YOLOv5n summary: 213 layers, 1867405 parameters, 0 gradients\n", 77 | "Adding AutoShape... \n" 78 | ] 79 | }, 80 | { 81 | "name": "stdout", 82 | "output_type": "stream", 83 | "text": [ 84 | "Видео akn00005_0xsmsNYD.mov длительностью 300.03 секунд, FPS: 29.97002997002997\n", 85 | "5\n", 86 | "Сегмент 1/31, время: 0.00-10.00 сек, Класс: Статья 12.15 часть 4 Выезд в нарушение правил дорожного движения на полосу, предназначенную для встречного движения, при объезде препятствия, либо на трамвайные пути встречного направления, за исключением случаев, предусмотренных частью 3 настоящей статьи, Доверие: 0.3878, Время нарушения: 5 сек\n", 87 | "0\n", 88 | "Сегмент 2/31, время: 10.00-20.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5259, Время нарушения: 15 сек\n", 89 | "1\n", 90 | "Сегмент 3/31, время: 20.00-30.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3473, Время нарушения: 25 сек\n", 91 | "1\n", 92 | "Сегмент 4/31, время: 30.00-40.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3527, Время нарушения: 35 сек\n", 93 | "0\n", 94 | "Сегмент 5/31, время: 40.00-50.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3889, Время нарушения: 45 сек\n", 95 | "0\n", 96 | "Сегмент 6/31, время: 50.00-60.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4889, Время нарушения: 55 сек\n", 97 | "1\n", 98 | "Сегмент 7/31, время: 60.00-70.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4933, Время нарушения: 65 сек\n", 99 | "1\n", 100 | "Сегмент 8/31, время: 70.00-80.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5087, Время нарушения: 75 сек\n", 101 | "1\n", 102 | "Сегмент 9/31, время: 80.00-90.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5030, Время нарушения: 85 сек\n", 103 | "1\n", 104 | "Сегмент 10/31, время: 90.00-100.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4305, Время нарушения: 95 сек\n", 105 | "0\n", 106 | "Сегмент 11/31, время: 100.00-110.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3868, Время нарушения: 105 сек\n", 107 | "0\n", 108 | "Сегмент 12/31, время: 110.00-120.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4563, Время нарушения: 115 сек\n", 109 | "0\n", 110 | "Сегмент 13/31, время: 120.00-130.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5209, Время нарушения: 125 сек\n", 111 | "0\n", 112 | "Сегмент 14/31, время: 130.00-140.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5159, Время нарушения: 135 сек\n", 113 | "0\n", 114 | "Сегмент 15/31, время: 140.00-150.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4812, Время нарушения: 145 сек\n", 115 | "0\n", 116 | "Сегмент 16/31, время: 150.00-160.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4979, Время нарушения: 155 сек\n", 117 | "0\n", 118 | "Сегмент 17/31, время: 160.00-170.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5302, Время нарушения: 165 сек\n", 119 | "0\n", 120 | "Сегмент 18/31, время: 170.00-180.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4017, Время нарушения: 175 сек\n", 121 | "0\n", 122 | "Сегмент 19/31, время: 180.00-190.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4069, Время нарушения: 185 сек\n", 123 | "1\n", 124 | "Сегмент 20/31, время: 190.00-200.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4835, Время нарушения: 195 сек\n", 125 | "1\n", 126 | "Сегмент 21/31, время: 200.00-210.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4597, Время нарушения: 205 сек\n", 127 | "1\n", 128 | "Сегмент 22/31, время: 210.00-220.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4429, Время нарушения: 215 сек\n", 129 | "1\n", 130 | "Сегмент 23/31, время: 220.00-230.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4322, Время нарушения: 225 сек\n", 131 | "1\n", 132 | "Сегмент 24/31, время: 230.00-240.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4210, Время нарушения: 235 сек\n", 133 | "1\n", 134 | "Сегмент 25/31, время: 240.00-250.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4239, Время нарушения: 245 сек\n", 135 | "1\n", 136 | "Сегмент 26/31, время: 250.00-260.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4032, Время нарушения: 255 сек\n", 137 | "1\n", 138 | "Сегмент 27/31, время: 260.00-270.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3814, Время нарушения: 265 сек\n", 139 | "1\n", 140 | "Сегмент 28/31, время: 270.00-280.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5370, Время нарушения: 275 сек\n", 141 | "1\n", 142 | "Сегмент 29/31, время: 280.00-290.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5348, Время нарушения: 285 сек\n", 143 | "1\n", 144 | "Сегмент 30/31, время: 290.00-300.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5098, Время нарушения: 295 сек\n", 145 | "1\n", 146 | "Сегмент 31/31, время: 300.00-300.03 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5960, Время нарушения: 300 сек\n", 147 | "Видео akn00007_3C5sneri.mov длительностью 300.03 секунд, FPS: 29.97002997002997\n", 148 | "1\n", 149 | "Сегмент 1/31, время: 0.00-10.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5993, Время нарушения: 5 сек\n", 150 | "1\n", 151 | "Сегмент 2/31, время: 10.00-20.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5595, Время нарушения: 15 сек\n", 152 | "1\n", 153 | "Сегмент 3/31, время: 20.00-30.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4780, Время нарушения: 25 сек\n", 154 | "1\n", 155 | "Сегмент 4/31, время: 30.00-40.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4534, Время нарушения: 35 сек\n", 156 | "1\n", 157 | "Сегмент 5/31, время: 40.00-50.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5542, Время нарушения: 45 сек\n", 158 | "1\n", 159 | "Сегмент 6/31, время: 50.00-60.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5005, Время нарушения: 55 сек\n", 160 | "1\n", 161 | "Сегмент 7/31, время: 60.00-70.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5303, Время нарушения: 65 сек\n", 162 | "1\n", 163 | "Сегмент 8/31, время: 70.00-80.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5477, Время нарушения: 75 сек\n", 164 | "1\n", 165 | "Сегмент 9/31, время: 80.00-90.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5318, Время нарушения: 85 сек\n", 166 | "1\n", 167 | "Сегмент 10/31, время: 90.00-100.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5054, Время нарушения: 95 сек\n", 168 | "1\n", 169 | "Сегмент 11/31, время: 100.00-110.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5322, Время нарушения: 105 сек\n", 170 | "1\n", 171 | "Сегмент 12/31, время: 110.00-120.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5211, Время нарушения: 115 сек\n", 172 | "1\n", 173 | "Сегмент 13/31, время: 120.00-130.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5379, Время нарушения: 125 сек\n", 174 | "1\n", 175 | "Сегмент 14/31, время: 130.00-140.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5494, Время нарушения: 135 сек\n", 176 | "1\n", 177 | "Сегмент 15/31, время: 140.00-150.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5612, Время нарушения: 145 сек\n", 178 | "1\n", 179 | "Сегмент 16/31, время: 150.00-160.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5335, Время нарушения: 155 сек\n", 180 | "1\n", 181 | "Сегмент 17/31, время: 160.00-170.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5787, Время нарушения: 165 сек\n", 182 | "1\n", 183 | "Сегмент 18/31, время: 170.00-180.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5743, Время нарушения: 175 сек\n", 184 | "1\n", 185 | "Сегмент 19/31, время: 180.00-190.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5324, Время нарушения: 185 сек\n", 186 | "1\n", 187 | "Сегмент 20/31, время: 190.00-200.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5358, Время нарушения: 195 сек\n", 188 | "1\n", 189 | "Сегмент 21/31, время: 200.00-210.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4825, Время нарушения: 205 сек\n", 190 | "1\n", 191 | "Сегмент 22/31, время: 210.00-220.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4605, Время нарушения: 215 сек\n", 192 | "1\n", 193 | "Сегмент 23/31, время: 220.00-230.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5401, Время нарушения: 225 сек\n", 194 | "1\n", 195 | "Сегмент 24/31, время: 230.00-240.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5783, Время нарушения: 235 сек\n", 196 | "1\n", 197 | "Сегмент 25/31, время: 240.00-250.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5065, Время нарушения: 245 сек\n", 198 | "1\n", 199 | "Сегмент 26/31, время: 250.00-260.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5429, Время нарушения: 255 сек\n", 200 | "1\n", 201 | "Сегмент 27/31, время: 260.00-270.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4804, Время нарушения: 265 сек\n", 202 | "1\n", 203 | "Сегмент 28/31, время: 270.00-280.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5169, Время нарушения: 275 сек\n", 204 | "1\n", 205 | "Сегмент 29/31, время: 280.00-290.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5092, Время нарушения: 285 сек\n", 206 | "1\n", 207 | "Сегмент 30/31, время: 290.00-300.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5198, Время нарушения: 295 сек\n", 208 | "1\n", 209 | "Сегмент 31/31, время: 300.00-300.03 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3114, Время нарушения: 300 сек\n", 210 | "Видео akn00083_65POhPKk.mov длительностью 300.03 секунд, FPS: 29.97002997002997\n", 211 | "1\n", 212 | "Сегмент 1/31, время: 0.00-10.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4604, Время нарушения: 5 сек\n", 213 | "1\n", 214 | "Сегмент 2/31, время: 10.00-20.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5140, Время нарушения: 15 сек\n", 215 | "1\n", 216 | "Сегмент 3/31, время: 20.00-30.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5240, Время нарушения: 25 сек\n", 217 | "1\n", 218 | "Сегмент 4/31, время: 30.00-40.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5015, Время нарушения: 35 сек\n", 219 | "1\n", 220 | "Сегмент 5/31, время: 40.00-50.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5096, Время нарушения: 45 сек\n", 221 | "1\n", 222 | "Сегмент 6/31, время: 50.00-60.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3734, Время нарушения: 55 сек\n", 223 | "0\n", 224 | "Сегмент 7/31, время: 60.00-70.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3918, Время нарушения: 65 сек\n", 225 | "0\n", 226 | "Сегмент 8/31, время: 70.00-80.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4186, Время нарушения: 75 сек\n", 227 | "1\n", 228 | "Сегмент 9/31, время: 80.00-90.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4671, Время нарушения: 85 сек\n", 229 | "1\n", 230 | "Сегмент 10/31, время: 90.00-100.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4849, Время нарушения: 95 сек\n", 231 | "1\n", 232 | "Сегмент 11/31, время: 100.00-110.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5258, Время нарушения: 105 сек\n", 233 | "1\n", 234 | "Сегмент 12/31, время: 110.00-120.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4733, Время нарушения: 115 сек\n", 235 | "1\n", 236 | "Сегмент 13/31, время: 120.00-130.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4242, Время нарушения: 125 сек\n", 237 | "1\n", 238 | "Сегмент 14/31, время: 130.00-140.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4855, Время нарушения: 135 сек\n", 239 | "1\n", 240 | "Сегмент 15/31, время: 140.00-150.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4815, Время нарушения: 145 сек\n", 241 | "1\n", 242 | "Сегмент 16/31, время: 150.00-160.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5191, Время нарушения: 155 сек\n", 243 | "1\n", 244 | "Сегмент 17/31, время: 160.00-170.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5205, Время нарушения: 165 сек\n", 245 | "1\n", 246 | "Сегмент 18/31, время: 170.00-180.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5225, Время нарушения: 175 сек\n", 247 | "1\n", 248 | "Сегмент 19/31, время: 180.00-190.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4951, Время нарушения: 185 сек\n", 249 | "1\n", 250 | "Сегмент 20/31, время: 190.00-200.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4648, Время нарушения: 195 сек\n", 251 | "1\n", 252 | "Сегмент 21/31, время: 200.00-210.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4911, Время нарушения: 205 сек\n", 253 | "1\n", 254 | "Сегмент 22/31, время: 210.00-220.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5708, Время нарушения: 215 сек\n", 255 | "1\n", 256 | "Сегмент 23/31, время: 220.00-230.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5377, Время нарушения: 225 сек\n", 257 | "1\n", 258 | "Сегмент 24/31, время: 230.00-240.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5107, Время нарушения: 235 сек\n", 259 | "1\n", 260 | "Сегмент 25/31, время: 240.00-250.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5508, Время нарушения: 245 сек\n", 261 | "1\n", 262 | "Сегмент 26/31, время: 250.00-260.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5822, Время нарушения: 255 сек\n", 263 | "1\n", 264 | "Сегмент 27/31, время: 260.00-270.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4683, Время нарушения: 265 сек\n", 265 | "1\n", 266 | "Сегмент 28/31, время: 270.00-280.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4534, Время нарушения: 275 сек\n", 267 | "1\n", 268 | "Сегмент 29/31, время: 280.00-290.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4860, Время нарушения: 285 сек\n", 269 | "1\n", 270 | "Сегмент 30/31, время: 290.00-300.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5345, Время нарушения: 295 сек\n", 271 | "1\n", 272 | "Сегмент 31/31, время: 300.00-300.03 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5855, Время нарушения: 300 сек\n", 273 | "Видео AKN00084.mp4 длительностью 300.03 секунд, FPS: 29.97002997002997\n", 274 | "1\n", 275 | "Сегмент 1/31, время: 0.00-10.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5873, Время нарушения: 5 сек\n", 276 | "1\n", 277 | "Сегмент 2/31, время: 10.00-20.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4102, Время нарушения: 15 сек\n", 278 | "1\n", 279 | "Сегмент 3/31, время: 20.00-30.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4334, Время нарушения: 25 сек\n", 280 | "1\n", 281 | "Сегмент 4/31, время: 30.00-40.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5447, Время нарушения: 35 сек\n", 282 | "1\n", 283 | "Сегмент 5/31, время: 40.00-50.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4673, Время нарушения: 45 сек\n", 284 | "1\n", 285 | "Сегмент 6/31, время: 50.00-60.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4195, Время нарушения: 55 сек\n", 286 | "1\n", 287 | "Сегмент 7/31, время: 60.00-70.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5147, Время нарушения: 65 сек\n", 288 | "1\n", 289 | "Сегмент 8/31, время: 70.00-80.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4378, Время нарушения: 75 сек\n", 290 | "1\n", 291 | "Сегмент 9/31, время: 80.00-90.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4893, Время нарушения: 85 сек\n", 292 | "1\n", 293 | "Сегмент 10/31, время: 90.00-100.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5343, Время нарушения: 95 сек\n", 294 | "1\n", 295 | "Сегмент 11/31, время: 100.00-110.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5720, Время нарушения: 105 сек\n", 296 | "1\n", 297 | "Сегмент 12/31, время: 110.00-120.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5440, Время нарушения: 115 сек\n", 298 | "1\n", 299 | "Сегмент 13/31, время: 120.00-130.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5091, Время нарушения: 125 сек\n", 300 | "1\n", 301 | "Сегмент 14/31, время: 130.00-140.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5160, Время нарушения: 135 сек\n", 302 | "1\n", 303 | "Сегмент 15/31, время: 140.00-150.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5161, Время нарушения: 145 сек\n", 304 | "1\n", 305 | "Сегмент 16/31, время: 150.00-160.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5071, Время нарушения: 155 сек\n", 306 | "1\n", 307 | "Сегмент 17/31, время: 160.00-170.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5308, Время нарушения: 165 сек\n", 308 | "1\n", 309 | "Сегмент 18/31, время: 170.00-180.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5565, Время нарушения: 175 сек\n", 310 | "1\n", 311 | "Сегмент 19/31, время: 180.00-190.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4257, Время нарушения: 185 сек\n", 312 | "1\n", 313 | "Сегмент 20/31, время: 190.00-200.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4930, Время нарушения: 195 сек\n", 314 | "1\n", 315 | "Сегмент 21/31, время: 200.00-210.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5427, Время нарушения: 205 сек\n", 316 | "1\n", 317 | "Сегмент 22/31, время: 210.00-220.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5228, Время нарушения: 215 сек\n", 318 | "1\n", 319 | "Сегмент 23/31, время: 220.00-230.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5650, Время нарушения: 225 сек\n", 320 | "1\n", 321 | "Сегмент 24/31, время: 230.00-240.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5542, Время нарушения: 235 сек\n", 322 | "1\n", 323 | "Сегмент 25/31, время: 240.00-250.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5533, Время нарушения: 245 сек\n", 324 | "1\n", 325 | "Сегмент 26/31, время: 250.00-260.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5131, Время нарушения: 255 сек\n", 326 | "1\n", 327 | "Сегмент 27/31, время: 260.00-270.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5439, Время нарушения: 265 сек\n", 328 | "1\n", 329 | "Сегмент 28/31, время: 270.00-280.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5181, Время нарушения: 275 сек\n", 330 | "1\n", 331 | "Сегмент 29/31, время: 280.00-290.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4087, Время нарушения: 285 сек\n", 332 | "1\n", 333 | "Сегмент 30/31, время: 290.00-300.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.5721, Время нарушения: 295 сек\n", 334 | "0\n", 335 | "Сегмент 31/31, время: 300.00-300.03 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3323, Время нарушения: 300 сек\n", 336 | "Видео AKN00089.mp4 длительностью 300.03 секунд, FPS: 29.97002997002997\n", 337 | "1\n", 338 | "Сегмент 1/31, время: 0.00-10.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3864, Время нарушения: 5 сек\n", 339 | "1\n", 340 | "Сегмент 2/31, время: 10.00-20.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3638, Время нарушения: 15 сек\n", 341 | "1\n", 342 | "Сегмент 3/31, время: 20.00-30.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3161, Время нарушения: 25 сек\n", 343 | "1\n", 344 | "Сегмент 4/31, время: 30.00-40.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3461, Время нарушения: 35 сек\n", 345 | "1\n", 346 | "Сегмент 5/31, время: 40.00-50.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3171, Время нарушения: 45 сек\n", 347 | "1\n", 348 | "Сегмент 6/31, время: 50.00-60.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3160, Время нарушения: 55 сек\n", 349 | "0\n", 350 | "Сегмент 7/31, время: 60.00-70.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3097, Время нарушения: 65 сек\n", 351 | "1\n", 352 | "Сегмент 8/31, время: 70.00-80.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3004, Время нарушения: 75 сек\n", 353 | "1\n", 354 | "Сегмент 9/31, время: 80.00-90.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4027, Время нарушения: 85 сек\n", 355 | "0\n", 356 | "Сегмент 10/31, время: 90.00-100.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3130, Время нарушения: 95 сек\n", 357 | "0\n", 358 | "Сегмент 11/31, время: 100.00-110.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.2752, Время нарушения: 105 сек\n", 359 | "1\n", 360 | "Сегмент 12/31, время: 110.00-120.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3316, Время нарушения: 115 сек\n", 361 | "1\n", 362 | "Сегмент 13/31, время: 120.00-130.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.2995, Время нарушения: 125 сек\n", 363 | "0\n", 364 | "Сегмент 14/31, время: 130.00-140.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3128, Время нарушения: 135 сек\n", 365 | "0\n", 366 | "Сегмент 15/31, время: 140.00-150.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.2759, Время нарушения: 145 сек\n", 367 | "0\n", 368 | "Сегмент 16/31, время: 150.00-160.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3514, Время нарушения: 155 сек\n", 369 | "0\n", 370 | "Сегмент 17/31, время: 160.00-170.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3042, Время нарушения: 165 сек\n", 371 | "0\n", 372 | "Сегмент 18/31, время: 170.00-180.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3174, Время нарушения: 175 сек\n", 373 | "0\n", 374 | "Сегмент 19/31, время: 180.00-190.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3131, Время нарушения: 185 сек\n", 375 | "0\n", 376 | "Сегмент 20/31, время: 190.00-200.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.2937, Время нарушения: 195 сек\n", 377 | "0\n", 378 | "Сегмент 21/31, время: 200.00-210.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3197, Время нарушения: 205 сек\n", 379 | "0\n", 380 | "Сегмент 22/31, время: 210.00-220.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3179, Время нарушения: 215 сек\n", 381 | "0\n", 382 | "Сегмент 23/31, время: 220.00-230.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3251, Время нарушения: 225 сек\n", 383 | "1\n", 384 | "Сегмент 24/31, время: 230.00-240.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4302, Время нарушения: 235 сек\n", 385 | "1\n", 386 | "Сегмент 25/31, время: 240.00-250.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.4362, Время нарушения: 245 сек\n", 387 | "1\n", 388 | "Сегмент 26/31, время: 250.00-260.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3493, Время нарушения: 255 сек\n", 389 | "0\n", 390 | "Сегмент 27/31, время: 260.00-270.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3230, Время нарушения: 265 сек\n", 391 | "1\n", 392 | "Сегмент 28/31, время: 270.00-280.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3425, Время нарушения: 275 сек\n", 393 | "0\n", 394 | "Сегмент 29/31, время: 280.00-290.00 сек, Класс: Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3182, Время нарушения: 285 сек\n", 395 | "1\n", 396 | "Сегмент 30/31, время: 290.00-300.00 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3051, Время нарушения: 295 сек\n", 397 | "1\n", 398 | "Сегмент 31/31, время: 300.00-300.03 сек, Класс: Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги, Доверие: 0.3554, Время нарушения: 300 сек\n", 399 | "Сабмит сохранен в файл submission.csv\n" 400 | ] 401 | } 402 | ], 403 | "source": [ 404 | "import os\n", 405 | "import torch\n", 406 | "import torch.nn as nn\n", 407 | "from torchvision import transforms\n", 408 | "from PIL import Image\n", 409 | "import cv2\n", 410 | "from transformers import (\n", 411 | " XCLIPModel,\n", 412 | " XCLIPProcessor,\n", 413 | " SegformerForSemanticSegmentation,\n", 414 | " SegformerImageProcessor,\n", 415 | ")\n", 416 | "import numpy as np\n", 417 | "import pandas as pd\n", 418 | "from model import EmbeddingClassifier\n", 419 | "\n", 420 | "import warnings\n", 421 | "import gdown # Добавляем импорт библиотеки gdown\n", 422 | "\n", 423 | "# Игнорировать все предупреждения\n", 424 | "warnings.filterwarnings(\"ignore\")\n", 425 | "\n", 426 | "# ======== Глобальные параметры ======== #\n", 427 | "video_folder = r\"C:\\Users\\pasha\\OneDrive\\Рабочий стол\\test_dataset_rzhd_test\\test РЖД ПДД\\videos\\videos\" # Папка с видео\n", 428 | "output_csv = r'submission.csv'\n", 429 | "MODEL_NAME = \"microsoft/xclip-base-patch16\" # Не менять\n", 430 | "\n", 431 | "# Путь к кастомной модели YOLO и ссылка для скачивания\n", 432 | "YOLO_CUSTOM_PATH = r\"best_93.pt\"\n", 433 | "YOLO_CUSTOM_URL = \"https://drive.google.com/uc?id=1KovZgdLspcwOmxXVUmWcG3ro_TnrGT5n\"\n", 434 | "\n", 435 | "# Путь к модели SegFormer и ссылка для скачивания\n", 436 | "SEGFORMER_MODEL_PATH = r\"segformer_model\"\n", 437 | "SEGFORMER_MODEL_URL = \"https://drive.google.com/drive/folders/1zrp_r4Iy1STrPYG9m0b96nuEiHLq7NNk\"\n", 438 | "\n", 439 | "BEST_MODEL_PATH = 'best_model_dataset_1_47.pth' # Обученная модель классификатора\n", 440 | "\n", 441 | "APPLY_PREPROCESSING = True # Переключатель для применения предварительной обработки\n", 442 | "\n", 443 | "# ======== Список меток и штрафов ======== #\n", 444 | "LABEL_LIST = ['Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги',\n", 445 | " 'нарушений нет',\n", 446 | " 'Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги',\n", 447 | "\n", 448 | " 'Статья 12.17 часть 1.1 и 1.2. движение транспортных средств по полосе для маршрутных транспортных средств или остановка на указанной полосе в нарушение Правил дорожного движения ',\n", 449 | " 'Статья 12.12 часть 2 1. невыполнение требования ПДД об остановке перед стоп-линией, обозначенной дорожными знаками или разметкой проезжей части дороги, при запрещающем сигнале светофора или запрещающем жесте регулировщика',\n", 450 | " 'Статья 12.15 часть 4 Выезд в нарушение правил дорожного движения на полосу, предназначенную для встречного движения, при объезде препятствия, либо на трамвайные пути встречного направления, за исключением случаев, предусмотренных частью 3 настоящей статьи']\n", 451 | "NUM_CLASSES = len(LABEL_LIST)\n", 452 | "\n", 453 | "FINE_DICT = {\n", 454 | " 'нарушений нет': 0,\n", 455 | " 'Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги': 500,\n", 456 | " 'Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги': 1000,\n", 457 | " 'Статья 12.17 часть 1.1 и 1.2. движение транспортных средств по полосе для маршрутных транспортных средств или остановка на указанной полосе в нарушение Правил дорожного движения ': 1500,\n", 458 | " 'Статья 12.12 часть 2 1. невыполнение требования ПДД об остановке перед стоп-линией, обозначенной дорожными знаками или разметкой проезжей части дороги, при запрещающем сигнале светофора или запрещающем жесте регулировщика': 800,\n", 459 | " 'Статья 12.15 часть 4 Выезд в нарушение правил дорожного движения на полосу, предназначенную для встречного движения, при объезде препятствия, либо на трамвайные пути встречного направления, за исключением случаев, предусмотренных частью 3 настоящей статьи': 5000\n", 460 | "}\n", 461 | "\n", 462 | "# ======== Функция для загрузки файлов ======== #\n", 463 | "def download_file_if_not_exists(file_path, url, is_folder=False):\n", 464 | " if not os.path.exists(file_path):\n", 465 | " print(f\"Файл {file_path} не найден. Начинаю загрузку...\")\n", 466 | " if is_folder:\n", 467 | " # Для загрузки папки используем флаг --folder\n", 468 | " gdown.download_folder(url, output=file_path, quiet=False)\n", 469 | " else:\n", 470 | " gdown.download(url, output=file_path, quiet=False)\n", 471 | " print(f\"Загрузка {file_path} завершена.\")\n", 472 | " else:\n", 473 | " print(f\"Файл {file_path} уже существует.\")\n", 474 | "\n", 475 | "# ======== Проверка и загрузка моделей ======== #\n", 476 | "if APPLY_PREPROCESSING:\n", 477 | " # Проверяем и загружаем кастомную модель YOLO\n", 478 | " download_file_if_not_exists(YOLO_CUSTOM_PATH, YOLO_CUSTOM_URL)\n", 479 | "\n", 480 | " # Проверяем и загружаем модель SegFormer\n", 481 | " download_file_if_not_exists(SEGFORMER_MODEL_PATH, SEGFORMER_MODEL_URL, is_folder=True)\n", 482 | "\n", 483 | "# ======== Загрузка моделей ======== #\n", 484 | "# Устройство (CPU или GPU)\n", 485 | "device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')\n", 486 | "print(f\"Используется устройство: {device}\")\n", 487 | "\n", 488 | "# Загрузка XCLIP модели и процессора\n", 489 | "processor = XCLIPProcessor.from_pretrained(MODEL_NAME)\n", 490 | "model = XCLIPModel.from_pretrained(MODEL_NAME)\n", 491 | "model.to(device)\n", 492 | "model.eval() # Переводим модель в режим оценки\n", 493 | "\n", 494 | "# Загрузка модели классификатора и весов\n", 495 | "classifier_model = EmbeddingClassifier(model.config.projection_dim, NUM_CLASSES)\n", 496 | "classifier_model.load_state_dict(torch.load(BEST_MODEL_PATH, map_location=device))\n", 497 | "classifier_model.to(device)\n", 498 | "classifier_model.eval()\n", 499 | "\n", 500 | "# Получение mean и std для нормализации изображений\n", 501 | "try:\n", 502 | " image_mean = processor.image_processor.image_mean\n", 503 | " image_std = processor.image_processor.image_std\n", 504 | "except AttributeError:\n", 505 | " image_mean = processor.feature_extractor.image_mean\n", 506 | " image_std = processor.feature_extractor.image_std\n", 507 | "\n", 508 | "# Определение видео трансформаций\n", 509 | "video_transform = transforms.Compose([\n", 510 | " transforms.Resize((224, 224)),\n", 511 | " transforms.ToTensor(),\n", 512 | " transforms.Normalize(mean=image_mean, std=image_std)\n", 513 | "])\n", 514 | "\n", 515 | "# ======== Класс для предварительной обработки ======== #\n", 516 | "class Preprocessor:\n", 517 | " def __init__(self, yolo_custom_path, segformer_model_path):\n", 518 | " self.device = device\n", 519 | " # Загрузка кастомной модели YOLOv5\n", 520 | " self.custom_model = torch.hub.load(\n", 521 | " 'ultralytics/yolov5', 'custom', path=yolo_custom_path, force_reload=True\n", 522 | " ).to(self.device).eval()\n", 523 | " # Загрузка предобученной модели YOLOv5\n", 524 | " self.pretrained_model = torch.hub.load(\n", 525 | " 'ultralytics/yolov5', 'yolov5n', pretrained=True\n", 526 | " ).to(self.device).eval()\n", 527 | " # Загрузка модели SegFormer\n", 528 | " self.segformer_model = SegformerForSemanticSegmentation.from_pretrained(\n", 529 | " segformer_model_path\n", 530 | " ).to(self.device).eval()\n", 531 | " self.extractor = SegformerImageProcessor()\n", 532 | " # Параметры\n", 533 | " self.traffic_related_classes = [\"car\", \"bus\", \"truck\", \"motorcycle\", \"bicycle\"]\n", 534 | " self.target_class_id = 2 # Целевой класс для SegFormer\n", 535 | "\n", 536 | " def apply(self, frame):\n", 537 | " height, width, _ = frame.shape\n", 538 | "\n", 539 | " # Преобразование кадра\n", 540 | " rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)\n", 541 | " img = Image.fromarray(rgb_frame)\n", 542 | "\n", 543 | " # Получение результатов от моделей YOLOv5\n", 544 | " results_pretrained = self.pretrained_model(img)\n", 545 | " results_custom = self.custom_model(img)\n", 546 | "\n", 547 | " # Объединение результатов\n", 548 | " results_combined = pd.concat(\n", 549 | " [results_pretrained.pandas().xyxy[0], results_custom.pandas().xyxy[0]],\n", 550 | " ignore_index=True,\n", 551 | " )\n", 552 | "\n", 553 | " # Обработка кадра моделью SegFormer\n", 554 | " seg_map = self.predict_segformer(rgb_frame)\n", 555 | "\n", 556 | " # Создание маски для затемнения\n", 557 | " mask = np.zeros((height, width), dtype=np.uint8)\n", 558 | "\n", 559 | " # Добавление результатов YOLOv5 в маску\n", 560 | " for _, row in results_combined.iterrows():\n", 561 | " if row[\"name\"] in self.traffic_related_classes or row[\"confidence\"] > 0.25:\n", 562 | " x1 = int(max(0, row[\"xmin\"]))\n", 563 | " y1 = int(max(0, row[\"ymin\"]))\n", 564 | " x2 = int(min(width - 1, row[\"xmax\"]))\n", 565 | " y2 = int(min(height - 1, row[\"ymax\"]))\n", 566 | " mask[y1:y2, x1:x2] = 255 # Область, которую не затемняем\n", 567 | "\n", 568 | " # Добавление результатов SegFormer в маску\n", 569 | " if seg_map.shape != (height, width):\n", 570 | " seg_map_resized = cv2.resize(seg_map, (width, height), interpolation=cv2.INTER_NEAREST)\n", 571 | " else:\n", 572 | " seg_map_resized = seg_map\n", 573 | " seg_mask = np.where(seg_map_resized == self.target_class_id, 255, 0).astype(np.uint8)\n", 574 | " mask = cv2.bitwise_or(mask, seg_mask)\n", 575 | "\n", 576 | " # Создание итогового кадра с затемнением\n", 577 | " alpha_mask = np.stack([mask, mask, mask], axis=-1) # Создаем маску с 3 каналами\n", 578 | " frame_darkened = (frame * 0.2).astype(np.uint8)\n", 579 | " frame_result = np.where(alpha_mask == 255, frame, frame_darkened)\n", 580 | "\n", 581 | " return frame_result\n", 582 | "\n", 583 | " def predict_segformer(self, image):\n", 584 | " inputs = self.extractor(images=image, return_tensors=\"pt\").to(self.device)\n", 585 | " with torch.no_grad():\n", 586 | " outputs = self.segformer_model(**inputs)\n", 587 | " logits = outputs.logits # [batch_size, num_classes, height, width]\n", 588 | " segmentation = torch.argmax(logits, dim=1).squeeze(0)\n", 589 | " return segmentation.cpu().numpy()\n", 590 | "\n", 591 | "# Инициализация препроцессора при необходимости\n", 592 | "if APPLY_PREPROCESSING:\n", 593 | " preprocessor = Preprocessor(YOLO_CUSTOM_PATH, SEGFORMER_MODEL_PATH)\n", 594 | "else:\n", 595 | " preprocessor = None\n", 596 | "\n", 597 | "# ======== Функции для обработки видео ======== #\n", 598 | "def extract_frames_from_video(\n", 599 | " video_capture, start_time, end_time, num_frames=8, preprocessor=None\n", 600 | "):\n", 601 | " fps = video_capture.get(cv2.CAP_PROP_FPS)\n", 602 | " start_frame = int(start_time * fps)\n", 603 | " end_frame = int(end_time * fps)\n", 604 | " total_frames = end_frame - start_frame\n", 605 | "\n", 606 | " frame_indices = np.linspace(start_frame, end_frame - 1, num=num_frames, dtype=int)\n", 607 | " frames = []\n", 608 | "\n", 609 | " for frame_idx in frame_indices:\n", 610 | " video_capture.set(cv2.CAP_PROP_POS_FRAMES, frame_idx)\n", 611 | " success, frame = video_capture.read()\n", 612 | " if not success:\n", 613 | " break\n", 614 | "\n", 615 | " # Применение предварительной обработки\n", 616 | " if preprocessor is not None:\n", 617 | " frame = preprocessor.apply(frame)\n", 618 | "\n", 619 | " frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)\n", 620 | " frame_pil = Image.fromarray(frame_rgb)\n", 621 | "\n", 622 | " # Используем заданные трансформации\n", 623 | " frame_tensor = video_transform(frame_pil)\n", 624 | " frames.append(frame_tensor)\n", 625 | "\n", 626 | " # Повторяем последний кадр, если кадров меньше, чем num_frames\n", 627 | " while len(frames) < num_frames:\n", 628 | " frames.append(frames[-1].clone() if len(frames) > 0 else torch.zeros(3, 224, 224))\n", 629 | "\n", 630 | " # Преобразуем список тензоров в один тензор и перемещаем на устройство\n", 631 | " video_frames_tensor = torch.stack(frames).to(device)\n", 632 | "\n", 633 | " return video_frames_tensor\n", 634 | "\n", 635 | "# ======== Функция для предсказания класса сегмента ======== #\n", 636 | "def predict_segment_class(video_capture, start_time, end_time, preprocessor=None):\n", 637 | " # Извлекаем кадры из сегмента\n", 638 | " video_frames_tensor = extract_frames_from_video(\n", 639 | " video_capture, start_time, end_time, num_frames=8, preprocessor=preprocessor\n", 640 | " )\n", 641 | " video_frames_tensor = video_frames_tensor.unsqueeze(0) # Добавляем размерность batch\n", 642 | "\n", 643 | " # Генерируем фиктивный текстовый ввод\n", 644 | " text_inputs = processor(\n", 645 | " text=[\"\"], # Пустой текст, так как мы используем только видеоэмбеддинги\n", 646 | " return_tensors='pt',\n", 647 | " padding=True,\n", 648 | " truncation=True,\n", 649 | " max_length=77\n", 650 | " )\n", 651 | " input_ids = text_inputs['input_ids'].to(device)\n", 652 | " attention_mask = text_inputs['attention_mask'].to(device)\n", 653 | "\n", 654 | " # Получаем видеоэмбеддинги из модели XCLIP\n", 655 | " with torch.no_grad():\n", 656 | " outputs = model(\n", 657 | " pixel_values=video_frames_tensor,\n", 658 | " input_ids=input_ids,\n", 659 | " attention_mask=attention_mask\n", 660 | " )\n", 661 | " video_embeds = outputs.video_embeds # [batch_size, projection_dim]\n", 662 | "\n", 663 | " # Передаем эмбеддинги в классификатор\n", 664 | " with torch.no_grad():\n", 665 | " logits = classifier_model(video_embeds)\n", 666 | " probabilities = torch.softmax(logits, dim=1)\n", 667 | " predicted_class_idx = torch.argmax(probabilities, dim=1).item()\n", 668 | " print(predicted_class_idx)\n", 669 | " predicted_class = LABEL_LIST[predicted_class_idx]\n", 670 | " confidence = probabilities[0, predicted_class_idx].item()\n", 671 | "\n", 672 | " return predicted_class, confidence\n", 673 | "\n", 674 | "# ======== Основная функция для обработки видео ======== #\n", 675 | "def process_video(video_path, preprocessor=None):\n", 676 | " video_capture = cv2.VideoCapture(video_path)\n", 677 | " if not video_capture.isOpened():\n", 678 | " print(f\"Не удалось открыть видео: {video_path}\")\n", 679 | " return []\n", 680 | "\n", 681 | " fps = video_capture.get(cv2.CAP_PROP_FPS)\n", 682 | " total_frames = int(video_capture.get(cv2.CAP_PROP_FRAME_COUNT))\n", 683 | " duration = total_frames / fps\n", 684 | " print(f\"Видео {os.path.basename(video_path)} длительностью {duration:.2f} секунд, FPS: {fps}\")\n", 685 | "\n", 686 | " segment_duration = 10 # Продолжительность сегмента в секундах\n", 687 | " predictions = []\n", 688 | "\n", 689 | " num_segments = int(np.ceil(duration / segment_duration))\n", 690 | " for i in range(num_segments):\n", 691 | " start_time = i * segment_duration\n", 692 | " end_time = min((i + 1) * segment_duration, duration)\n", 693 | "\n", 694 | " predicted_class, confidence = predict_segment_class(\n", 695 | " video_capture, start_time, end_time, preprocessor=preprocessor\n", 696 | " )\n", 697 | "\n", 698 | " # Вычисляем среднее время сегмента\n", 699 | " violation_time = int((start_time + end_time) / 2)\n", 700 | "\n", 701 | " # Получаем сумму штрафа\n", 702 | " fine_amount = FINE_DICT.get(predicted_class, 0)\n", 703 | "\n", 704 | " # Если нарушение отсутствует, не добавляем его в предсказания\n", 705 | " if predicted_class == 'нарушений нет':\n", 706 | " continue\n", 707 | "\n", 708 | " print(f\"Сегмент {i+1}/{num_segments}, время: {start_time:.2f}-{end_time:.2f} сек, \"\n", 709 | " f\"Класс: {predicted_class}, Доверие: {confidence:.4f}, Время нарушения: {violation_time} сек\")\n", 710 | "\n", 711 | " predictions.append({\n", 712 | " 'номер видео': os.path.splitext(os.path.basename(video_path))[0],\n", 713 | " 'наименование нарушения': predicted_class,\n", 714 | " 'сумма штрафа, руб.': fine_amount,\n", 715 | " 'время нарушения (в секундах)': float(violation_time)\n", 716 | " })\n", 717 | "\n", 718 | " video_capture.release()\n", 719 | " return predictions\n", 720 | "\n", 721 | "# ======== Обработка всех видео и формирование сабмита ======== #\n", 722 | "def create_submission(video_paths, output_csv='submission.csv', preprocessor=None):\n", 723 | " all_predictions = []\n", 724 | "\n", 725 | " for video_path in video_paths:\n", 726 | " predictions = process_video(video_path, preprocessor=preprocessor)\n", 727 | " all_predictions.extend(predictions)\n", 728 | "\n", 729 | " submission_df = pd.DataFrame(all_predictions)\n", 730 | " submission_df.sort_values(by=['номер видео', 'время нарушения (в секундах)'], inplace=True)\n", 731 | " submission_df.to_csv(output_csv, index=False)\n", 732 | " print(f\"Сабмит сохранен в файл {output_csv}\")\n", 733 | "\n", 734 | "# ======== Запуск скрипта ======== #\n", 735 | "if __name__ == \"__main__\":\n", 736 | " # Список видеофайлов для обработки\n", 737 | " video_files = [\n", 738 | " os.path.join(video_folder, filename)\n", 739 | " for filename in os.listdir(video_folder)\n", 740 | " if filename.endswith(('.mp4', '.mov', '.avi')) # Замените на нужные расширения файлов\n", 741 | " ]\n", 742 | "\n", 743 | " # Обработка видео и создание сабмита\n", 744 | " create_submission(video_files, output_csv=output_csv, preprocessor=preprocessor)\n" 745 | ] 746 | } 747 | ], 748 | "metadata": { 749 | "kernelspec": { 750 | "display_name": "Python 3", 751 | "language": "python", 752 | "name": "python3" 753 | }, 754 | "language_info": { 755 | "codemirror_mode": { 756 | "name": "ipython", 757 | "version": 3 758 | }, 759 | "file_extension": ".py", 760 | "mimetype": "text/x-python", 761 | "name": "python", 762 | "nbconvert_exporter": "python", 763 | "pygments_lexer": "ipython3", 764 | "version": "3.11.0" 765 | } 766 | }, 767 | "nbformat": 4, 768 | "nbformat_minor": 2 769 | } 770 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 |
2 | 3 | # 🚀 Хакатон: «Цифровой прорыв. Сезон: Искусственный интеллект» 🤖 4 | 5 |
6 | 7 |
8 | 9 | # 📌 Кейс: Детектирование нарушений правил дорожного движения 10 | 11 |
12 | 13 |
14 | 15 | ## 🎯 Команда: Центр Искусственного Интеллекта СФУ 🧠 16 | 17 |
18 | 19 | --- 20 | 21 | 22 | 23 | 40 | 45 | 46 |
24 | 25 | ### 🎯 Место: 4 26 | 📍 **Международный хакатон 2024 года** 27 | 🔗 [Ссылка на мероприятие](https://hacks-ai.ru/events/1077382) 28 | 29 | ### 📖 Описание кейса: 30 | Разработка ИИ-прототипа для автоматического анализа видеозаписей с видеорегистраторов автотранспорта ОАО «РЖД» с целью выявления нарушений ПДД. 31 | 32 | ### 👥 Участники команды: 33 | - [Константин Кожин](https://github.com/konstantinkozhin) — **Руководитель команды;** 34 | - [Павел Шерстнев](https://github.com/sherstpasha) — **Data Analyst;** 35 | - [Владислава Жуковская](https://github.com/vlada2025) — **Дизайнер;** 36 | - [Антон Михалев](https://github.com/asmikhalev) — **ML-инженер;** 37 | - [Алина Нуриманова](https://github.com/ALENKOZAVR) — **Data Scientist.** 38 | 39 | 41 | 42 | Демонстрация проекта 43 | 44 |
47 | 48 | ## 📌 Описание решения 49 | 50 | ### 🔹 Общая концепция 51 | Наша система анализирует видеозаписи с видеорегистраторов для выявления нарушений правил дорожного движения. В основе работы — комбинация моделей компьютерного зрения, которые определяют ключевые элементы дорожной сцены и фиксируют возможные нарушения. Такой подход делает систему гибкой, масштабируемой и позволяет её дообучать для повышения точности. 52 | 53 | ### ⚙️ Схема работы системы 54 | 🔹 **Разделение видео** на фрагменты по 10 секунд для последовательной обработки. 55 | 🔹 **Детекция ключевых объектов** с помощью нейросетей: 56 | - YOLOv5 — поиск автомобилей и пешеходов. 57 | - YOLOv5 — обнаружение дорожных знаков и светофоров. 58 | - SegFormer — сегментация дорожной разметки. 59 | 🔹 **Фокусировка на значимых зонах**: фоновые элементы приглушаются, что повышает точность анализа. 60 | 🔹 **Определение нарушений** с помощью XCLIP: модель анализирует обработанный фрагмент и фиксирует возможные нарушения. 61 | 🔹 **Переход к следующему фрагменту** и повторение процесса. 62 | 63 | ### 🔄 Гибкость и масштабируемость 64 | Мы разработали **модульную систему**, которая не зависит от жёстких правил и эвристик. Вместо простых триггеров (например, пересечение разметки) используется **нейросеть**, которую можно дообучать и адаптировать под новые типы нарушений. Это делает систему более точной и расширяемой. 65 | 66 | ## 🎥 Screencast (Демонстрация решения) 67 | Посмотрите, как система выявляет нарушения на реальных видеозаписях. 68 | 69 | 📌 **[Смотреть видеоролик](Screencast.mp4)** 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 |
📹 Презентация работы системы🎯 Обработанный фрагмент (вход для XCLIP)
ScreencastProcessed Clip
81 | 82 | ## 📊 Дополнительный функционал: Распознавание скорости 83 | 84 | В дополнение к выявлению нарушений, наша система использует **OCR-модель** для **распознавания показателей скорости** с видеорегистраторов. Это позволяет фиксировать еще одно важное нарушение — **превышение скорости**. 85 | 86 | 🔹 **Извлечение скорости** из видео в режиме реального времени. 87 | 🔹 **Сравнение полученных данных** с допустимыми скоростными ограничениями. 88 | 🔹 **Фиксация нарушений** при превышении установленного лимита. 89 | 🔹 **Запись статистики** по каждому фрагменту видео для дальнейшего анализа. 90 | 91 | Этот модуль расширяет возможности системы, позволяя детектировать не только визуальные нарушения, но и **анализировать скорость транспортного средства**. 92 | 93 | --- 94 | 95 |
96 | Распознавание скорости на видеорегистраторе 97 |
98 | 99 | --- 100 | 101 | ## 🛠 Технологический стек 102 | - **Python** — основной язык разработки; 103 | - **PyTorch** — для построения и обучения нейросетей; 104 | - **Hugging Face** — для использования предобученных моделей (X-CLIP, AST, BERT); 105 | - **EasyOCR** — для распознавания текста на видеозаписях (скорость); 106 | - **Gradio** — для удобного развертывания и тестирования модели через веб-интерфейс; 107 | - **Docker** — для контейнеризации и развертывания системы. 108 | 109 | --- 110 | 111 | ## 🏆 Лидерборд 112 |
113 | Лидерборд хакатона 114 |
115 | 116 | ## 📂 Описание файлов в репозитории 117 | 118 | ### 📌 Основные файлы проекта: 119 | 120 | 1. **`FULL_LAUNCH.ipynb`** 121 | - Jupyter Notebook для полного запуска решения на тестовом датасете. 122 | - Включает загрузку данных, обработку видео, предсказания и формирование `submission.csv`. 123 | 124 | 2. **`best_model_dataset_1_39.pth`** и **`best_model_dataset_1_47.pth`** 125 | - Файлы с весами предварительно обученных моделей. 126 | - Используются при запуске ноутбука для выполнения предсказаний. 127 | 128 | 3. **`dataset.py`** 129 | - Определяет класс датасета и логику загрузки данных. 130 | - Обеспечивает корректную обработку входных видеоданных. 131 | 132 | 4. **`model.py`** 133 | - Содержит архитектуру модели, используемой для анализа видео. 134 | 135 | 5. **`train_run.py`** 136 | - Скрипт для обучения модели, включая настройку, процесс обучения и сохранение контрольных точек. 137 | 138 | ### 🔄 Полный запуск решения 139 | Файл **`FULL_LAUNCH.ipynb`** позволяет запустить всю последовательность обработки данных, включая: 140 | ✅ Задание пути к папке с видео (`video_folder`). 141 | ✅ Формирование выходного файла (`output_csv`). 142 | ✅ Автоматическое создание `submission.csv` с результатами детекции нарушений. 143 | -------------------------------------------------------------------------------- /README_.md: -------------------------------------------------------------------------------- 1 | # hack_101124 2 | Описание файлов в репозитории: 3 | 4 | 1. **`FULL_LAUNCH.ipynb`**: 5 | - Этот Jupyter Notebook предназначен для полного запуска решения на тестовом датасете, начиная с загрузки тестовых данных и заканчивая созданием файла `submission.csv`. Он расположен в корне проекта и соответствует всем требованиям для полного запуска. 6 | 7 | 2. **`best_model_dataset_1_39.pth`** и **`best_model_dataset_1_47.pth`**: 8 | - Файлы с весами предварительно обученных моделей, которые загружаются при выполнении ноутбука для выполнения предсказаний. 9 | 10 | 3. **`dataset.py`**: 11 | - Скрипт, определяющий класс датасета и логику загрузки данных, необходимые для обработки входных данных. 12 | 13 | 4. **`model.py`**: 14 | - Скрипт с архитектурой модели, используемой в решении. 15 | 16 | 5. **`train_run.py`**: 17 | - Скрипт для обучения модели, который включает настройку модели, цикл обучения и сохранение контрольных точек. 18 | 19 | 20 | Файл **`FULL_LAUNCH.ipynb`** предназначен для запуска всей последовательности обработки данных, включая указание путей к папке с видео (`video_folder`) и выходному файлу (`output_csv`), в результате чего создается файл `submission.csv`. 21 | -------------------------------------------------------------------------------- /Screencast.gif: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/sherstpasha/hacks_ai_rzd_violation_detection/bd6345e27f6ecfbb4e3154cb71a3a616aa14f390/Screencast.gif -------------------------------------------------------------------------------- /Screencast.mp4: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/sherstpasha/hacks_ai_rzd_violation_detection/bd6345e27f6ecfbb4e3154cb71a3a616aa14f390/Screencast.mp4 -------------------------------------------------------------------------------- /Screencast2.gif: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/sherstpasha/hacks_ai_rzd_violation_detection/bd6345e27f6ecfbb4e3154cb71a3a616aa14f390/Screencast2.gif -------------------------------------------------------------------------------- /best_model_dataset_1_39.pth: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/sherstpasha/hacks_ai_rzd_violation_detection/bd6345e27f6ecfbb4e3154cb71a3a616aa14f390/best_model_dataset_1_39.pth -------------------------------------------------------------------------------- /best_model_dataset_1_47.pth: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/sherstpasha/hacks_ai_rzd_violation_detection/bd6345e27f6ecfbb4e3154cb71a3a616aa14f390/best_model_dataset_1_47.pth -------------------------------------------------------------------------------- /dataset.py: -------------------------------------------------------------------------------- 1 | from torch.utils.data import Dataset 2 | from torchvision import transforms 3 | import cv2 4 | import numpy as np 5 | from PIL import Image 6 | import os 7 | import torch 8 | import pandas as pd 9 | 10 | label_list = [ 11 | "нарушений нет", 12 | "Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги", 13 | "Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги", 14 | "Статья 12.17 часть 1.1 и 1.2. движение транспортных средств по полосе для маршрутных транспортных средств или остановка на указанной полосе в нарушение Правил дорожного движения ", 15 | "Статья 12.12 часть 2 1. невыполнение требования ПДД об остановке перед стоп-линией, обозначенной дорожными знаками или разметкой проезжей части дороги, при запрещающем сигнале светофора или запрещающем жесте регулировщика", 16 | "Статья 12.15 часть 4 Выезд в нарушение правил дорожного движения на полосу, предназначенную для встречного движения, при объезде препятствия, либо на трамвайные пути встречного направления, за исключением случаев, предусмотренных частью 3 настоящей статьи", 17 | ] 18 | 19 | 20 | # Определение класса датасета с применением обработки кадров 21 | import torch 22 | import cv2 23 | import numpy as np 24 | from PIL import Image 25 | import os 26 | from torch.utils.data import Dataset 27 | from torchvision import transforms 28 | from transformers import SegformerForSemanticSegmentation, SegformerImageProcessor 29 | 30 | label_list = [ 31 | "нарушений нет", 32 | "Статья 12.16. часть 1 Несоблюдение требований, предписанных дорожными знаками или разметкой проезжей части дороги", 33 | "Статья 12.16 часть 2 Поворот налево или разворот в нарушение требований, предписанных дорожными знаками или разметкой проезжей части дороги", 34 | "Статья 12.17 часть 1.1 и 1.2. движение транспортных средств по полосе для маршрутных транспортных средств или остановка на указанной полосе в нарушение Правил дорожного движения ", 35 | "Статья 12.12 часть 2 1. невыполнение требования ПДД об остановке перед стоп-линией, обозначенной дорожными знаками или разметкой проезжей части дороги, при запрещающем сигнале светофора или запрещающем жесте регулировщика", 36 | "Статья 12.15 часть 4 Выезд в нарушение правил дорожного движения на полосу, предназначенную для встречного движения, при объезде препятствия, либо на трамвайные пути встречного направления, за исключением случаев, предусмотренных частью 3 настоящей статьи", 37 | ] 38 | 39 | 40 | # Определение класса датасета с применением обработки кадров и сохранением в папку 41 | class XCLIPVideoDataset(Dataset): 42 | def __init__( 43 | self, 44 | dataframe, 45 | video_folder, 46 | processor, 47 | num_frames=8, 48 | apply_preprocessing=False, 49 | yolo_pretrained_path=None, 50 | yolo_custom_path=None, 51 | segformer_model_path=None, 52 | ): 53 | self.data_frame = dataframe.reset_index(drop=True) 54 | self.video_folder = video_folder 55 | self.processor = processor 56 | self.num_frames = num_frames 57 | self.apply_preprocessing = ( 58 | apply_preprocessing # Тумблер для применения предварительной обработки 59 | ) 60 | 61 | # Загрузка моделей 62 | self.device = "cuda" if torch.cuda.is_available() else "cpu" 63 | 64 | # Загрузка модели YOLOv5 (предобученной) 65 | if yolo_pretrained_path: 66 | self.pretrained_model = ( 67 | torch.hub.load( 68 | "ultralytics/yolov5", 69 | "yolov5n", 70 | pretrained=True, 71 | ) 72 | .to(self.device) 73 | .eval() 74 | ) 75 | 76 | # Загрузка кастомной модели YOLOv5 77 | if yolo_custom_path: 78 | self.custom_model = ( 79 | torch.hub.load( 80 | "ultralytics/yolov5", 81 | "custom", 82 | path=yolo_custom_path, 83 | force_reload=True, 84 | ) 85 | .to(self.device) 86 | .eval() 87 | ) 88 | 89 | # Загрузка модели SegFormer 90 | if segformer_model_path: 91 | self.extractor = SegformerImageProcessor() 92 | self.segformer_model = ( 93 | SegformerForSemanticSegmentation.from_pretrained(segformer_model_path) 94 | .to(self.device) 95 | .eval() 96 | ) 97 | 98 | self.video_transform = transforms.Compose( 99 | [ 100 | transforms.Resize((224, 224)), 101 | transforms.ToTensor(), 102 | ] 103 | ) 104 | 105 | # Папка для сохранения кадров 106 | # self.save_frames_folder = "./saved_frames" 107 | # os.makedirs(self.save_frames_folder, exist_ok=True) 108 | 109 | # Параметры для обработки 110 | self.traffic_related_classes = ["car", "bus", "truck", "motorcycle", "bicycle"] 111 | self.target_class_id = 2 # Идентификатор целевого класса для SegFormer 112 | 113 | def extract_video_frames(self, video_path, num_frames): 114 | video_capture = cv2.VideoCapture(video_path) 115 | frames = [] 116 | total_frames = int(video_capture.get(cv2.CAP_PROP_FRAME_COUNT)) 117 | frame_interval = max(total_frames // num_frames, 1) 118 | 119 | for frame_idx in range(0, total_frames, frame_interval): 120 | video_capture.set(cv2.CAP_PROP_POS_FRAMES, frame_idx) 121 | success, frame = video_capture.read() 122 | if not success: 123 | break 124 | 125 | if self.apply_preprocessing: 126 | frame = self.apply_models_processing(frame) 127 | 128 | frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB) 129 | frame_pil = Image.fromarray(frame_rgb) 130 | frame_tensor = self.video_transform(frame_pil) 131 | frames.append(frame_tensor) 132 | 133 | # Сохранение кадра 134 | # frame_save_path = os.path.join( 135 | # self.save_frames_folder, 136 | # f"{os.path.basename(video_path).split('.')[0]}_frame_{frame_idx}.png", 137 | # ) 138 | # frame_pil.save(frame_save_path) 139 | 140 | if len(frames) >= num_frames: 141 | break 142 | 143 | video_capture.release() 144 | 145 | if len(frames) == 0: 146 | print(f"Не удалось извлечь кадры для видео {video_path}") 147 | return torch.zeros((num_frames, 3, 224, 224)) 148 | 149 | while len(frames) < num_frames: 150 | frames.append( 151 | frames[-1].clone() if len(frames) > 0 else torch.zeros(3, 224, 224) 152 | ) 153 | 154 | return torch.stack(frames) 155 | 156 | def apply_models_processing(self, frame): 157 | height, width, _ = frame.shape 158 | 159 | # Преобразование кадра для SegFormer 160 | rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB) 161 | img = Image.fromarray(rgb_frame) 162 | 163 | # Получение результатов от обеих моделей YOLOv5 164 | results_pretrained = self.pretrained_model(img) 165 | results_custom = self.custom_model(img) 166 | 167 | # Объединение результатов в один DataFrame 168 | results_combined = pd.concat( 169 | [results_pretrained.pandas().xyxy[0], results_custom.pandas().xyxy[0]], 170 | ignore_index=True, 171 | ) 172 | 173 | # Обработка кадра моделью SegFormer 174 | seg_map = self.predict_segformer( 175 | self.segformer_model, self.extractor, rgb_frame 176 | ) 177 | 178 | # Создание маски для затемнения 179 | mask = np.zeros((height, width), dtype=np.uint8) 180 | 181 | # Добавление результатов YOLOv5 в маску 182 | for _, row in results_combined.iterrows(): 183 | if row["name"] in self.traffic_related_classes or row["confidence"] > 0.25: 184 | x1 = int(max(0, row["xmin"])) 185 | y1 = int(max(0, row["ymin"])) 186 | x2 = int(min(width - 1, row["xmax"])) 187 | y2 = int(min(height - 1, row["ymax"])) 188 | mask[y1:y2, x1:x2] = 255 # Область, которую не затемняем 189 | 190 | # Добавление результатов SegFormer в маску 191 | if seg_map.shape != (height, width): 192 | seg_map_resized = cv2.resize( 193 | seg_map, (width, height), interpolation=cv2.INTER_NEAREST 194 | ) 195 | else: 196 | seg_map_resized = seg_map 197 | seg_mask = np.where(seg_map_resized == self.target_class_id, 255, 0).astype( 198 | np.uint8 199 | ) 200 | mask = cv2.bitwise_or(mask, seg_mask) 201 | 202 | # Создание итогового кадра с затемнением 203 | alpha_mask = cv2.merge((mask, mask, mask)) 204 | frame_darkened = (frame * 0.2).astype(np.uint8) 205 | frame_result = np.where(alpha_mask == 255, frame, frame_darkened) 206 | 207 | return frame_result 208 | 209 | def predict_segformer(self, model, extractor, image): 210 | inputs = extractor(images=image, return_tensors="pt").to(self.device) 211 | with torch.no_grad(): 212 | outputs = model(**inputs) 213 | logits = outputs.logits # Shape [batch_size, num_classes, height, width] 214 | segmentation = torch.argmax(logits, dim=1).squeeze(0) 215 | return segmentation.cpu().numpy() 216 | 217 | def __getitem__(self, idx): 218 | row = self.data_frame.iloc[idx] 219 | segment_id = row["id"] 220 | segment_name = row["segment_name"] 221 | label = row["violation_name"] 222 | video_path = os.path.join(self.video_folder, segment_name) 223 | 224 | video_frames_tensor = self.extract_video_frames(video_path, self.num_frames) 225 | label_id = label_list.index(label) 226 | 227 | return { 228 | "pixel_values": video_frames_tensor, # [num_frames, 3, 224, 224] 229 | "label": torch.tensor(label_id, dtype=torch.long), 230 | "segment_id": segment_id, # Добавляем идентификатор сегмента 231 | "segment_name": segment_name, # Сохраняем имя сегмента для отладки, если нужно 232 | } 233 | 234 | def __len__(self): 235 | return len(self.data_frame) 236 | 237 | 238 | # ======== Создание датасета для эмбеддингов ======== # 239 | class EmbeddingsDataset(Dataset): 240 | def __init__(self, dataframe, embeddings_dir): 241 | self.data_frame = dataframe.reset_index(drop=True) 242 | self.embeddings_dir = embeddings_dir 243 | 244 | def __len__(self): 245 | return len(self.data_frame) 246 | 247 | def __getitem__(self, idx): 248 | row = self.data_frame.iloc[idx] 249 | segment_id = row["id"] 250 | label = row["violation_name"] 251 | label_id = label_list.index(label) 252 | 253 | embedding_filename = f"{segment_id}.pt" 254 | embedding_file = os.path.join(self.embeddings_dir, embedding_filename) 255 | 256 | data = torch.load(embedding_file) 257 | embedding = data["embedding"] # Tensor размерности [projection_dim] 258 | return {"embedding": embedding, "label": label_id} 259 | -------------------------------------------------------------------------------- /leaderboard.jpg: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/sherstpasha/hacks_ai_rzd_violation_detection/bd6345e27f6ecfbb4e3154cb71a3a616aa14f390/leaderboard.jpg -------------------------------------------------------------------------------- /model.py: -------------------------------------------------------------------------------- 1 | import torch.nn as nn 2 | 3 | 4 | # ======== Определение и обучение классификатора ======== # 5 | # Определение модели классификатора 6 | class EmbeddingClassifier(nn.Module): 7 | def __init__(self, input_dim, num_classes): 8 | super(EmbeddingClassifier, self).__init__() 9 | self.classifier = nn.Sequential( 10 | nn.Linear(input_dim, 1024), 11 | nn.ReLU(), 12 | nn.Dropout(0.1), 13 | nn.Linear(1024, num_classes) 14 | ) 15 | 16 | def forward(self, embedding): 17 | logits = self.classifier(embedding) 18 | return logits -------------------------------------------------------------------------------- /screenshot.jpg: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/sherstpasha/hacks_ai_rzd_violation_detection/bd6345e27f6ecfbb4e3154cb71a3a616aa14f390/screenshot.jpg -------------------------------------------------------------------------------- /speed_detection.jpg: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/sherstpasha/hacks_ai_rzd_violation_detection/bd6345e27f6ecfbb4e3154cb71a3a616aa14f390/speed_detection.jpg -------------------------------------------------------------------------------- /speed_test.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "code", 5 | "execution_count": 2, 6 | "id": "4c5e1150-a81d-45c1-b96f-d02211af69db", 7 | "metadata": {}, 8 | "outputs": [ 9 | { 10 | "name": "stdout", 11 | "output_type": "stream", 12 | "text": [ 13 | "Найдена скорость: '72KM/y' с уверенностью 0.51\n", 14 | "Область скорости определена: (282, 1020, 362, 1044)\n", 15 | "\n", 16 | "Кадр 356:\n", 17 | "\n", 18 | "Кадр 445:\n", 19 | "\n", 20 | "Кадр 534:\n", 21 | "Найдена скорость: '69KM/4' с уверенностью 0.81\n", 22 | "\n", 23 | "Кадр 623:\n", 24 | "Найдена скорость: '68KM/y' с уверенностью 0.53\n", 25 | "\n", 26 | "Кадр 712:\n", 27 | "\n", 28 | "Кадр 801:\n", 29 | "Найдена скорость: '76KM/y' с уверенностью 0.44\n", 30 | "\n", 31 | "Кадр 890:\n", 32 | "Найдена скорость: '79KM/y' с уверенностью 0.55\n", 33 | "\n", 34 | "Кадр 979:\n", 35 | "\n", 36 | "Кадр 1068:\n", 37 | "\n", 38 | "Кадр 1157:\n", 39 | "\n", 40 | "Кадр 1246:\n", 41 | "\n", 42 | "Кадр 1335:\n", 43 | "\n", 44 | "Кадр 1424:\n", 45 | "\n", 46 | "Кадр 1513:\n", 47 | "Найдена скорость: '63KM/y' с уверенностью 0.68\n", 48 | "\n", 49 | "Кадр 1602:\n", 50 | "\n", 51 | "Кадр 1691:\n", 52 | "Найдена скорость: '72KM/y' с уверенностью 0.53\n", 53 | "\n", 54 | "Кадр 1780:\n", 55 | "Найдена скорость: '78KM/4' с уверенностью 0.83\n", 56 | "\n", 57 | "Кадр 1869:\n", 58 | "Найдена скорость: '84KM/y' с уверенностью 0.52\n", 59 | "\n", 60 | "Кадр 1958:\n", 61 | "Найдена скорость: '86KM/y' с уверенностью 0.47\n", 62 | "\n", 63 | "Кадр 2047:\n", 64 | "Найдена скорость: '87KM/y' с уверенностью 0.60\n", 65 | "\n", 66 | "Кадр 2136:\n", 67 | "\n", 68 | "Кадр 2225:\n", 69 | "Найдена скорость: '72Km/y' с уверенностью 0.49\n", 70 | "\n", 71 | "Кадр 2314:\n", 72 | "Найдена скорость: '59Km/y' с уверенностью 0.60\n", 73 | "\n", 74 | "Кадр 2403:\n", 75 | "Найдена скорость: '55Km/y' с уверенностью 0.42\n", 76 | "\n", 77 | "Кадр 2492:\n", 78 | "\n", 79 | "Кадр 2581:\n", 80 | "Найдена скорость: '39KM/y' с уверенностью 0.51\n", 81 | "\n", 82 | "Кадр 2670:\n", 83 | "\n", 84 | "Кадр 2759:\n", 85 | "Найдена скорость: '33KM/4' с уверенностью 0.58\n", 86 | "\n", 87 | "Кадр 2848:\n", 88 | "Найдена скорость: '64Km/y' с уверенностью 0.52\n", 89 | "\n", 90 | "Кадр 2937:\n", 91 | "Найдена скорость: '94KM/4' с уверенностью 0.68\n", 92 | "\n", 93 | "Кадр 3026:\n", 94 | "Найдена скорость: '69KM/ 4' с уверенностью 0.68\n", 95 | "\n", 96 | "Кадр 3115:\n", 97 | "Найдена скорость: '19Km/4' с уверенностью 0.48\n", 98 | "\n", 99 | "Кадр 3204:\n", 100 | "\n", 101 | "Кадр 3293:\n", 102 | "Найдена скорость: '74KM}y' с уверенностью 0.55\n", 103 | "\n", 104 | "Кадр 3382:\n", 105 | "Найдена скорость: '64Km/4' с уверенностью 0.62\n", 106 | "\n", 107 | "Кадр 3471:\n", 108 | "Найдена скорость: '53KM/y' с уверенностью 0.56\n", 109 | "\n", 110 | "Кадр 3560:\n", 111 | "Найдена скорость: '39KM/4' с уверенностью 0.91\n", 112 | "\n", 113 | "Кадр 3649:\n", 114 | "Найдена скорость: '44Km/4' с уверенностью 0.50\n", 115 | "\n", 116 | "Кадр 3738:\n", 117 | "Найдена скорость: '17KM/4' с уверенностью 0.49\n", 118 | "\n", 119 | "Кадр 3827:\n", 120 | "Найдена скорость: '13KM/4' с уверенностью 0.87\n", 121 | "\n", 122 | "Кадр 3916:\n", 123 | "Найдена скорость: '25Km/y' с уверенностью 0.55\n", 124 | "\n", 125 | "Кадр 4005:\n", 126 | "Найдена скорость: '26KM/y' с уверенностью 0.55\n", 127 | "\n", 128 | "Кадр 4094:\n", 129 | "Найдена скорость: '13Km/4' с уверенностью 0.74\n", 130 | "\n", 131 | "Кадр 4183:\n", 132 | "Найдена скорость: '24Km/y' с уверенностью 0.47\n", 133 | "\n", 134 | "Кадр 4272:\n", 135 | "\n", 136 | "Кадр 4361:\n", 137 | "Найдена скорость: '42KM/4' с уверенностью 0.51\n", 138 | "\n", 139 | "Кадр 4450:\n", 140 | "Найдена скорость: '63KM/ 4' с уверенностью 0.58\n", 141 | "\n", 142 | "Кадр 4539:\n", 143 | "Найдена скорость: '83KM/y' с уверенностью 0.67\n", 144 | "\n", 145 | "Кадр 4628:\n", 146 | "Найдена скорость: '89KM/y' с уверенностью 0.50\n", 147 | "\n", 148 | "Кадр 4717:\n", 149 | "Найдена скорость: '86KM/y' с уверенностью 0.44\n", 150 | "\n", 151 | "Кадр 4806:\n", 152 | "Найдена скорость: '78KM/4' с уверенностью 0.73\n", 153 | "\n", 154 | "Кадр 4895:\n", 155 | "Найдена скорость: '76Km/y' с уверенностью 0.47\n", 156 | "\n", 157 | "Кадр 4984:\n", 158 | "Найдена скорость: '75Km/y' с уверенностью 0.72\n", 159 | "\n", 160 | "Кадр 5073:\n", 161 | "\n", 162 | "Кадр 5162:\n", 163 | "Найдена скорость: '70Km/4' с уверенностью 0.42\n", 164 | "\n", 165 | "Кадр 5251:\n", 166 | "Найдена скорость: '73KM/y' с уверенностью 0.53\n", 167 | "\n", 168 | "Кадр 5340:\n", 169 | "Найдена скорость: '74Km/y' с уверенностью 0.83\n", 170 | "\n", 171 | "Кадр 5429:\n", 172 | "\n", 173 | "Кадр 5518:\n", 174 | "Найдена скорость: '76KM/y' с уверенностью 0.43\n", 175 | "\n", 176 | "Кадр 5607:\n", 177 | "Найдена скорость: '76Km/y' с уверенностью 0.44\n", 178 | "\n", 179 | "Кадр 5696:\n", 180 | "Найдена скорость: '77Km/y' с уверенностью 0.75\n", 181 | "\n", 182 | "Кадр 5785:\n", 183 | "Найдена скорость: '73KM/y' с уверенностью 0.53\n", 184 | "\n", 185 | "Кадр 5874:\n", 186 | "Найдена скорость: '74Km/4' с уверенностью 0.41\n", 187 | "\n", 188 | "Кадр 5963:\n", 189 | "Найдена скорость: '69KM/y' с уверенностью 0.62\n", 190 | "\n", 191 | "Кадр 6052:\n", 192 | "Найдена скорость: '70Km/y' с уверенностью 0.44\n", 193 | "\n", 194 | "Кадр 6141:\n", 195 | "\n", 196 | "Кадр 6230:\n", 197 | "Найдена скорость: '68KM/4' с уверенностью 0.76\n", 198 | "\n", 199 | "Кадр 6319:\n", 200 | "\n", 201 | "Кадр 6408:\n", 202 | "Найдена скорость: '74Km/4' с уверенностью 0.58\n", 203 | "\n", 204 | "Кадр 6497:\n", 205 | "Найдена скорость: '73KM/y' с уверенностью 0.59\n", 206 | "\n", 207 | "Кадр 6586:\n", 208 | "Найдена скорость: '72Km/y' с уверенностью 0.68\n", 209 | "\n", 210 | "Кадр 6675:\n", 211 | "Найдена скорость: '70KM/4' с уверенностью 0.49\n", 212 | "\n", 213 | "Кадр 6764:\n", 214 | "\n", 215 | "Кадр 6853:\n", 216 | "Найдена скорость: '63KM/ 4' с уверенностью 0.68\n", 217 | "\n", 218 | "Кадр 6942:\n", 219 | "Найдена скорость: '63KM/ 4' с уверенностью 0.69\n", 220 | "\n", 221 | "Кадр 7031:\n", 222 | "Найдена скорость: '63KM/ 4' с уверенностью 0.74\n", 223 | "\n", 224 | "Кадр 7120:\n", 225 | "Найдена скорость: '62KM/4' с уверенностью 0.88\n", 226 | "\n", 227 | "Кадр 7209:\n", 228 | "\n", 229 | "Кадр 7298:\n", 230 | "Найдена скорость: '59Km/y' с уверенностью 0.48\n", 231 | "\n", 232 | "Кадр 7387:\n", 233 | "\n", 234 | "Кадр 7476:\n", 235 | "\n", 236 | "Кадр 7565:\n", 237 | "Найдена скорость: '47KM/4' с уверенностью 0.58\n", 238 | "\n", 239 | "Кадр 7654:\n", 240 | "\n", 241 | "Кадр 7743:\n", 242 | "Найдена скорость: '37KM/y' с уверенностью 0.70\n", 243 | "\n", 244 | "Кадр 7832:\n", 245 | "Найдена скорость: '30KM/4' с уверенностью 0.68\n", 246 | "\n", 247 | "Кадр 7921:\n", 248 | "Найдена скорость: '22KM/y' с уверенностью 0.64\n", 249 | "\n", 250 | "Кадр 8010:\n", 251 | "Найдена скорость: '18KM/4' с уверенностью 0.62\n", 252 | "\n", 253 | "Кадр 8099:\n", 254 | "Найдена скорость: '12KM/4' с уверенностью 0.48\n", 255 | "\n", 256 | "Кадр 8188:\n", 257 | "\n", 258 | "Кадр 8277:\n", 259 | "Найдена скорость: '02Km/y' с уверенностью 0.69\n", 260 | "\n", 261 | "Кадр 8366:\n", 262 | "Найдена скорость: '0 1KM/y' с уверенностью 0.51\n", 263 | "\n", 264 | "Кадр 8455:\n", 265 | "\n", 266 | "Кадр 8544:\n", 267 | "Найдена скорость: '23KM/y' с уверенностью 0.58\n", 268 | "\n", 269 | "Кадр 8633:\n", 270 | "Найдена скорость: '18KM/y' с уверенностью 0.54\n", 271 | "\n", 272 | "Кадр 8722:\n", 273 | "Найдена скорость: '03KM/4' с уверенностью 0.47\n", 274 | "\n", 275 | "Кадр 8811:\n", 276 | "\n", 277 | "Кадр 8900:\n", 278 | "\n", 279 | "Кадр 8989:\n", 280 | "Обработка видео завершена.\n" 281 | ] 282 | }, 283 | { 284 | "data": { 285 | "image/png": "", 286 | "text/plain": [ 287 | "
" 288 | ] 289 | }, 290 | "metadata": {}, 291 | "output_type": "display_data" 292 | }, 293 | { 294 | "name": "stdout", 295 | "output_type": "stream", 296 | "text": [ 297 | "Кадр 267: скорость 72 км/ч\n", 298 | "Кадр 356: скорость 71 км/ч\n", 299 | "Кадр 445: скорость 70 км/ч\n", 300 | "Кадр 534: скорость 69 км/ч\n", 301 | "Кадр 623: скорость 68 км/ч\n", 302 | "Кадр 712: скорость 72 км/ч\n", 303 | "Кадр 801: скорость 76 км/ч\n", 304 | "Кадр 890: скорость 79 км/ч\n", 305 | "Кадр 979: скорость 76 км/ч\n", 306 | "Кадр 1068: скорость 74 км/ч\n", 307 | "Кадр 1157: скорость 72 км/ч\n", 308 | "Кадр 1246: скорость 69 км/ч\n", 309 | "Кадр 1335: скорость 67 км/ч\n", 310 | "Кадр 1424: скорость 65 км/ч\n", 311 | "Кадр 1513: скорость 63 км/ч\n", 312 | "Кадр 1602: скорость 67 км/ч\n", 313 | "Кадр 1691: скорость 72 км/ч\n", 314 | "Кадр 1780: скорость 78 км/ч\n", 315 | "Кадр 1869: скорость 84 км/ч\n", 316 | "Кадр 1958: скорость 86 км/ч\n", 317 | "Кадр 2047: скорость 87 км/ч\n", 318 | "Кадр 2136: скорость 79 км/ч\n", 319 | "Кадр 2225: скорость 72 км/ч\n", 320 | "Кадр 2314: скорость 59 км/ч\n", 321 | "Кадр 2403: скорость 55 км/ч\n", 322 | "Кадр 2492: скорость 47 км/ч\n", 323 | "Кадр 2581: скорость 39 км/ч\n", 324 | "Кадр 2670: скорость 36 км/ч\n", 325 | "Кадр 2759: скорость 33 км/ч\n", 326 | "Кадр 2848: скорость 64 км/ч\n", 327 | "Кадр 2937: скорость 94 км/ч\n", 328 | "Кадр 3026: скорость 69 км/ч\n", 329 | "Кадр 3115: скорость 19 км/ч\n", 330 | "Кадр 3204: скорость 46 км/ч\n", 331 | "Кадр 3293: скорость 74 км/ч\n", 332 | "Кадр 3382: скорость 64 км/ч\n", 333 | "Кадр 3471: скорость 53 км/ч\n", 334 | "Кадр 3560: скорость 39 км/ч\n", 335 | "Кадр 3649: скорость 44 км/ч\n", 336 | "Кадр 3738: скорость 17 км/ч\n", 337 | "Кадр 3827: скорость 13 км/ч\n", 338 | "Кадр 3916: скорость 25 км/ч\n", 339 | "Кадр 4005: скорость 26 км/ч\n", 340 | "Кадр 4094: скорость 13 км/ч\n", 341 | "Кадр 4183: скорость 24 км/ч\n", 342 | "Кадр 4272: скорость 33 км/ч\n", 343 | "Кадр 4361: скорость 42 км/ч\n", 344 | "Кадр 4450: скорость 63 км/ч\n", 345 | "Кадр 4539: скорость 83 км/ч\n", 346 | "Кадр 4628: скорость 89 км/ч\n", 347 | "Кадр 4717: скорость 86 км/ч\n", 348 | "Кадр 4806: скорость 78 км/ч\n", 349 | "Кадр 4895: скорость 76 км/ч\n", 350 | "Кадр 4984: скорость 75 км/ч\n", 351 | "Кадр 5073: скорость 72 км/ч\n", 352 | "Кадр 5162: скорость 70 км/ч\n", 353 | "Кадр 5251: скорость 73 км/ч\n", 354 | "Кадр 5340: скорость 74 км/ч\n", 355 | "Кадр 5429: скорость 75 км/ч\n", 356 | "Кадр 5518: скорость 76 км/ч\n", 357 | "Кадр 5607: скорость 76 км/ч\n", 358 | "Кадр 5696: скорость 77 км/ч\n", 359 | "Кадр 5785: скорость 73 км/ч\n", 360 | "Кадр 5874: скорость 74 км/ч\n", 361 | "Кадр 5963: скорость 69 км/ч\n", 362 | "Кадр 6052: скорость 70 км/ч\n", 363 | "Кадр 6141: скорость 69 км/ч\n", 364 | "Кадр 6230: скорость 68 км/ч\n", 365 | "Кадр 6319: скорость 71 км/ч\n", 366 | "Кадр 6408: скорость 74 км/ч\n", 367 | "Кадр 6497: скорость 73 км/ч\n", 368 | "Кадр 6586: скорость 72 км/ч\n", 369 | "Кадр 6675: скорость 70 км/ч\n", 370 | "Кадр 6764: скорость 66 км/ч\n", 371 | "Кадр 6853: скорость 63 км/ч\n", 372 | "Кадр 6942: скорость 63 км/ч\n", 373 | "Кадр 7031: скорость 63 км/ч\n", 374 | "Кадр 7120: скорость 62 км/ч\n", 375 | "Кадр 7209: скорость 60 км/ч\n", 376 | "Кадр 7298: скорость 59 км/ч\n", 377 | "Кадр 7387: скорость 55 км/ч\n", 378 | "Кадр 7476: скорость 51 км/ч\n", 379 | "Кадр 7565: скорость 47 км/ч\n", 380 | "Кадр 7654: скорость 42 км/ч\n", 381 | "Кадр 7743: скорость 37 км/ч\n", 382 | "Кадр 7832: скорость 30 км/ч\n", 383 | "Кадр 7921: скорость 22 км/ч\n", 384 | "Кадр 8010: скорость 18 км/ч\n", 385 | "Кадр 8099: скорость 12 км/ч\n", 386 | "Кадр 8188: скорость 7 км/ч\n", 387 | "Кадр 8277: скорость 2 км/ч\n", 388 | "Кадр 8366: скорость 0 км/ч\n", 389 | "Кадр 8455: скорость 11 км/ч\n", 390 | "Кадр 8544: скорость 23 км/ч\n", 391 | "Кадр 8633: скорость 18 км/ч\n", 392 | "Кадр 8722: скорость 3 км/ч\n", 393 | "Кадр 8811: скорость 0 км/ч\n", 394 | "Кадр 8900: скорость 0 км/ч\n", 395 | "Кадр 8989: скорость 0 км/ч\n" 396 | ] 397 | } 398 | ], 399 | "source": [ 400 | "import cv2\n", 401 | "import easyocr\n", 402 | "import re\n", 403 | "import time\n", 404 | "import torch\n", 405 | "import numpy as np\n", 406 | "import matplotlib.pyplot as plt\n", 407 | "from scipy.interpolate import interp1d\n", 408 | "\n", 409 | "# Проверка наличия GPU\n", 410 | "use_gpu = torch.cuda.is_available()\n", 411 | "\n", 412 | "# Инициализация EasyOCR reader с использованием GPU, если доступен\n", 413 | "reader = easyocr.Reader(['en'], gpu=use_gpu)\n", 414 | "\n", 415 | "# Расширенное регулярное выражение для поиска значений скорости\n", 416 | "km_pattern = re.compile(r'\\b\\d+\\s?[kK][mM](?:/y|/ч|/h)?\\b')\n", 417 | "\n", 418 | "# Координаты области, где была обнаружена скорость\n", 419 | "speed_region = None\n", 420 | "\n", 421 | "def process_frame(frame, region=None):\n", 422 | " \"\"\"\n", 423 | " Обрабатывает один кадр, считывает текст и возвращает данные о тексте.\n", 424 | " \"\"\"\n", 425 | " if region:\n", 426 | " # Обрезаем кадр до области, где была найдена скорость\n", 427 | " frame = frame[region[1]:region[3], region[0]:region[2]]\n", 428 | " \n", 429 | " results = reader.readtext(frame, detail=1)\n", 430 | " return results\n", 431 | "\n", 432 | "def find_speed_region(results):\n", 433 | " \"\"\"\n", 434 | " Ищет область, содержащую текст скорости, используя регулярное выражение.\n", 435 | " \"\"\"\n", 436 | " for (bbox, text, prob) in results:\n", 437 | " if km_pattern.search(text) and prob > 0.4:\n", 438 | " print(f\"Найдена скорость: '{text}' с уверенностью {prob:.2f}\")\n", 439 | " return bbox # Возвращаем координаты области (top_left, bottom_right)\n", 440 | " return None\n", 441 | "\n", 442 | "def normalize_speed(text):\n", 443 | " \"\"\"\n", 444 | " Приводит найденное значение скорости к числовому формату.\n", 445 | " \"\"\"\n", 446 | " match = re.search(r'\\d+', text)\n", 447 | " if match:\n", 448 | " return int(match.group())\n", 449 | " return None\n", 450 | "\n", 451 | "def interpolate_speeds(frames, speeds):\n", 452 | " \"\"\"\n", 453 | " Интерполирует пропущенные значения скорости и возвращает только положительные значения.\n", 454 | " \"\"\"\n", 455 | " valid_indices = [i for i, s in enumerate(speeds) if s is not None]\n", 456 | " valid_frames = [frames[i] for i in valid_indices]\n", 457 | " valid_speeds = [s for s in speeds if s is not None]\n", 458 | "\n", 459 | " if len(valid_frames) < 2:\n", 460 | " # Недостаточно данных для интерполяции\n", 461 | " return speeds\n", 462 | "\n", 463 | " interpolation_function = interp1d(valid_frames, valid_speeds, kind='linear', fill_value='extrapolate')\n", 464 | " interpolated_speeds = interpolation_function(frames)\n", 465 | "\n", 466 | " # Убедимся, что все значения положительные\n", 467 | " return [max(0, int(s)) for s in interpolated_speeds]\n", 468 | "\n", 469 | "def process_video(video_path):\n", 470 | " \"\"\"\n", 471 | " Обрабатывает видеофайл, извлекает текст с каждого кадра и выводит результаты в консоль.\n", 472 | " \"\"\"\n", 473 | " global speed_region\n", 474 | "\n", 475 | " cap = cv2.VideoCapture(video_path)\n", 476 | " fps = cap.get(cv2.CAP_PROP_FPS)\n", 477 | " frame_interval = int(fps * 3) # Обрабатываем кадры каждые 3 секунды\n", 478 | " frame_count = 0\n", 479 | " speeds = []\n", 480 | " frames = []\n", 481 | "\n", 482 | " while cap.isOpened():\n", 483 | " ret, frame = cap.read()\n", 484 | " if not ret:\n", 485 | " break\n", 486 | "\n", 487 | " frame_count += 1\n", 488 | "\n", 489 | " if frame_count % frame_interval == 0:\n", 490 | " if speed_region is None:\n", 491 | " # Ищем скорость на всем кадре, если область еще не найдена\n", 492 | " results = process_frame(frame)\n", 493 | " region = find_speed_region(results)\n", 494 | " if region:\n", 495 | " x1, y1 = int(region[0][0]), int(region[0][1])\n", 496 | " x2, y2 = int(region[2][0]), int(region[2][1])\n", 497 | " speed_region = (x1, y1, x2, y2)\n", 498 | " print(f\"Область скорости определена: {speed_region}\")\n", 499 | " # Нормализуем значение скорости\n", 500 | " for (_, text, _) in results:\n", 501 | " if km_pattern.search(text):\n", 502 | " speed = normalize_speed(text)\n", 503 | " speeds.append(speed)\n", 504 | " frames.append(frame_count)\n", 505 | " break\n", 506 | " else:\n", 507 | " # Ищем только в заданной области\n", 508 | " results = process_frame(frame, region=speed_region)\n", 509 | " print(f\"\\nКадр {frame_count}:\")\n", 510 | " found_speed = None\n", 511 | " for (_, text, prob) in results:\n", 512 | " if km_pattern.search(text) and prob > 0.4:\n", 513 | " found_speed = normalize_speed(text)\n", 514 | " print(f\"Найдена скорость: '{text}' с уверенностью {prob:.2f}\")\n", 515 | " break\n", 516 | " \n", 517 | " speeds.append(found_speed)\n", 518 | " frames.append(frame_count)\n", 519 | "\n", 520 | " cap.release()\n", 521 | " print('Обработка видео завершена.')\n", 522 | "\n", 523 | " # Интерполяция пропущенных значений\n", 524 | " speeds = interpolate_speeds(frames, speeds)\n", 525 | "\n", 526 | " # Построение графика скорости\n", 527 | " plt.figure(figsize=(14, 6))\n", 528 | " plt.plot([f / fps for f in frames], speeds, marker='o', linestyle='-', color='b')\n", 529 | " plt.xlabel('Время (секунды)')\n", 530 | " plt.ylabel('Скорость (км/ч)')\n", 531 | " plt.title('Изменение скорости по времени')\n", 532 | " plt.grid(True)\n", 533 | " plt.show()\n", 534 | "\n", 535 | " # Вывод интерполированных значений\n", 536 | " for f, s in zip(frames, speeds):\n", 537 | " print(f\"Кадр {f}: скорость {s} км/ч\")\n", 538 | "\n", 539 | "# Путь к видеофайлу\n", 540 | "video_path = 'AKN00048.mp4'\n", 541 | "process_video(video_path)\n" 542 | ] 543 | }, 544 | { 545 | "cell_type": "code", 546 | "execution_count": null, 547 | "id": "d38914b5-0ba3-4327-b43b-4fccc3014e18", 548 | "metadata": {}, 549 | "outputs": [], 550 | "source": [] 551 | } 552 | ], 553 | "metadata": { 554 | "kernelspec": { 555 | "display_name": "Python 3 (ipykernel)", 556 | "language": "python", 557 | "name": "python3" 558 | }, 559 | "language_info": { 560 | "codemirror_mode": { 561 | "name": "ipython", 562 | "version": 3 563 | }, 564 | "file_extension": ".py", 565 | "mimetype": "text/x-python", 566 | "name": "python", 567 | "nbconvert_exporter": "python", 568 | "pygments_lexer": "ipython3", 569 | "version": "3.10.0" 570 | } 571 | }, 572 | "nbformat": 4, 573 | "nbformat_minor": 5 574 | } 575 | -------------------------------------------------------------------------------- /train_run.py: -------------------------------------------------------------------------------- 1 | import os 2 | import torch 3 | import torch.nn as nn 4 | from torch.utils.data import DataLoader 5 | import pandas as pd 6 | from transformers import XCLIPModel, XCLIPProcessor 7 | from sklearn.model_selection import train_test_split 8 | from tqdm import tqdm 9 | import numpy as np 10 | import matplotlib.pyplot as plt 11 | import seaborn as sns 12 | from sklearn.metrics import confusion_matrix, classification_report 13 | import torch.optim as optim 14 | 15 | from dataset import XCLIPVideoDataset, EmbeddingsDataset 16 | from model import EmbeddingClassifier 17 | 18 | import warnings 19 | 20 | # Игнорировать все предупреждения 21 | warnings.filterwarnings("ignore") 22 | 23 | 24 | # ======== Подготовка данных ======== # 25 | # Пути к данным 26 | csv_path = r"C:\Users\pasha\OneDrive\Рабочий стол\dataset1011_1\videos_cut\violations_summary_p.csv" 27 | video_folder = r"C:\Users\pasha\OneDrive\Рабочий стол\dataset1011_1\videos_cut" 28 | processor = XCLIPProcessor.from_pretrained("microsoft/xclip-base-patch16") 29 | 30 | # Загрузка данных 31 | data = pd.read_csv(csv_path) 32 | 33 | # Добавляем уникальный идентификатор для каждой строки 34 | data.reset_index(drop=True, inplace=True) 35 | data["id"] = data.index # Используем индекс как уникальный идентификатор 36 | 37 | label_list = data["violation_name"].unique().tolist() 38 | print(label_list) 39 | 40 | 41 | # Создание полного датасета 42 | full_dataset = XCLIPVideoDataset( 43 | data, 44 | video_folder, 45 | processor, 46 | num_frames=8, 47 | apply_preprocessing=True, 48 | yolo_custom_path=r"C:\Users\pasha\OneDrive\Рабочий стол\best_93.pt", 49 | yolo_pretrained_path=r"C:\Users\pasha\OneDrive\Рабочий стол\best_93.pt", 50 | segformer_model_path=r"C:\Users\pasha\OneDrive\Рабочий стол\model", 51 | ) 52 | 53 | # Создание DataLoader для вычисления эмбеддингов 54 | dataloader = DataLoader(full_dataset, batch_size=1, shuffle=False) 55 | 56 | # ======== Загрузка модели XCLIP и установка устройства ======== # 57 | model_name = "microsoft/xclip-base-patch16" 58 | model = XCLIPModel.from_pretrained(model_name) 59 | 60 | # Устройство (CPU или GPU) 61 | device = torch.device("cuda" if torch.cuda.is_available() else "cpu") 62 | print(f"Using device: {device}") 63 | 64 | model.to(device) 65 | model.eval() # Переводим модель в режим оценки 66 | 67 | # Папка для сохранения эмбеддингов 68 | embeddings_dir = "./embeddings" 69 | os.makedirs(embeddings_dir, exist_ok=True) 70 | 71 | # Вычисление и сохранение эмбеддингов 72 | with torch.no_grad(): 73 | for idx, sample in enumerate(tqdm(dataloader, desc="Processing")): 74 | pixel_values = sample["pixel_values"] # [batch_size, num_frames, 3, 224, 224] 75 | label = sample["label"] # [batch_size] 76 | segment_id = sample["segment_id"].item() # Идентификатор сегмента 77 | segment_name = sample["segment_name"][0] # Имя видеофайла (для отладки) 78 | 79 | # Создаем имя файла для эмбеддинга, используя идентификатор сегмента 80 | embedding_filename = f"{segment_id}.pt" 81 | embedding_file = os.path.join(embeddings_dir, embedding_filename) 82 | 83 | # Проверяем, существует ли файл эмбеддинга 84 | if os.path.exists(embedding_file): 85 | # Эмбеддинг уже существует, пропускаем вычисление 86 | continue 87 | 88 | # Перемещаем данные на устройство 89 | pixel_values = pixel_values.to(device) 90 | 91 | # Генерируем фиктивный текстовый ввод и перемещаем на устройство 92 | text_inputs = processor( 93 | text=[""] * pixel_values.size(0), 94 | return_tensors="pt", 95 | padding=True, 96 | truncation=True, 97 | max_length=77, 98 | ) 99 | input_ids = text_inputs["input_ids"].to(device) 100 | attention_mask = text_inputs["attention_mask"].to(device) 101 | 102 | # Передаем pixel_values в модель 103 | outputs = model( 104 | pixel_values=pixel_values, 105 | input_ids=input_ids, 106 | attention_mask=attention_mask, 107 | ) 108 | video_embeds = outputs.video_embeds # [batch_size, projection_dim] 109 | 110 | # Переносим эмбеддинги на CPU перед сохранением 111 | video_embeds_cpu = video_embeds.squeeze(0).cpu() 112 | 113 | # Сохраняем эмбеддинги и метку 114 | torch.save( 115 | { 116 | "embedding": video_embeds_cpu, # [projection_dim] 117 | "label": label.item(), 118 | "segment_id": segment_id, 119 | "segment_name": segment_name, # Сохраняем имя сегмента для отладки 120 | }, 121 | embedding_file, 122 | ) 123 | 124 | 125 | # Разделяем исходный датафрейм на обучающую и валидационную выборки 126 | train_data, val_data = train_test_split( 127 | data, test_size=0.3, stratify=data["violation_name"], random_state=42 128 | ) 129 | 130 | # Создаем датасеты 131 | train_dataset = EmbeddingsDataset(train_data, embeddings_dir) 132 | val_dataset = EmbeddingsDataset(val_data, embeddings_dir) 133 | 134 | 135 | # Инициализация модели 136 | input_dim = model.config.projection_dim # Размерность эмбеддингов 137 | num_classes = len(label_list) 138 | classifier_model = EmbeddingClassifier(input_dim, num_classes) 139 | 140 | # Параметры обучения 141 | batch_size = 8 142 | num_epochs = 5000 143 | initial_learning_rate = 1e-4 # Начальный learning rate 144 | 145 | # DataLoaders 146 | train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True) 147 | val_loader = DataLoader(val_dataset, batch_size=batch_size) 148 | 149 | # Определение функции потерь и оптимизатора 150 | criterion = nn.CrossEntropyLoss() 151 | optimizer = optim.Adam(classifier_model.parameters(), lr=initial_learning_rate) 152 | 153 | # Добавляем scheduler для изменения learning rate 154 | scheduler = optim.lr_scheduler.ReduceLROnPlateau( 155 | optimizer, mode="min", factor=0.1, patience=5, verbose=True 156 | ) 157 | 158 | # Перемещение классификатора на устройство 159 | classifier_model.to(device) 160 | 161 | # Папка для сохранения моделей 162 | models_dir = "./models" 163 | os.makedirs(models_dir, exist_ok=True) 164 | 165 | best_val_loss = float("inf") 166 | best_model_path = os.path.join(models_dir, "best_model.pth") 167 | 168 | # Добавляем параметры для ранней остановки 169 | early_stopping_patience = 100 # Количество эпох без улучшения для остановки 170 | epochs_without_improvement = 0 # Счетчик эпох без улучшения 171 | 172 | # Цикл обучения 173 | for epoch in range(num_epochs): 174 | classifier_model.train() 175 | running_loss = 0.0 176 | for batch in train_loader: 177 | embeddings = batch["embedding"].to(device) 178 | labels = batch["label"].to(device) 179 | 180 | optimizer.zero_grad() 181 | outputs = classifier_model(embeddings) 182 | loss = criterion(outputs, labels) 183 | loss.backward() 184 | optimizer.step() 185 | 186 | running_loss += loss.item() * embeddings.size(0) 187 | 188 | epoch_loss = running_loss / len(train_dataset) 189 | 190 | # Валидация 191 | classifier_model.eval() 192 | val_running_loss = 0.0 # Добавлено для валидационного лосса 193 | correct = 0 194 | total = 0 195 | with torch.no_grad(): 196 | for batch in val_loader: 197 | embeddings = batch["embedding"].to(device) 198 | labels = batch["label"].to(device) 199 | outputs = classifier_model(embeddings) 200 | val_loss = criterion(outputs, labels) # Вычисляем лосс на валидации 201 | val_running_loss += val_loss.item() * embeddings.size(0) 202 | _, predicted = torch.max(outputs.data, 1) 203 | total += labels.size(0) 204 | correct += (predicted == labels).sum().item() 205 | val_loss_epoch = val_running_loss / len(val_dataset) # Средний лосс на валидации 206 | val_accuracy = correct / total 207 | 208 | # Сохранение модели при улучшении валидационной ошибки 209 | if val_loss_epoch < best_val_loss: 210 | best_val_loss = val_loss_epoch 211 | torch.save(classifier_model.state_dict(), best_model_path) 212 | print( 213 | f"Модель сохранена на {epoch + 1} эпохе с валидационной ошибкой: {val_loss_epoch:.4f}" 214 | ) 215 | epochs_without_improvement = 0 # Сброс счетчика 216 | else: 217 | epochs_without_improvement += 1 218 | 219 | # Шаг scheduler 220 | scheduler.step(val_loss_epoch) 221 | 222 | # Проверка на раннюю остановку 223 | if epochs_without_improvement >= early_stopping_patience: 224 | print( 225 | f"Ранняя остановка на {epoch + 1} эпохе. Валидационная ошибка не улучшалась {early_stopping_patience} эпох." 226 | ) 227 | break 228 | 229 | # Вывод информации 230 | print( 231 | f"Epoch {epoch+1}/{num_epochs}, " 232 | f"Training Loss: {epoch_loss:.4f}, " 233 | f"Validation Loss: {val_loss_epoch:.4f}, " 234 | f"Validation Accuracy: {val_accuracy * 100:.2f}%" 235 | ) 236 | 237 | # Загрузка лучшей модели для оценки 238 | best_model_path = os.path.join(models_dir, "best_model.pth") 239 | classifier_model.load_state_dict(torch.load(best_model_path)) 240 | classifier_model.eval() 241 | 242 | print("Лучшая модель загружена для оценки.") 243 | 244 | # ======== Оценка модели на валидационном наборе ======== # 245 | # Сбор всех предсказаний и истинных меток 246 | val_all_preds = [] 247 | val_all_labels = [] 248 | with torch.no_grad(): 249 | for batch in val_loader: 250 | embeddings = batch["embedding"].to(device) 251 | labels = batch["label"].to(device) 252 | outputs = classifier_model(embeddings) 253 | _, predicted = torch.max(outputs.data, 1) 254 | val_all_preds.extend(predicted.cpu().numpy()) 255 | val_all_labels.extend(labels.cpu().numpy()) 256 | 257 | # Получаем уникальные метки, присутствующие в данных 258 | present_labels = np.unique(val_all_labels) 259 | present_label_names = [label_list[i] for i in present_labels] 260 | 261 | # Вычисление матрицы ошибок для валидационного набора 262 | cm = confusion_matrix(val_all_labels, val_all_preds, labels=present_labels) 263 | print("Classification report for validation data:") 264 | print( 265 | classification_report( 266 | val_all_labels, 267 | val_all_preds, 268 | labels=present_labels, 269 | target_names=present_label_names, 270 | ) 271 | ) 272 | 273 | # Отображение матрицы ошибок для валидационного набора 274 | plt.figure(figsize=(12, 10)) 275 | sns.heatmap( 276 | cm, 277 | annot=True, 278 | fmt="d", 279 | cmap="Blues", 280 | xticklabels=present_label_names, 281 | yticklabels=present_label_names, 282 | ) 283 | plt.ylabel("Истинные метки") 284 | plt.xlabel("Предсказанные метки") 285 | plt.title("Матрица ошибок (валидация)") 286 | plt.show() 287 | 288 | # ======== Оценка модели на обучающем наборе ======== # 289 | # Сбор всех предсказаний и истинных меток для обучающего набора 290 | train_all_preds = [] 291 | train_all_labels = [] 292 | with torch.no_grad(): 293 | for batch in train_loader: 294 | embeddings = batch["embedding"].to(device) 295 | labels = batch["label"].to(device) 296 | outputs = classifier_model(embeddings) 297 | _, predicted = torch.max(outputs.data, 1) 298 | train_all_preds.extend(predicted.cpu().numpy()) 299 | train_all_labels.extend(labels.cpu().numpy()) 300 | 301 | # Получаем уникальные метки, присутствующие в данных 302 | train_present_labels = np.unique(train_all_labels) 303 | train_present_label_names = [label_list[i] for i in train_present_labels] 304 | print(train_present_label_names) 305 | 306 | # Вычисление матрицы ошибок для обучающего набора 307 | train_cm = confusion_matrix( 308 | train_all_labels, train_all_preds, labels=train_present_labels 309 | ) 310 | print("Classification report for training data:") 311 | print( 312 | classification_report( 313 | train_all_labels, 314 | train_all_preds, 315 | labels=train_present_labels, 316 | target_names=train_present_label_names, 317 | ) 318 | ) 319 | 320 | # Отображение матрицы ошибок для обучающего набора 321 | plt.figure(figsize=(12, 10)) 322 | sns.heatmap( 323 | train_cm, 324 | annot=True, 325 | fmt="d", 326 | cmap="Blues", 327 | xticklabels=train_present_label_names, 328 | yticklabels=train_present_label_names, 329 | ) 330 | plt.ylabel("Истинные метки") 331 | plt.xlabel("Предсказанные метки") 332 | plt.title("Матрица ошибок (обучение)") 333 | plt.show() 334 | -------------------------------------------------------------------------------- /whisper.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "nbformat": 4, 3 | "nbformat_minor": 0, 4 | "metadata": { 5 | "colab": { 6 | "provenance": [] 7 | }, 8 | "kernelspec": { 9 | "name": "python3", 10 | "display_name": "Python 3" 11 | }, 12 | "language_info": { 13 | "name": "python" 14 | } 15 | }, 16 | "cells": [ 17 | { 18 | "cell_type": "code", 19 | "source": [ 20 | "# Установка библиотек\n", 21 | "!pip install openai-whisper ffmpeg-python pydub\n" 22 | ], 23 | "metadata": { 24 | "colab": { 25 | "base_uri": "https://localhost:8080/" 26 | }, 27 | "id": "RnNNBBd0oPwN", 28 | "outputId": "957102ca-b752-4620-b936-478b67b3fd77" 29 | }, 30 | "execution_count": null, 31 | "outputs": [ 32 | { 33 | "output_type": "stream", 34 | "name": "stdout", 35 | "text": [ 36 | "Requirement already satisfied: openai-whisper in /usr/local/lib/python3.10/dist-packages (20240930)\n", 37 | "Requirement already satisfied: ffmpeg-python in /usr/local/lib/python3.10/dist-packages (0.2.0)\n", 38 | "Requirement already satisfied: pydub in /usr/local/lib/python3.10/dist-packages (0.25.1)\n", 39 | "Requirement already satisfied: numba in /usr/local/lib/python3.10/dist-packages (from openai-whisper) (0.60.0)\n", 40 | "Requirement already satisfied: numpy in /usr/local/lib/python3.10/dist-packages (from openai-whisper) (1.26.4)\n", 41 | "Requirement already satisfied: torch in /usr/local/lib/python3.10/dist-packages (from openai-whisper) (2.5.0+cu121)\n", 42 | "Requirement already satisfied: tqdm in /usr/local/lib/python3.10/dist-packages (from openai-whisper) (4.66.6)\n", 43 | "Requirement already satisfied: more-itertools in /usr/local/lib/python3.10/dist-packages (from openai-whisper) (10.5.0)\n", 44 | "Requirement already satisfied: tiktoken in /usr/local/lib/python3.10/dist-packages (from openai-whisper) (0.8.0)\n", 45 | "Requirement already satisfied: triton>=2.0.0 in /usr/local/lib/python3.10/dist-packages (from openai-whisper) (3.1.0)\n", 46 | "Requirement already satisfied: future in /usr/local/lib/python3.10/dist-packages (from ffmpeg-python) (1.0.0)\n", 47 | "Requirement already satisfied: filelock in /usr/local/lib/python3.10/dist-packages (from triton>=2.0.0->openai-whisper) (3.16.1)\n", 48 | "Requirement already satisfied: llvmlite<0.44,>=0.43.0dev0 in /usr/local/lib/python3.10/dist-packages (from numba->openai-whisper) (0.43.0)\n", 49 | "Requirement already satisfied: regex>=2022.1.18 in /usr/local/lib/python3.10/dist-packages (from tiktoken->openai-whisper) (2024.9.11)\n", 50 | "Requirement already satisfied: requests>=2.26.0 in /usr/local/lib/python3.10/dist-packages (from tiktoken->openai-whisper) (2.32.3)\n", 51 | "Requirement already satisfied: typing-extensions>=4.8.0 in /usr/local/lib/python3.10/dist-packages (from torch->openai-whisper) (4.12.2)\n", 52 | "Requirement already satisfied: networkx in /usr/local/lib/python3.10/dist-packages (from torch->openai-whisper) (3.4.2)\n", 53 | "Requirement already satisfied: jinja2 in /usr/local/lib/python3.10/dist-packages (from torch->openai-whisper) (3.1.4)\n", 54 | "Requirement already satisfied: fsspec in /usr/local/lib/python3.10/dist-packages (from torch->openai-whisper) (2024.10.0)\n", 55 | "Requirement already satisfied: sympy==1.13.1 in /usr/local/lib/python3.10/dist-packages (from torch->openai-whisper) (1.13.1)\n", 56 | "Requirement already satisfied: mpmath<1.4,>=1.1.0 in /usr/local/lib/python3.10/dist-packages (from sympy==1.13.1->torch->openai-whisper) (1.3.0)\n", 57 | "Requirement already satisfied: charset-normalizer<4,>=2 in /usr/local/lib/python3.10/dist-packages (from requests>=2.26.0->tiktoken->openai-whisper) (3.4.0)\n", 58 | "Requirement already satisfied: idna<4,>=2.5 in /usr/local/lib/python3.10/dist-packages (from requests>=2.26.0->tiktoken->openai-whisper) (3.10)\n", 59 | "Requirement already satisfied: urllib3<3,>=1.21.1 in /usr/local/lib/python3.10/dist-packages (from requests>=2.26.0->tiktoken->openai-whisper) (2.2.3)\n", 60 | "Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.10/dist-packages (from requests>=2.26.0->tiktoken->openai-whisper) (2024.8.30)\n", 61 | "Requirement already satisfied: MarkupSafe>=2.0 in /usr/local/lib/python3.10/dist-packages (from jinja2->torch->openai-whisper) (3.0.2)\n" 62 | ] 63 | } 64 | ] 65 | }, 66 | { 67 | "cell_type": "code", 68 | "execution_count": null, 69 | "metadata": { 70 | "colab": { 71 | "base_uri": "https://localhost:8080/", 72 | "height": 158 73 | }, 74 | "id": "bHXubBYTlcvD", 75 | "outputId": "637a9cdf-0078-488a-808f-e9214c61fd31" 76 | }, 77 | "outputs": [ 78 | { 79 | "output_type": "stream", 80 | "name": "stderr", 81 | "text": [ 82 | "100%|████████████████████████████████████████| 139M/139M [00:01<00:00, 101MiB/s]\n", 83 | "/usr/local/lib/python3.10/dist-packages/whisper/__init__.py:150: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.\n", 84 | " checkpoint = torch.load(fp, map_location=device)\n", 85 | "/usr/local/lib/python3.10/dist-packages/whisper/transcribe.py:126: UserWarning: FP16 is not supported on CPU; using FP32 instead\n", 86 | " warnings.warn(\"FP16 is not supported on CPU; using FP32 instead\")\n" 87 | ] 88 | }, 89 | { 90 | "output_type": "stream", 91 | "name": "stdout", 92 | "text": [ 93 | "Транскрибация речи:\n", 94 | " Проверяю по ребрику. Показываю поворотник. Ставай на тормоз. Садок тормозим! Тормозимать твою! Сура! Блин, тормозим! Взравляю!\n" 95 | ] 96 | }, 97 | { 98 | "output_type": "display_data", 99 | "data": { 100 | "text/plain": [ 101 | "" 102 | ], 103 | "application/javascript": [ 104 | "\n", 105 | " async function download(id, filename, size) {\n", 106 | " if (!google.colab.kernel.accessAllowed) {\n", 107 | " return;\n", 108 | " }\n", 109 | " const div = document.createElement('div');\n", 110 | " const label = document.createElement('label');\n", 111 | " label.textContent = `Downloading \"${filename}\": `;\n", 112 | " div.appendChild(label);\n", 113 | " const progress = document.createElement('progress');\n", 114 | " progress.max = size;\n", 115 | " div.appendChild(progress);\n", 116 | " document.body.appendChild(div);\n", 117 | "\n", 118 | " const buffers = [];\n", 119 | " let downloaded = 0;\n", 120 | "\n", 121 | " const channel = await google.colab.kernel.comms.open(id);\n", 122 | " // Send a message to notify the kernel that we're ready.\n", 123 | " channel.send({})\n", 124 | "\n", 125 | " for await (const message of channel.messages) {\n", 126 | " // Send a message to notify the kernel that we're ready.\n", 127 | " channel.send({})\n", 128 | " if (message.buffers) {\n", 129 | " for (const buffer of message.buffers) {\n", 130 | " buffers.push(buffer);\n", 131 | " downloaded += buffer.byteLength;\n", 132 | " progress.value = downloaded;\n", 133 | " }\n", 134 | " }\n", 135 | " }\n", 136 | " const blob = new Blob(buffers, {type: 'application/binary'});\n", 137 | " const a = document.createElement('a');\n", 138 | " a.href = window.URL.createObjectURL(blob);\n", 139 | " a.download = filename;\n", 140 | " div.appendChild(a);\n", 141 | " a.click();\n", 142 | " div.remove();\n", 143 | " }\n", 144 | " " 145 | ] 146 | }, 147 | "metadata": {} 148 | }, 149 | { 150 | "output_type": "display_data", 151 | "data": { 152 | "text/plain": [ 153 | "" 154 | ], 155 | "application/javascript": [ 156 | "download(\"download_ae0475a8-6963-478b-9cde-b1b43df155cc\", \"transcription.txt\", 229)" 157 | ] 158 | }, 159 | "metadata": {} 160 | } 161 | ], 162 | "source": [ 163 | "import whisper\n", 164 | "import ffmpeg\n", 165 | "import os\n", 166 | "\n", 167 | "# Укажите путь к вашему видеофайлу (например, '/content/ваше_видео.mp4')\n", 168 | "video_path = '1.mp4'\n", 169 | "\n", 170 | "# Путь для сохранения извлеченного аудио\n", 171 | "audio_file = 'extracted_audio.mp3'\n", 172 | "\n", 173 | "# Преобразование видео в аудиоформат с использованием ffmpeg\n", 174 | "ffmpeg.input(video_path).output(audio_file, format='mp3').run(overwrite_output=True)\n", 175 | "\n", 176 | "# Загрузка модели Whisper для транскрибации\n", 177 | "model = whisper.load_model('base') # Можно заменить на другие размеры модели: 'small', 'medium', 'large'\n", 178 | "\n", 179 | "# Транскрибация аудио\n", 180 | "result = model.transcribe(audio_file)\n", 181 | "\n", 182 | "# Печать результата транскрибации\n", 183 | "print(\"Транскрибация речи:\")\n", 184 | "print(result['text'])\n", 185 | "\n", 186 | "# Сохранение результата в текстовый файл\n", 187 | "with open('transcription.txt', 'w') as f:\n", 188 | " f.write(result['text'])\n", 189 | "\n", 190 | "# Автоматическое скачивание файла с транскрибацией (если вы используете Colab)\n", 191 | "from google.colab import files\n", 192 | "files.download('transcription.txt')\n", 193 | "\n", 194 | "# Удаление временного аудиофайла\n", 195 | "os.remove(audio_file)" 196 | ] 197 | }, 198 | { 199 | "cell_type": "code", 200 | "source": [], 201 | "metadata": { 202 | "id": "vDw1aOcSq1Yn" 203 | }, 204 | "execution_count": null, 205 | "outputs": [] 206 | } 207 | ] 208 | } --------------------------------------------------------------------------------