Spaces:

teslatony
/

video-object-detection

Sleeping

App Files Files Community

teslatony commited on Nov 4

Commit

f2b0c81

verified ·

1 Parent(s): 5a32a5d

Update app.py

Browse files

Files changed (1) hide show

app.py +84 -80

app.py CHANGED Viewed

@@ -1,82 +1,86 @@
-import gradio as gr
-from ultralytics import YOLO
-import os
-import glob
-import shutil
-import tempfile
-# Загружаем модель один раз (YOLOv8n — лёгкая версия для object detection)
-model = YOLO("yolov8n.pt")
-def process_video(video):
-    """
-    Обрабатывает видео: обнаруживает объекты на каждом кадре и сохраняет аннотированный ролик.
-    """
-    if video is None:
-        return None, "Пожалуйста, загрузите видео или захватите с веб-камеры."
-    # Создаём временную директорию для результатов
-    temp_dir = "temp_output"
-    os.makedirs(temp_dir, exist_ok=True)
-    # Обработка видео с сохранением аннотаций
-    results = model.predict(
-        source=video,
-        save=True,
-        project=temp_dir,
-        name="detect",
-        exist_ok=True,
-        imgsz=640,  # Размер изображения для обработки
-        conf=0.25,  # Порог уверенности
-        show=False  # Не показывать в окне
-    )
-    # Находим сохранённый аннотированный видео-файл
-    output_pattern = os.path.join(temp_dir, "detect", "*.mp4")
-    output_files = glob.glob(output_pattern)
-    if output_files:
-        # Копируем в статическую папку для Gradio (HF Spaces требует)
-        static_path = "./static"
-        os.makedirs(static_path, exist_ok=True)
-        output_file = output_files[0]
-        shutil.copy2(output_file, os.path.join(static_path, "annotated_video.mp4"))
-        return os.path.join(static_path, "annotated_video.mp4"), "Обработка завершена! Объекты (люди, машины и т.д.) отмечены боксами."
-    else:
-        return None, "Ошибка: видео не обработано. Попробуйте другой файл или короче клип."
-# Создаём интерфейс на русском
-with gr.Blocks(title="Обнаружение объектов в видео") as demo:
-    gr.Markdown("# Обнаружение объектов в видео")
-    gr.Markdown("Загрузите видео-файл (MP4, AVI и т.д.) **или** захватите с веб-камеры. Приложение автоматически обнаружит объекты с помощью модели YOLOv8. Результат — видео с bounding boxes вокруг объектов.")
-    with gr.Row():
-        input_video = gr.Video(
-            label="Видео: загрузите файл или захватите с веб-камеры",
-            sources=["upload", "webcam"],  # Поддержка обоих источников
-            format="mp4"  # Авто-конверт в MP4
-        )
-        output_video = gr.Video(
-            label="Аннотированное видео",
-            interactive=False,  # Только просмотр
-            format="mp4"  # Формат вывода
-        )
-    output_text = gr.Textbox(label="Статус", interactive=False)
-    process_btn = gr.Button("Запустить обнаружение", variant="primary")
-    process_btn.click(
-        fn=process_video,
-        inputs=[input_video],
-        outputs=[output_video, output_text]
-    )
-    gr.Examples(
-        examples=[],
-        inputs=[input_video],
-        label="Примеры: добавьте свои видео для демонстрации"
-    )
 if __name__ == "__main__":
-    demo.launch()

+"""Gradio приложение: распознавание объектов с веб-камеры в реальном времени
+ultralytics модель работает с RGB или PIL, но результаты.plot() возвращает BGR (cv2-style).
+"""
+if img is None:
+raise ValueError("Пустое изображение на входе")
+# Если image в формате PIL -> конвертируем в numpy
+if not isinstance(img, np.ndarray):
+img = np.array(img)
+# Gradio возвращает изображение в RGB (H,W,3)
+return img
+def detect_and_annotate(frame: np.ndarray) -> np.ndarray:
+"""Выполняет обнаружение объектов и возвращает аннотированный кадр (RGB numpy array).
+Функция специально проектирована, чтобы быть быстрым и устойчивым для демонстрации в реальном времени.
+"""
+# Подготовка
+img = preprocess_image(frame)
+# Выполнить инференс (возвращает Results object)
+try:
+results = model(img, imgsz=640, conf=0.25, half=False) # conf и imgsz можно настроить
+except Exception as e:
+# В случае ошибки возвращаем исходный кадр
+print(f"Inference error: {e}")
+return img
+# results может содержать батч; берем первый
+r = results[0]
+# Получить аннотированное изображение. results.plot() возвращает изображение в формате BGR (OpenCV)
+annotated = r.plot()
+# Если annotated - None, вернем исходный RGB
+if annotated is None:
+return img
+# Конвертируем BGR->RGB для корректного отображения в Gradio
+try:
+annotated_rgb = cv2.cvtColor(annotated, cv2.COLOR_BGR2RGB)
+except Exception:
+# Если распознавание возвращает RGB сразу
+annotated_rgb = annotated
+return annotated_rgb
+# Gradio интерфейс
+def build_interface():
+with gr.Blocks(title="Realtime Object Detection — YOLOv8") as demo:
+gr.Markdown("## Распознавание объектов с веб-камеры (реальное время)")
+with gr.Row():
+webcam = gr.Image(source="webcam", type="numpy", tool="editor", label="Веб-камера", streaming=True)
+out_img = gr.Image(label="Результат", type="numpy")
+# Кнопка не нужна — каждый кадр будет обрабатываться при обновлении благодаря streaming=True
+webcam.change(fn=detect_and_annotate, inputs=webcam, outputs=out_img)
+gr.Markdown("---\nНастройки: модель yolov8n (скачивается автоматически при первом запуске).\nНастройте conf или imgsz в вызове model(...) при необходимости.")
+return demo
 if __name__ == "__main__":
+demo = build_interface()
+# Для портфолио и локального запуска: share=False, server_name и server_port можно изменить
+demo.launch(server_name="0.0.0.0", server_port=7860, share=False)