Spaces:

ErzhanAb
/

Russian_Language_Toxic_Comments

Sleeping

App Files Files Community

ErzhanAb commited on Aug 22

Commit

41796ea

verified ·

1 Parent(s): af1fd59

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -53

app.py CHANGED Viewed

@@ -23,11 +23,12 @@ def clean_text(s: str) -> str:
     return s
 # ---------------------------------
-# 2) Загрузка пайплайна и конфига (без изменений)
 # ---------------------------------
 PIPE = joblib.load("model.joblib")
-DEFAULT_THRESHOLD = 0.4
 try:
     with open("config.json", "r", encoding="utf-8") as f:
         cfg = json.load(f)
@@ -36,35 +37,35 @@ except Exception:
     pass
 # ---------------------------------
-# 3) Обновленный инференс для нового интерфейса
 # ---------------------------------
 def predict(comment: str, threshold: float):
     """
-    Функция инференса, адаптированная для вывода в компонент gr.Label.
-    Возвращает словарь {метка: вероятность}.
     """
     if not comment or not comment.strip():
-        return None # Возвращаем None, чтобы очистить поле вывода
     proba_toxic = float(PIPE.predict_proba([comment])[0, 1])
     proba_not_toxic = 1 - proba_toxic
-    # gr.Label автоматически выделит класс с большей вероятностью,
-    # но мы также можем сделать это наглядно, сравнив с порогом.
-    # Для простоты и наглядности, вернем вероятности для обоих классов.
-    # Компонент gr.Label сам подсветит тот, у которого значение выше.
-    if proba_toxic >= threshold:
-        # Если превышен порог, то "Токсичный" должен быть основным результатом
-        return {"Токсичный": proba_toxic, "Не токсичный": proba_not_toxic}
-    else:
-        # Иначе - "Не токсичный"
-        return {"Не токсичный": proba_not_toxic, "Токсичный": proba_toxic}
 # ---------------------------------
-# 4) Новый стильный и минималистичный интерфейс на gr.Blocks
 # ---------------------------------
-# Описание выносим в отдельную переменную для чистоты
 TITLE = "Анализатор токсичности комментариев"
 DESCRIPTION = "Введите комментарий на русском языке, чтобы определить его токсичность. Модель вернет вероятность принадлежности к классу 'Токсичный'."
 ARTICLE = """
@@ -75,13 +76,18 @@ ARTICLE = """
 *   **Разработано для**: Демонстрации работы простой, но эффективной baseline-модели.
 """
-# Используем gr.Blocks для кастомного дизайна
-with gr.Blocks(theme=gr.themes.Soft(primary_hue="blue", secondary_hue="sky")) as demo:
-    # Заголовок и описание
     gr.Markdown(f"# {TITLE}")
     gr.Markdown(DESCRIPTION)
-    # Основная раскладка в две колонки
     with gr.Row():
         # Левая колонка для ввода
         with gr.Column(scale=2):
@@ -90,61 +96,46 @@ with gr.Blocks(theme=gr.themes.Soft(primary_hue="blue", secondary_hue="sky")) as
                 lines=5,
                 placeholder="Напр��мер: Ты полный идиот!",
             )
             with gr.Row():
                 clear_btn = gr.Button("Очистить", variant="secondary")
                 analyze_btn = gr.Button("Анализ", variant="primary")
-            # Примеры для быстрого тестирования
-            gr.Examples(
-                examples=[
-                    "Ты полный идиот!",
-                    "Спасибо большое за помощь!",
-                    "Посмотри это <url> и скажи, что думаешь",
-                    "Что за бред ты несешь?",
-                    "Отличная работа, продолжайте в том же духе!",
-                ],
-                inputs=comment_input,
-            )
         # Правая колонка для вывода
         with gr.Column(scale=1):
-            result_label = gr.Label(label="Результат", num_top_classes=2)
-    # Выпадающий блок с настройками
     with gr.Accordion("Настройки", open=False):
         threshold_slider = gr.Slider(
-            minimum=0.0,
-            maximum=1.0,
-            value=DEFAULT_THRESHOLD,
-            step=0.01,
             label="Порог классификации",
             info="Комментарий считается токсичным, если вероятность превышает это значение."
         )
-    # Техническая информация о модели в самом низу
     gr.Markdown(ARTICLE)
     # --- Логика взаимодействия компонентов ---
-    # Функция для очистки полей
     def clear_all():
-        return "", None # Очищает текстовое поле и поле с результатом
-    # Привязка функций к кнопкам и событиям
     analyze_btn.click(
         fn=predict,
         inputs=[comment_input, threshold_slider],
-        outputs=result_label
     )
-    # Также запускаем анализ по нажатию Enter в текстовом поле
     comment_input.submit(
         fn=predict,
         inputs=[comment_input, threshold_slider],
-        outputs=result_label
     )
-    clear_btn.click(fn=clear_all, inputs=[], outputs=[comment_input, result_label])
 if __name__ == "__main__":
-    demo.launch(debug=True) # debug=True помогает при отладке

     return s
 # ---------------------------------
+# 2) Загрузка пайплайна и конфига (порог изменен)
 # ---------------------------------
 PIPE = joblib.load("model.joblib")
+# Устанавливаем новый порог по умолчанию
+DEFAULT_THRESHOLD = 0.5
 try:
     with open("config.json", "r", encoding="utf-8") as f:
         cfg = json.load(f)
     pass
 # ---------------------------------
+# 3) Инференс, возвращающий вердикт и вероятности отдельно
 # ---------------------------------
 def predict(comment: str, threshold: float):
     """
+    Возвращает три значения:
+    1. Вердикт (строка) на основе порога.
+    2. Вероятности (словарь) для gr.Label.
+    3. Вероятность токсичности (число) для наглядности.
     """
     if not comment or not comment.strip():
+        # Возвращаем пустые значения для всех трех полей вывода
+        return "", None, None
     proba_toxic = float(PIPE.predict_proba([comment])[0, 1])
     proba_not_toxic = 1 - proba_toxic
+    # 1. Определяем вердикт на основе порога
+    verdict = "Токсичный" if proba_toxic >= threshold else "Не токсичный"
+    # 2. Готовим словарь для gr.Label
+    probabilities = {"Токсичный": proba_toxic, "Не токсичный": proba_not_toxic}
+    # 3. Возвращаем все три результата
+    return verdict, probabilities, proba_toxic
 # ---------------------------------
+# 4) Обновленный интерфейс с кастомным шрифтом и рабочим порогом
 # ---------------------------------
 TITLE = "Анализатор токсичности комментариев"
 DESCRIPTION = "Введите комментарий на русском языке, чтобы определить его токсичность. Модель вернет вероятность принадлежности к классу 'Токсичный'."
 ARTICLE = """
 *   **Разработано для**: Демонстрации работы простой, но эффективной baseline-модели.
 """
+# CSS для подключения и применения шрифта "Inter"
+CUSTOM_CSS = """
+@import url('https://fonts.googleapis.com/css2?family=Inter:wght@400;700&display=swap');
+gradio-app {
+    font-family: 'Inter', sans-serif;
+}
+"""
+with gr.Blocks(theme=gr.themes.Soft(primary_hue="blue", secondary_hue="sky"), css=CUSTOM_CSS) as demo:
     gr.Markdown(f"# {TITLE}")
     gr.Markdown(DESCRIPTION)
     with gr.Row():
         # Левая колонка для ввода
         with gr.Column(scale=2):
                 lines=5,
                 placeholder="Напр��мер: Ты полный идиот!",
             )
             with gr.Row():
                 clear_btn = gr.Button("Очистить", variant="secondary")
                 analyze_btn = gr.Button("Анализ", variant="primary")
         # Правая колонка для вывода
         with gr.Column(scale=1):
+            verdict_output = gr.Textbox(label="Вердикт (с учетом порога)", interactive=False)
+            probabilities_output = gr.Label(label="Распределение вероятностей", num_top_classes=2)
     with gr.Accordion("Настройки", open=False):
         threshold_slider = gr.Slider(
+            minimum=0.0, maximum=1.0, value=DEFAULT_THRESHOLD, step=0.01,
             label="Порог классификации",
             info="Комментарий считается токсичным, если вероятность превышает это значение."
         )
     gr.Markdown(ARTICLE)
     # --- Логика взаимодействия компонентов ---
+    # Обновленная функция очистки для трех полей вывода
     def clear_all():
+        return "", "", None
+    # Привязываем predict к трем компонентам вывода
     analyze_btn.click(
         fn=predict,
         inputs=[comment_input, threshold_slider],
+        outputs=[verdict_output, probabilities_output]
     )
     comment_input.submit(
         fn=predict,
         inputs=[comment_input, threshold_slider],
+        outputs=[verdict_output, probabilities_output]
+    )
+    clear_btn.click(
+        fn=clear_all,
+        inputs=[],
+        outputs=[comment_input, verdict_output, probabilities_output]
     )
 if __name__ == "__main__":
+    demo.launch()