Spaces:

enesmanan
/

trendyol-review-summarizer

Sleeping

App Files Files Community

enesmanan commited on Feb 18

Commit

2667fe6

verified ·

1 Parent(s): 581c8a2

Update app.py

Browse files

Files changed (1) hide show

app.py +2 -79

app.py CHANGED Viewed

@@ -1,13 +1,10 @@
 import os
-import time
-import requests
-import re
 import pandas as pd
 import plotly.express as px
 import gradio as gr
 from dotenv import load_dotenv
 from scripts.review_summarizer import analyze_reviews
-from scrape.trendyol_scraper_origin import scrape_comments as selenium_scrape
 load_dotenv()
 GEMINI_API_KEY = os.getenv('GEMINI_API_KEY')
@@ -48,83 +45,11 @@ def create_star_plot(df):
     )
     return fig
-def scrape_product_comments_v2(url):
-    headers = {
-        "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7",
-        "accept-language": "en-US,en;q=0.9",
-        "cache-control": "max-age=0",
-        "upgrade-insecure-requests": "1",
-        "user-agent": "Mozilla/5.0 (iPad; CPU OS 14_6_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) FxiOS/129.0 Mobile/15E148 Safari/605.1.15"
-    }
-    # Extract product_id using regex
-    match = re.search(r"-p-(\d+)", url)
-    if not match:
-        raise ValueError("Product ID not found in URL")
-    product_id = match.group(1)
-    api_url = f"https://apigw.trendyol.com/discovery-web-websfxsocialreviewrating-santral/product-reviews-detailed?contentId={product_id}&page=1&order=DESC&orderBy=Score&channelId=1"
-    def fetch_reviews(api_url, headers):
-        all_reviews = []
-        response = requests.get(api_url, headers=headers)
-        if response.status_code != 200:
-            raise ConnectionError(f"Initial request failed: {response.status_code}")
-        data = response.json()
-        total_pages = data["result"]["productReviews"]["totalPages"]
-        all_reviews.extend(data["result"]["productReviews"]["content"])
-        for page in range(2, total_pages + 1):
-            paginated_url = api_url.replace("page=1", f"page={page}")
-            response = requests.get(paginated_url, headers=headers)
-            if response.status_code == 200:
-                page_data = response.json()
-                all_reviews.extend(page_data["result"]["productReviews"]["content"])
-            else:
-                print(f"Failed to fetch page {page}: {response.status_code}")
-        return all_reviews
-    reviews = fetch_reviews(api_url, headers)
-    reviews_df = pd.DataFrame(reviews)
-    reviews_df = reviews_df.rename(columns={
-        "id": "Kullanıcı_id",
-        "userFullName": "Kullanıcı Adı",
-        "comment": "Yorum",
-        "lastModifiedDate": "Tarih",
-        "rate": "Yıldız Sayısı"
-    })
-    reviews_df = reviews_df[["Kullanıcı_id", "Kullanıcı Adı", "Yorum", "Tarih", "Yıldız Sayısı"]]
-    return reviews_df
-def scrape_product_comments(url, use_selenium=False):
-    """
-    Trendyol yorumlarını çeker. Önce API ile dener,
-    başarısız olursa Selenium'a geçer.
-    """
-    try:
-        if use_selenium:
-            return selenium_scrape(url)
-        # Önce API ile deneyelim
-        df = scrape_product_comments_v2(url)
-        if df is not None and len(df) > 0:
-            return df
-        # API başarısız olursa Selenium'a geç
-        print("API scraping başarısız oldu, Selenium'a geçiliyor...")
-        return selenium_scrape(url)
-    except Exception as e:
-        print(f"Scraping hatası: {str(e)}")
-        return None
 def analyze_product(url, progress=gr.Progress()):
     try:
         # Fetch reviews
         progress(0.1, desc="Yorumlar çekiliyor...")
-        df = scrape_product_comments(url)
         if df is None or len(df) == 0:
             return None, None, None, None, None, None, None, "Yorumlar çekilemedi. URL'yi kontrol edin."
@@ -194,8 +119,6 @@ with gr.Blocks(title="Trendyol Yorum Analizi") as demo:
         avg_rating = gr.Textbox(label="Ortalama Puan")
         positive_ratio = gr.Textbox(label="Olumlu Yorum Oranı")
     summary = gr.Markdown(label="📝 Genel Değerlendirme")
     info_message = gr.Markdown()

 import os
 import pandas as pd
 import plotly.express as px
 import gradio as gr
 from dotenv import load_dotenv
 from scripts.review_summarizer import analyze_reviews
+from scrape.trendyol_scraper_origin import scrape_comments
 load_dotenv()
 GEMINI_API_KEY = os.getenv('GEMINI_API_KEY')
     )
     return fig
 def analyze_product(url, progress=gr.Progress()):
     try:
         # Fetch reviews
         progress(0.1, desc="Yorumlar çekiliyor...")
+        df = scrape_comments(url)
         if df is None or len(df) == 0:
             return None, None, None, None, None, None, None, "Yorumlar çekilemedi. URL'yi kontrol edin."
         avg_rating = gr.Textbox(label="Ortalama Puan")
         positive_ratio = gr.Textbox(label="Olumlu Yorum Oranı")
     summary = gr.Markdown(label="📝 Genel Değerlendirme")
     info_message = gr.Markdown()