Spaces:

MGZON
/

api-mg

Runtime error

App Files Files Community

ibrahimlasfar commited on Aug 25

Commit

431e7f9

1 Parent(s): 625c5f1

update for cache

Browse files

Files changed (4) hide show

Dockerfile +22 -21
Dockerfiley +33 -0
app.py +43 -30
setup.sh +8 -7

Dockerfile CHANGED Viewed

@@ -1,32 +1,33 @@
-# -------------------------------------------------
-#  Dockerfile – Python 3.10‑slim + build tools
-# -------------------------------------------------
 FROM python:3.10-slim
-# تثبيت الأدوات الأساسية + git & wget
-RUN apt-get update && \
-    apt-get install -y git wget build-essential && \
-    rm -rf /var/lib/apt/lists/*
-# مجلد العمل داخل الحاوية
 WORKDIR /app
-# ---------- المتطلبات ----------
 COPY requirements.txt .
-# تحديث pip ثم تثبيت الحزم
-RUN pip install --upgrade pip && \
-    pip install --no-cache-dir -r requirements.txt
-# ---------- الكود ----------
 COPY app.py .
 COPY setup.sh .
-COPY entrypoint.sh .
-RUN chmod +x setup.sh entrypoint.sh
-# ---------- إعدادات الـ cache ----------
-ENV HF_HOME=/root/.cache/huggingface
-ENV TRANSFORMERS_CACHE=${HF_HOME}
-ENV HF_HUB_CACHE=${HF_HOME}
-# ---------- نقطة الدخول ----------
-ENTRYPOINT ["./entrypoint.sh"]

 FROM python:3.10-slim
+# تثبيت المتطلبات الأساسية، بما في ذلك أدوات التطوير
+RUN apt-get update && apt-get install -y \
+    git \
+    wget \
+    gcc \
+    g++ \
+    cmake \
+    make \
+    && rm -rf /var/lib/apt/lists/*
+# إعداد مجلد العمل
 WORKDIR /app
+# نسخ ملفات التطبيق
 COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+# نسخ السكريبتات والملفات
 COPY app.py .
 COPY setup.sh .
+RUN chmod +x setup.sh
+# تحميل النموذج
+RUN ./setup.sh
+# تعيين المتغيّر لتجنب التحذير
+ENV HF_HOME=/app/.cache/huggingface
+ENV TRANSFORMERS_CACHE=/app/.cache/huggingface
+# تشغيل التطبيق
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "8080"]

Dockerfiley ADDED Viewed

	@@ -0,0 +1,33 @@

+FROM python:3.10-slim
+# تثبيت المتطلبات الأساسية، بما في ذلك أدوات التطوير
+RUN apt-get update && apt-get install -y \
+    git \
+    wget \
+    gcc \
+    g++ \
+    cmake \
+    make \
+    && rm -rf /var/lib/apt/lists/*
+# إعداد مجلد العمل
+WORKDIR /app
+# نسخ ملفات التطبيق
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+# نسخ السكريبتات والملفات
+COPY app.py .
+COPY setup.sh .
+RUN chmod +x setup.sh
+# تحميل النموذج
+RUN ./setup.sh
+# تعيين المتغيّر لتجنب التحذير
+ENV HF_HOME=/app/.cache/huggingface
+ENV TRANSFORMERS_CACHE=/app/.cache/huggingface
+# تشغيل التطبيق
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "8080"]

app.py CHANGED Viewed

@@ -5,11 +5,14 @@ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 from llama_cpp import Llama
 # -------------------------------------------------
-# إعداد مسار الـ cache (يُستَخدم للـ transformers & huggingface)
 # -------------------------------------------------
-CACHE_DIR = os.getenv("HF_HOME", "/root/.cache/huggingface")
 os.makedirs(CACHE_DIR, exist_ok=True)
-os.environ.setdefault("TRANSFORMERS_CACHE", CACHE_DIR)
 # -------------------------------------------------
 # إنشاء التطبيق
@@ -23,51 +26,61 @@ app = FastAPI(
 # 1️⃣ تحميل نموذج T5 المدرب من Hub
 # -------------------------------------------------
 T5_REPO = "MGZON/mgzon-flan-t5-base"
-t5_tokenizer = AutoTokenizer.from_pretrained(T5_REPO, cache_dir=CACHE_DIR)
-t5_model = AutoModelForSeq2SeqLM.from_pretrained(T5_REPO, cache_dir=CACHE_DIR)
 # -------------------------------------------------
-# 2️⃣ تحميل ملف Mistral .gguf (قد تم تنزيله runtime)
 # -------------------------------------------------
-gguf_path = os.path.abspath(os.path.join("models", "mistral-7b-instruct-v0.1.Q4_K_M.gguf"))
 if not os.path.exists(gguf_path):
-    # إذا لم يُحمَّل (مثلاً بسبب حذف الـ volume) نُعيد تحميله الآن
     raise RuntimeError(
         f"ملف Mistral .gguf غير موجود في {gguf_path}. "
-        "تأكد من أن ملف setup.sh تم تنفيذه (يتم تشغيله تلقائيًا عند بدء الحاوية)."
     )
-mistral = Llama(
-    model_path=gguf_path,
-    n_ctx=2048,
-    n_threads=8,
-    # إذا كان لديك GPU داخل Space يمكنك إضافة n_gpu_layers=35
-)
 # -------------------------------------------------
-# طلبات الـ API
 # -------------------------------------------------
 class AskRequest(BaseModel):
     question: str
     max_new_tokens: int = 150
 @app.post("/ask")
 def ask(req: AskRequest):
     q = req.question.strip()
     if not q:
         raise HTTPException(status_code=400, detail="Empty question")
-    # اختيار النموذج بناءً على الكلمات المفتاحية
-    if any(tok in q.lower() for tok in ["mgzon", "flan", "t5"]):
-        # ---------- نموذج T5 ----------
-        inputs = t5_tokenizer(q, return_tensors="pt", truncation=True, max_length=256)
-        out_ids = t5_model.generate(**inputs, max_length=req.max_new_tokens)
-        answer = t5_tokenizer.decode(out_ids[0], skip_special_tokens=True)
-        model_name = "MGZON‑FLAN‑T5"
-    else:
-        # ---------- نموذج Mistral ----------
-        out = mistral(prompt=q, max_tokens=req.max_new_tokens)
-        answer = out["choices"][0]["text"].strip()
-        model_name = "Mistral‑7B‑GGUF"
-    return {"model": model_name, "response": answer}

 from llama_cpp import Llama
 # -------------------------------------------------
+# إعداد مسار الـ cache
 # -------------------------------------------------
+CACHE_DIR = "/app/.cache/huggingface"  # مسار موحد لـ Hugging Face Spaces
 os.makedirs(CACHE_DIR, exist_ok=True)
+# تأكد من أن المكتبتين تقرأ المتغيّرات البيئية
+os.environ["TRANSFORMERS_CACHE"] = CACHE_DIR
+os.environ["HF_HOME"] = CACHE_DIR
 # -------------------------------------------------
 # إنشاء التطبيق
 # 1️⃣ تحميل نموذج T5 المدرب من Hub
 # -------------------------------------------------
 T5_REPO = "MGZON/mgzon-flan-t5-base"
+try:
+    t5_tokenizer = AutoTokenizer.from_pretrained(T5_REPO, cache_dir=CACHE_DIR)
+    t5_model = AutoModelForSeq2SeqLM.from_pretrained(T5_REPO, cache_dir=CACHE_DIR)
+except Exception as e:
+    raise RuntimeError(f"فشل تحميل نموذج T5 من {T5_REPO}: {str(e)}")
 # -------------------------------------------------
+# 2️⃣ تحميل ملف Mistral .gguf
 # -------------------------------------------------
+gguf_path = os.path.abspath("models/mistral-7b-instruct-v0.1.Q4_K_M.gguf")
 if not os.path.exists(gguf_path):
     raise RuntimeError(
         f"ملف Mistral .gguf غير موجود في {gguf_path}. "
+        "تأكد من أن ملف setup.sh تم تنفيذه أثناء الـ build."
     )
+try:
+    mistral = Llama(
+        model_path=gguf_path,
+        n_ctx=2048,
+        n_threads=8,
+        # إذا كان لديك GPU، يمكنك إضافة: n_gpu_layers=35
+    )
+except Exception as e:
+    raise RuntimeError(f"فشل تحميل نموذج Mistral من {gguf_path}: {str(e)}")
 # -------------------------------------------------
+# تعريف شكل الطلب (JSON)
 # -------------------------------------------------
 class AskRequest(BaseModel):
     question: str
     max_new_tokens: int = 150
+# -------------------------------------------------
+# نقطة النهاية /ask
+# -------------------------------------------------
 @app.post("/ask")
 def ask(req: AskRequest):
     q = req.question.strip()
     if not q:
         raise HTTPException(status_code=400, detail="Empty question")
+    # منطق اختيار النموذج
+    try:
+        if any(tok in q.lower() for tok in ["mgzon", "flan", "t5"]):
+            # نموذج T5
+            inputs = t5_tokenizer(q, return_tensors="pt", truncation=True, max_length=256)
+            out_ids = t5_model.generate(**inputs, max_length=req.max_new_tokens)
+            answer = t5_tokenizer.decode(out_ids[0], skip_special_tokens=True)
+            model_name = "MGZON-FLAN-T5"
+        else:
+            # نموذج Mistral
+            out = mistral(prompt=q, max_tokens=req.max_new_tokens)
+            answer = out["choices"][0]["text"].strip()
+            model_name = "Mistral-7B-GGUF"
+        return {"model": model_name, "response": answer}
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=f"خطأ أثناء معالجة الطلب: {str(e)}")

setup.sh CHANGED Viewed

@@ -1,28 +1,29 @@
 #!/usr/bin/env bash
 set -e
-# إنشاء مجلد للنماذج
 mkdir -p models
 # تحميل ملف .gguf إذا لم يكن موجودًا مسبقًا
 python - <<PY
 from huggingface_hub import hf_hub_download
 import os
 repo_id   = "TheBloke/Mistral-7B-Instruct-v0.1-GGUF"
 filename  = "mistral-7b-instruct-v0.1.Q4_K_M.gguf"
 local_dir = "models"
-dest_path = os.path.join(local_dir, filename)
-if not os.path.exists(dest_path):
-    # المتغيّر السري HF_TOKEN يُستَخدم تلقائيًا داخل huggingface_hub
     hf_hub_download(
         repo_id=repo_id,
         filename=filename,
         local_dir=local_dir,
         local_dir_use_symlinks=False,
         force_download=False,
     )
     print("✅ تم تحميل Mistral .gguf")
 else:

 #!/usr/bin/env bash
 set -e
+# التحقق من وجود HF_TOKEN
+if [ -z "$HF_TOKEN" ]; then
+    echo "⚠️ متغير HF_TOKEN غير معرف. قد يتسبب هذا في فشل تحميل النموذج."
+fi
+# إنشاء مجلد لتخزين النموذج
 mkdir -p models
 # تحميل ملف .gguf إذا لم يكن موجودًا مسبقًا
 python - <<PY
 from huggingface_hub import hf_hub_download
 import os
 repo_id   = "TheBloke/Mistral-7B-Instruct-v0.1-GGUF"
 filename  = "mistral-7b-instruct-v0.1.Q4_K_M.gguf"
 local_dir = "models"
+if not os.path.exists(os.path.join(local_dir, filename)):
     hf_hub_download(
         repo_id=repo_id,
         filename=filename,
         local_dir=local_dir,
         local_dir_use_symlinks=False,
         force_download=False,
+        token=os.environ.get("HF_TOKEN")
     )
     print("✅ تم تحميل Mistral .gguf")
 else: