Spaces:

MGZON
/

api-mg

Runtime error

App Files Files Community

ibrahimlasfar commited on Aug 24

Commit

625c5f1

1 Parent(s): bc187ec

Fix and add entrypoint.sh

Browse files

Files changed (4) hide show

Dockerfile +20 -13
app.py +15 -22
entrypoint.sh +10 -0
setup.sh +7 -4

Dockerfile CHANGED Viewed

@@ -1,25 +1,32 @@
 FROM python:3.10-slim
-# تثبيت المتطلبات الأساسية
-RUN apt-get update && apt-get install -y git wget && rm -rf /var/lib/apt/lists/*
-# إعداد مجلد العمل
 WORKDIR /app
-# نسخ ملفات التطبيق
 COPY requirements.txt .
-RUN pip install --no-cache-dir -r requirements.txt
-# نسخ السكريبتات والملفات
 COPY app.py .
 COPY setup.sh .
-RUN chmod +x setup.sh
-# تحميل النموذج
-RUN ./setup.sh
-# تعيين المتغيّر لتجنب التحذير
 ENV HF_HOME=/root/.cache/huggingface
-# تشغيل التطبيق
-CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "8080"]

+# -------------------------------------------------
+#  Dockerfile – Python 3.10‑slim + build tools
+# -------------------------------------------------
 FROM python:3.10-slim
+# تثبيت الأدوات الأساسية + git & wget
+RUN apt-get update && \
+    apt-get install -y git wget build-essential && \
+    rm -rf /var/lib/apt/lists/*
+# مجلد العمل داخل الحاوية
 WORKDIR /app
+# ---------- المتطلبات ----------
 COPY requirements.txt .
+# تحديث pip ثم تثبيت الحزم
+RUN pip install --upgrade pip && \
+    pip install --no-cache-dir -r requirements.txt
+# ---------- الكود ----------
 COPY app.py .
 COPY setup.sh .
+COPY entrypoint.sh .
+RUN chmod +x setup.sh entrypoint.sh
+# ---------- إعدادات الـ cache ----------
 ENV HF_HOME=/root/.cache/huggingface
+ENV TRANSFORMERS_CACHE=${HF_HOME}
+ENV HF_HUB_CACHE=${HF_HOME}
+# ---------- نقطة الدخول ----------
+ENTRYPOINT ["./entrypoint.sh"]

app.py CHANGED Viewed

@@ -5,14 +5,11 @@ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 from llama_cpp import Llama
 # -------------------------------------------------
-# إعداد مسار الـ cache (فقط إذا لم يكن معرفًا سلفًا)
 # -------------------------------------------------
-CACHE_DIR = "/app/.cache"          # نفس المسار الذي عرّفته في Dockerfile
 os.makedirs(CACHE_DIR, exist_ok=True)
-# تأكد من أن المكتبتين تقرأ المتغيّرات البيئية
 os.environ.setdefault("TRANSFORMERS_CACHE", CACHE_DIR)
-os.environ.setdefault("HF_HOME", CACHE_DIR)
 # -------------------------------------------------
 # إنشاء التطبيق
@@ -25,54 +22,50 @@ app = FastAPI(
 # -------------------------------------------------
 # 1️⃣ تحميل نموذج T5 المدرب من Hub
 # -------------------------------------------------
-T5_REPO = "MGZON/mgzon-flan-t5-base"   # إذا رفعت النموذج إلى مستودع آخر غير هذا غير الاسم
-t5_tokenizer = AutoTokenizer.from_pretrained(T5_REPO)
-t5_model = AutoModelForSeq2SeqLM.from_pretrained(T5_REPO)
 # -------------------------------------------------
-# 2️⃣ تحميل ملف Mistral .gguf (تم تنزيله بواسطة setup.sh)
 # -------------------------------------------------
-gguf_path = os.path.abspath("models/mistral-7b-instruct-v0.1.Q4_K_M.gguf")
 if not os.path.exists(gguf_path):
-    # في حالة عدم وجود الملف (مثلاً إذا لم يُنفّذ setup.sh) نُظهر رسالة واضحة
     raise RuntimeError(
         f"ملف Mistral .gguf غير موجود في {gguf_path}. "
-        "تأكد من أن ملف setup.sh تم تنفيذه أثناء الـ build."
     )
 mistral = Llama(
     model_path=gguf_path,
     n_ctx=2048,
-    n_threads=8,          # عدد الـ threads المتاح داخل Space (CPU فقط)
     # إذا كان لديك GPU داخل Space يمكنك إضافة n_gpu_layers=35
 )
 # -------------------------------------------------
-# تعريف شكل الطلب (JSON)
 # -------------------------------------------------
 class AskRequest(BaseModel):
     question: str
-    max_new_tokens: int = 150   # عدد الكلمات التي تريد استخراجها (يمكن تعديلها)
-# -------------------------------------------------
-# نقطة النهاية /ask
-# -------------------------------------------------
 @app.post("/ask")
 def ask(req: AskRequest):
     q = req.question.strip()
     if not q:
         raise HTTPException(status_code=400, detail="Empty question")
-    # منطق بسيط لاختيار النموذج:
-    # إذا احتوى السؤال على كلمة مفتاحية نستخدم T5، وإلا نستخدم Mistral
     if any(tok in q.lower() for tok in ["mgzon", "flan", "t5"]):
-        # --------- نموذج T5 ----------
         inputs = t5_tokenizer(q, return_tensors="pt", truncation=True, max_length=256)
         out_ids = t5_model.generate(**inputs, max_length=req.max_new_tokens)
         answer = t5_tokenizer.decode(out_ids[0], skip_special_tokens=True)
         model_name = "MGZON‑FLAN‑T5"
     else:
-        # --------- نموذج Mistral ----------
         out = mistral(prompt=q, max_tokens=req.max_new_tokens)
         answer = out["choices"][0]["text"].strip()
         model_name = "Mistral‑7B‑GGUF"

 from llama_cpp import Llama
 # -------------------------------------------------
+# إعداد مسار الـ cache (يُستَخدم للـ transformers & huggingface)
 # -------------------------------------------------
+CACHE_DIR = os.getenv("HF_HOME", "/root/.cache/huggingface")
 os.makedirs(CACHE_DIR, exist_ok=True)
 os.environ.setdefault("TRANSFORMERS_CACHE", CACHE_DIR)
 # -------------------------------------------------
 # إنشاء التطبيق
 # -------------------------------------------------
 # 1️⃣ تحميل نموذج T5 المدرب من Hub
 # -------------------------------------------------
+T5_REPO = "MGZON/mgzon-flan-t5-base"
+t5_tokenizer = AutoTokenizer.from_pretrained(T5_REPO, cache_dir=CACHE_DIR)
+t5_model = AutoModelForSeq2SeqLM.from_pretrained(T5_REPO, cache_dir=CACHE_DIR)
 # -------------------------------------------------
+# 2️⃣ تحميل ملف Mistral .gguf (قد تم تنزيله runtime)
 # -------------------------------------------------
+gguf_path = os.path.abspath(os.path.join("models", "mistral-7b-instruct-v0.1.Q4_K_M.gguf"))
 if not os.path.exists(gguf_path):
+    # إذا لم يُحمَّل (مثلاً بسبب حذف الـ volume) نُعيد تحميله الآن
     raise RuntimeError(
         f"ملف Mistral .gguf غير موجود في {gguf_path}. "
+        "تأكد من أن ملف setup.sh تم تنفيذه (يتم تشغيله تلقائيًا عند بدء الحاوية)."
     )
 mistral = Llama(
     model_path=gguf_path,
     n_ctx=2048,
+    n_threads=8,
     # إذا كان لديك GPU داخل Space يمكنك إضافة n_gpu_layers=35
 )
 # -------------------------------------------------
+# طلبات الـ API
 # -------------------------------------------------
 class AskRequest(BaseModel):
     question: str
+    max_new_tokens: int = 150
 @app.post("/ask")
 def ask(req: AskRequest):
     q = req.question.strip()
     if not q:
         raise HTTPException(status_code=400, detail="Empty question")
+    # اختيار النموذج بناءً على الكلمات المفتاحية
     if any(tok in q.lower() for tok in ["mgzon", "flan", "t5"]):
+        # ---------- نموذج T5 ----------
         inputs = t5_tokenizer(q, return_tensors="pt", truncation=True, max_length=256)
         out_ids = t5_model.generate(**inputs, max_length=req.max_new_tokens)
         answer = t5_tokenizer.decode(out_ids[0], skip_special_tokens=True)
         model_name = "MGZON‑FLAN‑T5"
     else:
+        # ---------- نموذج Mistral ----------
         out = mistral(prompt=q, max_tokens=req.max_new_tokens)
         answer = out["choices"][0]["text"].strip()
         model_name = "Mistral‑7B‑GGUF"

entrypoint.sh ADDED Viewed

	@@ -0,0 +1,10 @@

+#!/usr/bin/env bash
+set -e
+# 1️⃣ تحميل ملف الـ .gguf إذا لم يكن موجودًا
+echo "🔧 تشغيل setup.sh لتحميل النموذج (إن لم يكن موجودًا)..."
+./setup.sh
+# 2️⃣ تشغيل الخادم
+echo "🚀 تشغيل Uvicorn ..."
+exec uvicorn app:app --host 0.0.0.0 --port 8080

setup.sh CHANGED Viewed

@@ -1,10 +1,10 @@
 #!/usr/bin/env bash
 set -e
-# 1️⃣ إنشاء مجلد لتخزين النموذج
 mkdir -p models
-# 2️⃣ تحميل ملف .gguf إذا لم يكن موجودًا مسبقًا
 python - <<PY
 from huggingface_hub import hf_hub_download
 import os
@@ -13,13 +13,16 @@ repo_id   = "TheBloke/Mistral-7B-Instruct-v0.1-GGUF"
 filename  = "mistral-7b-instruct-v0.1.Q4_K_M.gguf"
 local_dir = "models"
-if not os.path.exists(os.path.join(local_dir, filename)):
     hf_hub_download(
         repo_id=repo_id,
         filename=filename,
         local_dir=local_dir,
         local_dir_use_symlinks=False,
-        force_download=False
     )
     print("✅ تم تحميل Mistral .gguf")
 else:

 #!/usr/bin/env bash
 set -e
+# إنشاء مجلد للنماذج
 mkdir -p models
+# تحميل ملف .gguf إذا لم يكن موجودًا مسبقًا
 python - <<PY
 from huggingface_hub import hf_hub_download
 import os
 filename  = "mistral-7b-instruct-v0.1.Q4_K_M.gguf"
 local_dir = "models"
+dest_path = os.path.join(local_dir, filename)
+if not os.path.exists(dest_path):
+    # المتغيّر السري HF_TOKEN يُستَخدم تلقائيًا داخل huggingface_hub
     hf_hub_download(
         repo_id=repo_id,
         filename=filename,
         local_dir=local_dir,
         local_dir_use_symlinks=False,
+        force_download=False,
     )
     print("✅ تم تحميل Mistral .gguf")
 else: