Spaces:

MGZON
/

api-mg

Runtime error

App Files Files Community

ibrahimlasfar commited on Aug 24

Commit

1cf32f2

1 Parent(s): b3dcc54

Add Dockerfile + auto‑download Mistral .gguf + FastAPI

Browse files

Files changed (3) hide show

Dockerfile +17 -7
app.py +8 -11
setup.sh +3 -3

Dockerfile CHANGED Viewed

@@ -1,18 +1,28 @@
-# Dockerfile
-FROM python:3.10               # ← صورة كاملة، لا Slim
-# تثبيت أي مكتبات نظام إضافية (مثلاً git إذا احتجت)
 RUN apt-get update && apt-get install -y --no-install-recommends \
-    git \
     && rm -rf /var/lib/apt/lists/*
-# نسخ كل شيء إلى داخل الحاوية
 WORKDIR /app
 COPY . /app
-# تثبيت المتطلبات
 RUN pip install --upgrade pip && \
     pip install -r requirements.txt
-# تشغيل التطبيق (FastAPI) – Hugging Face سيستبدل هذا بالأمر الافتراضي إذا لم تُحدده
 CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

+# -------------------------------------------------
+# Dockerfile – يستخدم صورة Python كاملة (تحتوي على gcc)
+# -------------------------------------------------
+# 1️⃣ صورة الأساس
+FROM python:3.10
+# 2️⃣ تثبيت الأدوات اللازمة لبناء llama‑cpp‑python
+#    (gcc, g++, make, cmake)
 RUN apt-get update && apt-get install -y --no-install-recommends \
+    gcc \
+    g++ \
+    make \
+    cmake \
     && rm -rf /var/lib/apt/lists/*
+# 3️⃣ تعيين دليل العمل داخل الحاوية
 WORKDIR /app
+# 4️⃣ نسخ كل الملفات من المستودع إلى داخل الحاوية
 COPY . /app
+# 5️⃣ تثبيت المكتبات Python من requirements.txt
 RUN pip install --upgrade pip && \
     pip install -r requirements.txt
+# 6️⃣ تشغيل FastAPI عندما تُنشأ الحاوية
 CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py CHANGED Viewed

@@ -12,46 +12,43 @@ app = FastAPI(
 # -------------------------------------------------
 # 1️⃣ تحميل نموذج T5 المدرب من Hub
 # -------------------------------------------------
-T5_REPO = "MGZON/mgzon-flan-t5-base"          # إذا رفعته باسم آخر عدّل هنا
 t5_tokenizer = AutoTokenizer.from_pretrained(T5_REPO)
 t5_model = AutoModelForSeq2SeqLM.from_pretrained(T5_REPO)
 # -------------------------------------------------
-# 2️⃣ تحميل ملف Mistral .gguf (تم تنزيله بـ setup.sh)
 # -------------------------------------------------
 gguf_path = os.path.abspath("models/mistral-7b-instruct-v0.1.Q4_K_M.gguf")
 mistral = Llama(
     model_path=gguf_path,
     n_ctx=2048,
-    n_threads=8,                 # عدد الـ threads المتاح داخل Space
     # إذا كان لديك GPU داخل Space يمكنك إضافة n_gpu_layers=35
 )
 # -------------------------------------------------
-# 3️⃣ تعريف شكل الطلب
 # -------------------------------------------------
 class AskRequest(BaseModel):
     question: str
-    max_new_tokens: int = 150   # عدد الكلمات التي تريد استخراجها
-# -------------------------------------------------
-# 4️⃣ نقطة النهاية /ask
-# -------------------------------------------------
 @app.post("/ask")
 def ask(req: AskRequest):
     q = req.question.strip()
     if not q:
         raise HTTPException(status_code=400, detail="Empty question")
-    # منطق بسيط لاختيار النموذج:
     if any(tok in q.lower() for tok in ["mgzon", "flan", "t5"]):
-        # ----- استخدام T5 -----
         inputs = t5_tokenizer(q, return_tensors="pt", truncation=True, max_length=256)
         out_ids = t5_model.generate(**inputs, max_length=req.max_new_tokens)
         answer = t5_tokenizer.decode(out_ids[0], skip_special_tokens=True)
         model_name = "MGZON‑FLAN‑T5"
     else:
-        # ----- استخدام Mistral -----
         out = mistral(prompt=q, max_tokens=req.max_new_tokens)
         answer = out["choices"][0]["text"].strip()
         model_name = "Mistral‑7B‑GGUF"

 # -------------------------------------------------
 # 1️⃣ تحميل نموذج T5 المدرب من Hub
 # -------------------------------------------------
+T5_REPO = "MGZON/mgzon-flan-t5-base"   # إذا رفعت النموذج إلى مستودع آخر استبدل الاسم
 t5_tokenizer = AutoTokenizer.from_pretrained(T5_REPO)
 t5_model = AutoModelForSeq2SeqLM.from_pretrained(T5_REPO)
 # -------------------------------------------------
+# 2️⃣ تحميل ملف Mistral .gguf (تم تنزيله بواسطة setup.sh)
 # -------------------------------------------------
 gguf_path = os.path.abspath("models/mistral-7b-instruct-v0.1.Q4_K_M.gguf")
 mistral = Llama(
     model_path=gguf_path,
     n_ctx=2048,
+    n_threads=8,          # عدد الـ threads المتاح داخل Space (CPU)
     # إذا كان لديك GPU داخل Space يمكنك إضافة n_gpu_layers=35
 )
 # -------------------------------------------------
+# 3️⃣ طلب API
 # -------------------------------------------------
 class AskRequest(BaseModel):
     question: str
+    max_new_tokens: int = 150
 @app.post("/ask")
 def ask(req: AskRequest):
     q = req.question.strip()
     if not q:
         raise HTTPException(status_code=400, detail="Empty question")
+    # اختيار النموذج بناءً على كلمة مفتاحية (يمكنك تعديل المنطق)
     if any(tok in q.lower() for tok in ["mgzon", "flan", "t5"]):
+        # --------- T5 ----------
         inputs = t5_tokenizer(q, return_tensors="pt", truncation=True, max_length=256)
         out_ids = t5_model.generate(**inputs, max_length=req.max_new_tokens)
         answer = t5_tokenizer.decode(out_ids[0], skip_special_tokens=True)
         model_name = "MGZON‑FLAN‑T5"
     else:
+        # --------- Mistral ----------
         out = mistral(prompt=q, max_tokens=req.max_new_tokens)
         answer = out["choices"][0]["text"].strip()
         model_name = "Mistral‑7B‑GGUF"

setup.sh CHANGED Viewed

@@ -1,10 +1,10 @@
 #!/usr/bin/env bash
 set -e
-# 1️⃣ مجلد لتخزين النموذج
 mkdir -p models
-# 2️⃣ تحميل ملف .gguf إذا لم يكن موجودًا
 python - <<PY
 from huggingface_hub import hf_hub_download
 import os
@@ -24,4 +24,4 @@ if not os.path.exists(os.path.join(local_dir, filename)):
     print("✅ تم تحميل Mistral .gguf")
 else:
     print("✅ الملف موجود مسبقًا")
-PY

 #!/usr/bin/env bash
 set -e
+# 1️⃣ إنشاء مجلد لتخزين النموذج
 mkdir -p models
+# 2️⃣ تحميل ملف .gguf إذا لم يكن موجودًا مسبقًا
 python - <<PY
 from huggingface_hub import hf_hub_download
 import os
     print("✅ تم تحميل Mistral .gguf")
 else:
     print("✅ الملف موجود مسبقًا")
+PY