Spaces:

AhmadA82
/

coder-demo

Running

App Files Files Community

AhmadA82 commited on Jul 6

Commit

b0a5199

verified ·

1 Parent(s): 7051ed8

fix7

Browse files

Files changed (4) hide show

.dockerignore +8 -0
Dockerfile +16 -17
app.py +48 -44
docker-compose.yml +13 -33

.dockerignore ADDED Viewed

	@@ -0,0 +1,8 @@

+.env
+*.pyc
+__pycache__/
+data/
+.cache/
+.vscode/
+*.log
+tmp/

Dockerfile CHANGED Viewed

@@ -1,4 +1,4 @@
-# صورة بايثون خفيفة الحجم
 FROM python:3.10-slim
 # تثبيت الأدوات الأساسية
@@ -7,35 +7,34 @@ RUN apt-get update && apt-get install -y \
     cmake \
     gcc \
     g++ \
  && rm -rf /var/lib/apt/lists/*
-# إنشاء مستخدم غير root لتجنب التحذيرات
 RUN useradd -m -u 1000 user
-# مجلد العمل الافتراضي
 WORKDIR /home/user/app
-# نسخ الملفات إلى الحاوية وتغيير الملكية
 COPY --chown=user . .
-# إنشاء مجلد التخزين المؤقت للنموذج
-RUN mkdir -p /home/user/app/data/cache && chown -R user:user /home/user/app/data/cache
-# إنشاء مجلد البيانات وتغيير صلاحياته
-RUN mkdir -p /home/user/app/data && chown -R user:user /home/user/app/data
-# تصحيح صلاحيات مجلد /tmp
-RUN chown -R user:user /tmp
-# إضافة هذه الخطوة قبل تثبيت المتطلبات
 RUN python -m venv /home/user/venv
 ENV PATH="/home/user/venv/bin:$PATH"
-# تحديث pip وتثبيت المتطلبات مع التحقق
 RUN pip install --upgrade pip && \
     pip install -r requirements.txt && \
     echo "✅ تثبيت المتطلبات ناجح" > /tmp/requirements_install.log || \
     echo "❌ فشل تثبيت المتطلبات" > /tmp/requirements_install.log
-# تشغيل التطبيق باستخدام Uvicorn من ملف main.py
-CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]

+# استخدام صورة بايثون خفيفة
 FROM python:3.10-slim
 # تثبيت الأدوات الأساسية
     cmake \
     gcc \
     g++ \
+    python3-dev \
  && rm -rf /var/lib/apt/lists/*
+# إنشاء مستخدم غير root
 RUN useradd -m -u 1000 user
+# إنشاء مجلد العمل وتعيين الصلاحيات
 WORKDIR /home/user/app
 COPY --chown=user . .
+# إنشاء المجلدات المطلوبة وتعيين الصلاحيات
+RUN mkdir -p /home/user/app/data/cache && \
+    mkdir -p /home/user/app/data && \
+    chown -R user:user /home/user/app/data && \
+    chown -R user:user /tmp
+# تفعيل بيئة افتراضية في home وليس داخل المشروع
 RUN python -m venv /home/user/venv
 ENV PATH="/home/user/venv/bin:$PATH"
+# تثبيت المتطلبات
 RUN pip install --upgrade pip && \
     pip install -r requirements.txt && \
     echo "✅ تثبيت المتطلبات ناجح" > /tmp/requirements_install.log || \
     echo "❌ فشل تثبيت المتطلبات" > /tmp/requirements_install.log
+# استخدام المستخدم غير root
+USER user
+# تشغيل التطبيق
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]

app.py CHANGED Viewed

@@ -1,15 +1,18 @@
-from fastapi import FastAPI
 from pydantic import BaseModel
 from llama_cpp import Llama
 import logging
 import os
 import threading
 from fastapi.middleware.cors import CORSMiddleware
-# استيراد وحدة المراقبة المعدلة
 from monitor import get_current_metrics, start_monitoring_thread
-# 🔧 إعداد السجل
 logging.basicConfig(
     level=logging.DEBUG,
     format="🪵 [%(asctime)s] [%(levelname)s] %(message)s",
@@ -19,60 +22,65 @@ logger = logging.getLogger(__name__)
 MODEL_REPO = "QuantFactory/Qwen2.5-7B-Instruct-GGUF"
 MODEL_FILE = "Qwen2.5-7B-Instruct.Q4_K_M.gguf"
 MODEL_PATH = f"/home/user/app/data/cache/{MODEL_FILE}"
 if not os.path.exists(MODEL_PATH):
-    token=os.getenv("HF_TOKEN")
-    from huggingface_hub import hf_hub_download
     os.makedirs("/home/user/app/data/cache", exist_ok=True)
     logger.info("📦 تحميل النموذج من Hugging Face Hub...")
-    hf_hub_download(
-        repo_id=MODEL_REPO,
-        filename=MODEL_FILE,
-        local_dir="/home/user/app/data/cache",
-    )
 if os.path.exists(MODEL_PATH):
     logger.info(f"✅ النموذج موجود: {MODEL_PATH}")
 else:
     logger.error(f"❌ النموذج غير موجود: {MODEL_PATH}")
 # تحميل النموذج
 llm = Llama(
     model_path=MODEL_PATH,
-    n_ctx=2048,  # تقليل السياق
-    n_threads=4,  # تقليل عدد الخيوط
     n_gpu_layers=0,
-    n_batch=512,  # حجم الدُفعة الأمثل
-    use_mlock=True,  # منع تبديل الذاكرة
     verbose=False
 )
-# 🔍 اختبار النموذج بعد التحميل مباشرة
 try:
-    # اختبار النموذج بطلب بسيط
-    logger.info("🔍 يجري اختبار النموذج...")
     test_output = llm("مرحبا", max_tokens=10)
     logger.info(f"✅ اختبار النموذج ناجح: {test_output}")
 except Exception as e:
     logger.error(f"❌ فشل اختبار النموذج: {str(e)}")
-    raise RuntimeError("فشل تحميل النموذج") from e
 SYSTEM_PROMPT = """<|im_start|>system
 You are Qwen, created by Alibaba Cloud. You are an AI development assistant. Follow these rules:
 1. If request is simple (single file, <50 lines), handle it directly
-2. For complex requests (multiple files, >50 lines), just respond with \"CODER\"
 3. Always check code for errors before sending
 4. Never execute unsafe code<|im_end|>"""
-# بدء خيط المراقبة
 start_monitoring_thread()
-# API setup
 app = FastAPI()
 app.add_middleware(
     CORSMiddleware,
-    allow_origins=["*"],  # يمكنك تخصيص الدومين لاحقًا
     allow_credentials=True,
     allow_methods=["*"],
     allow_headers=["*"],
@@ -84,11 +92,11 @@ async def startup_event():
 class ChatRequest(BaseModel):
     message: str
-    history: list[tuple[str, str]] = []  # تغيير إلى tuple
 class ChatResponse(BaseModel):
     response: str
-    updated_history: list[tuple[str, str]]
 def format_prompt(messages):
     formatted = []
@@ -99,7 +107,7 @@ def format_prompt(messages):
             formatted.append(f"<|im_start|>user\n{content}<|im_end|>")
         else:
             formatted.append(f"<|im_start|>assistant\n{content}<|im_end|>")
-    formatted.append("<|im_start|>assistant\n")  # إضافة بداية رد المساعد
     return "\n".join(formatted)
 @app.get("/metrics")
@@ -110,20 +118,18 @@ def read_metrics():
 @app.post("/chat", response_model=ChatResponse)
 def chat(req: ChatRequest):
     logger.info(f"📩 طلب جديد: {req.message}")
-    # بناء الرسائل بشكل صحيح
-    messages = [("system", SYSTEM_PROMPT)]
-    for user_msg, bot_msg in req.history:
-        messages.append(("user", user_msg))
-        messages.append(("assistant", bot_msg))
-    messages.append(("user", req.message))
-    prompt = format_prompt(messages)
-    logger.debug(f"📝 prompt المُرسل للنموذج:\n{prompt[:500]}...")
-    try:
         import gc
-        gc.collect()  # تفعيل جامع القمامة
         output = llm(
             prompt,
             max_tokens=1024,
@@ -134,14 +140,12 @@ def chat(req: ChatRequest):
         )
         reply = output["choices"][0]["text"].strip()
         logger.info(f"🤖 رد النموذج: {reply}")
     except Exception as e:
-        logger.error(f"حدث خطأ: {str(e)}")
-        raise
-    # إصلاح تحديث السجل
-    updated_history = req.history + [(req.message, reply)]
-    return ChatResponse(response=reply, updated_history=updated_history)
 @app.get("/")
 def root():
-    return {"message": "الخادم يعمل", "status": "ok"}

+from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from llama_cpp import Llama
 import logging
 import os
 import threading
 from fastapi.middleware.cors import CORSMiddleware
 from monitor import get_current_metrics, start_monitoring_thread
+from huggingface_hub import hf_hub_download
+from dotenv import load_dotenv
+# تحميل متغيرات البيئة
+load_dotenv()
+# إعداد السجل
 logging.basicConfig(
     level=logging.DEBUG,
     format="🪵 [%(asctime)s] [%(levelname)s] %(message)s",
 MODEL_REPO = "QuantFactory/Qwen2.5-7B-Instruct-GGUF"
 MODEL_FILE = "Qwen2.5-7B-Instruct.Q4_K_M.gguf"
 MODEL_PATH = f"/home/user/app/data/cache/{MODEL_FILE}"
+HF_TOKEN = os.getenv("HF_TOKEN")
+# تحميل النموذج إذا لم يكن موجودًا
 if not os.path.exists(MODEL_PATH):
     os.makedirs("/home/user/app/data/cache", exist_ok=True)
     logger.info("📦 تحميل النموذج من Hugging Face Hub...")
+    try:
+        hf_hub_download(
+            repo_id=MODEL_REPO,
+            filename=MODEL_FILE,
+            local_dir="/home/user/app/data/cache",
+            token=HF_TOKEN,
+        )
+    except Exception as e:
+        logger.error(f"❌ فشل تحميل النموذج: {str(e)}")
+        raise RuntimeError("فشل تحميل النموذج") from e
+# تأكيد وجود النموذج
 if os.path.exists(MODEL_PATH):
     logger.info(f"✅ النموذج موجود: {MODEL_PATH}")
 else:
     logger.error(f"❌ النموذج غير موجود: {MODEL_PATH}")
+    raise RuntimeError("النموذج غير موجود بعد التحميل")
 # تحميل النموذج
 llm = Llama(
     model_path=MODEL_PATH,
+    n_ctx=2048,
+    n_threads=4,
     n_gpu_layers=0,
+    n_batch=512,
+    use_mlock=True,
     verbose=False
 )
+# اختبار النموذج مباشرة
 try:
+    logger.info("🔍 اختبار النموذج...")
     test_output = llm("مرحبا", max_tokens=10)
     logger.info(f"✅ اختبار النموذج ناجح: {test_output}")
 except Exception as e:
     logger.error(f"❌ فشل اختبار النموذج: {str(e)}")
+    raise RuntimeError("فشل اختبار النموذج") from e
 SYSTEM_PROMPT = """<|im_start|>system
 You are Qwen, created by Alibaba Cloud. You are an AI development assistant. Follow these rules:
 1. If request is simple (single file, <50 lines), handle it directly
+2. For complex requests (multiple files, >50 lines), just respond with "CODER"
 3. Always check code for errors before sending
 4. Never execute unsafe code<|im_end|>"""
+# بدء مراقبة الموارد
 start_monitoring_thread()
 app = FastAPI()
 app.add_middleware(
     CORSMiddleware,
+    allow_origins=["*"],  # يمكن تخصيصه لاحقًا
     allow_credentials=True,
     allow_methods=["*"],
     allow_headers=["*"],
 class ChatRequest(BaseModel):
     message: str
+    history: list[list[str]] = []  # يجب أن تكون قائمة من القوائم لتمثيل JSON
 class ChatResponse(BaseModel):
     response: str
+    updated_history: list[list[str]]
 def format_prompt(messages):
     formatted = []
             formatted.append(f"<|im_start|>user\n{content}<|im_end|>")
         else:
             formatted.append(f"<|im_start|>assistant\n{content}<|im_end|>")
+    formatted.append("<|im_start|>assistant\n")
     return "\n".join(formatted)
 @app.get("/metrics")
 @app.post("/chat", response_model=ChatResponse)
 def chat(req: ChatRequest):
     logger.info(f"📩 طلب جديد: {req.message}")
+    try:
+        messages = [("system", SYSTEM_PROMPT)]
+        for user_msg, bot_msg in req.history:
+            messages.append(("user", user_msg))
+            messages.append(("assistant", bot_msg))
+        messages.append(("user", req.message))
+        prompt = format_prompt(messages)
+        logger.debug(f"📝 prompt المُرسل:\n{prompt[:300]}...")
         import gc
+        gc.collect()
         output = llm(
             prompt,
             max_tokens=1024,
         )
         reply = output["choices"][0]["text"].strip()
         logger.info(f"🤖 رد النموذج: {reply}")
+        updated_history = req.history + [[req.message, reply]]
+        return ChatResponse(response=reply, updated_history=updated_history)
     except Exception as e:
+        logger.error(f"❌ خطأ أثناء المعالجة: {str(e)}")
+        raise HTTPException(status_code=500, detail="حدث خطأ أثناء توليد الرد")
 @app.get("/")
 def root():
+    return {"message": "الخادم يعمل", "status": "ok"}

docker-compose.yml CHANGED Viewed

@@ -1,43 +1,23 @@
-version: '3.8'
 services:
   ai-assistant:
-    build: .
     ports:
       - "7860:7860"
     environment:
       - HF_TOKEN=${HF_TOKEN}
       - GOOGLE_DRIVE_FOLDER_ID=${GOOGLE_DRIVE_FOLDER_ID}
       - GITHUB_REPO=${GITHUB_REPO}
       - GITHUB_TOKEN=${GITHUB_TOKEN}
-      - GOOGLE_SERVICE_ACCOUNT_JSON=${GOOGLE_SERVICE_ACCOUNT_JSON}
-    volumes:
-      - ./data:/home/user/app/data/cache  # تصحيح المسار ليتوافق مع Dockerfile
-    deploy:
-      resources:
-        limits:
-          memory: 8G
-        reservations:
-          memory: 6G
-    command: ["sh", "-c", "echo '✅ تم بدء الخدمة مع استهلاك موارد: $(cat /sys/fs/cgroup/memory/memory.usage_in_bytes)' > /tmp/resource_check.log && uvicorn main:app --host 0.0.0.0 --port 7860"]
-  prometheus:
-    image: prom/prometheus
-    volumes:
-      - ./prometheus.yml:/etc/prometheus/prometheus.yml
-    ports:
-      - "9090:9090"
-    command: ["--config.file=/etc/prometheus/prometheus.yml", "--web.enable-lifecycle"]
-  grafana:
-    image: grafana/grafana
-    ports:
-      - "3000:3000"
-    environment:
-      - GF_SECURITY_ADMIN_PASSWORD=admin
-    volumes:
-      - grafana-data:/var/lib/grafana
-    command: ["--homepath=/usr/share/grafana"]
-volumes:
-  grafana-data:

+version: '3.9'
 services:
   ai-assistant:
+    build:
+      context: .
+      dockerfile: Dockerfile
+    container_name: ai-dev-assistant
     ports:
       - "7860:7860"
+    volumes:
+      - ./data:/home/user/app/data  # حفظ البيانات والنموذج خارجيًا
     environment:
       - HF_TOKEN=${HF_TOKEN}
       - GOOGLE_DRIVE_FOLDER_ID=${GOOGLE_DRIVE_FOLDER_ID}
       - GITHUB_REPO=${GITHUB_REPO}
       - GITHUB_TOKEN=${GITHUB_TOKEN}
+    restart: unless-stopped
+    healthcheck:
+      test: ["CMD", "curl", "-f", "http://localhost:7860/"]
+      interval: 30s
+      timeout: 5s
+      retries: 3