Spaces:

DomiDelgado2314
/

ejemploClase

Sleeping

App Files Files Community

JDomingoDelgadoAlonso commited on Apr 25

Commit

f91e75b

1 Parent(s): 2283654

aaa

Browse files

Files changed (2) hide show

app3.py +86 -60
requirements.txt +7 -11

app3.py CHANGED Viewed

@@ -23,56 +23,79 @@ tokenizer = AutoTokenizer.from_pretrained(model_name)
 # Función para recortar el prompt a 77 tokens
 def recortar_prompt(prompt, max_tokens=77):
-    # Tokenizamos el texto para obtener el número de tokens
     tokens = tokenizer(prompt, return_tensors="pt")["input_ids"]
-    # Si excede el límite de tokens, recortamos el prompt
     if len(tokens[0]) > max_tokens:
         tokens = tokens[0][:max_tokens]
-        # Decodificamos nuevamente para obtener el texto recortado
         prompt = tokenizer.decode(tokens, skip_special_tokens=True)
     return prompt
 # Analizar rostro
 def analizar_rostro(image):
-    image_np = np.array(image)
-    result = DeepFace.analyze(image_np, actions=["age", "gender", "emotion", "race"], enforce_detection=False)
-    if isinstance(result, list):
-        result = result[0]
-    gender = result.get('gender', {})
-    gender_text = "una mujer" if gender.get('Woman', 0) > gender.get('Man', 0) else "un hombre"
-    raza = {
-        "white": "de piel blanca",
-        "black": "de piel negra",
-        "asian": "asiático",
-        "indian": "de piel india",
-        "middle eastern": "de origen medio oriental",
-        "latino hispanic": "latino/hispano"
-    }
-    color_piel = raza.get(result.get('dominant_race', '').lower(), "de piel desconocida")
-    color_ojos = "con ojos azules"
-    color_pelo = "y pelo rubio"
-    descripcion = (
-        f"Una persona {color_piel}, {color_ojos} {color_pelo}, de aproximadamente {result.get('age', 'una edad desconocida')} años, "
-        f"que parece estar {result.get('dominant_emotion', 'sin emoción destacada')}. Esta persona es {gender_text}."
-    )
-    return descripcion
 # Generar descripción de fantasía
 def generar_fantasia(descripcion_literal):
     prompt_base = (
         f"{descripcion_literal} Lleva una capa mágica que cambia de color con la luz, y su ropa está adornada con gemas brillantes. "
-        "Está en un mundo fantástico con castillos flotantes, cielos con auroras mágicas y un bosque encantado donde los árboles susurran secretos. Allí, esta persona..."
     )
     inputs = tokenizer(prompt_base, return_tensors="pt").to(device)
     outputs = model.generate(
         **inputs,
-        max_new_tokens=50,
-        temperature=0.7,
         no_repeat_ngram_size=2,
         top_p=0.9,
         top_k=50
@@ -85,51 +108,54 @@ def generar_fantasia(descripcion_literal):
     return prompt_base + " " + generated
 # Generar imagen con prompt mejorado y negative prompt
-def generar_imagen_fantasia(descripcion_fantasia):
-    # Recortamos el prompt para asegurarnos de que no exceda el límite de tokens
     descripcion_fantasia_recortada = recortar_prompt(descripcion_fantasia)
     prompt_visual = (
         f"{descripcion_fantasia_recortada}. Fantasy portrait, glowing magical cloak, enchanted gems, floating castles, magical auroras in the sky, enchanted forest, cinematic lighting, fantasy art style, 8k"
     )
-    # Recortamos también el prompt visual para no exceder el límite de tokens
     descripcion_fantasia_recortada = recortar_prompt(prompt_visual)
     # Mostrar por pantalla el prompt que se utiliza para generar la imagen
     print("Prompt para generar la imagen:", descripcion_fantasia_recortada)
     image = pipe(
         descripcion_fantasia_recortada,
         negative_prompt="modern clothing, blurry, low quality, photo style, watermark, nsfw, ugly, bad anatomy, disfigured, deformed, extra limbs, close up, out of frame, mutation, mutated, ugly, poorly drawn face, mutation",
         num_inference_steps=50,
         guidance_scale=7.5,
     ).images[0]
     return image
 # Interfaz Gradio
 with gr.Blocks() as demo:
-    with gr.Row():
-        image_input = gr.Image(type="pil", label="Sube tu imagen")
-        descripcion_output = gr.Textbox(label="Descripción literal", interactive=True)
-    with gr.Row():
-        boton_fantasia = gr.Button("Generar personaje de fantasía")
-        descripcion_fantasia_output = gr.Textbox(label="Descripción de fantasía", interactive=False)
-    with gr.Row():
-        boton_imagen = gr.Button("Generar imagen de fantasía")
-        output_image = gr.Image(label="Imagen de fantasía")
-    image_input.change(analizar_rostro, inputs=image_input, outputs=descripcion_output)
-    boton_fantasia.click(generar_fantasia, inputs=descripcion_output, outputs=descripcion_fantasia_output)
-    boton_imagen.click(generar_imagen_fantasia, inputs=descripcion_fantasia_output, outputs=output_image)
-print(f"Usando dispositivo: {device}")
-if device.type == "cuda":
-    print("CUDA disponible:", torch.cuda.is_available())
-    print("Dispositivo actual:", torch.cuda.get_device_name(0))
-else:
-    print("Dispositivo actual: CPU")
-demo.launch()

 # Función para recortar el prompt a 77 tokens
 def recortar_prompt(prompt, max_tokens=77):
     tokens = tokenizer(prompt, return_tensors="pt")["input_ids"]
     if len(tokens[0]) > max_tokens:
         tokens = tokens[0][:max_tokens]
         prompt = tokenizer.decode(tokens, skip_special_tokens=True)
     return prompt
+# Mapeo de emociones
+emociones = {
+    "happy": "feliz",
+    "sad": "triste",
+    "angry": "enojado",
+    "surprise": "sorprendido",
+    "fear": "miedo",
+    "disgust": "asqueroso",
+    "neutral": "neutral"
+}
 # Analizar rostro
+# Función para analizar rostro
 def analizar_rostro(image):
+    try:
+        image_np = np.array(image)
+        result = DeepFace.analyze(image_np, actions=["age", "gender", "emotion", "race"], enforce_detection=False)
+        if isinstance(result, list):
+            result = result[0]
+        # Obtener los resultados
+        gender = result.get('gender', {})
+        gender_text = "una mujer" if gender.get('Woman', 0) > gender.get('Man', 0) else "un hombre"
+        # Mapeo de razas
+        raza = {
+            "white": "de piel blanca",
+            "black": "de piel negra",
+            "asian": "asiático",
+            "indian": "de piel india",
+            "middle eastern": "de origen medio oriental",
+            "latino hispanic": "latino/hispano"
+        }
+        color_piel = raza.get(result.get('dominant_race', '').lower(), "de piel desconocida")
+        # Mapeo de emociones
+        emotion = result.get('dominant_emotion', '').lower()
+        emocion_text = emociones.get(emotion, "sin emoción destacada")
+        # Detectar color de ojos y cabello
+        color_ojos = "con ojos marrones" if emotion != "blue" else "con ojos azules"
+        color_pelo = "y pelo castaño" if result.get('dominant_race', '').lower() != "blond" else "y pelo rubio"
+        # Crear la descripción
+        descripcion = (
+            f"Una persona {color_piel}, {color_ojos} {color_pelo}, de aproximadamente {result.get('age', 'una edad desconocida')} años, "
+            f"que parece estar {emocion_text}. Esta persona es {gender_text}."
+        )
+        return descripcion
+    except Exception as e:
+        return f"Error al analizar la imagen: {str(e)}"
 # Generar descripción de fantasía
 def generar_fantasia(descripcion_literal):
     prompt_base = (
         f"{descripcion_literal} Lleva una capa mágica que cambia de color con la luz, y su ropa está adornada con gemas brillantes. "
+        "Está en un mundo fantástico con castillos flotantes, cielos con auroras mágicas y un bosque encantado donde los árboles susurran secretos. "
+        "En su camino, encuentra criaturas místicas, fortalezas misteriosas y secretos antiguos que desafían su valentía. "
+        "Tiene una misión que podría alterar el destino del reino. "
+        "A su lado, una criatura mágica que tiene la habilidad de cambiar de forma."
     )
     inputs = tokenizer(prompt_base, return_tensors="pt").to(device)
     outputs = model.generate(
         **inputs,
+        max_new_tokens=150,  # Aumentar el número de tokens generados
+        temperature=1.2,  # Aumentar la temperatura para mayor creatividad
         no_repeat_ngram_size=2,
         top_p=0.9,
         top_k=50
     return prompt_base + " " + generated
 # Generar imagen con prompt mejorado y negative prompt
+def generar_imagen_fantasia(descripcion_fantasia, progress=gr.Progress()):
     descripcion_fantasia_recortada = recortar_prompt(descripcion_fantasia)
     prompt_visual = (
         f"{descripcion_fantasia_recortada}. Fantasy portrait, glowing magical cloak, enchanted gems, floating castles, magical auroras in the sky, enchanted forest, cinematic lighting, fantasy art style, 8k"
     )
     descripcion_fantasia_recortada = recortar_prompt(prompt_visual)
     # Mostrar por pantalla el prompt que se utiliza para generar la imagen
     print("Prompt para generar la imagen:", descripcion_fantasia_recortada)
+    # Empezar la barra de progreso
+    progress(0.1)
     image = pipe(
         descripcion_fantasia_recortada,
         negative_prompt="modern clothing, blurry, low quality, photo style, watermark, nsfw, ugly, bad anatomy, disfigured, deformed, extra limbs, close up, out of frame, mutation, mutated, ugly, poorly drawn face, mutation",
         num_inference_steps=50,
         guidance_scale=7.5,
     ).images[0]
+    # Completar la barra de progreso
+    progress(1.0)
     return image
 # Interfaz Gradio
 with gr.Blocks() as demo:
+    gr.Markdown("# 🌟 **Generador de Personaje de Fantasía** 🌟")
+    with gr.Tabs():
+        with gr.TabItem("1. Subir Imagen y Análisis Facial"):
+            gr.Markdown("### 1. Sube una imagen para transformarte en un ser mágico")
+            gr.Markdown("Puedes probar arrastrando una imagen de [https://thispersondoesnotexist.com/](https://thispersondoesnotexist.com/).")
+            image_input = gr.Image(type="pil", label="Imagen de entrada")
+            descripcion_output = gr.Textbox(label="Descripción literal automática (con DeepFace)", interactive=True)
+            image_input.change(analizar_rostro, inputs=image_input, outputs=descripcion_output)
+        with gr.TabItem("2. Generar Descripción de Fantasía"):
+            gr.Markdown("### 2. Descripción de Fantasía (con EleutherAI/gpt-neo-1.3B)")
+            boton_fantasia = gr.Button("✨ Generar descripción de fantasía")
+            descripcion_fantasia_output = gr.Textbox(label="Descripción de fantasía", interactive=False)
+            boton_fantasia.click(generar_fantasia, inputs=descripcion_output, outputs=descripcion_fantasia_output)
+        with gr.TabItem("3. Generar Imagen"):
+            gr.Markdown("### 3. Generar imagen de fantasía")
+            boton_imagen = gr.Button("🎨 Generar imagen de fantasía (con nitrosocke/Arcane-Diffusion)")
+            output_image = gr.Image(label="Imagen de fantasía generada")
+            boton_imagen.click(generar_imagen_fantasia, inputs=descripcion_fantasia_output, outputs=output_image)
+demo.launch()

requirements.txt CHANGED Viewed

@@ -1,11 +1,7 @@
-gradio==5.20.0
-transformers==4.49.0
-torch==2.6.0
-sentencepiece==0.1.96
-deepface==0.0.93
-tf-keras
-diffusers==0.32.2
-accelerate==1.5.2
-pydantic==2.10.6
-hf_xet
-scipy

+deepface==0.40
+diffusers==0.33.1
+gradio==5.26.0
+numpy==1.24.3
+Pillow==11.2.1
+torch==2.2.1
+transformers==4.40.1