backend/app/agents/pm_agent.py

#pm_agent.py
import json
import re
import logging
from langchain_openai import ChatOpenAI
from app.schemas.spec import ProjectSpec
from app.llm.prompts import PM_AGENT_PROMPT
from app.core.config import settings

logger = logging.getLogger(__name__)

async def run_pm_agent(user_input: str, history: list | None = None) -> ProjectSpec:
    """Agent PM qui remplit ProjectSpec en analysant le besoin utilisateur."""
    
    llm = ChatOpenAI(
        base_url=settings.llm_base_url,
        api_key=settings.llm_api_key,
        model="local-model",
        temperature=0.3,
    )
    
    messages = [
        {"role": "system", "content": PM_AGENT_PROMPT},
    ]
    
    if history:
        messages.extend(history)
    
    messages.append({
        "role": "user",
        "content": f"""En te basant sur TOUT l'historique de notre conversation et sur cette dernière précision, génère le JSON ProjectSpec valide et complètement rempli.

DERNIÈRE PRÉCISION / INPUT UTILISATEUR :
{user_input}

IMPORTANT : Tu dois impérativement combiner les contraintes énoncées précédemment (comme le langage de programmation choisi, l'OS, etc.) avec cette nouvelle information pour enrichir la spécification existante.
Réponds UNIQUEMENT avec du JSON valide. Aucun texte avant le JSON, aucun texte après le JSON."""
    })
        
    try:
        response = await llm.ainvoke(messages)
        raw_response = response.content if hasattr(response, 'content') else str(response)
        logger.debug(f"[PM Agent] Réponse brute: {raw_response}")
        
        parsed_spec = _extract_json_robust(raw_response)
        
        project_spec = ProjectSpec(**parsed_spec)
        logger.info(f"[PM Agent] ✅ Tentative réussie (parsing JSON manuel)")
        
        project_spec = _validate_and_sanitize(project_spec, user_input)
        return project_spec
        
    except Exception as e2:
        logger.error(f"[PM Agent] ❌ Tentative échouée: {type(e2).__name__}: {str(e2)}")
        logger.info("[PM Agent] Fallback: Génération automatique du spec")
        
        return _generate_fallback_spec(user_input)


def _extract_json_robust(response_text: str) -> dict:
    """
    Extrait et parse le JSON depuis la réponse du LLM.
    Robuste pour llama.cpp qui ajoute souvent du texte avant/après le JSON.
    """
    
    logger.debug(f"[JSON Extract] Réponse brute: {response_text}")
    
    # Stratégie 1: Chercher un bloc JSON entre ```json et ```
    json_match = re.search(r'```json\s*(.*?)\s*```', response_text, re.DOTALL)
    if json_match:
        json_str = json_match.group(1).strip()
        logger.debug(f"[JSON Extract] ✓ Trouvé via ```json block")
        return json.loads(json_str)
    
    # Stratégie 2: Chercher un bloc JSON entre ``` et ``` (sans spécifier json)
    json_match = re.search(r'```\s*(.*?)\s*```', response_text, re.DOTALL)
    if json_match:
        json_str = json_match.group(1).strip()
        logger.debug(f"[JSON Extract] ✓ Trouvé via ``` block")
        try:
            return json.loads(json_str)
        except json.JSONDecodeError:
            logger.debug(f"[JSON Extract] ✗ Code block trouvé mais pas JSON valide")
    
    # Stratégie 3: Chercher directement un objet JSON { ... } en étant très prudent
    first_brace = response_text.find('{')
    last_brace = response_text.rfind('}')
    
    if first_brace != -1 and last_brace != -1 and last_brace > first_brace:
        json_str = response_text[first_brace:last_brace+1].strip()
        
        logger.debug(f"[JSON Extract] Tentative extraction (longueur: {len(json_str)})")
        
        try:
            parsed = json.loads(json_str)
            logger.debug(f"[JSON Extract] ✓ Trouvé via extraction")
            return parsed
        except json.JSONDecodeError as e:
            logger.debug(f"[JSON Extract] ✗ Extraction invalide: {e}")
    
    # Stratégie 4: Parser tout le texte comme JSON (dernier recours)
    try:
        parsed = json.loads(response_text.strip())
        logger.debug(f"[JSON Extract] ✓ Trouvé via parsing direct")
        return parsed
    except json.JSONDecodeError:
        logger.debug(f"[JSON Extract] ✗ Parsing direct échoué")
    
    # Aucune stratégie n'a fonctionné
    logger.error(f"[JSON Extract] ❌ Impossible d'extraire JSON valide")
    logger.error(f"[JSON Extract] Réponse brute complète:\n{response_text}")
    raise ValueError(f"Impossible d'extraire un JSON valide de la réponse du LLM.\nRéponse: {response_text}")


def _validate_and_sanitize(spec: ProjectSpec, user_input: str) -> ProjectSpec:
    """
    Fait confiance au LLM pour la logique métier.
    Se contente de s'assurer de la cohérence technique minimale.
    """
    logger.debug(f"[Sanitize] Validation du spec généré pour : {spec.title}")
    
    # 1. Sécurité minimale sur les chaînes de texte vides
    if not spec.title or spec.title.lower() in ["null", "none", ""]:
        spec.title = "Automation Script"
        
    if not spec.description:
        spec.description = f"Script d'automatisation basé sur : {user_input[:50]}..."

    # 2. Gestion de la complétude :
    if not spec.is_complete or (spec.clarifying_question and spec.clarifying_question.strip()):
        spec.is_complete = False
        if not spec.clarifying_question:
            spec.clarifying_question = "Pourriez-vous apporter plus de précisions sur les actions que doit effectuer ce script ?"
        logger.info(f"[Sanitize] Le besoin est qualifié d'INCOMPLET par l'agent PM.")
    else:
        spec.is_complete = True
        spec.clarifying_question = None
        logger.info(f"[Sanitize] Le besoin est qualifié de COMPLET par l'agent PM.")

    return spec

def _generate_fallback_spec(user_input: str) -> ProjectSpec:
    """Génère un ProjectSpec par défaut en cas d'erreur complète."""
    
    logger.warning(f"[Fallback] Génération d'un spec par défaut pour: {user_input}")
    
    return ProjectSpec(
        title="Automation Script",
        description=f"Automatisation du besoin utilisateur: {user_input}",
        requirements=[
            f"Exécuter l'action demandée: {user_input}",
            "Gérer les erreurs",
            "Générer des logs"
        ],
        constraints=["PEP 8 strict"],
        language="Python",
        target_stack="",
        io_config={
            "has_inputs": False,
            "input_type": "none",
            "input_paths_or_sources": [],
            "has_outputs": False,
            "output_type": "log_only",
            "output_formats": []
        },
        auth_config={
            "requires_auth": False,
            "auth_method": "none",
            "target_tools_and_apis": []
        },
        env_config={
            "target_os": "cross_platform",
            "language_version": "3.11",
            "critical_dependencies": ["logging"]
        },
        error_handling_strategy="log_and_continue",
        is_complete=False,
        clarifying_question="Pourriez-vous donner plus de détails sur votre demande ?"
    )
Etape 1 OK, sans optionnel 2026-06-16 11:27:41 +02:00			`#pm_agent.py`
			`import json`
			`import re`
			`import logging`
			`from langchain_openai import ChatOpenAI`
first push 2026-06-12 18:16:58 +02:00			`from app.schemas.spec import ProjectSpec`
Etape 1 OK, sans optionnel 2026-06-16 11:27:41 +02:00			`from app.llm.prompts import PM_AGENT_PROMPT`
			`from app.core.config import settings`
first push 2026-06-12 18:16:58 +02:00
Etape 1 OK, sans optionnel 2026-06-16 11:27:41 +02:00			`logger = logging.getLogger(__name__)`
first push 2026-06-12 18:16:58 +02:00
Etape 1 OK, sans optionnel 2026-06-16 11:27:41 +02:00			`async def run_pm_agent(user_input: str, history: list \| None = None) -> ProjectSpec:`
			`"""Agent PM qui remplit ProjectSpec en analysant le besoin utilisateur."""`

			`llm = ChatOpenAI(`
			`base_url=settings.llm_base_url,`
			`api_key=settings.llm_api_key,`
			`model="local-model",`
			`temperature=0.3,`
			`)`

			`messages = [`
			`{"role": "system", "content": PM_AGENT_PROMPT},`
			`]`

			`if history:`
			`messages.extend(history)`

			`messages.append({`
			`"role": "user",`
			`"content": f"""En te basant sur TOUT l'historique de notre conversation et sur cette dernière précision, génère le JSON ProjectSpec valide et complètement rempli.`

			`DERNIÈRE PRÉCISION / INPUT UTILISATEUR :`
			`{user_input}`

			`IMPORTANT : Tu dois impérativement combiner les contraintes énoncées précédemment (comme le langage de programmation choisi, l'OS, etc.) avec cette nouvelle information pour enrichir la spécification existante.`
			`Réponds UNIQUEMENT avec du JSON valide. Aucun texte avant le JSON, aucun texte après le JSON."""`
			`})`

			`try:`
			`response = await llm.ainvoke(messages)`
			`raw_response = response.content if hasattr(response, 'content') else str(response)`
			`logger.debug(f"[PM Agent] Réponse brute: {raw_response}")`

			`parsed_spec = _extract_json_robust(raw_response)`

			`project_spec = ProjectSpec(**parsed_spec)`
			`logger.info(f"[PM Agent] ✅ Tentative réussie (parsing JSON manuel)")`

			`project_spec = _validate_and_sanitize(project_spec, user_input)`
			`return project_spec`

			`except Exception as e2:`
			`logger.error(f"[PM Agent] ❌ Tentative échouée: {type(e2).__name__}: {str(e2)}")`
			`logger.info("[PM Agent] Fallback: Génération automatique du spec")`

			`return _generate_fallback_spec(user_input)`


			`def _extract_json_robust(response_text: str) -> dict:`
first push 2026-06-12 18:16:58 +02:00			`"""`
Etape 1 OK, sans optionnel 2026-06-16 11:27:41 +02:00			`Extrait et parse le JSON depuis la réponse du LLM.`
			`Robuste pour llama.cpp qui ajoute souvent du texte avant/après le JSON.`
first push 2026-06-12 18:16:58 +02:00			`"""`
Etape 1 OK, sans optionnel 2026-06-16 11:27:41 +02:00
			`logger.debug(f"[JSON Extract] Réponse brute: {response_text}")`

			# Stratégie 1: Chercher un bloc JSON entre ```json et ```
			json_match = re.search(r'```json\s(.?)\s*```', response_text, re.DOTALL)
			`if json_match:`
			`json_str = json_match.group(1).strip()`
			logger.debug(f"[JSON Extract] ✓ Trouvé via ```json block")
			`return json.loads(json_str)`

			# Stratégie 2: Chercher un bloc JSON entre ``` et ``` (sans spécifier json)
			json_match = re.search(r'```\s(.?)\s*```', response_text, re.DOTALL)
			`if json_match:`
			`json_str = json_match.group(1).strip()`
			logger.debug(f"[JSON Extract] ✓ Trouvé via ``` block")
			`try:`
			`return json.loads(json_str)`
			`except json.JSONDecodeError:`
			`logger.debug(f"[JSON Extract] ✗ Code block trouvé mais pas JSON valide")`

			`# Stratégie 3: Chercher directement un objet JSON { ... } en étant très prudent`
			`first_brace = response_text.find('{')`
			`last_brace = response_text.rfind('}')`

			`if first_brace != -1 and last_brace != -1 and last_brace > first_brace:`
			`json_str = response_text[first_brace:last_brace+1].strip()`

			`logger.debug(f"[JSON Extract] Tentative extraction (longueur: {len(json_str)})")`

			`try:`
			`parsed = json.loads(json_str)`
			`logger.debug(f"[JSON Extract] ✓ Trouvé via extraction")`
			`return parsed`
			`except json.JSONDecodeError as e:`
			`logger.debug(f"[JSON Extract] ✗ Extraction invalide: {e}")`

			`# Stratégie 4: Parser tout le texte comme JSON (dernier recours)`
			`try:`
			`parsed = json.loads(response_text.strip())`
			`logger.debug(f"[JSON Extract] ✓ Trouvé via parsing direct")`
			`return parsed`
			`except json.JSONDecodeError:`
			`logger.debug(f"[JSON Extract] ✗ Parsing direct échoué")`

			`# Aucune stratégie n'a fonctionné`
			`logger.error(f"[JSON Extract] ❌ Impossible d'extraire JSON valide")`
			`logger.error(f"[JSON Extract] Réponse brute complète:\n{response_text}")`
			`raise ValueError(f"Impossible d'extraire un JSON valide de la réponse du LLM.\nRéponse: {response_text}")`


			`def _validate_and_sanitize(spec: ProjectSpec, user_input: str) -> ProjectSpec:`
			`"""`
			`Fait confiance au LLM pour la logique métier.`
			`Se contente de s'assurer de la cohérence technique minimale.`
			`"""`
			`logger.debug(f"[Sanitize] Validation du spec généré pour : {spec.title}")`

			`# 1. Sécurité minimale sur les chaînes de texte vides`
			`if not spec.title or spec.title.lower() in ["null", "none", ""]:`
			`spec.title = "Automation Script"`

			`if not spec.description:`
			`spec.description = f"Script d'automatisation basé sur : {user_input[:50]}..."`

			`# 2. Gestion de la complétude :`
			`if not spec.is_complete or (spec.clarifying_question and spec.clarifying_question.strip()):`
			`spec.is_complete = False`
			`if not spec.clarifying_question:`
			`spec.clarifying_question = "Pourriez-vous apporter plus de précisions sur les actions que doit effectuer ce script ?"`
			`logger.info(f"[Sanitize] Le besoin est qualifié d'INCOMPLET par l'agent PM.")`
			`else:`
			`spec.is_complete = True`
			`spec.clarifying_question = None`
			`logger.info(f"[Sanitize] Le besoin est qualifié de COMPLET par l'agent PM.")`

			`return spec`

			`def _generate_fallback_spec(user_input: str) -> ProjectSpec:`
			`"""Génère un ProjectSpec par défaut en cas d'erreur complète."""`

			`logger.warning(f"[Fallback] Génération d'un spec par défaut pour: {user_input}")`

first push 2026-06-12 18:16:58 +02:00			`return ProjectSpec(`
Etape 1 OK, sans optionnel 2026-06-16 11:27:41 +02:00			`title="Automation Script",`
			`description=f"Automatisation du besoin utilisateur: {user_input}",`
			`requirements=[`
			`f"Exécuter l'action demandée: {user_input}",`
			`"Gérer les erreurs",`
			`"Générer des logs"`
			`],`
			`constraints=["PEP 8 strict"],`
			`language="Python",`
			`target_stack="",`
			`io_config={`
			`"has_inputs": False,`
			`"input_type": "none",`
			`"input_paths_or_sources": [],`
			`"has_outputs": False,`
			`"output_type": "log_only",`
			`"output_formats": []`
			`},`
			`auth_config={`
			`"requires_auth": False,`
			`"auth_method": "none",`
			`"target_tools_and_apis": []`
			`},`
			`env_config={`
			`"target_os": "cross_platform",`
			`"language_version": "3.11",`
			`"critical_dependencies": ["logging"]`
			`},`
			`error_handling_strategy="log_and_continue",`
			`is_complete=False,`
			`clarifying_question="Pourriez-vous donner plus de détails sur votre demande ?"`
first push 2026-06-12 18:16:58 +02:00			`)`