Add provider implementations (OpenAI, Anthropic, Ollama)

2026-02-04 12:32:11 +00:00
parent de3ffc114e
commit 8e3a8716fa
1 changed files with 106 additions and 0 deletions
--- a/src/promptforge/providers/ollama.py
+++ b/src/promptforge/providers/ollama.py
@@ -0,0 +1,106 @@
 import asyncio
 import time
 from typing import Any, AsyncIterator, Dict, Optional
 import httpx
 from .base import ProviderBase, ProviderResponse
 from ..core.exceptions import ProviderError
 class OllamaProvider(ProviderBase):
    def __init__(
        self,
        model: str = "llama2",
        temperature: float = 0.7,
        base_url: str = "http://localhost:11434",
        **kwargs,
    ):
        super().__init__(None, model, temperature, **kwargs)
        self.base_url = base_url.rstrip('/')
    @property
    def name(self) -> str:
        return "ollama"
    async def complete(
        self,
        prompt: str,
        system_prompt: Optional[str] = None,
        max_tokens: Optional[int] = None,
        **kwargs,
    ) -> ProviderResponse:
        start_time = time.time()
        try:
            async with httpx.AsyncClient() as client:
                payload = {
                    "model": self.model,
                    "prompt": prompt,
                    "stream": False,
                    "options": {
                        "temperature": self.temperature,
                    }
                }
                if max_tokens:
                    payload["options"]["num_predict"] = max_tokens
                response = await client.post(
                    f"{self.base_url}/api/generate",
                    json=payload,
                    timeout=120.0
                )
                response.raise_for_status()
                data = response.json()
                latency_ms = (time.time() - start_time) * 1000
                return ProviderResponse(
                    content=data.get("response", ""),
                    model=self.model,
                    provider=self.name,
                    latency_ms=latency_ms,
                )
        except httpx.HTTPStatusError as e:
            raise ProviderError(f"Ollama HTTP error: {e}")
        except httpx.RequestError as e:
            raise ProviderError(f"Ollama connection error: {e}")
    async def stream_complete(
        self,
        prompt: str,
        system_prompt: Optional[str] = None,
        max_tokens: Optional[int] = None,
        **kwargs,
    ) -> AsyncIterator[str]:
        try:
            async with httpx.AsyncClient() as client:
                payload = {
                    "model": self.model,
                    "prompt": prompt,
                    "stream": True,
                    "options": {
                        "temperature": self.temperature,
                    }
                }
                if max_tokens:
                    payload["options"]["num_predict"] = max_tokens
                async with client.stream(
                    "POST",
                    f"{self.base_url}/api/generate",
                    json=payload,
                    timeout=120.0
                ) as response:
                    async for line in response.aiter_lines():
                        import json
                        data = json.loads(line)
                        if "response" in data:
                            yield data["response"]
        except httpx.HTTPStatusError as e:
            raise ProviderError(f"Ollama HTTP error: {e}")
        except httpx.RequestError as e:
            raise ProviderError(f"Ollama connection error: {e}")
    def validate_api_key(self) -> bool:
        return True