aidial_adapter_openai/completions.py

from typing import Any, Dict from aidial_sdk.exceptions import RequestValidationError from openai import AsyncStream from openai.types import Completion from aidial_adapter_openai.app_config import ApplicationConfig from aidial_adapter_openai.utils.auth import OpenAICreds from aidial_adapter_openai.utils.parsers import ( AzureOpenAIEndpoint, OpenAIEndpoint, ) from aidial_adapter_openai.utils.reflection import call_with_extra_body from aidial_adapter_openai.utils.streaming import ( build_chunk, debug_print, map_stream, ) def sanitize_text(text: str) -> str: return text.replace("<|endoftext|>", "") def convert_to_chat_completions_response( chunk: Completion, is_stream: bool ) -> Dict[str, Any]: converted_chunk = build_chunk( id=chunk.id, finish_reason=chunk.choices[0].finish_reason, message={ "content": sanitize_text(chunk.choices[0].text), "role": "assistant", }, created=chunk.created, is_stream=is_stream, usage=chunk.usage.to_dict() if chunk.usage else None, ) debug_print("response", converted_chunk) return converted_chunk async def chat_completion( data: Dict[str, Any], endpoint: OpenAIEndpoint | AzureOpenAIEndpoint, creds: OpenAICreds, api_version: str, deployment_id: str, app_config: ApplicationConfig, ): if data.get("n") or 1 > 1: raise RequestValidationError("The deployment doesn't support n > 1") client = endpoint.get_client({**creds, "api_version": api_version}) messages = data.get("messages") or [] if not messages: raise RequestValidationError("The request doesn't contain any messages") prompt = messages[-1].get("content") or "" if ( template := app_config.COMPLETION_DEPLOYMENTS_PROMPT_TEMPLATES.get( deployment_id ) ) is not None: prompt = template.format(prompt=prompt) del data["messages"] response = await call_with_extra_body( client.completions.create, {"prompt": prompt, **data}, ) if isinstance(response, AsyncStream): return map_stream( lambda item: convert_to_chat_completions_response( item, is_stream=True ), response, ) else: return convert_to_chat_completions_response(response, is_stream=False)

aidial_adapter_openai/completions.py (69 lines of code) (raw):