API-dokumentaatio

OpenAI-yhteensopiva REST API yritystason kielimallipääsyyn. Integroidu olemassa oleviin työkaluihisi minuuteissa.

Yleiskatsaus

GetYourLLM API tarjoaa yhtenäisen OpenAI-yhteensopivan käyttöliittymän Anthropicin, OpenAI:n, Googlen ja Metan tehokkaimpiin kielimalleihin pääsemiseksi. Olemassa olevat OpenAI SDK -integraatiot toimivat ilman muutoksia muuttamalla vain base_url-osoitteen ja API-avaimen.

Kaikki pyynnöt käsitellään Euroopan unionin sisällä sijaitsevissa konesaleissa. Pyyntöjen sisältöä ei tallenneta, ellei lokitus ole erikseen otettu käyttöön tililläsi.

Tämä API on täysin yhteensopiva virallisen OpenAI Python SDK:n, Node.js SDK:n ja kaikkien OpenAI-spesifikaatiota noudattavien HTTP-asiakkaiden kanssa.

Todennus

Todenna jokainen pyyntö API-avaimellasi Authorization-otsikon kautta. API-avaimia voidaan hallita koontinäytöstä.

Authorization: Bearer gyllm_<sinun-api-avaimesi>

curl-esimerkki

curl https://api.getyourllm.space/chat/completions \
  -H "Authorization: Bearer gyllm_..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "messages": [{"role": "user", "content": "Hei"}]
  }'

Python SDK -esimerkki

from openai import OpenAI

client = OpenAI(
    base_url="https://api.getyourllm.space",
    api_key="gyllm_..."
)

response = client.chat.completions.create(
    model="claude-sonnet-4-6",
    messages=[{"role": "user", "content": "Hei"}]
)
print(response.choices[0].message.content)

Perus-URL

Kaikki API-pyynnöt lähetetään seuraavaan päätepisteeseen:

https://api.getyourllm.space

API tukee vain HTTPS:ää. HTTP-yhteydet ohjataan uudelleen tai hylätään.

Chat completions

Ensisijainen päätepiste tekstin generoimiseen viestisekvenssien perusteella. Tukee suoratoistoa server-sent events -teknologialla.

POST /chat/completions Suoratoisto tuettu

Parametrit

Parametri Tyyppi Kuvaus
model Pakollinen string Käytettävän mallin tunnus. Katso kaikki saatavilla olevat tunnukset malliyleiskatsauksesta.
messages Pakollinen array Viestikohteiden luettelo, joka sisältää role (system, user, assistant) ja content kentät.
max_tokens integer Vastauksen enimmäistokenimäärä. Oletus: mallikohtainen maksimi.
temperature number Vastauksen satunnaisuus. Alue: 0–2. Oletus: 1.
stream boolean Lähetä vastaus palvelinlähetettynä tapahtumavirrana. Oletus: false.
top_p number Ydinotosnäytteistyksen kynnys. Alue: 0–1. Oletus: 1.

Vastaus

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1746009600,
  "model": "claude-sonnet-4-6",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hei, miten voin auttaa?"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 12,
    "completion_tokens": 9,
    "total_tokens": 21
  }
}

Embeddings

Muuttaa tekstin numeerisiksi vektorirepresentaatioiksi semanttista hakua, klusterointia ja hakupohjaista generointia varten.

POST /embeddings

Parametrit

Parametri Tyyppi Kuvaus
model Pakollinen string Embedding-mallin tunnus, esim. text-embedding-3-large.
input Pakollinen string | array Käsiteltävä teksti tai tekstiluettelo.
dimensions integer Haluttu vektoriulottuvuuksien määrä (jos malli tukee).

Malliluettelo

Hae tililläsi saatavilla olevien mallien luettelo.

GET /models Ei pyyntörunkoa
curl https://api.getyourllm.space/models \
  -H "Authorization: Bearer gyllm_..."

Malliyleiskatsaus

Alla olevat mallit ovat käytettävissä API:n kautta. Taulukon mallin tunnukset ovat tarkat arvot, jotka välitetään model-parametrille.

Mallin tunnus Tarjoaja Konteksti Ominaisuudet
claude-opus-4-7 Anthropic 200K Syvä päättely, monimutkainen analyysi
claude-sonnet-4-6 Anthropic 200K Tuotanto-optimoitu, nopeus + laatu
claude-haiku-4-5 Anthropic 200K Suuri volyymi, matala latenssi
gpt-4o OpenAI 128K Multimodaali, funktiokutsut
gpt-4o-mini OpenAI 128K Kustannustehokas, suuri volyymi
o3-mini OpenAI 128K Kehittynyt päättely, matematiikka
gemini-2.5-pro Google 1M Pitkä konteksti, multimodaali
gemini-2.5-flash Google 1M Nopeus, suuret asiakirjat
llama-4-scout Meta 10M Avoimet painot, erittäin pitkä konteksti
llama-4-maverick Meta 1M Avoimet painot, korkea suorituskyky
mistral-large-2 Mistral AI 128K Monikielinen, ohjeiden noudattaminen
deepseek-r2 DeepSeek 128K Ilmainen — kehittynyt päättely
deepseek-v3 DeepSeek 128K Ilmainen — koodi, ohjeet
qwen3-235b Alibaba / Qwen 128K Ilmainen — monikielinen, päättely
gemma-3-27b Google 128K Ilmainen — avoimet painot
phi-4 Microsoft 16K Ilmainen — kevyt, tehokas
mistral-small-3.2 Mistral AI 32K Ilmainen — monikielinen, matala latenssi
text-embedding-3-large OpenAI Embeddings, 3072 ulottuvuutta

Virhekoodit

API palauttaa standardit HTTP-tilakoodit. Virhevastauksiin sisältyy JSON-objekti, jossa on error-kenttä.

{
  "error": {
    "message": "Virheellinen tai vanhentunut API-avain.",
    "type": "authentication_error",
    "code": "invalid_api_key"
  }
}
HTTP-tila Tyyppi Merkitys
400 invalid_request_error Virheellinen pyyntömuoto tai puuttuvat pakolliset parametrit.
401 authentication_error API-avain puuttuu, on virheellinen tai vanhentunut.
403 permission_error Tili ei pääse käsiksi pyydettyyn malliin tai päätepisteeseen.
429 rate_limit_error Pyyntöraja ylitetty. Vähennä pyyntönopeutta tai kasvata kiintiötä.
500 api_error Sisäinen palvelinvirhe. Yritä uudelleen tai tarkista tilusivu.
503 overloaded_error Malli tilapäisesti ylikuormittunut. Ota käyttöön eksponentiaalinen peruutus.

Nopeusrajoitukset

Pyyntörajoitukset sovelletaan API-avainkohtaisesti ja vaihtelevat tilauksen mukaan. Rajoitukset palautetaan vastausotsikkoina:

X-RateLimit-Limit-Requests: 500
X-RateLimit-Remaining-Requests: 487
X-RateLimit-Reset-Requests: 2026-04-30T12:00:00Z
X-RateLimit-Limit-Tokens: 100000
X-RateLimit-Remaining-Tokens: 94231

Jos raja ylitetään, API palauttaa tilakoodin 429. Ota käyttöön eksponentiaalinen peruutus Retry-After-otsikon perusteella.

Suositeltava malli

import time

def completions_with_retry(client, **kwargs):
    for attempt in range(5):
        try:
            return client.chat.completions.create(**kwargs)
        except Exception as e:
            if "429" in str(e):
                time.sleep(2 ** attempt)
            else:
                raise