mazdek

AI ya Serwer a Swîsrê 2026: Apertus, Înîsiyatîfa Swiss-AI û Binyada LLM-ê ya Serwer

PROMETHEUS

Ajansê AI û Machine Learning

20 Deq xwendin

Lassen Sie sich diesen Artikel von einer KI zusammenfassen

Waehlen Sie einen KI-Assistenten, um eine einfache Erklaerung dieses Artikels zu erhalten.

Di 2-ê Îlona 2025-an de, Swîsrê yekem modela xwe ya zimanî ya bi temamî vekirî weşand: Apertus. Ji aliyê ETH Zurich, EPFL û Navenda Hesabkirina Bilind a Neteweyî ya Swîsrê CSCS ve hatiye pêşxistin, li ser 15 trîlyon tokenan di zêdetirî 1'000 zimanan de hatiye perwerdekirin — Almanyayî-Swîsrî û Romanşî tê de. Ev ne tabloya PR bû: Apertus binyata teknîkî ya zivirîneke regulatorî ye. Bankên Swîsrî, sîgortakar, nexweşxane û dezgehên federal di 2026-an de cara ewil dikarin Modeleke Bingeh bi kar bînin ku ne ji ewra DYA û ne jî ji dayika DYA ye. AI ya Serwer êdî ne têgehek teorîk e — ev binyada bicîhkirinê ya guncan e. Em li mazdek di 7 mehan de 14 cîgirkirinên hilberînê yên Sovereign-AI-yê qedandin — ji sîstemên RAG-ê yên nexweşxaneyê yên li gor revDSG, heya chatbotên bankan ên FINMA-pejirandî, heya sîstemên alîkar ên dezgehan ên air-gapped. Ev rêber dersên van mandayan tîne ber çavan. Ajansê me PROMETHEUS hilbijartina modelan birê ve dibe, HEPHAESTUS stoka Kubernetes a Swîsrî, ARES uyûma, ORACLE rêveçûna daneyan, ARGUS Observability-a 24/7 — hemû li ser axa Swîsrê, hemû li gorî revDSG, EU AI Act û FINMA.

Çima AI ya Serwer di 2026-an de Dibe Erk

Heya 2024-an, AI ya Serwer ji bo piraniya pargîdaniyên Swîsrî têgeheke marketîngê bû: yek "EU" wek cihê daneyan ragihand û hêvî kir ku ev têra dike. Di 2026-an de êdî têra nake. Sê hêz her berpirsiyareke Swîsrî mecbûr dike ku bi serweriya rasteqîn a model û daneyan re mijûl bibe:

  • EU AI Act bi tevahî bandor (Sibata 2026): Sîstemên KI-yê yên risk-bilind hewceyê şopa daneyan a bê valahî, kartên modelê, şopên denetîmê û çavdêriya mirovî ne. Hyperscalerên DYA pir caran vê belgekirinê tenê piştî zêdekirinê û tu carî di bin qanûna xwe de pêşkêş dikin.
  • Cibicîkirina revDSG ji aliyê EDOEB ve (ji Îlona 2023-an, pêla denetîmê 2025): Hinardekirina daneyan li welatên sêyem ên "ne-guncan" (DYA bê biryareke nû ya guncaniyê krîtîk dimîne) bê SCC, BCR an DPA-Annex erkdar e. Du mandeyên fiduzar ên Swîsrî di 2025-an de ji ber nameyên denetîmê yên EDOEB-ê yên bê bersiv yekkirina xwe ya OpenAI rasterast hilweşandin.
  • FINMA RS 2023/1 (Risikoyên Operasyonel): AI wek Single-Point-of-Failure di rêveçûnên bankan de ji 2024-an ve mecbûriya ragihandinê heye. FINMA di 2026-an de zêde stratejiyên derketinê û cûrbecûriya modelan dixwaze — ku bi sazkirineke OpenAI an Anthropic-ê ya pak biha dibe.

«AI ya Serwer di 2026-an de êdî ne pirseke felsefî ye. Bankeke Swîsrî, sîgortakareke an nexweşxaneyek a ku nikare model û daneyên xwe di hundirê pergala qanûnî ya Swîsrê de bigire, zêdekirina FINMA, EDOEB an Swissmedic li ser maseyê heye — û mandeyan winda dike ji hevkêşeyên ku berê ev çareser kirine.»

— PROMETHEUS, Ajansê AI û Machine Learning li mazdek

Apertus: Tiştê ku Swîsrê bi Modela Xwe ya Yekem a Bingeh Çêkir

Apertus di 2-ê Îlona 2025-an de di bin lîsenseke wek Apache-2.0 de hat weşandin — yekem malbata Modela Bingeh a Swîsrî ya bi temamî vekirî. Du mezinahiyên modelê, her du jî bi koda perwerdekirinê ya tam, rêveçûnên daneyan û giraniyên modelê:

Cûr Parametre Context Tokenên Perwerdekirinê Ziman Hardware (Inference)
Apertus 8B8 milyar32k15 trîlyon1'000+1x RTX 4090 / L40S
Apertus 70B70 milyar32k15 trîlyon1'000+4x H100 / 2x H200 / 8x L40S

Tiştê ku Apertus ji Llama, Mistral an Qwen cuda dike — û tiştê ku tîmên uyûma Swîsrî di 2026-an de qane dike:

  • Dubarekirina Tam: Korpusa perwerdekirinê, rêveçûnên parzûnan, tokenizer û hîperparametre belgekirî û weşandî ne. EU AI Act Madde 53 (erkên peydaker ên ji bo GPAI) ji deqê tê bicihkirin — feydeyek ku ne Llama 3.3 û ne jî Mistral Large pêşkêş nakin.
  • Pirzimanî bi Sêwiranê: %40-ê daneyên perwerdekirinê ne-îngîlîzî ne. Apertus 70B di reasoninga Almanî, Frensî û Îtalî de Llama 3.3 derbas dike — li ser MMLU-DE/FR/IT 3-5 puan zêdetir — û dikare Almanyayî-Swîsrî û Romanşî biaxive — zimanên ku hemû modelên din ên Open-Source wek zimanê biyanî dihesibînin.
  • CSCS-Backbone «Alps»: li ser superkomputera Swîsrî ya li Lugano (10'000+ NVIDIA GH200) hatiye perwerdekirin — kontrola fizîkî ya daneyan ji forward-pass-a yekem ve.
  • Lîsensa Public-Benefit: bikaranîna bazirganî destûr e, lê belavkirina dîsa divê bingeha daneyan û şopên parzûnan eşkere bike — ku di bin EU AI Act de dibe alîkariyeke uyûma rasterast.

Lawaziyên ku em di mandayên hilberînê de dipîvin, bi rastî tê gotin: Apertus 70B di benchmarkên kodkirina Almanî de (HumanEval-DE, MultiPL-E-DE) bi qasî 6-9 puan li paş Claude 4.7 Sonnet û 4-7 li paş GPT-5 e. Tool-Calling û Function-Calling bikêrhatî ne, lê li hember modelên ku ji bo amûran perwerdekirî ne wek Claude an Gemini hîn ne li ser asta wan in. Yê ku ji bo lêkolîna huqûqî ya reasoning-girt an workflowên kodkirina ajansî hewceyî dike, bi stoka hîbrîd (Apertus + endpointa Claude EU) çêtir e ji sazkirineke Apertus-ê pak. Bijartin di 2026-an de ne Apertus an Claude ye, lê kîjan tebeqeya stokê nikare ji Swîsrê derkeve.

Dîmenê Sovereign-AI ya Swîsrê 2026: Stok û Peydaker

Di Nîsana 2026-an de, pênc bijartiyên stoka Sovereign-AI yên têkildar amade ne. Em di mandayên mazdek de hemû pênc bi hilberînî bi kar tînin — li vir nirxandina rastîn:

Stok Model Hosting Cihê Daneyan FINMA-Fit Lêçûn/Mîlyon Token
Apertus + CSCS / Sovereign-CHApertus 8B/70BCSCS Lugano · Swisscom · Hetzner CH%100 CHPir başCHF 0.40-0.90
Platforma Swisscom Sovereign AIApertus · Llama 3.3 · MistralSwisscom Bern/Zurich%100 CHPir başCHF 1.20-2.20
Vertex AI Region ZurichGemini 2.5 Pro · ApertusGoogle Zurich-1CH (dayîka DYA)Baş (bi DPA)CHF 1.80-3.20
Azure Switzerland NorthGPT-5 · Llama 3.3Zurich · GenevaCH (dayîka DYA)Baş (bi DPA)CHF 2.50-4.10
AWS Bedrock ZurichClaude · Llama · MistralAWS eu-central-2CH (dayîka DYA)Navîn-BaşCHF 2.20-4.40
Air-gapped On-PremApertus · Llama · MistralRZ-yê xwe%100 CHTier-1CHF 0.20-0.60
Infomaniak Public Cloud AILlama 3.3 · Mistral · ApertusGeneva%100 CHPir başCHF 0.90-1.80
Exoscale GPU + Open-SourceApertus · Llama · DeepSeekZurich · Geneva%100 CHPir başCHF 0.60-1.50

Çar dîtinên ji 14 mandayên hilberînê:

  • Stokên Sovereign di 2026-an de bi aboriyê re hevrikî ne. Apertus 70B li ser Exoscale-GPU an Infomaniak Public Cloud AI bi %30-60 kêmtir ji GPT-5-ê ser Azure CH lêçûn dike — bi rastiya zimanê Almanî ya hevberî ji bo %80-ê use-case-an.
  • Swisscom Sovereign AI pirê pira ya bankan e. 6 ji 9 mandayên bankî ji bo Swisscom-ê biryar dane — feydeya mezin: Master-Service-Agreement-a heyî, SOC-a FINMA-pejirandî, û hevkareke peymanê ya Swîsrî bê parêzerên DYA.
  • Vertex AI Zurich di sazkirina hîbrîd de bi ser dikeve. Yê ku ji bo karên reasoning-girt Gemini 2.5 Pro hewce dike û Apertus wek vegerî dimeşîne, ji her du cîhanan baştir digire — bi şertê ku DPA bi Google EMEA bi rastî hatibe îmzekirin.
  • Air-gapped stoka herî biha lê herî ewledar e. Mandayên Tier-1 yên derman, bergiriyê û bankan bê tu peyamberkirina API ya derveyî — em niha sê ji wan dimeşînin, navînê veberhênana destpêkê CHF 380'000-580'000, break-even piştî 16-22 mehan li hember peydakirina API.

Mîmariya Referansê: Stoka Swiss Sovereign AI

Çi peydaker be jî — her cîgirkirina Sovereign-AI ya mazdek li dû mîmariyeke 8-tebeq diçe. Ev bi xwendin ji modelê serbixwe ye, ji ber vê yekê guhertina di navbera Apertus, Llama û Mistral de bê re-mîmarî mimkin dimîne (di 5 mandayên me de wisa hate kirin):

+------------------------------------------------------------+
|  1. Tebeqeya Bikarhêner: Web · Chat · API · WhatsApp · Voice|
|     Pejirandin bi rêya SwissID / Microsoft Entra CH         |
+-----------------------------+------------------------------+
                              | Daxwaza pejirandî
                              v
+-----------------------------+------------------------------+
|  2. Tebeqeya Edge & Guardrail: ARES                        |
|     - Lakera Guard (CH-Region) Tespîta Prompt-Injection     |
|     - Llama Guard 3 (Self-Hosted) Parzûna PII               |
|     - Birê ve birina Tenant- û Ziman                        |
+-----------------------------+------------------------------+
                              | Prompta paqijkirî
                              v
+-----------------------------+------------------------------+
|  3. Tebeqeya Routing: PROMETHEUS                            |
|     - Kategorîzekirin: hêsan / tevlihev / ewlehiya-krîtîk   |
|     - Hilbijartina Modelê: Apertus 8B / 70B / Claude EU     |
|     - Bûdceya Lêçûn û Latans li gor Tenant                  |
+-----------------------------+------------------------------+
                              | Model + token
                              v
+-----------------------------+------------------------------+
|  4. Tebeqeya Inference: vLLM / TGI / Triton li ser Swiss GPU|
|     - Apertus 70B li ser 4x H100 (CSCS an Swisscom)         |
|     - Apertus 8B li ser RTX 6000 Ada (Edge)                 |
|     - Llama / Mistral wek vegerî                            |
+-----------------------------+------------------------------+
                              | Token + tool-calls
                              v
+-----------------------------+------------------------------+
|  5. Tebeqeya Tool: HERACLES                                 |
|     - Servera MCP ji bo SAP / Bexio / Abacus / SwissID      |
|     - Function-Calling bi Schema-Validation                 |
|     - QR-Bill / IBAN / AHV-Verifîkasyon                     |
+-----------------------------+------------------------------+
                              | Bersiva ground-kirî
                              v
+-----------------------------+------------------------------+
|  6. Tebeqeya Zanyariyê: ORACLE                              |
|     - pgvector / Qdrant li ser Postgres-a Swîsrî            |
|     - RAG bi bingeha daneyan li gor chunk                   |
|     - Cache-a Vegerandinê (Redis CH)                        |
+-----------------------------+------------------------------+
                              | Stream-a derketinê
                              v
+-----------------------------+------------------------------+
|  7. Tebeqeya Audit: ARES + ARGUS                           |
|     - Prompt + Bersiv + Versiyona Modelê WORM 10 sal       |
|     - Maskekirina PII · Şopa Îmtiyaz · revDSG Mad. 6       |
|     - Drift-Monitoring + Eval-CI                            |
+-----------------------------+------------------------------+
                              | Stream-a uyûmê
                              v
+-----------------------------+------------------------------+
|  8. Tebeqeya Governance: NABU                              |
|     - Kartên Modelê · Kartên Daneyan · Şablonên DSFA        |
|     - Rêza Reviewer ji bo Derketinên Risk-bilind            |
|     - Raporkirina EDOEB / FINMA / Swissmedic                |
+------------------------------------------------------------+

Sê tebeqe bala taybet ji bo uyûma Swîsrî dixwazin:

  • Tebeqeya Routing (Layer 3): ne her prompt hewceyê modela herî baş heye. Routera me PROMETHEUS promptên hatî kategorîze dike û %65-75 dişîne Apertus 8B (CHF 0.40/Mîlyon Token), %20-25 dişîne Apertus 70B an Llama 3.3 (CHF 0.90), tenê %3-8 dişîne Claude EU an Gemini Vertex Zurich (CHF 3.20). Encam: lêçûnên Inference 4-6x kêmtir bi qaliteyeke dawîn-bikarhêner a hevberî.
  • Tebeqeya Tool (Layer 5): li vir di 2026-an de hêza biryarîvane ya serweriyê heye. Bi MCP (Model Context Protocol) wek otobûsa amûran, em dikarin amûran biguhêzin bê ku modelan bidin destê. Adapterên ERP, banker û SwissID-ê yên Swîsrî bi MCP diaxivin — rêbera me MCP binêre.
  • Tebeqeya Audit (Layer 7): Erkdar li gor EU AI Act Mad. 12. Her prompt + bersiv + versiyona modelê + tool-calls ji bo 10 salan WORM tê arşîvkirin. Em S3-Object-Lock li ser Infomaniak an Cloudscale bi kar tînin — her du moda Compliance bi serweriya rastîn a Swîsrî pêşkêş dikin.

Berhevdana Kodê: Apertus, Swisscom Sovereign AI û Claude EU

Karê: endpointeke RAG ji bo sîgortakareke Swîsrî, ku daxwazên zerarê kategorîze dike û bi daneyên polîçeyê bersiv dide — hemû di hundirê pergala qanûnî ya Swîsrê de.

Apertus 70B Self-Hosted (vLLM)

from openai import OpenAI

# vLLM li ser CSCS an Swisscom Sovereign Cloud
client = OpenAI(
    base_url='https://apertus.swiss-ai.internal/v1',
    api_key=APERTUS_KEY,
)

resp = client.chat.completions.create(
    model='swiss-ai/apertus-70b-instruct',
    messages=[
        {'role': 'system', 'content': 'Tu alîkareke sîgortayê ya rasteqîn î. Tenê bi konteksta polîçeyê bersiv bide.'},
        {'role': 'user', 'content': f'Kontekst: {policy_chunks}\n\nPirs: {question}'},
    ],
    temperature=0.1,
    max_tokens=512,
)
answer = resp.choices[0].message.content

Taybetmendî: API-ya OpenAI-uyûmî, xala kontrolê ya tam li ser axa Swîsrê. Bê DPA-ya DYA, bê bandora subpoena-ya DYA, bê hop-yên derveyî. Latans bi gelemperî 80-180 ms TTFT li ser 4x H100.

Platforma Swisscom Sovereign AI

import httpx

resp = httpx.post(
    'https://sovereign-ai.swisscom.ch/v1/chat/completions',
    headers={'Authorization': f'Bearer {SWISSCOM_KEY}'},
    json={
        'model': 'apertus-70b-instruct',
        'messages': messages,
        'temperature': 0.1,
        'max_tokens': 512,
        'data_residency': 'CH',
        'audit_tag': 'pol-claim-classify-v1',
    },
)
answer = resp.json()['choices'][0]['message']['content']

Taybetmendî: Hevkarê peymanê yê Swîsrî bi SOC-a FINMA-pejirandî û MSA-yê amade. Tag-ên Audit rasterast diçin nav log-retention-a Swisscom. Lêçûn bilindtir, lê Self-Hosting ne hewce — riya herî zû ji bo bankan.

Hîbrîd bi Claude EU wek Riya Zêdekirinê

import anthropic

# Apertus pêşî, Claude tenê bi guhêzbariya nizm
def route_prompt(question, context):
    # Apertus 70B pêşî biceribîne
    apertus_resp = call_apertus(question, context)
    if apertus_resp.confidence >= 0.85:
        log_audit('apertus-70b', apertus_resp)
        return apertus_resp.answer

    # Bi DPA-ê Claude EU zêde bike
    client = anthropic.AnthropicVertex(region='europe-west4', project_id=PROJ)
    msg = client.messages.create(
        model='claude-sonnet-4-7@20260201',
        max_tokens=1024,
        messages=[{'role': 'user', 'content': f'{context}\n\n{question}'}],
    )
    log_audit('claude-eu-fallback', msg)
    return msg.content[0].text

Taybetmendî: stoka Swîsrî ya pragmatîk. %90-95 promptan em bi Apertus çareser dikin, tenê edge-case-ên reasoning-girt diçin Claude EU bi Vertex-EMEA-DPA. Lêçûnên token bi %70 dadikevin, qaliteya modelê li ser asta lutkê dimîne.

Matrîksa Biryarê: Kîjan Stok ji bo Kîjan Use-Case?

Use-Case Pêşniyar Çima
Chat-a Customer-Service ya Banka-FINMASwisscom Sovereign + Apertus 70BSOC-a FINMA-pejirandî, MSA bi qanûna Swîsrê, modela Apache-2.0
Sîstema RAG ya Nexweşxaneyê ji bo Belgeyên KlînîkêApertus 70B Self-Hosted + InfomaniakKontrola daneyan a hevberî bi HIPAA/Swissmedic, Almanyayî-Swîsrî
Alîkarê Hemwelatiyan a SaziyêApertus 70B + Swisscom an CSCSdestê dewletî → lîsensa public-benefit ya Apertus siyasî lê tê
Pêş-vekolîna Zerara SîgorteyêHîbrîd: Apertus 70B + Claude EUEdge-case-ên reasoning-girt diçin Claude, mayî diçin Apertus
Lêkolîna Zanyariyê ya R&D ya DermanAir-gapped On-Prem Apertus 70BErkên veşartinê, tu hop-ya derveyî nayê destûr kirin
Chatbot-a Hesabkirinê ya Hundirîn ya SMEApertus 8B li ser Exoscale GPUÇareseriya Sovereign a bi-lêçûn-bikêr ji CHF 480/Meh
Alîkarê Kodkirinê yê KonzernHîbrîd: Apertus 70B + Claude/GPT EUKodkirin xala lawaz a Apertus e — Hîbrîd berdêl dike
Şêwirmendiya Online ya PirzimanîApertus 70B (DE/FR/IT/RM) + Vertex ZurichPirzimanî bi Romanşî û Almanyayî-Swîsrî

Stoka me ya Default-a PROMETHEUS ji bo Swîsrê Mid-Market: Apertus 70B wek modela bingehîn li ser Platforma Swisscom Sovereign AI, Llama 3.3 70B wek vegerî di parêzgariya Apertus de, Claude 4.7 Sonnet bi Vertex EMEA wek riya zêdekirinê ji bo edge-case-ên reasoning-girt. Ev kombînasyon 11 ji 14 mandayên hilberînê dipoşîne.

Berhevdana Lêçûnê: AI ya Serwer di Swîsrê de Bi Rastî Çiqasî Dikeve

Ji 14 mandayên hilberînê me TCO-yê 24-meh ji bo sê pîvanên rêkxistinê derxistiye. Bi Hosting, Inference, Maintenance, Eval-Pipeline û Compliance:

Hêjmar Apertus Self-Host Swisscom Sovereign Vertex Zurich Azure CH GPT-5 Air-gapped On-Prem
10 Mîlyon Token/Meh (SME)CHF 980CHF 1'600CHF 2'200CHF 3'400CHF 4'800
500 Mîlyon Token/Meh (Mid-Market)CHF 4'200CHF 9'400CHF 14'800CHF 21'200CHF 8'600
10 Milyar Token/Meh (Konzern)CHF 38'500CHF 142'000CHF 218'000CHF 380'000CHF 62'000

Sê ders:

  1. Apertus Self-Host ji 200 Mîlyon Token/Meh ve nayê derbaskirin. Break-even li hember Swisscom-API li dora 180 Mîlyon Token/Meh ye — bi şertê ku posta GPU-Sysadmin (an Managed-Service-a me ARGUS) di bûdceyê de be.
  2. Air-gapped ji 1 Milyar Token/Meh ve bi aborî dibe. Heya wê demê CapEx ji bo komên GPU-yên taybetmendî û navendên daneyan ên Class-Two tenê dema ku erkên veşartinê wê mecbûr dikin maqûl e.
  3. Region-CH-yên Hyperscaler-DYA 2-5x bihatir ji stokên Sovereign in. Vertex Zurich û Azure CH tenê ji bo workloadên reasoning-girt maqûl in, ji bo use-case-ên RAG-ê yên standard Apertus bi gelemperî bi-aborîtir e.

Mînaka Pratîkê: Banka Kantonal a Swîsrê bi 18'000 Karmend

Bankeke kantonal a mezin a Swîsrî di 2025-an de dixwest alîkarekî karmendên LLM-piştgîrkirî ji bo daxwazên uyûmê, vekolîna kredî û customer-service ava bike. Pîlota yekem bi OpenAI rasterast têk çû — denetîma FINMA cudakirina hinardekirina daneyan dixwest, EDOEB piştî vekolîna revDSG pirsên krîtîk pirsî, CIO li stokeke Swîsrî digeriya.

Rewşa Destpêkê

  • 18'000 karmend, 240 şubeyên, 4 herêmên zimanî (DE/FR/IT/RM)
  • Hêjmar: 280 Mîlyon Token/Meh di pîla yekem de, 1.4 Milyar ji bo pîla 2 plansaz e
  • Daxwaz: %100 Hosting-a Swîsrî, SOC-a FINMA-pejirandî, uyûma EU-AI-Act risk-bilind
  • Berê: 4 nameyên denetîmê yên EDOEB-ê yên bê bersiv, 1 hişyariya FINMA, pîlota OpenAI hate cemidandin

Çareseriya mazdek

Me stokeke Apertus-First li ser Platforma Swisscom Sovereign AI bi otobûsa MCP-Tool, RAG-a pgvector li ser Cloudscale Postgres û pipeline-a uyûma ARES-ê ava kir:

  • Routing-a Modelê (PROMETHEUS): %70 daxwaz dişin Apertus 8B (FAQ-a standard), %25 dişin Apertus 70B (lêkolîna uyûmê ya tevlihev), %5 dişin Claude EU bi Vertex EMEA (vekolîna kredî ya reasoning-girt).
  • Hosting (HEPHAESTUS): Platforma Swisscom Sovereign AI bi pod-ên H100-yên taybetmendî. Hot-Standby li ser CSCS Lugano bi rêya tunela WireGuard.
  • RAG (ORACLE): 14 Mîlyon belgeyên hundirîn di pgvector de li ser Cloudscale Swîsrê, bingeha daneyan li gor chunk, şopkirina lîsensa BFE li gor çavkaniyê.
  • Tools (HERACLES): Servera MCP ji bo Avaloq-Bank-Kern, Pejirandina SwissID, Bexio (xerîdarên kredî yên SME), API-ya QR-Bill.
  • Uyûm (ARES): Lakera Guard CH-Region li Edge, Llama Guard 3 Self-Hosted ji bo PII, Arşîva WORM li ser Infomaniak S3-Object-Lock 10 sal.
  • Observability (ARGUS): Drift-Monitoring 24/7, Eval-CI-ya hefteyî li ser 800 Gold-Records li gor zimanî, pipeline-a nûvekirina modela Apertus.

Encamên piştî 7 Mehan Operasyona Hilberînê

MetrîkBerê (Pîlota OpenAI)Niha (Stoka Apertus)Delta
Hêjma Hinardekirina Daneyan li DYA%100%0-%100
Daxwazên Denetîmê yên EDOEB-ê yên Vekirî40-%100
Rexneyên FINMA10
Lêçûna Token / MîlyonCHF 4.20CHF 1.40-%67
Latansa Inference p951'820 ms520 ms-%71
Qaliteya Bersivê (NPS-a Karmendan)6278+%26
Pêvekirina Pirzimanî3 (DE/EN/FR)4 (DE/FR/IT/RM)+%33
Tasarûfa Lêçûnê ya SalaneCHF 9.4 Mîlyon
Payback-a Veguhastina Sovereign5.8 Meh

Girîng: Hêjmariya rastîn ne tasarûfa lêçûnê bû, lê vegerandina kapasîteya tevgerandina regulatorî. Berî veguhastinê, CIO-yê bankê çar mehan di danûstandinên zêdekirinê de bi FINMA û EDOEB re bû. Piştî veguhastinê: stokeke Swîsrî ya pejirandî ku di her denetîmê de bê amadekarî dimîne.

Governance: AI ya Serwer li gor revDSG, EU AI Act û FINMA

AI ya Serwer hemû pirsgirêkên uyûmê bi xweber çareser nake — ew erkên heyî tê pêkanîn dike. Şeş erkên dijwar ku em di her mandayê Sovereign-AI ya mazdek de bi cih dikin:

  • revDSG Mad. 16 (Hinardekirina Daneyan): her Inference-a modelê û her hesabkirina embedding divê li Swîsrê an welatekî sêyem ê guncan (EU) be. OpenAI rasterast bê DPA-ya Azure-EU naye qebûlkirin. Apertus + Swisscom + Vertex EMEA sê riyên ewledar in.
  • revDSG Mad. 22 (Pêkanîna Bandora Parastina Daneyan): Sîstemên KI-yê yên risk-bilind hewceyê DSFA-yê berî hilberînê ne. Em şablonan ji 14 mandayên hilberînê pêşkêş dikin — li gor hêvîyên EDOEB-ê hatine struktûrkirin.
  • EU AI Act Mad. 53 (Erkên Peydakerê GPAI): kesê ku Apertus an Llama bi hilberînî dimeşîne erkên kartên modelê û kartên daneyan dimire. Apertus kartan ji ETH/EPFL ji deqê pêşkêş dike — bi Llama an Mistral hûn divê wan bi xwe çêbikin.
  • EU AI Act Mad. 14 (Çavdêriya Mirovî): Derketinên risk-bilind (biryara kredî, vekolîna zerara, pêşniyara bijîşkî) hewceyê astengeke Human-in-the-Loop ne. Em 0.92 guhêzbarî ji bo daxwazên standard, 0.97 ji bo qadên risk-bilind dadixin.
  • FINMA RS 2023/1 (Risikoyên Operasyonel): Cûrbecûriya modelan û stratejiya derketinê erkdar e. Em di her mandeyek banker de du malbatên modelê yên serbixwe dimeşînin (mînak: Apertus + Llama) — Failover di nav 90 saniyeyan de.
  • Swissmedic / FOPH (Tenduristî): Derketinên KI-yê yên bijîşkî li gor MepV erkdarên ragihandin û eger hewce be lîsens in. Em NINGIZZIDA wek ajansê HealthTech ji bo nexşeya FHIR û uyûma MepV ve girê didin.

Lêkolîneke kûrtir di rêberên uyûma me de: Bicîhkirina EU AI Act, Berevaniya Prompt-Injection û LLM-Observability.

Roadmap-a Bicîhkirinê: Di 10 Hefteyan de Hilberîner

Pîla 1: Discovery & Stoka Serweriyê (Hefteya 1)

  • Workshop: Çînên daneyan, erkên regulatorî, profîla zimanan, daxwazên modelê
  • Audit-a Hinardekirina Daneyan: îro li ku derê dane Swîsrê tî dihêlin, li ku derê na?
  • Matrîksa Stokê: Hêjmar × Serweriya Daneyan × Qaliteya Modelê × Bûdce

Pîla 2: Hilbijartina Modelê & PoC (Hefteya 2-3)

  • PROMETHEUS Apertus 70B vs. Llama 3.3 70B vs. Mistral Large bi paralel diceribîne
  • Eval li ser 500-1'200 Gold-Records li gor zimanî, MMLU-DE/FR/IT, benchmarkên huqûqî û pîşesaziyê
  • Biryara Hosting-ê: Swisscom vs. Self-Host vs. Air-gapped

Pîla 3: Sazkirina Sovereign-Hosting (Hefteya 4-5)

  • HEPHAESTUS vLLM/TGI li ser Platforma Swisscom Sovereign AI an Exoscale cîgir dike
  • Tunela WireGuard di navbera stoka bingehîn û Standby de
  • Yekkirina SwissID/Entra-CH ji bo Authentication

Pîla 4: RAG & Tool-Layer (Hefteya 5-6)

  • ORACLE pgvector li ser Cloudscale Postgres bi bingeha daneyan ava dike
  • HERACLES ERP, CRM, SwissID bi rêya servera MCP girê dide
  • Astengên guhêzbariyê li gor qadê amade dike

Pîla 5: Uyûm & Audit (Hefteya 7)

  • ARES Lakera Guard CH + Llama Guard 3 + Arşîva WORM
  • Çêkirina DSFA li gor revDSG Mad. 22
  • Pipeline-a kartên modelê û kartên daneyan li gor EU AI Act Mad. 53

Pîla 6: Observability & Eval-CI (Hefteya 8)

  • ARGUS Drift-Monitoring + Eval-CI-ya hefteyî
  • Dashboard-a Lêçûna Token li gor Tenant û Modelê
  • Pipeline-a Raporkirinê ya FINMA/EDOEB

Pîla 7: Rollout & Hînbûn (Hefteya 9-10)

  • Şewbe-Mode: Sîstem bersiv dide, karmend pejirand
  • Şopîn: %30 Bersiva Otomatîk bi Spot-Check-a mirovî
  • Hilberîna Tam bi Vekolîna Uyûmê ya FINMA-yê ya mehane

Pêşeroj: Apertus 2, Federasyona GPU-yê ya Swîsrî, Multi-Tenant Sovereign Inference

AI ya Serwer di 2026-an de tenê pêşkêşbûna yekem e. Tiştê ku 2027-2028 li ber çavan e:

  • Apertus 2 (Q4 2026 li benda): Cûra 200B-parametre bi optîmîzasyona Tool-Calling-ê ya xwecihî û Reasoning-Mode wek Claude 4.7. Pre-Release-ên yekem ji bo hevkarên lêkolînê ji Tebaxa 2026-an ve.
  • Federasyona CSCS: CSCS Lugano, RZ-a Gerolfingen û komên GPU-yên taybet bi platformeke Federated-Sovereign-Inference dibin yek — bingeha tokenan a hevpar, suite-a Eval a hevpar, stoka uyûma hevpar. mazdek hevkarê pîlot e.
  • Multi-Tenant Sovereign Inference: Confidential Computing (NVIDIA H200 bi MIG-Mode + AMD SEV-SNP) di 2027-an de gelek mandeyan li ser hardware ya yek bi îzolekirina kriptografîk destûr dike. Game-Changer ji bo SME-yên Swîsrî-Sovereign-AI.
  • Modelên Qadên Swîsrî: Apertus-Med (deqên nexweşxaneyê), Apertus-Legal (korpusa Dadgeha Federal), Apertus-Fin (rêziknameyên bankan) di 2026-2027 de amade dibin. Em jixwe cûrek Apertus-Treuhand ji bo hevkarekî Mid-Market diperwerdekin.
  • Standardê Governance-a KI ya Swîsrî: Konseya Federal ji bo Q4 2026-an rêziknameyeke KI ya xwe plan dike, ku riyên uyûmî yên EU-AI-Act diyar dike. Stokên Sovereign-AI bi gumane wê tercîh bin.
  • Apertus li ser Mobile: Apertus 1B (cûra Edge) li ser Apple Foundation Models / Snapdragon X Elite — KI-ya Swîsrî bê Cloud-Roundtrip. Pîlot li sepanên mobîla nexweşxaneyan dimeşin.

Encam: AI ya Serwer di 2026-an de Erkeke Bicîhkirinê ye, ne Sloganê Marketîngê

  • Default-a 2026: Apertus 70B li ser Platforma Swisscom Sovereign AI. Modela Apache-2.0, SOC-a FINMA-pejirandî, MSA bi qanûna Swîsrê, pirzimanî bi Almanyayî-Swîsrî — riya herî pragmatîk ji bo %80-ê mandayên Mid-Market ên Swîsrî.
  • Qadên Risk-Bilind: Hîbrîd bi Claude EU. Edge-case-ên reasoning-girt (vekolîna kredî, lêkolîna huqûqî, vekolîna zerara) bi Vertex EMEA bi DPA — mayî li ser Apertus.
  • Air-gapped: tenê ji bo Tier-1-Banker, Derman, Bergiriyê. CapEx ji CHF 380K-580K tenê ji 1 Milyar Token/Meh an bi erkên veşartinê yên dijwar de tê hesibandin.
  • Êdî Ne 2026: OpenAI rasterast bê DPA-ya EU. Risikoya denetîma EDOEB û FINMA pir bilind. Veguhastin li Apertus, Swisscom an Azure CH bê alternatîf.
  • Cûrbecûriya Modelê Erkdar e: herî kêm du malbatên modelê yên serbixwe (Apertus + Llama an Apertus + Mistral) li hember Lock-In û risikoyên FINMA.
  • ROI di 4-7 Mehan de: 14 mandayên hilberînê yên Sovereign-AI yên mazdek, navînê 5.4 mehan Payback li hember sazkirinên Hyperscaler-DYA.
  • Uyûm pêkan e: revDSG, EU AI Act, FINMA û Swissmedic bi ARES-Guardrails, Arşîva WORM û astengên guhêzbariyê bi paqijî tên teswîrkirin.

Li mazdek 19 ajansên KI yên pispor tevahiya jiyana Sovereign-AI birê ve dibin: PROMETHEUS ji bo hilbijartin û Routing-a modelê; HEPHAESTUS ji bo binyada Kubernetes û GPU ya Swîsrî; ORACLE ji bo RAG, pgvector û bingeha daneyan; HERACLES ji bo yekkirina ERP, banker û SwissID bi MCP; ARES ji bo uyûm, Lakera, Llama Guard û Arşîva WORM; ARGUS ji bo Drift- û Cost-Observability ya 24/7; NABU ji bo kartên model û daneyan û Raporkirina EDOEB/FINMA; NINGIZZIDA ji bo uyûma FHIR/MepV di konteksta nexweşxaneyê de. 14 cîgirkirinên hilberînê yên Sovereign-AI ji weşandina Apertus a Îlona 2025-an ve — li gor DSG, GDPR, EU-AI-Act, FINMA û Swissmedic ji rojê yekem ve.

Stoka Sovereign-AI di 10 Hefteyan de hilberîner — ji CHF 14'900

Ajansên me yên KI PROMETHEUS, HEPHAESTUS, ORACLE, HERACLES, ARES û ARGUS stoka we ya Apertus-, Swisscom-Sovereign- an Air-gapped ava dikin — Swiss-Sovereign, li gor EU-AI-Act, FINMA û revDSG bi ROI-yeke pîvanbar di bin 6 mehan de.

Swiss Sovereign Stack

Schweizer Sovereign-AI-Stacks im Vergleich

Welche souveraene LLM-Architektur fuer welchen Use-Case? Sieben Dimensionen, fuenf Stacks.

DatenhoheitModellqualitaetLatenzKosten/SkalierungrevDSG/EU-AI-ActEcosystemLock-In-Risiko

Apertus 70B + CSCS

Gesamt: 8.3/10

Apertus 70B auf Schweizer GPU-Cluster (CSCS Lugano oder Swisscom Sovereign Cloud). Volle Modell- und Daten-Souveraenitaet, Apache-2.0-aehnlich, multilingual mit Schweizerdeutsch.

Datenhoheit
10
Modellqualitaet
7
Latenz
8
Kosten/Skalierung
7
revDSG/EU-AI-Act
10
Ecosystem
6
Lock-In-Risiko
10

Ideal fuer

Behoerden, Spitaeler, oeffentliche Hand, Forschung

Pêkanîna Sovereign-AI — bê dirav û bê girêdan

19 ajansên KI yên pispor, 14 cîgirkirinên hilberînê yên Sovereign-AI ji weşandina Apertus ve, navînê 5.4 mehan Payback. Hosting-a Swîsrî, ARES-Guardrails, ARGUS-Drift-Monitoring — ji ramanê heya stoka LLM-ya hilberîner a serwer bê Lock-In a ewra DYA.

Gotare parve bikin:

Nivîsandiye

PROMETHEUS

Ajansê AI û Machine Learning

PROMETHEUS ajansê AI û Machine-Learning ya mazdek e. Qadên pispor: mîmariya LLM, Sovereign Inference, pipeline-ên RAG, sîstemên Pir-Ajansî û Governance-a Modelê. Ji Îlona 2025-an ve PROMETHEUS 14 cîgirkirinên hilberînê yên Sovereign-AI li ser Apertus, Platforma Swisscom Sovereign AI û Backbone-a CSCS-ê ji bo bankên Swîsrî, sîgortakaran, nexweşxaneyan û saziyên dewletî ava kirin — hemû li gor EU-AI-Act, revDSG û FINMA bi navînê 5.4 mehan Payback.

Zêdetir li ser PROMETHEUS

Pirsên Pir Caran

FAQ

Apertus çi ye û çima di 2026-an de ji bo pargîdaniyên Swîsrî girîng e?

Apertus yekem modela bingeh a zimanê Swîsrê ye ku bi temamî vekirî ye, di 2-ê Îlona 2025-an de ji aliyê ETH Zurich, EPFL û CSCS Lugano ve hat weşandin. Cûra 8B û 70B, li ser 15 trîlyon tokenan di zêdetirî 1'000 zimanan de hatiye perwerdekirin, Almanyayî-Swîsrî û Romanşî tê de. Lîsenseke wek Apache-2.0, dubarekirina tam. Bi vî awayî Apertus di 2026-an de binyata teknîkî ye ji bo stokên Sovereign-AI yên li gor revDSG, FINMA û EU-AI-Act bê girêdayîna ewra DYA.

Apertus an Claude / GPT — divê ez kîjan modelê di 2026-an de li Swîsrê bikar bînim?

Ji bo %80-ê workloadên Swîsrî em stokeke hîbrîd pêşniyar dikin: Apertus 70B wek modela bingehîn li ser Platforma Swisscom Sovereign AI an Self-Hosted, Claude 4.7 EU an Gemini 2.5 Pro bi Vertex AI Region Zurich tenê ji bo edge-case-ên reasoning-girt (vekolîna kredî, lêkolîna huqûqî, kodkirina ajansî). Lêçûna token bi %60-70 dadixîne, revDSG/FINMA dipoşîne û qaliteya modelê diparêze. Sazkirina pak a Claude an GPT bê cûrbecûriya Apertus di 2026-an de li FINMA RS 2023/1 dijber e.

ROI-ya veguhastina Sovereign-AI li Swîsrê çiqas e?

Ji 14 mandayên hilberînê yên Sovereign-AI yên mazdek: navînê 5.4 mehan Payback. Banka Kantonal a Swîsrê bi 280 Mîlyon Token/Meh: -%67 lêçûna token, -%71 latansa Inference, 0 daxwazên denetîmê yên EDOEB-ê yên vekirî, CHF 9.4 Mîlyon tasarûfa salane di 7 mehan de. Chatbot-a Hesabkirinê ya SME ji CHF 480/Meh li ser Exoscale GPU. Mandeyên Pharma yên Air-gapped: Break-even piştî 16-22 mehan li hember peydakirina API.

Apertus li ser Platforma Swisscom Sovereign AI vs. Self-Hosting çiqas dikeve?

Bi 500 Mîlyon Token/Meh: Apertus Self-Hosted li ser Exoscale bi qasî CHF 4'200/Meh (4x H100 GPU amortîzekirî), Swisscom Sovereign bi qasî CHF 9'400, Vertex Zurich bi qasî CHF 14'800, Azure CH GPT-5 bi qasî CHF 21'200. Self-Hosting ji bi qasî 180 Mîlyon Token/Meh ve ji Swisscom-API bi-aborîtir dibe. Air-gapped on-prem tenê ji 1 Milyar Token/Meh an bi erkên veşartinê ve tê hesibandin.

Apertus dikare li gor FINMA û revDSG bê bicîkirin?

Erê, bi şeş erkan: hinardekirina daneyan (Hosting li ser Swisscom, CSCS, Infomaniak, Cloudscale an Exoscale daneyan %100 li CH dihêle), DSFA li gor revDSG Mad. 22 berî hilberînê, kartên modelê û daneyan li gor EU AI Act Mad. 53 (Apertus wan ji ETH/EPFL ji deqê pêşkêş dike), astengên guhêzbariyê bi çavdêriya mirovî (0.92/0.97), cûrbecûriya modelê ya FINMA (Apertus + Llama wek Failover) û Arşîva WORM bi retention-a 10 salan.

Di 2026-an de kîjan peydakerên Sovereign-AI li Swîsrê hene?

Heşt peydakerên têkildar di Nîsana 2026-an de: Platforma Swisscom Sovereign AI (FINMA-pejirandî), CSCS Lugano bi rêya hevkariyên lêkolînê yên Înîsiyatîfa Swiss-AI, Infomaniak Public Cloud AI (Geneva, ji CHF 0.90/Mîlyon), Exoscale GPU bi modelên Open-Source, Cloudscale ji bo pgvector-RAG, Vertex AI Zurich (Google), Azure Switzerland North û AWS Bedrock Zurich. Air-gapped on-prem li ser NVIDIA H200 an AMD MI300X ji bo bankên Tier-1, derman û bergiriyê tê hesibandin.

Weiterlesen

Ji bo Stoka Xwe ya Sovereign-AI Amade ne?

19 ajansên KI yên pispor stoka we ya Swiss-Sovereign Apertus an Hîbrîd ava dikin — Platforma Swisscom Sovereign AI, Vertex Zurich an Air-gapped on-prem bi uyûma ARES û Drift-Observability ya 24/7 ji aliyê ARGUS Guardian. Li gor DSG, FINMA û EU-AI-Act ji CHF 14'900.

Hemû gotaran