Di 2-ê Îlona 2025-an de, Swîsrê yekem modela xwe ya zimanî ya bi temamî vekirî weşand: Apertus. Ji aliyê ETH Zurich, EPFL û Navenda Hesabkirina Bilind a Neteweyî ya Swîsrê CSCS ve hatiye pêşxistin, li ser 15 trîlyon tokenan di zêdetirî 1'000 zimanan de hatiye perwerdekirin — Almanyayî-Swîsrî û Romanşî tê de. Ev ne tabloya PR bû: Apertus binyata teknîkî ya zivirîneke regulatorî ye. Bankên Swîsrî, sîgortakar, nexweşxane û dezgehên federal di 2026-an de cara ewil dikarin Modeleke Bingeh bi kar bînin ku ne ji ewra DYA û ne jî ji dayika DYA ye. AI ya Serwer êdî ne têgehek teorîk e — ev binyada bicîhkirinê ya guncan e. Em li mazdek di 7 mehan de 14 cîgirkirinên hilberînê yên Sovereign-AI-yê qedandin — ji sîstemên RAG-ê yên nexweşxaneyê yên li gor revDSG, heya chatbotên bankan ên FINMA-pejirandî, heya sîstemên alîkar ên dezgehan ên air-gapped. Ev rêber dersên van mandayan tîne ber çavan. Ajansê me PROMETHEUS hilbijartina modelan birê ve dibe, HEPHAESTUS stoka Kubernetes a Swîsrî, ARES uyûma, ORACLE rêveçûna daneyan, ARGUS Observability-a 24/7 — hemû li ser axa Swîsrê, hemû li gorî revDSG, EU AI Act û FINMA.
Çima AI ya Serwer di 2026-an de Dibe Erk
Heya 2024-an, AI ya Serwer ji bo piraniya pargîdaniyên Swîsrî têgeheke marketîngê bû: yek "EU" wek cihê daneyan ragihand û hêvî kir ku ev têra dike. Di 2026-an de êdî têra nake. Sê hêz her berpirsiyareke Swîsrî mecbûr dike ku bi serweriya rasteqîn a model û daneyan re mijûl bibe:
- EU AI Act bi tevahî bandor (Sibata 2026): Sîstemên KI-yê yên risk-bilind hewceyê şopa daneyan a bê valahî, kartên modelê, şopên denetîmê û çavdêriya mirovî ne. Hyperscalerên DYA pir caran vê belgekirinê tenê piştî zêdekirinê û tu carî di bin qanûna xwe de pêşkêş dikin.
- Cibicîkirina revDSG ji aliyê EDOEB ve (ji Îlona 2023-an, pêla denetîmê 2025): Hinardekirina daneyan li welatên sêyem ên "ne-guncan" (DYA bê biryareke nû ya guncaniyê krîtîk dimîne) bê SCC, BCR an DPA-Annex erkdar e. Du mandeyên fiduzar ên Swîsrî di 2025-an de ji ber nameyên denetîmê yên EDOEB-ê yên bê bersiv yekkirina xwe ya OpenAI rasterast hilweşandin.
- FINMA RS 2023/1 (Risikoyên Operasyonel): AI wek Single-Point-of-Failure di rêveçûnên bankan de ji 2024-an ve mecbûriya ragihandinê heye. FINMA di 2026-an de zêde stratejiyên derketinê û cûrbecûriya modelan dixwaze — ku bi sazkirineke OpenAI an Anthropic-ê ya pak biha dibe.
«AI ya Serwer di 2026-an de êdî ne pirseke felsefî ye. Bankeke Swîsrî, sîgortakareke an nexweşxaneyek a ku nikare model û daneyên xwe di hundirê pergala qanûnî ya Swîsrê de bigire, zêdekirina FINMA, EDOEB an Swissmedic li ser maseyê heye — û mandeyan winda dike ji hevkêşeyên ku berê ev çareser kirine.»
— PROMETHEUS, Ajansê AI û Machine Learning li mazdek
Apertus: Tiştê ku Swîsrê bi Modela Xwe ya Yekem a Bingeh Çêkir
Apertus di 2-ê Îlona 2025-an de di bin lîsenseke wek Apache-2.0 de hat weşandin — yekem malbata Modela Bingeh a Swîsrî ya bi temamî vekirî. Du mezinahiyên modelê, her du jî bi koda perwerdekirinê ya tam, rêveçûnên daneyan û giraniyên modelê:
| Cûr | Parametre | Context | Tokenên Perwerdekirinê | Ziman | Hardware (Inference) |
|---|---|---|---|---|---|
| Apertus 8B | 8 milyar | 32k | 15 trîlyon | 1'000+ | 1x RTX 4090 / L40S |
| Apertus 70B | 70 milyar | 32k | 15 trîlyon | 1'000+ | 4x H100 / 2x H200 / 8x L40S |
Tiştê ku Apertus ji Llama, Mistral an Qwen cuda dike — û tiştê ku tîmên uyûma Swîsrî di 2026-an de qane dike:
- Dubarekirina Tam: Korpusa perwerdekirinê, rêveçûnên parzûnan, tokenizer û hîperparametre belgekirî û weşandî ne. EU AI Act Madde 53 (erkên peydaker ên ji bo GPAI) ji deqê tê bicihkirin — feydeyek ku ne Llama 3.3 û ne jî Mistral Large pêşkêş nakin.
- Pirzimanî bi Sêwiranê: %40-ê daneyên perwerdekirinê ne-îngîlîzî ne. Apertus 70B di reasoninga Almanî, Frensî û Îtalî de Llama 3.3 derbas dike — li ser MMLU-DE/FR/IT 3-5 puan zêdetir — û dikare Almanyayî-Swîsrî û Romanşî biaxive — zimanên ku hemû modelên din ên Open-Source wek zimanê biyanî dihesibînin.
- CSCS-Backbone «Alps»: li ser superkomputera Swîsrî ya li Lugano (10'000+ NVIDIA GH200) hatiye perwerdekirin — kontrola fizîkî ya daneyan ji forward-pass-a yekem ve.
- Lîsensa Public-Benefit: bikaranîna bazirganî destûr e, lê belavkirina dîsa divê bingeha daneyan û şopên parzûnan eşkere bike — ku di bin EU AI Act de dibe alîkariyeke uyûma rasterast.
Lawaziyên ku em di mandayên hilberînê de dipîvin, bi rastî tê gotin: Apertus 70B di benchmarkên kodkirina Almanî de (HumanEval-DE, MultiPL-E-DE) bi qasî 6-9 puan li paş Claude 4.7 Sonnet û 4-7 li paş GPT-5 e. Tool-Calling û Function-Calling bikêrhatî ne, lê li hember modelên ku ji bo amûran perwerdekirî ne wek Claude an Gemini hîn ne li ser asta wan in. Yê ku ji bo lêkolîna huqûqî ya reasoning-girt an workflowên kodkirina ajansî hewceyî dike, bi stoka hîbrîd (Apertus + endpointa Claude EU) çêtir e ji sazkirineke Apertus-ê pak. Bijartin di 2026-an de ne Apertus an Claude ye, lê kîjan tebeqeya stokê nikare ji Swîsrê derkeve.
Dîmenê Sovereign-AI ya Swîsrê 2026: Stok û Peydaker
Di Nîsana 2026-an de, pênc bijartiyên stoka Sovereign-AI yên têkildar amade ne. Em di mandayên mazdek de hemû pênc bi hilberînî bi kar tînin — li vir nirxandina rastîn:
| Stok | Model | Hosting | Cihê Daneyan | FINMA-Fit | Lêçûn/Mîlyon Token |
|---|---|---|---|---|---|
| Apertus + CSCS / Sovereign-CH | Apertus 8B/70B | CSCS Lugano · Swisscom · Hetzner CH | %100 CH | Pir baş | CHF 0.40-0.90 |
| Platforma Swisscom Sovereign AI | Apertus · Llama 3.3 · Mistral | Swisscom Bern/Zurich | %100 CH | Pir baş | CHF 1.20-2.20 |
| Vertex AI Region Zurich | Gemini 2.5 Pro · Apertus | Google Zurich-1 | CH (dayîka DYA) | Baş (bi DPA) | CHF 1.80-3.20 |
| Azure Switzerland North | GPT-5 · Llama 3.3 | Zurich · Geneva | CH (dayîka DYA) | Baş (bi DPA) | CHF 2.50-4.10 |
| AWS Bedrock Zurich | Claude · Llama · Mistral | AWS eu-central-2 | CH (dayîka DYA) | Navîn-Baş | CHF 2.20-4.40 |
| Air-gapped On-Prem | Apertus · Llama · Mistral | RZ-yê xwe | %100 CH | Tier-1 | CHF 0.20-0.60 |
| Infomaniak Public Cloud AI | Llama 3.3 · Mistral · Apertus | Geneva | %100 CH | Pir baş | CHF 0.90-1.80 |
| Exoscale GPU + Open-Source | Apertus · Llama · DeepSeek | Zurich · Geneva | %100 CH | Pir baş | CHF 0.60-1.50 |
Çar dîtinên ji 14 mandayên hilberînê:
- Stokên Sovereign di 2026-an de bi aboriyê re hevrikî ne. Apertus 70B li ser Exoscale-GPU an Infomaniak Public Cloud AI bi %30-60 kêmtir ji GPT-5-ê ser Azure CH lêçûn dike — bi rastiya zimanê Almanî ya hevberî ji bo %80-ê use-case-an.
- Swisscom Sovereign AI pirê pira ya bankan e. 6 ji 9 mandayên bankî ji bo Swisscom-ê biryar dane — feydeya mezin: Master-Service-Agreement-a heyî, SOC-a FINMA-pejirandî, û hevkareke peymanê ya Swîsrî bê parêzerên DYA.
- Vertex AI Zurich di sazkirina hîbrîd de bi ser dikeve. Yê ku ji bo karên reasoning-girt Gemini 2.5 Pro hewce dike û Apertus wek vegerî dimeşîne, ji her du cîhanan baştir digire — bi şertê ku DPA bi Google EMEA bi rastî hatibe îmzekirin.
- Air-gapped stoka herî biha lê herî ewledar e. Mandayên Tier-1 yên derman, bergiriyê û bankan bê tu peyamberkirina API ya derveyî — em niha sê ji wan dimeşînin, navînê veberhênana destpêkê CHF 380'000-580'000, break-even piştî 16-22 mehan li hember peydakirina API.
Mîmariya Referansê: Stoka Swiss Sovereign AI
Çi peydaker be jî — her cîgirkirina Sovereign-AI ya mazdek li dû mîmariyeke 8-tebeq diçe. Ev bi xwendin ji modelê serbixwe ye, ji ber vê yekê guhertina di navbera Apertus, Llama û Mistral de bê re-mîmarî mimkin dimîne (di 5 mandayên me de wisa hate kirin):
+------------------------------------------------------------+
| 1. Tebeqeya Bikarhêner: Web · Chat · API · WhatsApp · Voice|
| Pejirandin bi rêya SwissID / Microsoft Entra CH |
+-----------------------------+------------------------------+
| Daxwaza pejirandî
v
+-----------------------------+------------------------------+
| 2. Tebeqeya Edge & Guardrail: ARES |
| - Lakera Guard (CH-Region) Tespîta Prompt-Injection |
| - Llama Guard 3 (Self-Hosted) Parzûna PII |
| - Birê ve birina Tenant- û Ziman |
+-----------------------------+------------------------------+
| Prompta paqijkirî
v
+-----------------------------+------------------------------+
| 3. Tebeqeya Routing: PROMETHEUS |
| - Kategorîzekirin: hêsan / tevlihev / ewlehiya-krîtîk |
| - Hilbijartina Modelê: Apertus 8B / 70B / Claude EU |
| - Bûdceya Lêçûn û Latans li gor Tenant |
+-----------------------------+------------------------------+
| Model + token
v
+-----------------------------+------------------------------+
| 4. Tebeqeya Inference: vLLM / TGI / Triton li ser Swiss GPU|
| - Apertus 70B li ser 4x H100 (CSCS an Swisscom) |
| - Apertus 8B li ser RTX 6000 Ada (Edge) |
| - Llama / Mistral wek vegerî |
+-----------------------------+------------------------------+
| Token + tool-calls
v
+-----------------------------+------------------------------+
| 5. Tebeqeya Tool: HERACLES |
| - Servera MCP ji bo SAP / Bexio / Abacus / SwissID |
| - Function-Calling bi Schema-Validation |
| - QR-Bill / IBAN / AHV-Verifîkasyon |
+-----------------------------+------------------------------+
| Bersiva ground-kirî
v
+-----------------------------+------------------------------+
| 6. Tebeqeya Zanyariyê: ORACLE |
| - pgvector / Qdrant li ser Postgres-a Swîsrî |
| - RAG bi bingeha daneyan li gor chunk |
| - Cache-a Vegerandinê (Redis CH) |
+-----------------------------+------------------------------+
| Stream-a derketinê
v
+-----------------------------+------------------------------+
| 7. Tebeqeya Audit: ARES + ARGUS |
| - Prompt + Bersiv + Versiyona Modelê WORM 10 sal |
| - Maskekirina PII · Şopa Îmtiyaz · revDSG Mad. 6 |
| - Drift-Monitoring + Eval-CI |
+-----------------------------+------------------------------+
| Stream-a uyûmê
v
+-----------------------------+------------------------------+
| 8. Tebeqeya Governance: NABU |
| - Kartên Modelê · Kartên Daneyan · Şablonên DSFA |
| - Rêza Reviewer ji bo Derketinên Risk-bilind |
| - Raporkirina EDOEB / FINMA / Swissmedic |
+------------------------------------------------------------+
Sê tebeqe bala taybet ji bo uyûma Swîsrî dixwazin:
- Tebeqeya Routing (Layer 3): ne her prompt hewceyê modela herî baş heye. Routera me PROMETHEUS promptên hatî kategorîze dike û %65-75 dişîne Apertus 8B (CHF 0.40/Mîlyon Token), %20-25 dişîne Apertus 70B an Llama 3.3 (CHF 0.90), tenê %3-8 dişîne Claude EU an Gemini Vertex Zurich (CHF 3.20). Encam: lêçûnên Inference 4-6x kêmtir bi qaliteyeke dawîn-bikarhêner a hevberî.
- Tebeqeya Tool (Layer 5): li vir di 2026-an de hêza biryarîvane ya serweriyê heye. Bi MCP (Model Context Protocol) wek otobûsa amûran, em dikarin amûran biguhêzin bê ku modelan bidin destê. Adapterên ERP, banker û SwissID-ê yên Swîsrî bi MCP diaxivin — rêbera me MCP binêre.
- Tebeqeya Audit (Layer 7): Erkdar li gor EU AI Act Mad. 12. Her prompt + bersiv + versiyona modelê + tool-calls ji bo 10 salan WORM tê arşîvkirin. Em S3-Object-Lock li ser Infomaniak an Cloudscale bi kar tînin — her du moda Compliance bi serweriya rastîn a Swîsrî pêşkêş dikin.
Berhevdana Kodê: Apertus, Swisscom Sovereign AI û Claude EU
Karê: endpointeke RAG ji bo sîgortakareke Swîsrî, ku daxwazên zerarê kategorîze dike û bi daneyên polîçeyê bersiv dide — hemû di hundirê pergala qanûnî ya Swîsrê de.
Apertus 70B Self-Hosted (vLLM)
from openai import OpenAI
# vLLM li ser CSCS an Swisscom Sovereign Cloud
client = OpenAI(
base_url='https://apertus.swiss-ai.internal/v1',
api_key=APERTUS_KEY,
)
resp = client.chat.completions.create(
model='swiss-ai/apertus-70b-instruct',
messages=[
{'role': 'system', 'content': 'Tu alîkareke sîgortayê ya rasteqîn î. Tenê bi konteksta polîçeyê bersiv bide.'},
{'role': 'user', 'content': f'Kontekst: {policy_chunks}\n\nPirs: {question}'},
],
temperature=0.1,
max_tokens=512,
)
answer = resp.choices[0].message.content
Taybetmendî: API-ya OpenAI-uyûmî, xala kontrolê ya tam li ser axa Swîsrê. Bê DPA-ya DYA, bê bandora subpoena-ya DYA, bê hop-yên derveyî. Latans bi gelemperî 80-180 ms TTFT li ser 4x H100.
Platforma Swisscom Sovereign AI
import httpx
resp = httpx.post(
'https://sovereign-ai.swisscom.ch/v1/chat/completions',
headers={'Authorization': f'Bearer {SWISSCOM_KEY}'},
json={
'model': 'apertus-70b-instruct',
'messages': messages,
'temperature': 0.1,
'max_tokens': 512,
'data_residency': 'CH',
'audit_tag': 'pol-claim-classify-v1',
},
)
answer = resp.json()['choices'][0]['message']['content']
Taybetmendî: Hevkarê peymanê yê Swîsrî bi SOC-a FINMA-pejirandî û MSA-yê amade. Tag-ên Audit rasterast diçin nav log-retention-a Swisscom. Lêçûn bilindtir, lê Self-Hosting ne hewce — riya herî zû ji bo bankan.
Hîbrîd bi Claude EU wek Riya Zêdekirinê
import anthropic
# Apertus pêşî, Claude tenê bi guhêzbariya nizm
def route_prompt(question, context):
# Apertus 70B pêşî biceribîne
apertus_resp = call_apertus(question, context)
if apertus_resp.confidence >= 0.85:
log_audit('apertus-70b', apertus_resp)
return apertus_resp.answer
# Bi DPA-ê Claude EU zêde bike
client = anthropic.AnthropicVertex(region='europe-west4', project_id=PROJ)
msg = client.messages.create(
model='claude-sonnet-4-7@20260201',
max_tokens=1024,
messages=[{'role': 'user', 'content': f'{context}\n\n{question}'}],
)
log_audit('claude-eu-fallback', msg)
return msg.content[0].text
Taybetmendî: stoka Swîsrî ya pragmatîk. %90-95 promptan em bi Apertus çareser dikin, tenê edge-case-ên reasoning-girt diçin Claude EU bi Vertex-EMEA-DPA. Lêçûnên token bi %70 dadikevin, qaliteya modelê li ser asta lutkê dimîne.
Matrîksa Biryarê: Kîjan Stok ji bo Kîjan Use-Case?
| Use-Case | Pêşniyar | Çima |
|---|---|---|
| Chat-a Customer-Service ya Banka-FINMA | Swisscom Sovereign + Apertus 70B | SOC-a FINMA-pejirandî, MSA bi qanûna Swîsrê, modela Apache-2.0 |
| Sîstema RAG ya Nexweşxaneyê ji bo Belgeyên Klînîkê | Apertus 70B Self-Hosted + Infomaniak | Kontrola daneyan a hevberî bi HIPAA/Swissmedic, Almanyayî-Swîsrî |
| Alîkarê Hemwelatiyan a Saziyê | Apertus 70B + Swisscom an CSCS | destê dewletî → lîsensa public-benefit ya Apertus siyasî lê tê |
| Pêş-vekolîna Zerara Sîgorteyê | Hîbrîd: Apertus 70B + Claude EU | Edge-case-ên reasoning-girt diçin Claude, mayî diçin Apertus |
| Lêkolîna Zanyariyê ya R&D ya Derman | Air-gapped On-Prem Apertus 70B | Erkên veşartinê, tu hop-ya derveyî nayê destûr kirin |
| Chatbot-a Hesabkirinê ya Hundirîn ya SME | Apertus 8B li ser Exoscale GPU | Çareseriya Sovereign a bi-lêçûn-bikêr ji CHF 480/Meh |
| Alîkarê Kodkirinê yê Konzern | Hîbrîd: Apertus 70B + Claude/GPT EU | Kodkirin xala lawaz a Apertus e — Hîbrîd berdêl dike |
| Şêwirmendiya Online ya Pirzimanî | Apertus 70B (DE/FR/IT/RM) + Vertex Zurich | Pirzimanî bi Romanşî û Almanyayî-Swîsrî |
Stoka me ya Default-a PROMETHEUS ji bo Swîsrê Mid-Market: Apertus 70B wek modela bingehîn li ser Platforma Swisscom Sovereign AI, Llama 3.3 70B wek vegerî di parêzgariya Apertus de, Claude 4.7 Sonnet bi Vertex EMEA wek riya zêdekirinê ji bo edge-case-ên reasoning-girt. Ev kombînasyon 11 ji 14 mandayên hilberînê dipoşîne.
Berhevdana Lêçûnê: AI ya Serwer di Swîsrê de Bi Rastî Çiqasî Dikeve
Ji 14 mandayên hilberînê me TCO-yê 24-meh ji bo sê pîvanên rêkxistinê derxistiye. Bi Hosting, Inference, Maintenance, Eval-Pipeline û Compliance:
| Hêjmar | Apertus Self-Host | Swisscom Sovereign | Vertex Zurich | Azure CH GPT-5 | Air-gapped On-Prem |
|---|---|---|---|---|---|
| 10 Mîlyon Token/Meh (SME) | CHF 980 | CHF 1'600 | CHF 2'200 | CHF 3'400 | CHF 4'800 |
| 500 Mîlyon Token/Meh (Mid-Market) | CHF 4'200 | CHF 9'400 | CHF 14'800 | CHF 21'200 | CHF 8'600 |
| 10 Milyar Token/Meh (Konzern) | CHF 38'500 | CHF 142'000 | CHF 218'000 | CHF 380'000 | CHF 62'000 |
Sê ders:
- Apertus Self-Host ji 200 Mîlyon Token/Meh ve nayê derbaskirin. Break-even li hember Swisscom-API li dora 180 Mîlyon Token/Meh ye — bi şertê ku posta GPU-Sysadmin (an Managed-Service-a me ARGUS) di bûdceyê de be.
- Air-gapped ji 1 Milyar Token/Meh ve bi aborî dibe. Heya wê demê CapEx ji bo komên GPU-yên taybetmendî û navendên daneyan ên Class-Two tenê dema ku erkên veşartinê wê mecbûr dikin maqûl e.
- Region-CH-yên Hyperscaler-DYA 2-5x bihatir ji stokên Sovereign in. Vertex Zurich û Azure CH tenê ji bo workloadên reasoning-girt maqûl in, ji bo use-case-ên RAG-ê yên standard Apertus bi gelemperî bi-aborîtir e.
Mînaka Pratîkê: Banka Kantonal a Swîsrê bi 18'000 Karmend
Bankeke kantonal a mezin a Swîsrî di 2025-an de dixwest alîkarekî karmendên LLM-piştgîrkirî ji bo daxwazên uyûmê, vekolîna kredî û customer-service ava bike. Pîlota yekem bi OpenAI rasterast têk çû — denetîma FINMA cudakirina hinardekirina daneyan dixwest, EDOEB piştî vekolîna revDSG pirsên krîtîk pirsî, CIO li stokeke Swîsrî digeriya.
Rewşa Destpêkê
- 18'000 karmend, 240 şubeyên, 4 herêmên zimanî (DE/FR/IT/RM)
- Hêjmar: 280 Mîlyon Token/Meh di pîla yekem de, 1.4 Milyar ji bo pîla 2 plansaz e
- Daxwaz: %100 Hosting-a Swîsrî, SOC-a FINMA-pejirandî, uyûma EU-AI-Act risk-bilind
- Berê: 4 nameyên denetîmê yên EDOEB-ê yên bê bersiv, 1 hişyariya FINMA, pîlota OpenAI hate cemidandin
Çareseriya mazdek
Me stokeke Apertus-First li ser Platforma Swisscom Sovereign AI bi otobûsa MCP-Tool, RAG-a pgvector li ser Cloudscale Postgres û pipeline-a uyûma ARES-ê ava kir:
- Routing-a Modelê (PROMETHEUS): %70 daxwaz dişin Apertus 8B (FAQ-a standard), %25 dişin Apertus 70B (lêkolîna uyûmê ya tevlihev), %5 dişin Claude EU bi Vertex EMEA (vekolîna kredî ya reasoning-girt).
- Hosting (HEPHAESTUS): Platforma Swisscom Sovereign AI bi pod-ên H100-yên taybetmendî. Hot-Standby li ser CSCS Lugano bi rêya tunela WireGuard.
- RAG (ORACLE): 14 Mîlyon belgeyên hundirîn di pgvector de li ser Cloudscale Swîsrê, bingeha daneyan li gor chunk, şopkirina lîsensa BFE li gor çavkaniyê.
- Tools (HERACLES): Servera MCP ji bo Avaloq-Bank-Kern, Pejirandina SwissID, Bexio (xerîdarên kredî yên SME), API-ya QR-Bill.
- Uyûm (ARES): Lakera Guard CH-Region li Edge, Llama Guard 3 Self-Hosted ji bo PII, Arşîva WORM li ser Infomaniak S3-Object-Lock 10 sal.
- Observability (ARGUS): Drift-Monitoring 24/7, Eval-CI-ya hefteyî li ser 800 Gold-Records li gor zimanî, pipeline-a nûvekirina modela Apertus.
Encamên piştî 7 Mehan Operasyona Hilberînê
| Metrîk | Berê (Pîlota OpenAI) | Niha (Stoka Apertus) | Delta |
|---|---|---|---|
| Hêjma Hinardekirina Daneyan li DYA | %100 | %0 | -%100 |
| Daxwazên Denetîmê yên EDOEB-ê yên Vekirî | 4 | 0 | -%100 |
| Rexneyên FINMA | 1 | 0 | — |
| Lêçûna Token / Mîlyon | CHF 4.20 | CHF 1.40 | -%67 |
| Latansa Inference p95 | 1'820 ms | 520 ms | -%71 |
| Qaliteya Bersivê (NPS-a Karmendan) | 62 | 78 | +%26 |
| Pêvekirina Pirzimanî | 3 (DE/EN/FR) | 4 (DE/FR/IT/RM) | +%33 |
| Tasarûfa Lêçûnê ya Salane | — | CHF 9.4 Mîlyon | — |
| Payback-a Veguhastina Sovereign | — | 5.8 Meh | — |
Girîng: Hêjmariya rastîn ne tasarûfa lêçûnê bû, lê vegerandina kapasîteya tevgerandina regulatorî. Berî veguhastinê, CIO-yê bankê çar mehan di danûstandinên zêdekirinê de bi FINMA û EDOEB re bû. Piştî veguhastinê: stokeke Swîsrî ya pejirandî ku di her denetîmê de bê amadekarî dimîne.
Governance: AI ya Serwer li gor revDSG, EU AI Act û FINMA
AI ya Serwer hemû pirsgirêkên uyûmê bi xweber çareser nake — ew erkên heyî tê pêkanîn dike. Şeş erkên dijwar ku em di her mandayê Sovereign-AI ya mazdek de bi cih dikin:
- revDSG Mad. 16 (Hinardekirina Daneyan): her Inference-a modelê û her hesabkirina embedding divê li Swîsrê an welatekî sêyem ê guncan (EU) be. OpenAI rasterast bê DPA-ya Azure-EU naye qebûlkirin. Apertus + Swisscom + Vertex EMEA sê riyên ewledar in.
- revDSG Mad. 22 (Pêkanîna Bandora Parastina Daneyan): Sîstemên KI-yê yên risk-bilind hewceyê DSFA-yê berî hilberînê ne. Em şablonan ji 14 mandayên hilberînê pêşkêş dikin — li gor hêvîyên EDOEB-ê hatine struktûrkirin.
- EU AI Act Mad. 53 (Erkên Peydakerê GPAI): kesê ku Apertus an Llama bi hilberînî dimeşîne erkên kartên modelê û kartên daneyan dimire. Apertus kartan ji ETH/EPFL ji deqê pêşkêş dike — bi Llama an Mistral hûn divê wan bi xwe çêbikin.
- EU AI Act Mad. 14 (Çavdêriya Mirovî): Derketinên risk-bilind (biryara kredî, vekolîna zerara, pêşniyara bijîşkî) hewceyê astengeke Human-in-the-Loop ne. Em 0.92 guhêzbarî ji bo daxwazên standard, 0.97 ji bo qadên risk-bilind dadixin.
- FINMA RS 2023/1 (Risikoyên Operasyonel): Cûrbecûriya modelan û stratejiya derketinê erkdar e. Em di her mandeyek banker de du malbatên modelê yên serbixwe dimeşînin (mînak: Apertus + Llama) — Failover di nav 90 saniyeyan de.
- Swissmedic / FOPH (Tenduristî): Derketinên KI-yê yên bijîşkî li gor MepV erkdarên ragihandin û eger hewce be lîsens in. Em NINGIZZIDA wek ajansê HealthTech ji bo nexşeya FHIR û uyûma MepV ve girê didin.
Lêkolîneke kûrtir di rêberên uyûma me de: Bicîhkirina EU AI Act, Berevaniya Prompt-Injection û LLM-Observability.
Roadmap-a Bicîhkirinê: Di 10 Hefteyan de Hilberîner
Pîla 1: Discovery & Stoka Serweriyê (Hefteya 1)
- Workshop: Çînên daneyan, erkên regulatorî, profîla zimanan, daxwazên modelê
- Audit-a Hinardekirina Daneyan: îro li ku derê dane Swîsrê tî dihêlin, li ku derê na?
- Matrîksa Stokê: Hêjmar × Serweriya Daneyan × Qaliteya Modelê × Bûdce
Pîla 2: Hilbijartina Modelê & PoC (Hefteya 2-3)
- PROMETHEUS Apertus 70B vs. Llama 3.3 70B vs. Mistral Large bi paralel diceribîne
- Eval li ser 500-1'200 Gold-Records li gor zimanî, MMLU-DE/FR/IT, benchmarkên huqûqî û pîşesaziyê
- Biryara Hosting-ê: Swisscom vs. Self-Host vs. Air-gapped
Pîla 3: Sazkirina Sovereign-Hosting (Hefteya 4-5)
- HEPHAESTUS vLLM/TGI li ser Platforma Swisscom Sovereign AI an Exoscale cîgir dike
- Tunela WireGuard di navbera stoka bingehîn û Standby de
- Yekkirina SwissID/Entra-CH ji bo Authentication
Pîla 4: RAG & Tool-Layer (Hefteya 5-6)
- ORACLE pgvector li ser Cloudscale Postgres bi bingeha daneyan ava dike
- HERACLES ERP, CRM, SwissID bi rêya servera MCP girê dide
- Astengên guhêzbariyê li gor qadê amade dike
Pîla 5: Uyûm & Audit (Hefteya 7)
- ARES Lakera Guard CH + Llama Guard 3 + Arşîva WORM
- Çêkirina DSFA li gor revDSG Mad. 22
- Pipeline-a kartên modelê û kartên daneyan li gor EU AI Act Mad. 53
Pîla 6: Observability & Eval-CI (Hefteya 8)
- ARGUS Drift-Monitoring + Eval-CI-ya hefteyî
- Dashboard-a Lêçûna Token li gor Tenant û Modelê
- Pipeline-a Raporkirinê ya FINMA/EDOEB
Pîla 7: Rollout & Hînbûn (Hefteya 9-10)
- Şewbe-Mode: Sîstem bersiv dide, karmend pejirand
- Şopîn: %30 Bersiva Otomatîk bi Spot-Check-a mirovî
- Hilberîna Tam bi Vekolîna Uyûmê ya FINMA-yê ya mehane
Pêşeroj: Apertus 2, Federasyona GPU-yê ya Swîsrî, Multi-Tenant Sovereign Inference
AI ya Serwer di 2026-an de tenê pêşkêşbûna yekem e. Tiştê ku 2027-2028 li ber çavan e:
- Apertus 2 (Q4 2026 li benda): Cûra 200B-parametre bi optîmîzasyona Tool-Calling-ê ya xwecihî û Reasoning-Mode wek Claude 4.7. Pre-Release-ên yekem ji bo hevkarên lêkolînê ji Tebaxa 2026-an ve.
- Federasyona CSCS: CSCS Lugano, RZ-a Gerolfingen û komên GPU-yên taybet bi platformeke Federated-Sovereign-Inference dibin yek — bingeha tokenan a hevpar, suite-a Eval a hevpar, stoka uyûma hevpar. mazdek hevkarê pîlot e.
- Multi-Tenant Sovereign Inference: Confidential Computing (NVIDIA H200 bi MIG-Mode + AMD SEV-SNP) di 2027-an de gelek mandeyan li ser hardware ya yek bi îzolekirina kriptografîk destûr dike. Game-Changer ji bo SME-yên Swîsrî-Sovereign-AI.
- Modelên Qadên Swîsrî: Apertus-Med (deqên nexweşxaneyê), Apertus-Legal (korpusa Dadgeha Federal), Apertus-Fin (rêziknameyên bankan) di 2026-2027 de amade dibin. Em jixwe cûrek Apertus-Treuhand ji bo hevkarekî Mid-Market diperwerdekin.
- Standardê Governance-a KI ya Swîsrî: Konseya Federal ji bo Q4 2026-an rêziknameyeke KI ya xwe plan dike, ku riyên uyûmî yên EU-AI-Act diyar dike. Stokên Sovereign-AI bi gumane wê tercîh bin.
- Apertus li ser Mobile: Apertus 1B (cûra Edge) li ser Apple Foundation Models / Snapdragon X Elite — KI-ya Swîsrî bê Cloud-Roundtrip. Pîlot li sepanên mobîla nexweşxaneyan dimeşin.
Encam: AI ya Serwer di 2026-an de Erkeke Bicîhkirinê ye, ne Sloganê Marketîngê
- Default-a 2026: Apertus 70B li ser Platforma Swisscom Sovereign AI. Modela Apache-2.0, SOC-a FINMA-pejirandî, MSA bi qanûna Swîsrê, pirzimanî bi Almanyayî-Swîsrî — riya herî pragmatîk ji bo %80-ê mandayên Mid-Market ên Swîsrî.
- Qadên Risk-Bilind: Hîbrîd bi Claude EU. Edge-case-ên reasoning-girt (vekolîna kredî, lêkolîna huqûqî, vekolîna zerara) bi Vertex EMEA bi DPA — mayî li ser Apertus.
- Air-gapped: tenê ji bo Tier-1-Banker, Derman, Bergiriyê. CapEx ji CHF 380K-580K tenê ji 1 Milyar Token/Meh an bi erkên veşartinê yên dijwar de tê hesibandin.
- Êdî Ne 2026: OpenAI rasterast bê DPA-ya EU. Risikoya denetîma EDOEB û FINMA pir bilind. Veguhastin li Apertus, Swisscom an Azure CH bê alternatîf.
- Cûrbecûriya Modelê Erkdar e: herî kêm du malbatên modelê yên serbixwe (Apertus + Llama an Apertus + Mistral) li hember Lock-In û risikoyên FINMA.
- ROI di 4-7 Mehan de: 14 mandayên hilberînê yên Sovereign-AI yên mazdek, navînê 5.4 mehan Payback li hember sazkirinên Hyperscaler-DYA.
- Uyûm pêkan e: revDSG, EU AI Act, FINMA û Swissmedic bi ARES-Guardrails, Arşîva WORM û astengên guhêzbariyê bi paqijî tên teswîrkirin.
Li mazdek 19 ajansên KI yên pispor tevahiya jiyana Sovereign-AI birê ve dibin: PROMETHEUS ji bo hilbijartin û Routing-a modelê; HEPHAESTUS ji bo binyada Kubernetes û GPU ya Swîsrî; ORACLE ji bo RAG, pgvector û bingeha daneyan; HERACLES ji bo yekkirina ERP, banker û SwissID bi MCP; ARES ji bo uyûm, Lakera, Llama Guard û Arşîva WORM; ARGUS ji bo Drift- û Cost-Observability ya 24/7; NABU ji bo kartên model û daneyan û Raporkirina EDOEB/FINMA; NINGIZZIDA ji bo uyûma FHIR/MepV di konteksta nexweşxaneyê de. 14 cîgirkirinên hilberînê yên Sovereign-AI ji weşandina Apertus a Îlona 2025-an ve — li gor DSG, GDPR, EU-AI-Act, FINMA û Swissmedic ji rojê yekem ve.