Li paş her boriya RAG, Memory an Recommender ya hilberîner di 2026-an de database-yek vektorî heye. Ew prîmîtîfa bingehîn a hilanînê ya serdema AI ye — wek tişta ku database-yên relasyonel ji bo Web 1.0 bûn. Lê dema ku cîhana OLTP-ê sê dehsalên xwe yên konsolîdebûnê li ser Postgres, MySQL û Oracle hebûn, bazara Database-yên Vektorî teqîya: pgvector, Qdrant, Weaviate, Milvus, Pinecone — plus deh çareseriyên nîvçeyî yên wek Chroma, LanceDB, Vespa, Marqo, Vald, FAISS, ScaNN, Turbopuffer û rikberên Postgres-ê yên xwemalî yên wek pgvecto.rs. Kîjan ji bo doza we? Kîjan ji bo mîmariya li gor FINMA-yê? Kîjan ji bo 200 mîlyon Embedding? Em li mazdek di 14 mehan de 18 bicîhkirinên hilberîner ên Database-yên Vektorî yên Swîsreyî qedandine — ji 80'000 Embedding heya 230 mîlyon, ji şîrketa pêbawerî heya banka taybet a Cenevreyê. Ev rêbername hînkariyan dahf dike. Ajanê me PROMETHEUS mîmariyê analîz dike, ORACLE herikîna daneyan orkestre dike, HERACLES Pipeline-ên Embedding girê dide, ARES Compliance ewle dike, ARGUS 24/7-Observability peyda dike — hemû li gor revDSG, EU-AI-Act û FINMA-yê.
Çima Database-yên Vektorî di 2026-an de dibin pêwîst
Database-yek Vektorî Embeddingan — temsîlên hejmarî yên dîmensiyonên bilind ên nivîs, wêne, deng an daneyên strukturkirî — hildigire û pirsên hevwekheviyê di milîçirkeyan de bersiv dide, ne di çirkeyan de. Sê kişandek di 2026-an de ev kirine perçeyek standard:
- RAG li her derê: 87% projeyên AI yên Pargîdaniyên Swîsreyê niha Retrieval-Augmented-Generation bikar tînin, ne ku LLM-an tazî promp dikin. Bibînin rêbernameya me ya RAG.
- Bîra Multi-Agent: her stack-eke Multi-Agent ya hilberîner Episodic-Memory-yê li ser pgvector an Qdrant hewce dike. Mem0 û Letta di 2026-an de perçeyên standard in.
- Lêgerîna semantîk û Recommender: Lêgerîna nivîsa tevahî êdî nayê. Hybrid-Search (BM25 + Vektor) ji bo database-yên zanyariyê yên hundirîn, kesanekirina E-Commerce û nirxandinên Compliance dibe Default.
«Database-yek Vektorî di 2026-an de ew tişt e ku Postgres di 2010-an de bû: perçeyek xwezayî ya Infrastructure-ê. Pirs êdî ne ev e gelo, lê kîjan — û kîjan ji bo kîjan polê barê kar. Yê ku ya nedurist hildibijêre, heya 9 caran lêçûnên Infra-yê yên zêde dide an ji ber Routing-a daneyan a DYA-yê pejirandina FINMA winda dike.»
— PROMETHEUS, Ajanê AI û Machine Learning li mazdek
Peysaja Database-yên Vektorî ya 2026-an
Pênc bijardeyên serdest ên bi felsefeyên cuda — plus du derbazpêçeran ên derketî:
| Engine | Hilberîner | Lîsans | Mîmarî | Index | Swiss-Fit |
|---|---|---|---|---|---|
| pgvector | PostgreSQL Community | PostgreSQL (OSS) | Postgres-Extension | HNSW · IVFFlat | Pir baş |
| Qdrant | Qdrant Solutions GmbH (Berlîn) | Apache 2.0 | Engine ya Standalone (Rust) | HNSW (custom) | Pir baş |
| Weaviate | Weaviate B.V. (Amsterdam) | BSD-3-Clause | GraphQL Vector + Hybrid | HNSW + BM25 | Baş (NL/YE) |
| Milvus | Zilliz (LF AI & Data) | Apache 2.0 | K8s-native ya Belavkirî | HNSW · IVF · DiskANN · GPU | Navîn (DYA/CN) |
| Pinecone | Pinecone Systems Inc. (DYA) | SaaS ya Proprietary | Cloud-a Serverless (girtî) | Pinecone Proprietary | Bisînor |
| pgvecto.rs | TensorChord | Apache 2.0 | Postgres-Extension (Rust) | HNSW · Flat · Quantized | Pir baş |
| LanceDB | Lance / LF AI | Apache 2.0 | Embedded (Rust) | IVF-PQ · HNSW | Pir baş |
| Vespa | Yahoo / Vespa.ai | Apache 2.0 | Search Engine ya Belavkirî | HNSW + Tensor + BM25 | Baş |
Di bicîhkirinên hilberîner ên Swîsreyê de em di 2026-an de pênc arketîpên zelal dibînin — li gor pîvanê û daxwaza serweriya daneyan:
- pgvector: Default-a pragmatîk. Ji bo 80% mandatên me yên Mid-Market têra dike heya 20 mîlyon Embedding — sîstemeke zêde nîn e, ACID, hosting-a Swîsreyê hêsan, heman Backup-Workflow wek beşa mayî ya app-ê.
- Qdrant: Şampiyonê Performance. Kernelê Rust, Cloud-a YE (DE/CH), heya 500 mîlyon vektor di p50 di bin 10 ms de. Apache-2.0 — bê Vendor-Lock-in.
- Weaviate: Dema Hybrid-Search (BM25 + Vektor) û GraphQL-API tê xwestin. Ji bo SaaS-a Multi-Tenant û grafên zanyariyê yên semantîk xurt e.
- Milvus: Dema 100M+ vektor an GPU-Acceleration hewce ne. Tevliheviya K8s — tenê ji bo Pargîdaniyên bi tîmê Platform.
- Pinecone: Şampiyonê Time-to-Market. Lê: Closed-Source, tenê DYA, dane ji Swîsreyê derdikevin — ji bo FINMA, revDSG û parastina daneyan a Swîsreyê nayê pejirandin.
Berhevdana Mîmariyê: Pênc Engine çawa dixebitin
Cudahiya biryarder di Topolojiya Storage-ê de ye: index, dane û Query-Engine li ku dijîn — û kî çawa dipîve?
+-----------------------------+ +-----------------------------+
| pgvector | | Qdrant |
| (Postgres-Extension) | | (Standalone, Rust) |
| | | |
| +---------------------+ | | +---------------------+ |
| | Postgres Tablespace | | | | Qdrant Storage | |
| | - Vector column | | | | - Segment files | |
| | - HNSW Index | | | | - Custom HNSW | |
| | - WAL · MVCC | | | | - Payload (JSON) | |
| +---------------------+ | | +---------------------+ |
| | SQL | | | gRPC + REST |
| +---------------------+ | | +---------------------+ |
| | App / Backend | | | | App / Embedder | |
| +---------------------+ | | +---------------------+ |
| | | |
| ACID · heman DB wek App | | p50 8ms · 500M Vektor |
+-----------------------------+ +-----------------------------+
+-----------------------------+ +-----------------------------+
| Weaviate | | Milvus |
| (GraphQL + Hybrid) | | (Distributed K8s) |
| | | |
| +---------------------+ | | Coordinator QueryNode |
| | LSM-Tree Storage | | | | | |
| | - HNSW + BM25 | | | DataNode IndexNode |
| | - Object + Vector | | | | | |
| +---------------------+ | | +---v-------------v-+ |
| | GraphQL | | | MinIO / Pulsar / KV | |
| +---------------------+ | | +---------------------+ |
| | Multi-Tenant SaaS | | | |
| +---------------------+ | | GPU · DiskANN · 1B+ scale |
+-----------------------------+ +-----------------------------+
+----------------------------------------+
| Pinecone (DYA-SaaS) |
| |
| App-a Müşteriyê (li her derê) |
| | |
| v HTTPS |
| +-----------------------------+ |
| | Pinecone Edge (Cloud Region)| |
| | - Index ya Proprietary | |
| | - Multi-tenant pods | |
| | - Vektor + metadata | |
| +-----------------------------+ |
| |
| Closed-Source · DYA-routing |
+----------------------------------------+
Ji vê topolojiyê hema hema her tişt tê: profîla derengmayînê, profîla lêçûnê, guncavbûna Compliance-ê:
- pgvector (di Postgres de): stûnên vektorî li tenişta tabloyên we yên bingehîn dijîn. Join di navbera lêgerîna vektorî û fîltreyên SQL de xwemalî ye — li mazdek standard e, ji ber ku 95% pirsên RAG bi her halî fîltreyên SQL (Tenant, dîrok, ACL) hewce dikin. Lewazîya wê: çêkirina HNSW single-threaded ye; ji 30M vektor zêdetir teng dibe.
- Qdrant (Rust ya standalone): sîstemeke cuda bi gRPC-API. Padîşahê derengmayînê bi saya Rust + HNSW ya bi destê hatî nivîsîn. Cloud-a YE (Frankfurt) û hosting-a Swîsreyê hêsan. Apache 2.0 bê fêlbaziya Open-Core.
- Weaviate (GraphQL): Hybrid-Search first-class e — ne Bolt-on. Schema-ya GraphQL bi tîpan rewşa Multi-Tenant hêsan dike.
- Milvus (distributed): Coordinator + Query-Nodes + Data-Nodes + Index-Nodes li ser K8s. Backplane-a Pulsar ji bo Durable-Logs. Bi hovîtî dipîve, lê 6 mehan ferqkirin.
- Pinecone (Closed-SaaS): tenê bijardeya bê Self-Host. Saetkirina Sub-Sekonde, lê dane ji nêrîna jurîdîk ji Swîsreyê û YE-yê derdikevin.
Mîmariya Referansê: Stack-a RAG ya Swiss-Sovereign
Çi engine be jî — her bicîhkirineke hilberîner a mazdek li gor mîmariyeke 7-tebeqeyî dimeşe. Ev bi zelalî DB-agnostîk e, da ku guhertina engine-ê bê re-mîmarî gengaz be (di 3 mandatên me de ji Pinecone bo Qdrant hat koçberkirin):
+------------------------------------------------------------+
| 1. Tebeqeya Çavkaniyê: SAP · Bexio · Confluence · S3 · Pelan |
+-----------------------------+------------------------------+
| CDC / ETL / Webhook
v
+-----------------------------+------------------------------+
| 2. Ingest: ORACLE — Chunking, Paqijkirin, Metadata |
| - Markdown · PDF · DOCX · HTML · daneyên strukturkirî |
| - Parvekirina li gor Beşan (256-1024 token windows) |
+-----------------------------+------------------------------+
| Chunks
v
+-----------------------------+------------------------------+
| 3. Tebeqeya Embedding: PROMETHEUS |
| - Voyage-3 / Cohere v4 / BGE-M3 · 768-3072 dim |
| - Batched, retry-safe, cached |
+-----------------------------+------------------------------+
| Vektor + payload
v
+-----------------------------+------------------------------+
| 4. DB-a Vektorî: pgvector · Qdrant · Weaviate · Milvus |
| - HNSW (m=16, ef=128) · Cosine / Dot / L2 |
| - Hybrid: BM25 + Vektor + Reranker |
+-----------------------------+------------------------------+
| top-k cîran
v
+-----------------------------+------------------------------+
| 5. Reranker + Fîltre: HERACLES |
| - Cohere Rerank 3 · Cross-Encoder |
| - Fîltreya ACL · Fîltreya Tenant · Fîltreya Dîrokê |
+-----------------------------+------------------------------+
| Context
v
+-----------------------------+------------------------------+
| 6. Generator: PROMETHEUS — Claude 4.7 / DeepSeek-R2 |
| - Şablona Prompt + Citation |
| - Guardrails (PII / Injection) — ARES |
+-----------------------------+------------------------------+
| Bersiv + Çavkanî
v
+-----------------------------+------------------------------+
| 7. Observability + Audit: ARGUS |
| - Langfuse + OpenTelemetry · Eval-Regression |
| - Arşîva WORM 10 sal · Trace-Replay |
+------------------------------------------------------------+
Sê tebeqe bala taybet hêjayî ne:
- Tebeqeya Embedding: hilbijartina modela Embedding-ê di 2026-an de gelek caran zêdetir ji hilbijartina DB-ê tayîn dike. Voyage-3 û Cohere v4 di Benchmark-ên Swîsreyê de pêşeng in; BGE-M3 ji bo Self-Hosting bijardeya herî baş a Open-Source ye.
- Reranker: Reranker-ek baş (Cohere Rerank 3, BGE-Reranker-v2) kalîteya encamê 12-25 xalên ji sedî bilind dike. Di 17-yê ji 18 mandatên me de perçeyek pêwîst e.
- Tebeqeya Audit: her pirsa RAG li gor EU AI Act Mad. 12 deyna protokolê ye. Arşîva WORM ya 10-salî standard e. Langfuse + OpenTelemetry vê dipoşin.
Benchmark 2026: Derengmayîn, Recall, Bîr di barê kar ê rasteqîn ê Swîsreyê de
Me pênc engine bi barê kar ê yek-rengî ceribandin: 12 mîlyon Embedding (768 dim, Voyage-3), 80% nivîsên almanî, 20% îngilîzî/fransî, donanima c5.2xlarge (8 vCPU, 16 GB), Cosine-Distance, top-k=20, ef_search=64. Hemû nirx Median li ser 100'000 pirsan in:
| Engine | Derengmayîna p50 | Derengmayîna p95 | Recall@20 | RAM | QPS | CHF/Meh (Hosting) |
|---|---|---|---|---|---|---|
| pgvector 0.7 (HNSW) | 14 ms | 38 ms | 0.962 | 11.8 GB | 410 | CHF 380 (Hetzner CH) |
| Qdrant 1.10 | 8 ms | 22 ms | 0.971 | 9.4 GB | 820 | CHF 360 |
| Weaviate 1.27 | 11 ms | 29 ms | 0.968 | 10.6 GB | 610 | CHF 420 |
| Milvus 2.4 (HNSW) | 13 ms | 33 ms | 0.969 | 9.8 GB | 740 | CHF 690 (K8s 3-Node) |
| Milvus 2.4 (DiskANN) | 22 ms | 61 ms | 0.964 | 3.1 GB | 520 | CHF 580 |
| Pinecone (s1.x1) | 28 ms | 94 ms | 0.965 | — | — | CHF 920 (Herêma DYA) |
Çar hîn ji daneyan:
- Qdrant şampiyonê derengmayînê ye bi 1.6x kêmtir RAM û 2x QPS-a li gor pgvector — kernelê Rust cudahiyê dike.
- pgvector têra dûr e: 14 ms p50 ji bo 95% hemû dozên RAG têr e — û sadebûna operasyonel (heman Backup, ACID, SQL-Joins) hema hema her dem dibe pêşeng.
- Pinecone 2-3x hêdîtir e ji ber Routing-a DYA-yê ji Swîsreyê û buhatir e. Trade-off: bê Self-Host, bê Patching.
- Milvus DiskANN RAM 70% kêm dike — ji 100M+ vektor zêdetir girîng e, li wir lêçûnên RAM serdest in.
Matrîksa Biryarê: Kîjan Engine ji bo kîjan barê kar?
| Profîla Barê Kar | Pêşniyar | Çima |
|---|---|---|
| RAG ya Mid-Market < 20M Vektor | pgvector | Sîstemek nû tune, ACID, SQL-Joins, hosting-a Swîsreyê hêsan |
| SLA-ya Derengmayînê < 10 ms | Qdrant | Kernelê Rust, p50 8 ms, Cloud-a YE/CH |
| 20M-100M Vektor | Qdrant an Weaviate | Her du bê drama K8s dipîvin |
| Hybrid-Search (BM25+Vektor) ya xwemalî | Weaviate | First-class hybrid, GraphQL-API |
| 100M+ Vektor / GPU-Acceleration | Milvus | Distributed K8s, DiskANN, Index-a GPU |
| Stack-a tenê Postgres, App-a Embedded | pgvector / pgvecto.rs | DB-yek ji bo her tiştî, kernelê Rust opsiyonel |
| FINMA-/revDSG-Compliance | pgvector / Qdrant | Self-host, Audit-Trail, hosting-a YE/CH |
| Time-to-Market di 2 rojan de | Pinecone (bi çavên vekirî) | Tenê heke routing-a daneyan a DYA-yê tê pejirandin |
| Edge / AI ya Embedded / Mobile | LanceDB | Li ser pelan, bê server, embedded |
Default-a me ya PROMETHEUS ji bo Pargîdaniya Mid-Market a Swîsreyê: pgvector wek standard, Qdrant ji 20M an di SLA-ya derengmayînê de, Milvus tenê ji 100M an daxwaza GPU, Pinecone tu carî ji bo serweriya daneyan a Swîsreyê. Ev matrîks 16-yê ji 18 mandatên me yên hilberîner dipoşe.
Berhevdana Kodê: Heman doza RAG di çar engine de
Kar: 100'000 maddeyên peymanê yên almanî bi Embeddingên Cohere-v4 indeks bike û top-5 maddeyên hevwekheviyê yên ji bo pirsekê bibîne — bi fîltreya Tenant (deyna revDSG).
pgvector (SQL)
CREATE EXTENSION IF NOT EXISTS vector;
CREATE TABLE clauses (
id BIGSERIAL PRIMARY KEY,
tenant_id UUID NOT NULL,
text TEXT NOT NULL,
embedding VECTOR(1024) NOT NULL,
created_at TIMESTAMPTZ DEFAULT now()
);
CREATE INDEX clauses_hnsw_idx
ON clauses USING hnsw (embedding vector_cosine_ops)
WITH (m = 16, ef_construction = 64);
CREATE INDEX clauses_tenant_idx ON clauses(tenant_id);
-- Pirs
SELECT id, text, 1 - (embedding <=> $1) AS similarity
FROM clauses
WHERE tenant_id = $2
ORDER BY embedding <=> $1
LIMIT 5;
Taybetî: sîstemek nû tune. Fîltreya Tenant SQL-WHERE-a normal e, JOIN bi daneyên bingehîn re hêsan. Backup, Replication, MVCC, ACID — her tişt wek berê.
Qdrant (Python)
from qdrant_client import QdrantClient
from qdrant_client.models import (
Distance, VectorParams, PointStruct, Filter, FieldCondition, MatchValue,
)
client = QdrantClient(url='https://qdrant.swiss-cloud.example')
client.create_collection(
collection_name='clauses',
vectors_config=VectorParams(size=1024, distance=Distance.COSINE),
)
client.upsert(
collection_name='clauses',
points=[PointStruct(id=i, vector=v, payload={'tenant_id': t, 'text': txt})
for i, v, t, txt in batch],
)
hits = client.query_points(
collection_name='clauses',
query=query_vec,
query_filter=Filter(must=[FieldCondition(
key='tenant_id', match=MatchValue(value=tenant_id))]),
limit=5,
)
Taybetî: Fîltre first-class in. Performance bi fîltreyê re xweş dimîne — Qdrant algorîtmayeke filtered-HNSW heye ku paşê fîltre nake (problemeke navdar a pgvector di fîltreyên hilbijartî de).
Weaviate (GraphQL)
{
Get {
Clause(
nearVector: { vector: $queryVec, distance: 0.3 }
where: { path: ["tenant_id"], operator: Equal, valueText: $tenantId }
hybrid: { query: $rawQuery, alpha: 0.6 }
limit: 5
) { text _additional { distance score } }
}
}
Taybetî: Hybrid-Search xwemalî ye. Parametra alpha BM25 û skora vektorî tevlihev dike — servîseke zêde nayê hewce kirin. GraphQL bi tîmên Frontend-ê re sempatîk e.
Milvus (Python)
from pymilvus import (
connections, FieldSchema, CollectionSchema, DataType, Collection,
)
connections.connect('default', host='milvus-cluster.zurich')
schema = CollectionSchema([
FieldSchema('id', DataType.INT64, is_primary=True, auto_id=True),
FieldSchema('tenant_id', DataType.VARCHAR, max_length=64),
FieldSchema('text', DataType.VARCHAR, max_length=8192),
FieldSchema('embedding', DataType.FLOAT_VECTOR, dim=1024),
])
c = Collection('clauses', schema)
c.create_index('embedding', {
'index_type': 'HNSW',
'metric_type': 'COSINE',
'params': {'M': 16, 'efConstruction': 64},
})
c.insert([ids, tenant_ids, texts, embeddings])
c.load()
hits = c.search(
data=[query_vec], anns_field='embedding',
param={'metric_type': 'COSINE', 'params': {'ef': 64}},
limit=5, expr=f'tenant_id == "{tenant_id}"',
)
Taybetî: K8s-native, distributed. Bi awayî horîzontal dipîve — Coordinator, Query-Nodes, Data-Nodes serbixwe têne pîvandin. Ji bo birêvebirinê tevlihev e; tenê ji 100M vektor an Index-a GPU bidest tê.
Berhevdana Lêçûnê: Database-yên Vektorî bi rastî li Swîsreyê çiqas dikevin
Ji 18 mandatên hilberîner me TCO-ya 24 mehan ji bo sê astên pîvandinê derxistiye. Hosting-a li Swîsreyê (Hetzner CH an Infomaniak) li ku gengaz be, an na YE (Frankfurt):
| Pîvan | pgvector | Qdrant | Weaviate | Milvus | Pinecone |
|---|---|---|---|---|---|
| 5M Vektor / 50 QPS | CHF 180 | CHF 220 | CHF 270 | CHF 580 | CHF 620 |
| 30M Vektor / 200 QPS | CHF 460 | CHF 380 | CHF 510 | CHF 720 | CHF 1'420 |
| 150M Vektor / 800 QPS | nayê pêşniyar kirin | CHF 1'180 | CHF 1'420 | CHF 1'690 | CHF 4'880 |
Sê hîn:
- pgvector di bin 20M vektor de bi ser dikeve — xala «sîstemek zêde tune» piranî 60% nirxê ye.
- Qdrant ji 20M heya 200M vektor bi ser dikeve — derengmayîn, RAM û lêçûnên lîsansê bi hev re.
- Pinecone 2-3x buhatir e ji her bijardeyeke Self-Hosted û serweriya daneyan dixe.
Mînaka Pratîkî: Banka Taybet a Cenevreyê bi Qdrant di 11 hefteyan de hilberîner
Bankayeke taybet a Cenevreyê (CHF 18 Mrd. AuM, 240 karmend) dixwest 2.4 mîlyon belgeyên Compliance — Rûnameyên FINMA, Polîtîkayên hundirîn, Hiqûqa Swîsreyê, Regulasyona YE — bi awayî semantîk lêbigerîne, bi SLA-ya hişk: p95 di bin 60 ms de, 100% serweriya daneyan a Swîsreyê, Audit ya FINMA-pesendkirî.
Rewşa destpêkê
- 2.4 Mio. belge, ji 800-12'000 Token (~38 Mio. Chunk)
- 120 Compliance-Officer ên hevdem, nêzîkî 200'000 Pirs/Meh
- Daxwaz: dane di Cloud-a DYA de tune, FINMA-Audit-Trail, WORM ya 10 salî
- Berê: lêkolîna destî ya bi saetan, 38% lihevhatina nirxander
Çareseriya mazdek
Me Cluster-eke Qdrant li ser donanima Swîsreyê (Hetzner Helsinki + Infomaniak Geneva ji bo Disaster-Recovery) ava kir, Embedding bi Voyage-3 (1024 dim), Reranking bi BGE-Reranker-v2.5, Generator-a RAG bi Claude 4.7 bi Citation-First-Prompting:
- Ingest (ORACLE): ETL ji SharePoint û Confluence, Chunking ya li gor Beşan (512 Token, 64 Overlap), Metadata (Tîpa belge, dîrok, ziman, ACL).
- Embedding (PROMETHEUS): Voyage-3 batched, Cache bi Redis, Cohere v4 wek Fallback ji bo cûrbecûriya Audit.
- Vector-DB (Qdrant): Cluster-a 3-Node bi Replikasyonê, HNSW (m=24, ef=200) ji bo Recall-eke bilindtir, fîltreya payload ji bo ACL û dîrokê.
- Reranker (HERACLES): BGE-Reranker-v2.5 ji bo Top-100-Candîdan → Top-10.
- Generator (PROMETHEUS): Claude 4.7 bi Prompt-a «Cite-or-Refuse» — bê çavkanî bersiv tune.
- Guardrails (ARES): Llama Guard 3 ji bo PII-Redaction di navbera tebeqeyan de; fîltreya ACL ji bo her Tenant.
- Audit (ARGUS): Langfuse + OpenTelemetry, Bucket-a WORM li S3-a Rêhesinên Federal ên Swîsreyê (sic), Retention-a 10-salî.
Encam piştî 7 mehan kar a hilberîner
| Metrîk | Berê | Piştî | Delta |
|---|---|---|---|
| Wexta navîn a lêkolînê ji bo her pirsê | 42 deqîqe | 3.4 deqîqe | -92% |
| Lihevhatina nirxander (Cohen's Kappa) | 0.38 | 0.81 | +113% |
| Derengmayîna p95 | — | 54 ms | SLA hat bicîh kirin |
| Recall@10 | — | 0.94 | — |
| Şikayetên FINMA ji Go-Live ve | — | 0 | — |
| Teserûfa salane | — | CHF 2.6 Mio | — |
| Payback | — | 5.1 meh | — |
Girîng: tu Compliance-Officer ji kar dernehat. Wexta hatî azad kirin diçû Risk-Reviewên proaktîf û Edge-Case-Eskalasyonê — karên ku tîmê berê wext ji bo wan tunebû.
Rêvebirin: Database-yên Vektorî li gor revDSG, EU AI Act û FINMA
Database-yên Vektorî sê pirsên Compliance ên zêde dirêjê dikin ku DB-yên klasîk ên OLTP nedikirin:
- revDSG Mad. 6 (Înkarbûna Daneyan): Embedding ji nêrîna teknîkî veneger in, lê ji nêrîna forensîk dibe ku ji nû ve werin avakirin (Embedding-Inversion-Attack). Di mandatên FINMA-yê yên Swîsreyî de em ji ber wê DB-yên Vektorî di heman Trust-Zone-a daneyên çavkaniyê de datînin — qet «Embedding bênav in» nine.
- EU AI Act Mad. 12 (Deyna Protokolê): her pirsa RAG plus çavkaniyên vegerandî ketin/derketinên sîstemeke AI ya bi rîska bilind in û 10 salan deyna arşîvê ne.
- FINMA RS 2023/1 (Rîskên Operasyonel): Têkçûna DB-ya Vektorî Single-Point-of-Failure ji bo sîstemên RAG e. Backup, Replikasyon, Testên HA perçeyên pêwîst in.
Sê deynên hişk ji bo her bicîhkirina DB-ya Vektorî ya Swîsreyê:
- Serweriya Daneyan: Self-host li ser axa Swîsreyê an YE-yê, lîsansa Apache/BSD bipirsîne. Pinecone û SaaS-ên din ên DYA ji mandatên FINMA derdixin.
- Backup & Recovery: Snapshotên rojane, Recovery-Drills, plana ji nû ve avakirina Index-a HNSW (bi gelemperî 4-12 saet ji bo 100M vektor).
- Fîltrekirina ACL di Index de: ne di tebeqeya Application de. Her hîtên lêgerînê yên ku bê fîltreya ACL vedigerin, bûyereke gengaz a parastina daneyan in.
Zêdetir di rêbernameya me ya EU-AI-Act de.
Roadmap-a Bicîhkirinê: Di 11 hefteyan de hilberîner
Qonax 1: Discovery û Hilbijartina Engine (Hefte 1-2)
- Workshop: sîstemên çavkanî, qebareya daneyan, frekansa nûvekirinê, modela ACL, SLA-ya derengmayînê
- Matrîksa Engine: Pîvan × Serweriya Daneyan × Derengmayîn × Jêhatîya tîmê
- Hilbijartina modela Embedding-ê: Voyage-3 (Cloud) an BGE-M3 (self-host)
Qonax 2: PoC + Eval (Hefte 3-5)
- PROMETHEUS Pipeline-a Ingest, Embedding û Lêgerînê ava dike
- Set-a Gold-Eval bi 200-500 cotên Pirs-Bersiv
- Recall@10, p50/p95-derengmayîn, Rêjeya Halusinasyonê tê pîvandin
Qonax 3: Reranker, Hybrid-Search, Citation (Hefte 6-7)
- HERACLES Cohere Rerank 3 an BGE-Reranker entegre dike
- Hybrid-Search çalak bike (BM25 + Vektor)
- Cite-or-Refuse-Prompting di Generator de
Qonax 4: Guardrails, Audit, Compliance (Hefte 8-9)
- ARES fîltreya Llama-Guard-3 ji bo PII / Prompt-Injection
- ARGUS Langfuse + OpenTelemetry + Arşîva WORM
- Kontrola lihevhatina EU-AI-Act û revDSG
Qonax 5: Rollout (Hefte 10-11)
- Şêwaza Şahidiyê: sîstem bersiv dide, lê nayê nîşan dan
- Bi nezeretê: 10% trafîk bi îcazeya mirov
- Hilberîna tam bi Eval-Regression-CI
Pêşeroj: Multi-Vector, Quantîzasyon û Late-Interaction
Database-yên Vektorî yên 2026-an tenê nifşê duyemîn in. Tişta ku ji bo 2027-2028-an dixuye:
- Multi-Vector / ColBERT: belgeyek wek rêze ji vektor li şûna vektoreke navîn. Recall 8-15 xalên ji sedî bilind dibe. Qdrant 1.10, Vespa û Weaviate 1.27 jixwe Multi-Vector bi awayî xwemalî piştgirî dikin.
- Quantîzasyona Binary û Int8: Embeddingên 32x piçûktir bê windabûneke girîng a Recall. Cohere v4 + Embeddingên Matryoshka + Binary Quantization 90% RAM teserûf dike.
- Reranker-a Late-Interaction: ColBERTv2 wek Reranker rasterast di Engine-ya Vector-DB de. Milvus û Vespa pêşeng in.
- Index-ên Disk-First: DiskANN, SPANN — daxwaza RAM 70-90% kêm bûye. Ji 100M vektor zêdetir girîng e.
- Fîltreya Vektorî ya SQL-xwemalî: Postgres 18 bi Index-a HNSW ya xwemalî di pgvector 0.8 de — êdî sînorên Extension tune.
- RAG bê Embedding: SPLADE-style sparse-Retrieval û Reasoning-Over-Index modela Embedding-ê ya klasîk bi qismî winda dike.
Encam: Kîjan DB-ya Vektorî ji bo we?
- Default: pgvector. Ji bo 80% mandatên Mid-Market ên Swîsreyê têra dike — sîstemek nû tune, ACID, SQL-Joins, hosting-a Swîsreyê hêsan.
- Performance & Cloud-a YE: Qdrant. Kernelê Rust, Apache 2.0, p50 di bin 10 ms de bi 100M+ vektor. Ji 20M vektor îdeal e.
- Hybrid-Search ya xwemalî: Weaviate. BM25 + Vektor + GraphQL — ji bo SaaS-a Multi-Tenant tekûz e.
- Pîvana Mezin: Milvus. Distributed K8s, DiskANN, GPU. Ji 100M vektor an bi tîmê Platform.
- NE ji bo Swîsreyê: Pinecone. Closed-Source, Routing-a DYA, 2-3x buhatir, FINMA-bê pejirandinê.
- ROI di 5-7 mehan de: 18 mandatên hilberîner ên mazdek, navîn 5.4 mehan Payback.
- Compliance gengaz: revDSG, EU AI Act, FINMA bi Guardrails-ên ARES, Observability-ya ARGUS û Self-Hosting bi paqijî tê dîtin.
Li mazdek 19 ajanên AI yên pispor tevahiya Lifecycle-a DB-ya Vektorî orkestre dikin: PROMETHEUS ji bo mîmarî û hilbijartina Embedding-ê; ORACLE ji bo Ingest û modela daneyan; HERACLES ji bo Reranker û Pirên API; ARES ji bo Guardrails û Compliance; ARGUS ji bo Observability-ya 24/7 û WORM-Audit; HEPHAESTUS ji bo Infrastructure-a Swiss-K8s. 18 bicîhkirinên hilberîner ên DB-ya Vektorî ji 2024-an vir ve — ji roja yekem li gor DSG, DSGVO, EU-AI-Act, FINMA û OR.