CARVISCARVIS
Teknoloji

Görüntüden rapora altı katman + paralel Q&A boru hattı

CARVIS, her katmanı ayrıştırılabilir biçimde tasarlanmış bir karar destek prototipidir. Aşağıdaki yığın şeması klinik veri akışının soldan sağa hangi bileşenlerden geçtiğini özetler; tam sistem mimarisi ise bunun ardından, karar dalları ve Unity XR dahil olmak üzere ayrıntılandırılır.

Klinisyen arayüzüElectron + React
Rapor üretim katmanıDeterministik iskelet + sınırlı LLM
Bağlam-kilitli Q&AQwen2.5-7B (llama.cpp)
Anatomik lokalizasyonHarvard-Oxford · Couinaud · Lob
SegmentasyonnnU-Net (PyTorch)
Görüntü I/ONIfTI · DICOM

Veri görüntü I/O katmanından girer ve segmentasyon, lokalizasyon, soru-cevap ve rapor üretimi katmanlarından geçerek klinisyen arayüzüne ulaşır.

Her katman bağımsız çalışacak biçimde tanımlanmıştır. Bu yapı, bileşenlerin ayrı ayrı değerlendirilmesini ve değiştirilmesini kolaylaştırır.

Dil katmanı tamamen devre dışı bırakıldığında dahi deterministik üretim (segmentasyon, atlas eşleme, sayısal metrikler) çalışmaya devam eder. Sistemin alt katmanları üst katmanların varlığına bağlı değildir.

02Tam sistem akışı

Karar dalları, paylaşılan bağlam, XR çıktı

Ana boru hattı ve paralel Q&A boru hattı, patient_context yapısı üzerinden birbirine bağlanır. Karar düğümleri (maske geçerlilik, atlas güveni, yüksek-risk soru) akışın hangi dala saplandığını belirler.

Başlat — GörüntüMR / BT VakasıBeyin (MR)Akciğer / Karaciğer (BT)Bağlam yüklemetarama · DICOM ayrıştırmaSegmentasyonÖn-işlemeresample · normalizennU-Net inferencepatch sliding-windowSon-işlemeCC birleştirme · belirsizlikMaskegeçerli?Metrik + Bölge Haritasıhacim · atlas · bölgeRapor üretimişablon · LLM cilaÇıktırapor · kanıtUnity XR Görüntüleyici3B tümör + segmentasyonVR / AR (XR modu)Unity'de açReddetgeçerli maske yokİfadeyi yumuşatdüşük bölge güveniBaşlat — Q&AKullanıcı sorusuvakaya özel sorguQ&A motorusınıflandır + geri-getirYüksekrisk?Güvenlik kalkanıyüksek-risk konuyu sapt.Kanıt-bağlı yanıtkanıt + güvenpatient_contextHasta ID · Yaş · Cinsiyet · Tarama tarihi · Modalitehayırevetdüşüksehayırevet
03Bileşen detayı

Yedi temel modülün her biri

Her bileşenin girdisi, mantığı ve neyi karara bağladığı; her ifadenin neden öyle yazıldığı.

01

Segmentasyon katmanı

Üç organ alanı için önceden eğitilmiş nnU-Net modelleri inference modunda çalıştırılır. Beyin için BraTS 2020 protokolüne uygun çoklu-modaliteli MR girdisi alınır; konfigürasyon 3D fullres olarak yapılandırılmıştır.

Akciğer modülü Medical Segmentation Decathlon Task06 (MSD Lung) veri kümesi üzerinde eğitilmiş nnU-Net modeliyle toraks BT görüntülerini işler. Pipeline iç yapısı: ön-işleme (resample · normalize) → patch-tabanlı sliding-window inference → son-işleme (bağlı bileşen birleştirme, belirsizlik haritası).

CARVIS yeni bir segmentasyon mimarisi önermez ve modelleri yeniden eğitmez; mevcut nnU-Net çıktılarını karar destek akışının başlangıç katmanı olarak kullanır.

02

Maske geçerlilik kontrolü

Segmentasyon çıktısı kantitatif kalite kontrolden geçer: maskenin bağlı bileşen yapısı, hacim aralığı ve belirsizlik dağılımı eşiklere göre değerlendirilir.

Geçerli sayılmayan maskeler için akış erken sonlandırılır ("reject path"). Sistem, kötü maske üzerinden iç-tutarlı ama klinik olarak yanıltıcı bir rapor üretmek yerine açıkça başarısız olur.

Bu, "tüm aşağı akış açıklama kalitesi segmentasyon kalitesine bağlıdır" prensibinin pratik uygulamasıdır.

03

Anatomik lokalizasyon

Beyin için lezyon merkezi, hasta hacminin MNI152 uzayına SimpleITK rigid + affine + histogram-matching ile kayıt edilmesinin ardından Harvard-Oxford kortikal ve subkortikal atlas etiketlerine eşlenir. Hemisfer, lob ve derinlik bilgisi raporda birlikte sunulur.

Karaciğer için Couinaud sınıflaması — IVC, falsiform ligament, sol/orta/sağ hepatik ven ve safra kesesi fossası gibi anatomik anchor noktalarına dayanan centroid-temelli bir heuristik ile uygulanır. Akciğer için lob bazlı haritalama kullanılır.

Atlas güveni düşük olduğunda akış "soften wording" dalına girer: rapor dilinde hedge ifadeleri ("yaklaşık", "lokalizasyon belirsizdir") otomatik olarak uygulanır.

04

patient_context — Paylaşılan veri deposu

Bağlam yükleme aşamasında oluşturulan patient_context yapısı tüm akışın merkezindedir. Hasta ID, yaş, cinsiyet, tarama tarihi ve modalite bilgisi burada toplanır.

Son-işleme adımı segmentasyon bulgularını bu yapıya yazar; metrik + bölge haritalama burada okur; Q&A motoru aynı yapıdan vakaya özel bağlamı çeker. Tek bir vaka boyunca tüm bileşenler aynı veriyi görür.

Bu paylaşılan durum, dil katmanının "klasik RAG"den farkını netleştirir: model serbest geri-getirme yapmaz, sadece patient_context içeriğini kullanır.

05

Bağlam-kilitli soru-cevap

CARVIS dil katmanı, klasik açık-uçlu RAG yerine vaka için önceden üretilmiş patient_context tanımı üzerinden çalışır. Model bu bağlamın dışına çıkmaya izin verilmez.

Soru sınıflandırma + bağlam geri-getirme adımı yüksek-risk konuları tespit eder (örn. histopatolojik tanı talebi, tedavi kararı, prognoz hesabı). Bu sorular guardrail dalına yönlendirilir; sistem konuyu açıkça reddedip klinisyene yönlendirir.

Çalışma zamanında kullanılan model Qwen2.5-7B-Instruct (GGUF, q4_k_m). Çıkarım, gömülü llama.cpp sunucu süreci üzerinden yerel olarak yapılır; bulut çağrısı veya dış API yoktur.

06

Hibrit raporlama

Rapor iskeleti deterministik olarak üretilir: Clinical Context, Findings, Impression, Limitations, Suggested Clinical Correlation ve Disclaimer bölümleri sabit başlıklar olarak yer alır (sırasıyla: Klinik Bağlam, Bulgular, Klinik Değerlendirme, Sınırlılıklar, Klinik Korelasyon Önerisi, Yasal Uyarı).

Dil modeli yalnızca Clinical Context, Findings ve Impression bölümlerinde anlatım tonunu sağlar; ölçümler, lokalizasyon etiketleri, güven düzeyleri ve uyarılar şablon tarafından doğrudan yerleştirilir.

Bu yaklaşım, raporun klinik açıdan güvenli bir minimum yapı korumasını ve dil modeli çıktısının yapısal denetim altında kalmasını hedefler.

07

Unity XR Görüntüleyici

Akışın çıktısı Unity XR Viewer aracılığıyla VR/AR modlarında üç boyutlu olarak incelenebilir. Tümör maskesi, anatomik referans katmanı ve metrik etiketleri sahnede birlikte sunulur.

Bu bileşen ana karar akışının üstünde isteğe bağlı bir görselleştirme dalıdır; eğitim ortamlarında ve karmaşık vakaların hekimler-arası tartışmasında kullanılmak üzere tasarlanmıştır.

Unity XR sahnesi, raporun yanında kanıt katmanı olarak işlev görür. Web tanıtım sitesinde gördüğünüz Three.js tabanlı atlas, masaüstü uygulamadaki XR görüntüleyicinin tarayıcı eşdeğeridir.

Sistem, kötü maskenin üzerinden iç-tutarlı görünen yanıltıcı bir rapor üretmek yerine akışı erken sonlandırır. Atlas güveni düşükse dilini yumuşatır. Yüksek-risk bir soru için yanıt üretmeyi reddeder. Karar dalları, sistemin güvenliğinin kalbi.
CARVIS — Karar dalları prensibi