Tıpta Dijital Dönüşümün Dilbilimsel Boyutu
Yapay Zeka ve Robotik Sistemlerde Doğal Dil İşleme (NLP) Uygulamaları Geleceğin Sağlık Ekosisteminde Dilin Epistemolojik Rolü
Yazar: Eren Gültekin
Bu yayın, NEÜ Tıp Fakültesi ve Mühendislik Fakültesi iş birliğinde düzenlenmiş olan 1. Geleneksel Sağlıkta Yeni Teknolojiler Paneli'nde sunum olarak gerçekleştirilmiştir.
1. Klinik Verilerin Anlamlandırılması: NLP ve Elektronik Sağlık Kayıtlarının (EHR) Analizi
Sağlık hizmetlerinin dijitalleşmesiyle birlikte Elektronik Sağlık Kayıtları (EHR), muazzam bir veri havuzu oluşturmuştur. Bu verilerin büyük bir kısmı yapılandırılmamış metinlerden oluştuğu için geleneksel analiz yöntemleriyle işlenmesi imkansızdır. NLP, bu noktada klinik anlatıyı (clinical narrative) bilgisayar tarafından işlenebilir bir yapıya dönüştürerek klinik karar destek sistemlerinin omurgasını oluşturur.
1.1. Varlık İsmi Tanıma (NER) ve Kavramsal Hassasiyet
Klinik NLP süreçlerinin ilk ve en kritik adımı, Varlık İsmi Tanıma (NER) sistemleridir. Bu sistemler metin içerisinden ilaçları, hastalıkları, prosedürleri ve laboratuvar sonuçlarını tespit eder. Güncel çalışmalar, genel amaçlı büyük dil modellerinin (LLM) klinik alanda uzmanlaşmış boru hatları karşısında zorlandığını göstermektedir. Örneğin, Spark NLP gibi klinik alanda önceden eğitilmiş modeller, İnsan Fenotip Ontolojisi (HPO) kodlamasında %100'e yakın bir kapsama oranına ulaşırken, GPT-4 gibi modellerin bu alandaki başarısı %60'ın altında kalmaktadır.
Klinik metinlerin doğası, rapor türüne göre dramatik farklılıklar gösterir. Vizit notları (progress notes), radyoloji veya patoloji raporlarına kıyasla çok daha yüksek bir tıbbi varlık yoğunluğuna sahiptir. Yapılan analizler, vizit notlarının cümle başına ortalama 8.01 tıbbi varlık içerdiğini, oysa patoloji raporlarında bu oranın 0.53'e kadar düştüğünü göstermektedir. Bu durum, klinik NLP modellerinin eğitilmesinde "tek tip veri" yaklaşımının yetersizliğini ve rapor türüne özgü dilbilimsel modellerin geliştirilmesi gerektiğini kanıtlamaktadır.
Klinik Veri Metrikleri (Ortalama Değerler) Patoloji Raporu Vizit Notu Radyoloji Raporu
Not başına tümce sayısı 2.385 1.714 477
Tümce başına belirteç (token) sayısı 1.183 3.646 1.216
Tümce başına klinik varlık (entity) sayısı 53 801 206
Klinik varlık yoğunluğu (%) 452 2.198 1.692
Tablo 1: Klinik Veri Metrikleri — Kaynak: https://pmc.ncbi.nlm.nih.gov/articles/PMC12449662/
1.2. İddia Tespiti (Assertion Detection) ve Bağlamsal Doğruluk
Bir tıbbi varlığın metinde geçmesi, hastanın o duruma sahip olduğu anlamına gelmez. Bir "diyabet" ifadesi; hastanın diyabet olduğunu belirtebileceği gibi, aile öyküsünde geçtiğini (associated with someone else), bir şüpheyi ifade ettiğini (possible) veya hastada diyabetin bulunmadığını (absent/negation) belirtebilir. Bu ayrımın yapılamaması, tıbbi hataların ve yanlış teşhislerin en büyük teknik nedenlerinden biridir.
Modern derin öğrenme modelleri, özellikle Bi-LSTM (Çift Yönlü Uzun-Kısa Süreli Bellek) mimarileri, hedef kelimenin etrafındaki 9 kelime solu ve 15 kelime sağı kapsayan bir pencere içinde bağlam analizi yaparak bu sorunu çözer. 2025 yılına ait veriler, ince ayar yapılmış (fine-tuned) LLM'lerin özellikle "Varsayımsal" (Hypothetical) ve "Başkasıyla İlişkili" durumlarda ticari API'lerden çok daha yüksek doğruluk (0.962) sergilediğini göstermektedir. Bu modellerin başarısı, klinik metinlerdeki karmaşık negasyon yapılarını çözebilme kapasitelerine bağlıdır.
Model Karşılaştırması (Doğruluk/Accuracy) Mevcut (Present) Yok (Absent) Varsayımsal Ağırlıklı Ortalama
İnce Ayar Yapılmış LLM 976 975 911 962
GPT-4o 937 891 677 901
AWS Med Comprehend 882 788 617 839
NegEx (Kural Tabanlı) - 897 - 897
Tablo 2: Model Karşılaştırması — Doğruluk/Accuracy Değerleri
1.3. Tıbbi Ontolojiler ve Standartlaştırma: UMLS ve SNOMED CT
Klinik verilerin anlamlandırılmasında dilbilimsel bir iskelet görevi gören ontolojiler, verilerin farklı sistemler arasında taşınabilirliğini sağlar. Birleşik Tıbbi Dil Sistemi (UMLS), CPT'den ICD-10'a kadar yüzlerce farklı vokabüleri birbirine bağlayan devasa bir meta-thesaurus yapısı sunar. SNOMED CT ise modern tıp terminolojisinin en kapsamlı ontolojisi olarak, klinik kavramlar arasında mantıksal ve hiyerarşik bağlar kurar.
Ancak bu ontolojilerin NLP boru hatlarına entegrasyonu ciddi zorluklar barındırır. SNOMED CT'nin devasa boyutu (300.000'den fazla kavram ve 1 milyondan fazla tanım), modellerin karmaşıklığını artırır. Yapılan çalışmalar, SNOMED CT içindeki kavramların yaklaşık %12'sinin (35.010 kavram) tanımlarında gereksiz öğeler barındırdığını ve "IS_A" (dir/dır) ilişkisinin bazen "bir parçasıdır" veya "bir örneğidir" gibi farklı anlamlarda kullanılarak mantıksal karışıklığa yol açtığını ortaya koymuştur. Bu durum, ontoloji tabanlı NLP sistemlerinin geliştirilmesinde daha "hafif" ve spesifik alt kümelerin (subset) kullanılmasını zorunlu kılmaktadır.
Tıbbi bilginin formelleştirilmesi süreci, mantıksal bir denkleme indirgenebilir:
O = TBOX + ABOX
Burada TBOX (Terminology Box), kavram hiyerarşisini ve ilişkilerin şemasını tanımlarken; ABOX (Assertion Box), bu şemanın gerçek dünyadaki hasta verilerine uygulanmasını ifade eder. Bu matematiksel modelleme, yapay zekanın tıbbi bir muhakeme yürütebilmesi için gereken temel dilbilimsel yapıdır.
2. Nörolojik Hastalıklarda Bir "Biyobelirteç" Olarak Konuşma Örüntüleri
Tıpta dijital dönüşümün en inovatif alanlarından biri, konuşmanın sadece bir iletişim aracı değil, aynı zamanda merkezi sinir sisteminin durumunu yansıtan bir "dijital biyobelirteç" olarak kabul edilmesidir. Alzheimer ve Parkinson gibi nörolojik hastalıklar, daha motor semptomlar (titreme, unutkanlık) klinik olarak belirginleşmeden çok önce konuşmanın akustik ve dilbilimsel özelliklerinde sapmalara neden olur.
2.1. Alzheimer Hastalığı ve Spontane Konuşma Analizi
Alzheimer (AD) teşhisinde geleneksel yöntemler (CSF biyobelirteçleri veya görüntüleme) invaziv ve pahalıdır. Oysa otomatik konuşma analizi, hastanın ev ortamında bile gerçekleştirilebilen non-invaziv bir alternatiftir. AD hastalarının konuşmalarında iki ana dilbilimsel sapma gözlemlenir:
• Zamanlama Özellikleri: Sözcükler arası duraklamaların artması, konuşma hızının yavaşlaması ve "ee, şey" gibi boşluk doldurucuların sıklaşması.
• Sözcük-Anlamsal Özellikler: Sözcük dağarcığının daralması (semantic richness kaybı), isimlerin yerine adılların kullanılması ve düşük bilgi yoğunluğu.
Yapılan araştırmalar, bu özelliklerin birleştirilmesiyle oluşturulan modellerin AD hastalarını sağlıklı bireylerden ayırt etmede 0.88 AUC (Eğri Altındaki Alan) başarısına ulaştığını kanıtlamıştır.
Özellikle konuşma zamanlaması özelliklerinin, diller arası (cross-linguistic) geçerliliği daha yüksektir. Örneğin, İngilizce verilerle eğitilen bir modelin zamanlama özellikleri İspanyolca konuşan hastalarda 0.75 AUC başarısı gösterirken, sözcük-anlamsal özellikler aynı başarıyı (0.64 AUC) sergileyememiştir. Bu, sinir sistemindeki motor kontrol kaybının dilin gramer yapısından daha evrensel bir biyobelirteç olduğunu göstermektedir.
2.2. Parkinson Hastalığı: Hipokinetik Dizartri ve Akustik Analiz
Parkinson hastalarının %90'ında görülen hipokinetik dizartri; ses kısıklığı, monoton ses tonu ve artikülasyon bozukluklarıyla karakterizedir. Bu akustik değişimler, bazal ganglion fonksiyon bozukluğundan kaynaklanan solunum ve gırtlak kasları üzerindeki nöromüsküler kontrol kaybının bir sonucudur.
Parkinson dilbilimsel analizinde öne çıkan temel akustik özellikler şunlardır:
• Jitter ve Shimmer: Sesin frekans ve genliğindeki mikroskobik düzensizlikler.
• Harmonik-Gürültü Oranı (HNR): Sesin saflığını ölçen bir metrik; Parkinson hastalarında glottal kapanma yetersizliği nedeniyle düşüktür.
• Duraklama Yüzdesi: Konuşma içindeki sessizlik sürelerinin toplam konuşma süresine oranı.
Modern LLM'ler, Parkinson hastalarının transkriptlerini analiz ederek %78 doğruluğa ulaşabilmektedir. Bu modeller; sözdizimsel karmaşıklığın azalmasını (simpler syntax), fiil yoğunluğunun artmasını ve duygusal tonun "nötrleşmesini" (flat affect) tespit ederek erken teşhise katkı sağlar.
Hastalık Belirteçleri Akustik Parametreler Dilbilimsel/Sözdizimsel Değişimler Başarı (AUC)
Alzheimer Artan duraklama süresi Düşük bilgi yoğunluğu, zamir kullanımı 0.88
Parkinson Monotonluk, düşük ses şiddeti Basit cümle yapıları, fiil yoğunluğu 0.78 (Doğruluk)
Tablo 3: Alzheimer ve Parkinson — Hastalık Belirteçleri ve AUC Başarıları Kaynak: Automated Speech Markers - Journal of Medical Internet Research, erişim tarihi Mayıs 1, 2026
3. Sağlık Botları ve Hasta İletişiminde Edimbilimsel (Pragmatik) Sınırlar
3.1. "Yapay Empati" ve İnsan-Makine Etkileşimi
Yapay zekanın tıptaki rolü teşhisle sınırlı değildir; sağlık botları ve sanal asistanlar aracılığıyla hasta ile sistem arasındaki ilk temas noktası haline gelmektedir. Ancak bu etkileşimin kalitesi, makinelerin dilin edimbilimsel (pragmatik) boyutlarını ne kadar yönetebildiğiyle doğrudan ilişkilidir.
Empati, hasta-hekim ilişkisinin ve tedaviye bağlılığın temel taşıdır. İlginç bir şekilde, 2023-2024 yıllarında yapılan meta-analizler, hastaların metin tabanlı etkileşimlerde yapay zekayı insan hekimlerden daha "empatik" bulduğunu göstermektedir. 15 çalışmadan 13'ünde AI chatbotlar, empati puanlarında insanları geride bırakmıştır (SMD 0.87, bu da 10 puanlık bir ölçekte yaklaşık 2 puanlık bir artışa tekabül eder).
Bu paradoksal durumun altında yatan nedenler şunlardır:
• Yanıt Uzunluğu ve Ayrıntı: Chatbotlar, hekimlerin aksine zaman kısıtlaması olmadan uzun, nazik ve açıklayıcı yanıtlar verebilir.
• Eylem Odaklı Destek: AI sistemleri, sadece duygusal teselli vermekle kalmayıp, çoklu sosyal destek ve eylem planları sunma eğilimindedir.
• Yorgunluk Faktörü: İnsan profesyoneller tükenmişlik yaşarken, yapay zeka her zaman standart bir nezaket düzeyini korur.
Ancak bu "yapay empati" (artificial empathy), gerçek bir duygusal deneyimden ziyade algoritmik bir simülasyondur. "Pseudo-empathy" (sahte empati) olarak adlandırılan bu durum, hastada yanlış bir bağlanma ve gerçekçi olmayan bir güven duygusu yaratma riski taşır.
3.2. İroni ve Metafor: NLP'nin Pragmatik Çıkmazı
Dilbilimsel edimbilimin en karmaşık alanları olan ironi ve metafor, tıbbi iletişimde sıklıkla karşımıza çıkar. Bir hastanın "Harika, bir bu eksikti!" şeklindeki ironik ifadesini literal olarak algılayan bir AI botu, klinik tabloyu tamamen yanlış yorumlayabilir.
Araştırmalar, ChatGPT'nin metaforları tanıma konusunda "belirgin bir yetenek" (marked aptitude) sergilediğini, ancak ironi tespiti konusunda "istikrarsız" (erratic) olduğunu göstermektedir. İroni tespiti, sadece kelimelerin anlamını değil, aynı zamanda konuşmacının niyetini, ses tonunu ve sosyal bağlamı kavramayı gerektirir. Mevcut LLM'ler literal ve örtük anlamlar arasındaki farkı her zaman ayırt edememektedir. Bu durum, özellikle psikiyatrik değerlendirmelerde veya hassas tanı paylaşımlarında dilin "ince katmanlarının" makine tarafından ıskalanması anlamına gelir.
4. Tele-Cerrahi ve Küresel Tıp: Anlık Çeviri ve Ortak Terminoloji
4.1. 5G ve Gecikme (Latency) Sınırları
Dijital dönüşümün en ileri aşaması, bir cerrahın binlerce kilometre uzaktaki bir hastayı robotik sistemler aracılığıyla ameliyat edebildiği tele-cerrahidir. Bu süreçte dil, sadece tıbbi bir kayıt aracı değil, ameliyathanedeki koordinasyonu sağlayan anlık bir komuta zinciri işlevi görür.
Tele-cerrahinin önündeki en büyük engel, verinin cerrahın el hareketinden robota iletilmesi ve videonun geri dönmesi sırasında yaşanan gecikmedir. Araştırmalar, cerrahlar için 200 ms altındaki gecikmelerin "ideal", 300 ms'ye kadar olan gecikmelerin "güvenli", ancak 500 ms üzerindeki gecikmelerin "yorgunluk verici ve hatalara açık" olduğunu göstermektedir.
5G teknolojisi, 1 ms kadar düşük gecikme süreleri sunarak tele-cerrahiyi deneysel bir aşamadan pratik bir gerçekliğe dönüştürmüştür. 2024 yılında Orlando'dan Dubai ve Şanghay'a (10.000 km'den fazla) gerçekleştirilen başarılı tele-cerrahi gösterimleri, 5G'nin ultra-düşük gecikme (URLLC) kapasitesinin bir kanıtıdır.
Tele-Cerrahi Gecikme Eşikleri Etki Düzeyi Cerrahi Performans
0 - 100 ms Fark edilemez Mükemmel
100 - 200 ms Hafif İdeal
300 - 500 ms Belirgin Yorgunluk verici, hata riski artar
700 ms Kabul edilemez Tehlikeli
Tablo 4: Tele-Cerrahi Gecikme Eşikleri ve Cerrahi Performansa Etkileri
4.2. Çok Dilli Cerrahi Koordinasyon ve STSW
Küresel tıp uygulamalarında, cerrahın ve yerel ekibin farklı dilleri konuşması durumunda anlık çeviri sistemleri hayati önem kazanır. 5G ile optimize edilmiş "Konuşmadan Konuşmaya İş Akışı" (Speech-to-Speech Workflow - STSW), ileri seviye konuşma tanıma (OpenAI Whisper) ve makine çevirisi (Marian MT) modellerini entegre eder.
Bu sistemler, tıbbi terminolojiye özgü eğitilmiş modeller kullanarak 0.12 gibi düşük bir Kelime Hata Oranı (WER) ile 2.1 saniyelik bir uçtan uca gecikme süresine ulaşabilmektedir. Bu teknolojik altyapı, cerrahi komutların hatasız ve gecikmesiz olarak çevrilmesini sağlayarak küresel tıp kaynaklarının daha adil dağılımına imkan tanımaktadır.
5. Pazar Dinamikleri ve Sektörel Gelecek
Sağlıkta NLP ve yapay zeka pazarı, dijital dönüşümün hızıyla paralel olarak devasa bir ekonomik büyüme sergilemektedir. 2025 yılında 5.18 milyar USD olarak öngörülen pazar hacminin, 2030 yılına kadar %25.3'lük bir yıllık bileşik büyüme oranı (CAGR) ile 16.01 milyar USD'ye çıkması beklenmektedir.
6. Sonuç ve Öneriler
Tıpta dijital dönüşüm, sadece daha hızlı işlemciler veya daha hassas robotik kolların devreye girmesi değil, aynı zamanda makinelerin "insan dilini" tüm katmanlarıyla işleme kapasitesidir. NLP, tıbbı yapılandırılmamış bir anlatı yığınından, yapılandırılmış ve aksiyon alınabilir bir bilgi sistemine dönüştürmektedir. Ancak bu dönüşümün başarısı, teknik mükemmelliğin yanı sıra etik ve dilbilimsel derinlikle doğrudan ilişkilidir.
Bu çerçevede aşağıdaki öneriler önem taşımaktadır:
• Klinik Linguistlerin Rolü: Yazılım geliştirme süreçlerinde sadece mühendislerin değil, klinik dilbilimcilerin (clinical linguists) de yer aldığı multidisipliner takımlar kurulmalıdır. Dilin pragmatik sınırlarını (ironi, metafor) anlamayan bir yapay zeka, klinik hatalara davetiye çıkarabilir.
• Açıklanabilir Yapay Zeka (XAI): NLP modellerinin verdiği kararların arkasındaki dilbilimsel kanıtlar (örneğin hangi ifadenin "negasyon" olarak algılandığı), hekimlerin sistem güvenini artırmak için şeffaf bir şekilde sunulmalıdır.
• Standartlaştırma ve Ontoloji Yönetimi: UMLS ve SNOMED CT gibi sistemlerin güncel klinik dile uyarlanması ve modellerin bu hiyerarşik yapıları daha verimli işlemesi için yeni algoritmalar geliştirilmelidir.
• Küresel İşbirliği ve 5G/6G Geçişi: Tele-cerrahi ve anlık çeviri sistemleri için gereken düşük gecikmeli altyapı yatırımları, özellikle sağlık hizmetine erişimin kısıtlı olduğu bölgelerde önceliklendirilmelidir.