| Komisyon Adı | : | (10/235, 837, 1601, 1602, 1800, 1801) Esas Numaralı Meclis Araştırması Komisyonu |
| Konu | : | TÜİK Başkan Yardımcısı Tuğba Değirmenci'nin, resmî istatistikler, Türkiye'de veri, veri yönetimi, veri yönetimindeki dönüşüm, yapay zekânın ihtiyaçları ve TÜİK'in yapay zekâ konusundaki çalışmaları hakkında sunumu |
| Dönemi | : | 28 |
| Yasama Yılı | : | 3 |
| Tarih | : | 22 .04.2025 |
BAŞKAN FATİH DÖNMEZ - Tuba Hanım, biz de çok teşekkür ediyoruz bu faydalı bilgiler için.
Siz de konuşmanızda ifade ettiniz; tabii, yapay zekâ teknolojisinin yakıtı, en büyük kaynağı veri. Daha önceki toplantılarımızdan bir tanesinde bu veri kalitesiyle ilgili olarak bir STK temsilcisinin değerlendirmelerini almıştık.
Şimdi, zaman zaman biz de soruyoruz bazı istatistiki bilgileri, verileri -malum, şöhretli olan- yapay zekâ programlarına. Bakıyorum, TÜİK'ten alacağına Eurostat'tan, Avrupa kaynaklarından veya Türkiye'deki ikincil kaynaklardan alıyor. Aslında verinin kaynağı TÜİK, belli oluyor, fakat daha kolay mı erişiyor, kalitesiyle ilgili bir sorundan dolayı mı onu bilemedim; bir sorunla karşı karşıya kalıyoruz zaman zaman. Ben onun üzerine Sayın Başkanınız Erhan Bey'i de aradım; ya, böyle bir konu da gündeme geldi, erişmekte mi zorlanıyor, makine öğrenmesine uygun mu değil acaba verileriniz dedim. Böyle bir eleştiri vardı.
Ben de zaman zaman TÜİK sitesine girerek bazı verilere erişmeye çalışıyorum; açık söyleyeyim, çok kullanıcı dostu bir ekran yüzünüz yok; dallanıyoruz budaklanıyoruz filan, öbür taraftan çıkıyoruz ama veriye ulaşamıyoruz, veri bir yerlerde saklı, saklanmış durumda.
JÜLİDE SARIEROĞLU (Ankara) - Telefon uygulaması yok herhalde, değil mi?
TÜİK BAŞKAN YARDIMCISI TUĞBA DEĞİRMENCİ - Mobil uygulamamız şu anda yok.
BAŞKAN FATİH DÖNMEZ - Normal masaüstü bilgisayarlardan girdiğimizde de doğrusu böyle bir sorunla karşılaşıyoruz. Şimdi, tabii, biliyorsunuz, çok sık ziyaret edilen yerlerde "Sen robot musun? diye birtakım kontroller, testler yapılıyor, acaba oraya mı takılıyor yapay zekâ programları? Ama biz resmî bir veriyi almasını ve onu bize sunmasını isteriz. Çünkü geçenlerde size sordum: "Veriyi nereden alıyorsun, bana önceliklendirerek kaynaklarını söyler misin?" diye. Aslında TÜİK'i ilk sıralara koyuyor veya ilgili resmî kurumları da koyuyor. Tabii, verinin içeriğinden siz sorumlu değilsiniz çünkü size de değişik kurumlardan o veriler geliyor ama bunun sunuşu, saklanması, güvenliği sizinle ilgili. Onun için onu sormak istiyorum. Bu konu önemli.
Bir diğeri de verinin güvenliği, kalitesi ve erişilebilirliğini dışarıdan bir üçüncü göze denetlettiniz mi? Öyle bir geri dönüş, bir nevi müşteri memnuniyet anketi gibi bir çalışmanız var mı? TÜİK verilerini dünya standartlarına göre veya bu konuda iddialı olan ülkelerin istatistik kurumlarına göre mukayese ettiğimizde hangi sıralamada olduğunu söyleyebilirsiniz?
Benim sorularım bunlar. Siz benim sorularımdan başlayın isterseniz, diğer arkadaşlar da talep ettikçe onları da yönlendireceğim.
Buyurun.
TÜİK BAŞKAN YARDIMCISI TUĞBA DEĞİRMENCİ - LLM'lerde herhangi bir resmî istatistik sorgusu yaptığınız zaman veriyi nereden alacağı, neden Türkiye İstatistik Kurumundan alamadığı sorusu güzel bir soru. Biz bunu kendi içimizde de denedik ve bunların analizlerini de yaptık. Galiba yüzde 50 oranında ancak Türkiye İstatistik Kurumunun verilerine ulaşabildiğini gördük ama tam bir muamma yani LLM'in hangi veri üzerine eğitildiği, en son hangi tarihli veriyi gördüğü konusu tam bir muamma. Biz ne zaman kendi yerli LLM'imize sahip oluruz, onu da "fine tune" ederek herhangi bir resmî istatistik sorgusunda Türkiye İstatistik Kurumunu işaret etmesini sağlayabilirsek o zaman esasında gerçek kontrolü elimize alırız. Fakat Sayın Bakanım, sizin de dediğiniz gibi, peki, kendimize dönüp baktığımız zaman Türkiye İstatistik Kurumunun -LLM baksın bakmasın- veri portalleri, "web" sistemiz gerçekten kullanıcı dostu mu, ihtiyaca cevap veriyor mu? Bu bizim her zaman üzerinde çalıştığımız bir konu, hatta anlık kullanıcı memnuniyet anketleriyle, veriye kullanıcıların doğru bir şekilde, kolay bir şekilde erişip erişmediğini anlık bir şekilde ölçerek sürekli gözlemliyoruz. Bundan tam otuz sene önce kamuda ilk açılan "web" sitesi Türkiye İstatistik Kurumunun "web" sitesiydi. Tabii ki bu süreçte çok fazla şey değişti. Bu sene, inşallah, tam 30'uncu yıl dönümümüzde yeni veri portalimizi, kullanıcı dostu, makine okuyabilir, daha iyi etiketlenmiş veri portalimizi kullanımınıza sunacağız. Notumuzu alıyoruz bunun alakalı.
Peki, üçüncü gözlere biz süreçlerimizi denetletiyor muyuz? Bu süreçler nasıl oluyor? Şimdi, biz, Avrupa Birliği müktesebatına bağlı olarak işliyoruz kurumsal olarak ve yine, Avrupa Birliği üyeliği müzakerelerinde kendimize ait bir faslımız var, istatistik faslı. Bu istatistik faslındaki uyumluluğumuzu sürekli iyileştirmeye çalışıyoruz, şu an yüksek uyumluluk çerçevesindeyiz. Bu müktesebata bağlı olarak operasyonlarımızı yürüttüğümüz için "Avrupa İstatistik Ofisi" olarak adlandırılan Eurostat sürekli bizimle görüşme hâlinde ve sürekli bütün süreçlerimizi aslında gözlemliyor. Örneğin "peer review"lara giriyoruz. İşte, iki yılda bir, üç yılda bir, beş yılda bir "peer review"ın emsal tarama çalışmalarına giriyoruz. Emsal taramada bir grup aday ülke Eurostat'ın başkanlığında, istatistik kurumlarına -sadece TÜİK'e özel değil- gidiyor ve süreçlerini gözden geçiriyor. İşte, eksik olan verilerine veya her türlü atama süreçlerine kadar gözden geçirip bir rapor sunuyor ve bu raporun akabinde de biz kendi iyileştirmelerimizi yapıyoruz. Onun dışında, işte, kaliteye ilişkin standartlar, bilgi güvenliğine ilişkin... Eğer üçüncü göz olarak tanımlayabilirsek bunları kalite uzmanlarından veya güvenlik uzmanlarının gözünden süreçlerimizi geçiriyoruz. Tabii ki verilerimiz hiçbir zaman kendi kurum personelimiz de dâhil açık değil. Veriler hiçbir zaman gözden geçirilemez çünkü sadece o veri işleyen o veriyi görebilir ama süreçlerimiz mümkün olduğunca şeffaf bir şekilde muhataplarına zaman zaman açılmaktadır.