Veri/Büyük Veri Mühendisi/Mimarı
Görev ve Sorumluluklar
• Büyük ölçekli veri platformları (data lake, data warehouse, lakehouse) tasarlamak, geliştirmek ve sürdürmek.
• Gerçek zamanlı (streaming) ve batch veri işleme sistemleri kurmak ve yönetmek.
• Farklı kaynaklardan gelen verileri entegre ederek güvenilir ve sürdürülebilir veri pipeline’ları oluşturmak.
• Büyük ölçekli zaman serisi tahmini ve gerçek zamanlı analitik kullanım senaryoları için veri altyapısı ve modelleme süreçlerini geliştirmek.
• Veri kalitesi, veri yönetişimi ve metadata yönetimi süreçlerini tasarlamak ve uygulamak.
• Veri sözlüğü ve kurumsal veri standartlarının oluşturulmasına katkı sağlamak.
• Analitik, raporlama ve makine öğrenmesi ekipleri için düşük gecikmeli ve ölçeklenebilir veri servisleri (serving layer) sunmak.
• Büyük veri sistemlerinin performansını izlemek, optimize etmek ve ölçeklenebilirliğini sağlamak.
• Veri güvenliği, erişim kontrolü ve regülasyonlara (KVKK, GDPR vb.) uyumu sağlamak.
• Ar-Ge ve yapay zekâ projelerinde veri katmanı konusunda mimari tasarım geliştirmek.
• Alt yüklenici firmalarca geliştirilen veri bileşenlerinin mimari uyumluluğunun değerlendirilmesine teknik katkı sağlamak.
• Teknik dokümantasyon hazırlamak ve kurumsal bilgi birikiminin korunmasına katkı sunmak.
Nitelikler
• Dağıtık veri işleme teknolojileri konusunda deneyim (Apache Spark, Hadoop ekosistemi vb.).
• Streaming veri işleme teknolojilerine hâkimiyet (Apache Kafka, Apache Flink vb.).
• SQL, NoSQL ve analitik veri tabanları (PostgreSQL, Cassandra, MongoDB, ClickHouse vb.) ile ileri seviye deneyim.
• Python, Scala veya Java ile veri pipeline geliştirme deneyimi.
• ETL/ELT süreçleri, veri modelleme (star schema, data vault vb.) ve veri dönüşüm araçları (dbt vb.) konusunda deneyim.
• Veri orkestrasyonu araçları (Apache Airflow, Prefect vb.) ile deneyim.
• Data lakehouse mimarileri (Delta Lake, Apache Iceberg, Hudi vb.) konusunda deneyim.
• Veri kalitesi, veri doğrulama, veri gözlemlenebilirliği (data observability) ve izleme süreçleri konusunda deneyim.
• Kubernetes üzerinde veri ve streaming sistemleri (Spark, Kafka vb.) kurma ve yönetme deneyimi.
• Düşük gecikmeli veri erişimi ve gerçek zamanlı analitik sistemleri tasarlama deneyimi.
• Veri yönetişimi, veri kalitesi ve veri standardizasyonu konularında bilgi sahibi olmak.
• Git ve versiyon kontrol sistemlerine hâkim olmak.
• Analitik düşünme yeteneği, problem çözme odaklı yaklaşım, öğrenmeye açık tutum ve ekip çalışmasına yatkınlık.
Tercih Sebepleri
• Büyük ölçekli veri platformları veya ulusal/kurumsal veri altyapısı projelerinde görev almış olmak.
• Büyük ölçekli zaman serisi verileri ile çalışma ve zaman serisi tahmini kullanım senaryolarına aşinalık.
• Apache NiFi veya benzeri veri akış yönetimi (data flow orchestration) araçları ile deneyim.
• Feature store, data catalog ve metadata yönetim araçları (Feast, Amundsen, OpenMetadata vb.) konusunda deneyim.
• Gerçek zamanlı analitik ve yüksek hacimli sorgular için columnar veri tabanları (ClickHouse vb.) ile çalışma deneyimi.
• BI ve veri görselleştirme araçları (Power BI, Tableau, Superset vb.) ile entegrasyon deneyimi.
• Veri şeması yönetimi (schema evolution) ve veri sözleşmeleri (data contracts) konusunda deneyim.
• Pathway, Kafka, ClickHouse gibi streaming ve analitik teknolojilerle proje deneyimi.
• Air-gapped (internet erişimi olmayan) ortamlarda veri platformu kurulumu ve yönetimi deneyimi.
• Açık kaynak lisanslama konusunda farkındalık (Apache 2.0, MIT vb. lisans uyumluluğu).
• Akademik yayın, teknik blog veya konferans katkısı.
Eğitim
• Üniversitelerin Bilgisayar Mühendisliği, Yazılım Mühendisliği veya ilgili mühendislik bölümlerinden mezun; tercihen bu alanlarda yüksek lisans veya doktora yapmış ya da devam ediyor olmak.
Deneyim
• Büyük veri, veri mühendisliği veya veri platformları alanında en az 5 yıl profesyonel deneyime sahip olmak.
Yabancı Dil
• İngilizce (teknik dokümantasyon, uluslararası proje iletişimi ve akademik literatür takibi düzeyinde).