CV Parser API
PDF ve DOCX formatındaki CV'leri yükleyen ve LangChain + GPT-4 ile ayrıştıran REST API. Çıktı: isim, iletişim, iş geçmişi, eğitim, beceriler şeklinde temiz JSON.
Kategori
Yapay Zeka
Yıl
2023
Rol
Backend Developer
Durum
Tamamlandı
Proje görseli
Problem
İnsan kaynakları yazılımlarının CV parse modülleri hem pahalı hem de Türkçe CV formatlarında düşük performanslı.
Çözüm
LangChain'in structured output özelliğiyle birleştirilen özel prompt şablonları, hem İngilizce hem Türkçe CV'leri %94 doğrulukla ayrıştırıyor. Redis ile parse sonuçları önbelleğe alınıyor.
Sonuçlar
%94 parse doğruluğu (Türkçe ve İngilizce CV'ler)
Ortalama işlem süresi: 2.3 saniye
2 müşteri entegrasyonu (HR yazılımı)
Teknik Zorluklar
Farklı CV formatları için robust text extraction
LangChain structured output ile tip güvenli ayrıştırma
Redis TTL stratejisiyle maliyet optimizasyonu
Teknoloji Stack
FastAPI
API framework
LangChain
LLM orchestration
GPT-4
Parse motoru
PyMuPDF
PDF text extraction
python-docx
Word dosyası okuma
Redis
Önbellekleme