B.Öztürk
Yapay Zeka2023·4 hafta·Tamamlandı

CV Parser API

PDF ve DOCX formatındaki CV'leri yükleyen ve LangChain + GPT-4 ile ayrıştıran REST API. Çıktı: isim, iletişim, iş geçmişi, eğitim, beceriler şeklinde temiz JSON.

Kategori

Yapay Zeka

Yıl

2023

Rol

Backend Developer

Durum

Tamamlandı

Proje görseli

Problem

İnsan kaynakları yazılımlarının CV parse modülleri hem pahalı hem de Türkçe CV formatlarında düşük performanslı.

Çözüm

LangChain'in structured output özelliğiyle birleştirilen özel prompt şablonları, hem İngilizce hem Türkçe CV'leri %94 doğrulukla ayrıştırıyor. Redis ile parse sonuçları önbelleğe alınıyor.

Sonuçlar

%94 parse doğruluğu (Türkçe ve İngilizce CV'ler)

Ortalama işlem süresi: 2.3 saniye

2 müşteri entegrasyonu (HR yazılımı)

Teknik Zorluklar

01

Farklı CV formatları için robust text extraction

02

LangChain structured output ile tip güvenli ayrıştırma

03

Redis TTL stratejisiyle maliyet optimizasyonu

Teknoloji Stack

FastAPI

API framework

LangChain

LLM orchestration

GPT-4

Parse motoru

PyMuPDF

PDF text extraction

python-docx

Word dosyası okuma

Redis

Önbellekleme

Etiketler

FastAPIPythonLangChainRedis

Diğer projeler