Cum am construit o aplicatie Python care extrage automat datele din buletin si completeaza documente Word
Publicat: Februarie 2026 • Autor: Aldea Daniel • Categorie: Automatizare, Python, OCR
Introduci manual date din buletine in Word zilnic?
In multe organizatii — HR, servicii sociale, administratie publica, birouri juridice — operatorii pierd ore intregi introducand manual aceleasi date din cartile de identitate in formulare Word.
Un CNP gresit.
O adresa incompleta.
Un nume tastat gresit.
Erorile sunt frecvente, iar timpul consumat este urias.
Am construit Cititor CI, o aplicatie desktop Windows care extrage automat datele din cartea de identitate romaneasca si genereaza documente Word complete in cateva secunde — 100% offline.
Problema reala in cifre
Un operator tipic:
- ~3 minute pentru completarea manuala a unui formular
- ~20 formulare pe zi
- ≈ 60 minute pierdute zilnic
Asta inseamna:
Cu Cititor CI:
- 10-15 secunde per document
- Date completate automat
- Risc minim de eroare
Cum functioneaza aplicatia
Scanare sau incarcare imagine
Aplicatia se conecteaza direct la scanner prin:
- WIA (Windows Image Acquisition)
- TWAIN
Operatorul poate scana direct buletinul sau incarca o fotografie existenta.
Extragere automata cu OCR
Motorul OCR bazat pe PaddleOCR extrage automat:
Toate modelele ruleaza local pe calculator. Nu se trimite nimic pe internet.

Interfata principala Cititor CI
Verificare rapida
Datele apar intr-un formular editabil cu 24 de campuri. Operatorul poate:
- Verifica rezultatele
- Corecta eventuale erori OCR
- Adauga telefon, email sau alte informatii

Formularul cu datele extrase automat
Generare automata document Word
Operatorul selecteaza template-ul dorit si apasa Genereaza Document.
Aplicatia:
- Completeaza automat campurile
- Salveaza documentul cu timestamp
- Il pregateste pentru print sau trimitere

Exemplu de document Word generat automat
Citirea Cardului Electronic de Identitate (CEI)
Pe langa OCR, aplicatia poate citi direct datele din cipul cardului electronic folosind un cititor smart card.
Aceasta metoda este:
- Mai rapida
- Mai precisa
- Complet automata
Functionalitate speciala
Aplicatia automatizeaza IDPlugManager (IDEMIA) folosind pywinauto, ceea ce permite extragerea inclusiv a adresei de domiciliu, un camp care nu este expus prin API-ul standard PKCS#11.
Exemplu real de utilizare
Un departament HR trebuie sa genereze 30 contracte.
Fara aplicatie
- Introducere manuala
- Verificare date
- Copiere intre documente
Cu aplicatia
- Scanare buletin
- Verificare rapida
- Generare automata
Template-uri Word flexibile cu Jinja2
Orice document Word poate deveni template:
Subsemnatul {{ nume_complet }}, CNP {{ cnp }},
domiciliat in {{ adresa }}, legitimat cu {{ ci_complet }},
declar ca...
Aplicatia include 7 template-uri gata pregatite:
- Cereri ajutor social
- Cereri imprumut
- Formulare inscriere
- Formulare plata in numele altcuiva
- Imputerniciri
Stack tehnologic
Totul scris in Python si distribuit ca executabil standalone. Platform: Windows 10/11. Versiune: 1.2.0
Provocari tehnice interesante
Compatibilitate PaddleOCR
Versiunile 2.x si 3.x returneaza rezultate diferite. Am implementat parsare adaptiva automata.
Extragerea completa a datelor CEI
Adresa nu este accesibila prin API standard. Solutia: automatizarea interfetei IDPlugManager.
Bundle PyInstaller cu modele AI
Impachetarea PaddleOCR + PaddlePaddle a necesitat peste 100 directive collect-all si patch-uri runtime pentru compatibilitate PaddleX.
Suport dual scanare
Detectare automata intre WIA si TWAIN. Compatibilitate inclusiv cu scanere enterprise.
Performanta
Optimizari implementate:
- Preincarcare modele OCR
- Dezactivare module inutile
- Cache modele
Confidentialitate si GDPR
Aplicatia ruleaza complet offline.
- Fara cloud
- Fara transfer date
- Fisiere temporare sterse automat
- Buton “Sterge Tot” pentru curatare instantanee
Potrivit pentru medii cu cerinte stricte de protectie a datelor.
Pentru cine este utila aplicatia
Ai un proces similar in organizatia ta?
Construiesc aplicatii custom pentru extragere automata date documente, generare automata contracte si formulare, automatizare fluxuri interne si solutii offline pentru medii sensibile GDPR.
Contacteaza-maAlte automatizari pe care le pot construi
- Extragere date facturi
- Procesare contracte PDF
- Completare formulare automate
- Integrare scanere enterprise
- Aplicatii desktop interne pentru companii