Inapoi la Portofoliu
Case Study — Automatizare

Cum am construit o aplicatie Python care extrage automat datele din buletin si completeaza documente Word

Publicat: Februarie 2026 • Autor: Aldea Daniel • Categorie: Automatizare, Python, OCR

10-15s
per document
24
campuri extrase
100%
offline
7
template-uri

Introduci manual date din buletine in Word zilnic?

In multe organizatii — HR, servicii sociale, administratie publica, birouri juridice — operatorii pierd ore intregi introducand manual aceleasi date din cartile de identitate in formulare Word.

Un CNP gresit.

O adresa incompleta.

Un nume tastat gresit.

Erorile sunt frecvente, iar timpul consumat este urias.

Am construit Cititor CI, o aplicatie desktop Windows care extrage automat datele din cartea de identitate romaneasca si genereaza documente Word complete in cateva secunde — 100% offline.

Problema reala in cifre

Un operator tipic:

  • ~3 minute pentru completarea manuala a unui formular
  • ~20 formulare pe zi
  • ≈ 60 minute pierdute zilnic

Asta inseamna:

20+
ore pierdute lunar
Sute
de documente introduse manual

Cu Cititor CI:

  • 10-15 secunde per document
  • Date completate automat
  • Risc minim de eroare

Cum functioneaza aplicatia

1

Scanare sau incarcare imagine

Aplicatia se conecteaza direct la scanner prin:

  • WIA (Windows Image Acquisition)
  • TWAIN

Operatorul poate scana direct buletinul sau incarca o fotografie existenta.

2

Extragere automata cu OCR

Motorul OCR bazat pe PaddleOCR extrage automat:

CNP
Serie si numar CI
Nume si prenume
Adresa completa
Data nasterii
Sex
Cetatenie
Valabilitate
Emitent

Toate modelele ruleaza local pe calculator. Nu se trimite nimic pe internet.

Cititor CI - Interfata principala a aplicatiei

Interfata principala Cititor CI

3

Verificare rapida

Datele apar intr-un formular editabil cu 24 de campuri. Operatorul poate:

  • Verifica rezultatele
  • Corecta eventuale erori OCR
  • Adauga telefon, email sau alte informatii
Cititor CI - Formular de date extras din buletin

Formularul cu datele extrase automat

4

Generare automata document Word

Operatorul selecteaza template-ul dorit si apasa Genereaza Document.

Aplicatia:

  • Completeaza automat campurile
  • Salveaza documentul cu timestamp
  • Il pregateste pentru print sau trimitere
Cititor CI - Document Word generat automat

Exemplu de document Word generat automat

Citirea Cardului Electronic de Identitate (CEI)

Pe langa OCR, aplicatia poate citi direct datele din cipul cardului electronic folosind un cititor smart card.

Aceasta metoda este:

  • Mai rapida
  • Mai precisa
  • Complet automata

Functionalitate speciala

Aplicatia automatizeaza IDPlugManager (IDEMIA) folosind pywinauto, ceea ce permite extragerea inclusiv a adresei de domiciliu, un camp care nu este expus prin API-ul standard PKCS#11.

Exemplu real de utilizare

Un departament HR trebuie sa genereze 30 contracte.

Fara aplicatie

  • Introducere manuala
  • Verificare date
  • Copiere intre documente
2-3 ore munca

Cu aplicatia

  • Scanare buletin
  • Verificare rapida
  • Generare automata
~10 minute total

Template-uri Word flexibile cu Jinja2

Orice document Word poate deveni template:

Subsemnatul {{ nume_complet }}, CNP {{ cnp }},

domiciliat in {{ adresa }}, legitimat cu {{ ci_complet }},

declar ca...

Aplicatia include 7 template-uri gata pregatite:

  • Cereri ajutor social
  • Cereri imprumut
  • Formulare inscriere
  • Formulare plata in numele altcuiva
  • Imputerniciri

Stack tehnologic

PythonCustomTkinterPaddleOCRPaddleXdocxtplJinja2pywinautoWIA / TWAINPillowOpenCVPyInstaller

Totul scris in Python si distribuit ca executabil standalone. Platform: Windows 10/11. Versiune: 1.2.0

Provocari tehnice interesante

Compatibilitate PaddleOCR

Versiunile 2.x si 3.x returneaza rezultate diferite. Am implementat parsare adaptiva automata.

Extragerea completa a datelor CEI

Adresa nu este accesibila prin API standard. Solutia: automatizarea interfetei IDPlugManager.

Bundle PyInstaller cu modele AI

Impachetarea PaddleOCR + PaddlePaddle a necesitat peste 100 directive collect-all si patch-uri runtime pentru compatibilitate PaddleX.

Suport dual scanare

Detectare automata intre WIA si TWAIN. Compatibilitate inclusiv cu scanere enterprise.

Performanta

Optimizari implementate:

  • Preincarcare modele OCR
  • Dezactivare module inutile
  • Cache modele
2-3s
prima rulare
<1s
rulari ulterioare

Confidentialitate si GDPR

Aplicatia ruleaza complet offline.

  • Fara cloud
  • Fara transfer date
  • Fisiere temporare sterse automat
  • Buton “Sterge Tot” pentru curatare instantanee

Potrivit pentru medii cu cerinte stricte de protectie a datelor.

Pentru cine este utila aplicatia

Departamente HR
Servicii sociale
Birouri juridice / notariale
Administratie publica
Organizatii / sindicate

Ai un proces similar in organizatia ta?

Construiesc aplicatii custom pentru extragere automata date documente, generare automata contracte si formulare, automatizare fluxuri interne si solutii offline pentru medii sensibile GDPR.

Contacteaza-ma

Alte automatizari pe care le pot construi

  • Extragere date facturi
  • Procesare contracte PDF
  • Completare formulare automate
  • Integrare scanere enterprise
  • Aplicatii desktop interne pentru companii