Case study

Invoice Field Recognition – Automatyzacja mechanizmu rozpoznawania, ekstrakcji i przetwarzania danych z faktur

Branża
Healthcare
Okres współpracy
2025
Osoba w białym fartuchu medycznym trzyma tablet i rysik, stojąc obok aparatu do USG w gabinecie medycznym.

O kliencie

HAMMERmed Medical Polska to jeden z liderów rynku dystrybucji wyrobów medycznych w Polsce. Firma aktywnie uczestniczy w postępowaniach przetargowych, oferując szerokie portfolio produktów do placówek medycznych na terenie całego kraju.

Wiodący na polskim rynku dystrybutor produktów medycznych oraz nowoczesnych metod leczenia.

O projekcie

Klient zgłosił się do nas z potrzebą usprawnienia procesów przetwarzania faktur w obszarze księgowości operacyjnej. Dotychczasowy model pracy opierał się na ręcznym odczycie danych z dokumentów PDF, co generowało duże obciążenie czasowe oraz ryzyko błędów ludzkich.

Wraz z rozwojem organizacji i wzrostem wolumenu dokumentów, manualna obsługa stawała się coraz mniej efektywna i trudna do skalowania. 

Rozwiązanie problemu

W odpowiedzi na potrzeby Klienta przygotowaliśmy rozwiązanie umożliwiające zautomatyzowane rozpoznawanie pól na fakturach, ich dynamiczną transformację oraz bezpieczny zapis do systemu bazodanowego, w oparciu o skalowalną architekturę chmurową Microsoft Azure. 

Wymogiem było również zachowanie elastyczności i możliwość łatwego dostosowywania rozwiązania do zmieniających się potrzeb. 

Dodatkowo rozwiązanie zapewnienia wysoką spójność i jakość danych trafiających do systemów bazodanowych, jak również możliwość ich dalszego wykorzystania w procesach analitycznych. 

Wdrożenie i rozwój

Pełen zakres prac dla HAMMERmed obejmował 4 kluczowe etapy, które pozwoliły nam rozwiązania zgodne z oczekiwaniami Klienta.

Etap I – Analiza i przygotowanie danych

  • Przegląd i klasyfikacja formatów faktur dostarczanych przez klienta,
  • Identyfikacja pól kluczowych (m.in. kwoty, daty, numery faktur, dostawcy),
  • Opracowanie struktury danych wejściowych i wyjściowych,
  • Stworzenie zaleceń dotyczących standaryzacji danych. 

Etap II – Mechanizm ekstrakcji i transformacji wartości

Przygotowano i wdrożono moduł umożliwiający:

  • Odczyt treści z plików PDF przy użyciu specjalizowanego PDF field readera, 
  • Zastosowanie dynamicznego słownika parametrów definiującego pola do wyciągania oraz sposób ich transformacji, 
  • Modyfikację danych „w locie” – np. standaryzację dat, formatowanie kwot, normalizację wartości tekstowych,
  • Możliwość elastycznego rozszerzania zakresu pól bez ingerencji w kod aplikacji. 

Etap III – Automatyzacja procesu

  • Opracowanie w pełni zautomatyzowanego przepływu przetwarzania faktur: pobranie pliku z współdzielonego magazynu, uruchomienie mechanizmu ekstrakcji, transformacja zgodnie z regułami, zapis wyników do bazy danych,
  • Implementacja procesów harmonogramowania i monitorowania,
  • Zastosowanie architektury serverless, umożliwiającej skalowanie i obsługę zmiennej liczby dokumentów bez konieczności zarządzania serwerami. 

Etap IV – Budowa infrastruktury chmurowej

Wykorzystano środowisko Microsoft Azure, w którym dostarczono:

  • Infrastrukturę uruchomieniową opartą o konteneryzację Docker, 
  • Środowisko serverless (np. Azure Functions / Container Apps), 
  • Współdzielony storage na faktury wejściowe, 
  • Bezpieczną bazę danych dla wyników ekstrakcji, 
  • Mechanizmy logowania i obserwowalności, 
  • Automatyzację publikacji i wersjonowania komponentów. 

Architektura rozwiązania

01. Warstwa wejściowa – HAMMERmed

  1. Faktury (PDF) trafiają do shared storage,
  2. Przetworzone dane zapisywane są do output database.

02. Warstwa obliczeniowa – Azure

  1. Kontenerowa aplikacja Invoice Scrapper App uruchamiana jako Docker/serverless,
  2. Mechanizm przetwarzania sterowany automatycznie na podstawie zdarzeń (np. nowy plik). 

03. Warstwa logiczna aplikacji

  • PDF field reader – odczyt pól z dokumentu,
  • Parameters dictionary – definicje pól i reguł transformacji,
  • Transform value – moduł przetwarzający dane „w locie”,
  • Final data preparation / saved – zapis danych do bazy. 
Diagram architektury aplikacji do przetwarzania faktur: pliki PDF z faktur trafiają ze współdzielonej przestrzeni do aplikacji „Invoice scrapper app” uruchomionej w kontenerze Docker w środowisku serverless na Microsoft Azure, a wyniki zapisywane są w bazie danych. Proces obejmuje odczyt pól PDF, transformację wartości z użyciem słownika parametrów oraz końcowe przygotowanie i zapis danych.

„Zespół 3Soft zrealizował dla nas kompleksowe wdrożenie – od analizy i standaryzacji danych, przez budowę modułu ekstrakcji treści i logiki transformacji, aż po zaprojektowanie nowoczesnej architektury chmurowej. Dzięki zastosowaniu mechanizmów serverless i konteneryzacji, opracowane rozwiązanie pozwala elastycznie obsługiwać zmienne wolumeny dokumentów, bez angażowania zasobów IT.

Cały proces, od wczytania faktury, przez ekstrakcję i przekształcenie danych za pomocą rozwiązań opartych o Machine Learning, aż po ich zapis, został w pełni zautomatyzowany. Znacząco skróciło to czas operacyjny działań i wyeliminowało błędy ludzki.

Doceniamy profesjonalizm zespołu 3Soft: ich umiejętność szybkiego zrozumienia kontekstu biznesowego oraz elastyczność w podejmowanych działaniach. Z pełnym przekonaniem rekomendujemy 3Soft jako rzetelnego i jakościowego partnera technologicznego w obszarze inteligentnej automatyzacji procesów biznesowych.”

Tomasz Rajca

IT Project Manager, HAMMERmed Medical Polska

Kluczowe efekty

Wdrożenie naszego rozwiązania pozwoliło klientowi:

  • Skrócić czasu obsługi danych z faktur dzięki pełnej automatyzacji,
  • Wyeliminować błędy wynikające z ręcznego przepisywania danych,
  • Stworzyć możliwość skalowania procesu w zależności od obciążenia,
  • Elastycznie dostarczać nowe reguły i pola bez konieczności zmiany logiki aplikacji,
  • Uzyskać wzrost efektywności procesów finansowo-operacyjnych w organizacji. 

Kontakt

Skontaktuj się z nami

Z niecierpliwością czekamy
na wiadomość od Ciebie!

Formularz kontaktowy

Formularz kontaktowy

Szczegółowe informacje dotyczące przetwarzania danych osobowych dostępne są w Polityce prywatności.