Document Parser
Ekstrakcja struktury
PDF, DOCX i skany konwertowane do ustrukturyzowanego tekstu z zachowaniem hierarchii artykułów i paragrafów. Vision LLM obsługuje tabele i wykresy.
PDFDOCXOCR
Infrastruktura wyłącznie w UE| Zero retencji danych| DORA art. 28-30| RODO art. 9| Prawa audytu KNF| Brak US CLOUD Act| Art. 104 Prawa bankowego
Wszystko, czego potrzebujesz
AthenaVault przetwarza dokumenty w trzech warstwach: parsowanie, anonimizacja i weryfikacja. Każda dostępna osobno lub jako spójny pipeline.
Ekstrakcja struktury
PDF, DOCX i skany konwertowane do ustrukturyzowanego tekstu z zachowaniem hierarchii artykułów i paragrafów. Vision LLM obsługuje tabele i wykresy.
PDFDOCXOCR
Trójwarstwowe usuwanie PII
Regex, NLP i kontekstowy LLM działające kaskadowo. PESEL, nazwiska i adresy wykrywane i zastępowane ustrukturyzowanymi placeholderami.
PIIRODOPDF
Epistemologiczne Q&A
Zadawaj pytania dokumentom regulacyjnym. Każda odpowiedź cytowana co do artykułu, paragrafu i dokumentu. Każde zapytanie logowane do audytu.
DORAGDPRRODO
Dla zespołów technicznych, budujących na tej samej infrastrukturze
Wizualny kreator pipeline'ów
Buduj pipeline'y uczenia maszynowego, przeciągając bloki na kanwę. Asystent AI generuje pipeline z opisu w języku naturalnym.
PipelineAutoML
Własni asystenci AI
Podłącz własnych asystentów AI do korpusu dokumentów. Konfiguruj uprawnienia, definiuj zachowanie, wdrażaj dla zespołów. Pełny ślad audytowy w zestawie.
AsystenciQ&A na dokumentach
Verifact
Verifact wykonuje 1-5 epistemicznych cykli rozumowania, zanim odpowie. Każde stwierdzenie jest klasyfikowane taksonomią, nie według prawdopodobieństwa, lecz według statusu dowodowego. Twój audytor to doceni.
// Verifact · mapa dowodów
// zapytanie · Czy szkoda jest objęta §12?
Ochrona potwierdzona wg §12 ust. 1
BEZPOŚREDNIO POTWIERDZONEFranszyza obniża wypłatę do 46 300 PLN
WYNIKAJĄCE Z KONTEKSTUFaktura sprzeczna z kosztami osuszania
SPRZECZNE Z DOWODAMIBrak dowodu terminowego zgłoszenia
BRAK DANYCHcykle epistemiczne · ●●●○○ · 3/5
// Anonymizer · 9 PII usuniętych · zgodne z RODO
Anonymizer
W1 regex wyłapuje PESEL i NIP w milisekundy. W2, polski model NLP, znajduje nazwiska i adresy. W3, kontekstowy LLM, domyka wszystko, co umknęło dwóm pierwszym warstwom.
Wyzwanie
Banki, ubezpieczyciele i kancelarie działają pod prawnym obowiązkiem poufności, którego publiczne chmurowe AI nie jest w stanie spełnić. AthenaVault powstała, by domknąć tę lukę.
Publiczne LLM-y
ChatGPT, Copilot i Gemini przetwarzają twoje prompty w Stanach Zjednoczonych. Każdy przesłany dokument znajduje się poza twoją jurysdykcją regulacyjną, podlega US CLOUD Act, a twój regulator nie ma żadnych praw audytu.
AthenaVault
AthenaVault działa w całości w infrastrukturze UE. Inferencja jest ulotna, przetwarzana w RAM, nigdy nie zapisywana. Twoje dokumenty pozostają w twoim perymetrze regulacyjnym, zawsze.
Architektura
AthenaVault
AthenaVault to zasada architektoniczna, która czyni z niej infrastrukturę AI gotową do wdrożenia w sektorach regulowanych. Każda inferencja działa w ulotnej pamięci RAM. Żaden prompt, żaden wynik, żaden dokument nie jest zapisywany przez warstwę przetwarzania. Gdy sesja się kończy, nie zostaje nic.
Platforma
Trzy komponenty. Każdy działa samodzielnie albo jako część w pełni zintegrowanego pipeline'u. Wszystko działa w twoim perymetrze UE, w ulotnej pamięci, bez śladu na infrastrukturze.
001
Ekstrakcja struktury z dowolnego formatu
Przekształca każdy regulowany dokument w ustrukturyzowane, przeszukiwalne dane. Skanowane PDF-y, złożone tabele, wielostronicowe umowy, osadzone wykresy. Każda sekcja zrozumiana, każdy element na swoim miejscu, niezależnie od formatu i jakości.
002
Trójwarstwowe usuwanie PII przed inferencją
Każdy dokument przechodzi trzy warstwy anonimizacji, zanim trafi do jakiegokolwiek modelu. Dane osobowe, numery rachunków i wrażliwe identyfikatory są usuwane. Twoje dane są analizowane, nie eksponowane.
03 · VERIFACT
Verifact zamienia korpus dokumentów w przeszukiwalną, cytowaną warstwę wiedzy. Każda odpowiedź wskazuje dokładny fragment źródła. Każde zapytanie zostawia trwały ślad audytowy. Zero halucynacji. Zero parafraz. Zero ryzyka.
// zapytanie
Jakie są warunki wcześniejszej spłaty wg art. 7.3 umowy kredytowej zawartej 12 marca 2024?
// odpowiedź
Zgodnie z art. 7.3 umowy kredytowej z 12 marca 2024 wcześniejsza spłata jest dopuszczalna po 6 miesiącach od uruchomienia kredytu, z prowizją 1,5% spłacanego kapitału. Po 24. miesiącu opłata nie obowiązuje.
// źródło
KR-2024-1234.pdf · art. 7.3 · s. 14 · zalogowano 14:23:01
zapytanie zalogowane · ślad audytowy aktywny · gotowe na DORA art. 28
Aplikacje
Wyspecjalizowane aplikacje domenowe dla sektorów regulowanych. Każda działa na infrastrukturze regulacyjnej AthenaVault, wyłącznie w UE, zero retencji danych, pełny ślad audytowy. Wdrażaj wprost w swój perymetr zgodności.
[AML-01]WKRÓTCE
Monitoring transakcji pod AMLD6
Wykrywanie podejrzanych wzorców transakcji skalibrowane pod twoją instytucję. Trenowane na twojej historii transakcji, nie na średnich branżowych. Flaguje to, co istotne, ignoruje to, co nie.
AMLD6Czas rzeczywistyBankowość
[FRD-01]WKRÓTCE
Wykrywanie anomalii w strumieniach transakcji
Wykrywanie anomalii w przepływach płatności w czasie rzeczywistym. Uczy się normalnych wzorców twojej instytucji, by minimalizować fałszywe alarmy przy legalnych transakcjach transgranicznych.
Monitoring transakcjiWykrywanie anomaliiCzas rzeczywisty
[INS-01]WKRÓTCE
Aktuarialny scoring ryzyka na twoim portfelu szkód
Scoring ryzyka produktów ubezpieczeniowych trenowany na twojej historii szkód. Odzwierciedla twój rzeczywisty portfel, nie branżowe benchmarki.
Scoring ryzykaAktuariatSzkody
Dla zespołów technicznych
Dla zespołów, które potrzebują własnych przepływów, logiki domenowej albo autorskich modeli. Buduj wprost na infrastrukturze regulacyjnej AthenaVault, bez dodatkowego narzutu zgodności.
[MLL-01]WKRÓTCE
Wizualny kreator pipeline'ów ML
Projektuj, testuj i wdrażaj pipeline'y uczenia maszynowego w wizualnym interfejsie drag-and-drop. Buduj własne modele na własnych danych bez złożoności infrastruktury. Twoja logika, nasza zgodna infrastruktura.
Własne pipeline'yWizualny kreatorDowolne dane
[LLM-01]WKRÓTCE
Buduj i wdrażaj własnych asystentów AI
Podłącz własnych asystentów AI do korpusu dokumentów. Konfiguruj uprawnienia, definiuj zachowanie, wdrażaj dla zespołów. Pełny ślad audytowy i inferencja wyłącznie w UE.
Własni asystenciAutomatyzacja procesówQ&A na dokumentach
Nasze modele
Cztery wyspecjalizowane modele trenowane na dziesiątkach tysięcy polskich dokumentów regulowanych: umowach, orzeczeniach, polisach, sprawozdaniach. Otwarte wagi, inferencja wyłącznie w UE, licencje komercyjne.
01 / 04
Embedding i reranking
Modele embeddingu i rerankingu dostrojone na dziesiątkach tysięcy par zapytanie-dokument z polskich dokumentów regulowanych. Najwyższa trafność dopasowania semantycznego w naszych wewnętrznych benchmarkach.
SFT · DPOPL · EN · DESelf-hosted w UELicencja komercyjna
02 / 04
Rzadkie wyszukiwanie leksykalne
Precyzyjny model leksykalny dla dokumentów regulowanych, numery umów, odniesienia do artykułów, identyfikatory klauzul, daty. Kotwiczy wyszukiwanie w dokładnej terminologii regulacyjnej i strukturze dokumentu.
Precyzja leksykalnaTerminologia prawnaSelf-hosted w UELicencja komercyjna
03 / 04
Model vision-language do OCR dokumentów
Ekstrakcja strukturalna z dokumentów regulowanych, skanowane PDF-y, złożone tabele, układy wielokolumnowe, formularze. Rozumie geometrię dokumentu i wydobywa ustrukturyzowane znaczenie.
Ekstrakcja strukturalnaTabele · FormularzeSelf-hosted w UELicencja komercyjna
04 / 04
Model reasoning dostrojony na polskich regulacjach
Model rozumowania dostrojony na polskich dokumentach regulowanych, umowach bankowych, polisach ubezpieczeniowych, orzeczeniach sądów, wytycznych KNF. Trenowany metodami SFT i DPO na kuratorowanych korpusach regulacyjnych.
SFT · DPOPL · EN · DE · FR · ES · ITServerless w UELicencja komercyjna
Wydajność
Wszystkie benchmarki wykonywane na polskich korpusach dokumentów regulowanych, umowach bankowych, polisach, pismach procesowych. Rzeczywista trafność, nie warunki laboratoryjne.
98%
Trafność dokumentowa (F1) na naszym polskim korpusie regulacyjnym
<850ms
Opóźnienie end-to-end od zapytania do cytowanej odpowiedzi
99%
Trafność OCR na skanowanych dokumentach regulacyjnych
6 jęz.
Gwarantowana jakość w PL, EN, DE, FR, ES, IT
Zgodność regulacyjna
✓ DORA
Rejestr umów ICT, udokumentowana analiza ryzyka jurysdykcyjnego, strategia wyjścia wg art. 28(8), prawa audytu KNF, standardowo w każdej umowie enterprise.
✓ RODO
Dane zdrowotne, prawne, wrażliwe dane finansowe, wszystko przetwarzane z zabezpieczeniami RODO art. 9. Umowa powierzenia art. 28 z podmiotem prawnym w UE. Szyfrowanie at rest per klient.
✓ Bankowość
Zero retencji danych oznacza, że żadna poufna informacja bankowa nie utrwala się poza twoim perymetrem. Art. 104 i aneksy tajemnicy bankowej w zestawie.
✓ Prawo
Zero retencji danych po stronie infrastruktury przetwarzającej czyni AthenaVault zgodną z tajemnicą adwokacką i radcowską w polskim prawie.
✓ Audyt
Umowny łańcuch audytu: twój regulator → ty → xdivision. → infrastruktura. Gwarantowane prawa audytu KNF. Udokumentowany łańcuch podprocesorów z podmiotami UE na każdym poziomie.
✓ AI Act
AthenaVault działa z kompletną dokumentacją systemu AI wymaganą dla wdrożeń wysokiego ryzyka, dokumentacja techniczna, ocena zgodności, mechanizmy nadzoru człowieka.
Dla twojej branży
sektor 01
Analiza dokumentacji kredytowej, przegląd dokumentów KYC/AML, sprawozdawczość regulacyjna, Q&A po procedurach wewnętrznych, w reżimie art. 104 i DORA.
DORAArt. 104KNFRek. D
→sektor 02
Analiza dokumentacji szkodowej, przegląd polis, dokumenty underwritingowe, zgodność DORA dla ubezpieczycieli, z RODO art. 9 dla danych zdrowotnych.
DORARODO art. 9KNFPIU
→sektor 03
Due diligence M&A, analiza umów, research orzecznictwa, Q&A dla klientów, z pełną ochroną tajemnicy adwokackiej i dokumentacją AI Act.
Tajemnica adwokackaRODOAI Act
→Program partnerów założycielskich
Projekt o stałym zakresie na twoich prawdziwych dokumentach. Rezultat: raport wydajności na twoim korpusie, pakiet dokumentacji zgodności i jasny punkt decyzyjny przed wdrożeniem.
Cennik dla partnerów założycielskich, 6 tygodni stałego zakresu, suwerenność UE od pierwszego dnia. Od xdivision z Warszawy.