Przekształcanie danych
w wiedzę
DoRIS - Specyfikacja techniczna
Liczba dokumentów zależnie od edycji
Unlimited (ograniczone zasobami środowiska)
Liczba użytkowników
Unlimited
Źródła danych
- Serwer sieciowy (SMB)
- Chmura (Onedrive, Googledrive, etc.)
- Strony WWW – Webscraping, Webcrawling
- Inne wskazane przez Klienta
- Formularz WWW (GUI)
- Sharepoint (on premise, cloud)
- Systemy zewnętrzne z API
Typy danych wejściowych
- Nieustrukturyzowane
Właściciel dokumentów
Administrator zawartości
- Ustrukturyzowane
Excel, json, xml, csv
Formaty danych wyjściowych
- API: json
Graficzny Interfejs Użytkownika
- Interfejs WEB z poziomu przeglądarki internetowej (Chrome, Firefox, Edge) lub urządzeń mobilnych
- Integracja z Active Directory
- Wyszukiwanie z uwzględnieniem literówek, negacji, dopełnień słów lub metadanych.
- Wyznaczanie dokumentów podobnych oraz duplikatów
- Wyszukiwanie w zasobach zewnętrznych
- Graficzny podgląd stron dokumentów
- Edycja metadanych
- Moduł BI
Statystyki dokumentów
Raporty aktywności użytkowników
Wizualizacja danych tabelarycznych - Role użytkowników
Użytkownik
Właściciel dokumentów
Administrator zawartości
- Autoryzowany dostęp do aplikacji
- Wersje językowe interfejsu: polska, angielska
- Wyszukiwanie pełnotekstowe z uwzględnieniem odmiany dla języka polskiego oraz angielskiego
- Rekomendacje dokumentów na bazie zachowania użytkowników
- Oznaczanie wyszukanych fraz w wynikach wyszukiwania
- Przeglądanie struktury repozytorium wg. klasyfikacji
- Tagowanie dokumentów
- Poziomy uprawnień
Dostęp na poziomie taksonomii
Przetwarzanie
- OCR - rozpoznawanie tekstu z obrazu
- AI, NLP - przetwarzanie języka naturalnego z wykorzystaniem sztucznej inteligencji:
Automatyczna klasyfikacja dokumentów
Automatyczne uzupełnianie brakujących metadanych
Generowanie streszczenia
- Generowanie podglądu stron dokumentu
- Conformal Prediction - douczanie modeli na podstawie aktywności i preferencji użytkowników
Repozytorium dokumentów
- Historia wersji dokumentu
- Indeks szybkiego wyszukiwania
- Historia aktywności użytkownika
- Metadane dokumentu
-
Wielowymiarowa, hierarchiczna klasyfikacja dokumentów
API programistyczne
- Autoryzowany dostęp do repozytorium bez użycia GUI
- REST API
- Swagger UI
Technologie
- Dokumentowa baza danych: MongoDB
- Indeks wyszukiwania: ElasticSearch
- Relacyjna baza danych: PostgreSQL
- Frontend: Vue.js
- Przetwarzanie: Python
- Serwer aplikacji: Nginx
Minimalne wymagania systemowe
- HDD: 500 GB
- RAM: 40 GB
- CPU: 8x core
- System operacyjny: Linux
Instalacja
- Instalacja w infrastrukturze lokalnej klienta
- Instalacja w chmurze (AWS, Azure, HP, IBM)