Логотип О сервисе DocResearch

📝 Возможности

  • 📄 Загрузка договоров в форматах .pdf и .docx
  • 🤖 Автоматический анализ по юридическим шаблонам
  • ⚠️ Выявление рисков, потенциально опасных формулировок
  • 📥 Скачивание результатов анализа
  • 🖥️ Удобный и адаптивный интерфейс

🛠️ Используемые технологии

📄 Анализ документов

  • Python + Flask — серверная логика
  • PyMuPDF — извлечение текста из PDF
  • Pymorphy2 — морфологический анализ
  • Sentence-BERT (sBERT) — семантическое сопоставление
  • Scikit-learn — работа с векторными представлениями
  • Pandas + OpenPyXL — формирование Excel-отчётов

🧠 Модели и ИИ

  • sbert-miniLM — компактная модель BERT
  • Собственные шаблоны риска — настраиваемые категории
  • Позитивные и негативные примеры — для улучшения семантики

🌐 Веб-интерфейс

  • HTML5 + CSS3 + JavaScript — адаптивный интерфейс
  • Fetch API — асинхронный обмен с сервером
  • Фильтрация и подсветка — удобный просмотр результатов

⚙️ Архитектура

  • Модульный анализ: синтаксический → семантический
  • JSON-интерфейс — готовность к API
  • Поддержка многопоточности — масштабируемость

📬 Контакты

Если у вас есть предложения, замечания или вы нашли ошибку, свяжитесь с нами:

📌 Будущие обновления
  • 📄 Анализ актов, писем и других документов
  • 🗃️ Интеграция с облачными хранилищами
  • 📊 Расширенные форматы выгрузки (PDF, Excel)
  • 🌍 Шаблоны под разные юрисдикции