Обробка зображень з метою подальшого дослідження чи eDiscovery

В попередній статті ми розповідали про застосування у практичній діяльності уніфікованих UTBMS та LEDES кодів. Відповідні коди містять багато, на перший погляд, неспецифічні для вітчизняної практики юридичні послуги. Саме тому ми вирішили присвятити цикл статей таким послугам. Почнемо з послуг, які вимагають застосування спеціального програмного забезпечення. Ми спробуємо розповісти про програмні продукти, які можуть стати корисними юристу, суттєво полегшити його роботу та підвищити якість надання юридичних послуг.

Юридична робота часто вимагає вчинення певних дій з документами в електронну вигляді. Так, кодом A120 передбачено такий вид юридичних послуг як "Обробка документів". Ця послуга включає в себе обробку документів, зображень, файлів, в тому числі пакетну обробку, з метою подальшого дослідження чи eDiscovery (дослідження інформації в електронному вигляді). Обробка може полягати в розпізнаванні тексту, імпортування/архівування/накладення на зображення текстового шару, конвертування файлів тощо.

Іншим видом послуг є "Створення документальної продукції" (код A125). Дана послуга полягає у створенні, передачі чи доставка документальної продукції (зведених документів чи файлів) для їх подальшого дослідження або eDiscovery.

Попередня обробка документів необхідна також для надання послуги передбаченої кодом A126 - "Створення або підготовка речових доказів " (створення, передача чи доставка речових доказів, з метою дослідження чи eDiscovery, зокрема: створення відеоматеріалів чи інших речових доказів).

Інший класифікатор LEDES містить цілий розділ, який присвячений eDiscovery, що лише підтверджує важливе значення обробки документів в юридичній роботі.

Робота над будь-яким проектом (підготовка договору, позову, надання консультації тощо) передбачає огляд та аналіз документів. Часто юристу доводиться вступати у вже триваючий судовий процес. В такому випадку доводиться ознайомлюватися з матеріалами справи. Нажаль, в українських судах не передбачено можливість отримати доступ до електронних версій матеріалів справи, як це можливо, приміром, в США за допомогою системи PACER (https://www.pacer.gov/). Тому українського юриста із матеріалами справи розпочинається з фотоапарата чи із вбудованої у телефон фотокамери.

Особливої насолоди у процес додає відсутність обладнаних місць для ознайомлення та погане освітлення. Саме тому після такого ознайомлення необхідно приділити значну частину часу обробці отриманих зображень. Застосування складних графічних редакторі на зразок PhotoShop чи CorelDraw не найкраще вирішення проблеми. Відповідні програми мають доволі складний інтерфейс, є платними, потребують додаткових плагінів та вміння створення макросів для пакетної обробки. Таким чином, обробка зображень за допомогою таких програм впливатиме на вартість послуг по обробці документів. В реаліях українського юридичного бізнесу доволі складно пояснити клієнту, чому на обробку зображень було затрачено 5-6 годин?

Розглянемо програму, яка дозволить автоматизувати процес обробки, зробити його швидшим та дешевшим. Такою програмою є Scan Tailor. Перевагою даної програми, між іншим, є її безкоштовність та кросплатформеність - можливість використання в різних операційних системах (Windows, Linux, MacOS).

Останній офіційний реліз (версія) програми було підготовлено в 2012 році (версія 0.9.11.1), проте програма має відкритий код (opensource) і на її основі були підготовлені авторські релізи (Scan Tailor Featured та Scan Tailor EnhancedScan Tailor Enhanced). Найновішим авторським релізом є Scan Tailor Featured, який можна завантажити за наступним посилання. Саме його ми і будемо тестувати.

Інтерфейс програми складається з трьох панелей:

  1. Вибір операції;
  2. Попередній перегляд (прев'ю);
  3. Список зображень.

Загальний вигляд програми

Початок роботи

Для обробки зображень необхідно натиснути на кнопку "Новий проект", після чого вибрати папку із зображеннями.

Після вибору папки в лівій панелі з'явиться список файлів. Якщо натиснути "Вибрати все", то всі файли зі списку будуть передані на обробку.

Також можна вибрати окремі файли, які не будуть приймати участь в обробці. Натискаємо "ОК" та переходимо до наступних налаштувань.

В даному меню пропонується визначити роздільну здатність зображення. Як правило для підготовки документів до друку достатньо 300х300 dpi. Такі ж вимоги до роздільної здатності встановлюють і окремі державні органи (приміром державні реєстратори, сервісні центри тощо). Після того як визначилися із роздільною здатністю натискаємо "Применить" та "ОК" і переходимо безпосередньо до обробки зображень.

Перевертання сторінок

Доволі часто зображення мають горизонтальне положення.Тому їх варто перевернути у вертикальне. Scan Tailor дозволяє перевернути всі зображення одночасно. Для цього в лівій колонці програми натискаємо стрілки в залежності від напрямку повертання.

Також варто натиснути кнопку "Применить к...." та у меню, що з'явиться, обрати "К этой странице и всем последующим". Відповідне налаштування дозволить повернути всі наступні зображення у списку. В результаті ми отримаємо зображення правильної орієнтації.

Для пакетної обробки варто натиснути кнопку "Плей" (зі значнокм стрілочки), після чого програма застосує вибрані налаштування для всі наступних зображень.


Розрізання зображення

Наступним кроком є розрізання зображення. Це необхідно у випадку, якщо у нас є зображення книжного формату, де є дві сторінки та розворот. При фотографуванні судової справи часто захоплюється також розворот та частина попереднього документа.Відповідна опція дозволить відокремити зайві частини зображення. Програма автоматично виділяє область для розрізання. В редакторі можна також підкорегувати параметри обрізання кожної сторінки шляхом перетягування країв виділеного поля.

Якщо програма правильно визначила область розрізання, то можна із впевненістю натискати на "Изменить" та обрати "К этой странице и всем последующим". Це дозволить автоматично застосувати параметри обрізання для інших сторінок.

Компенсація нахилу

В програмі реалізована функція компенсації нахилу. Функція буде корисна у випадку, якщо зображення має перкос.Програма автоматично визначить правильну орієнтацію тексту та здійснить відповідне коригування. Аналогічно попередній функція натискаємо "Применить к..." для пакетної обробки зображень.


Визначення корисної області

Наступною функцією є визначення корисної області. Це дозволяє позначити на зображенні корисну частину, тобто малюнки, сам текст, інші символи тощо. Функція дозволяє відокремити пусті поля та частину зображення, яка не потрібна.

Як і аналогічні функції обробка може здійснюватися як в автоматичному, так і в ручному режимі. Корисну область можна задати по ширині та висоті всього документу. В такому випадку програма не буде самостійно визначати корисну область, а визначить весь документ як корисна область. Далі натискаємо "Применить к...", обираємо "Ко всем последующим" та натискаємо кнопку "Плей" для запуску обробки.

Програма здійснить визначення корисної області для всіх зображень. Звертаємо увагу, що в копіях документів, які створені на бланках зі спеціальним захистом, варто задати корисну область вручну для всіх зображень, оскільки програма може обрізати елементи захисту, які не є текстом. Якщо програма правильно визначила корисну область можна переходити до наступної функції.

Визначення полів

Наступною функцією є визначення полів. Дана функція дозволяє додати додаткові поля до документу. Зазвичай потреби в таких полях немає, а тому можна сміло натискати "Плей" для запуску пакетної обробки.


Налаштування вихідного зображення

Наступною та самою, на наш погляд, основною функція є налаштування виводу. Зупинимося на окремих налаштуваннях даної функції.

Першим пунктом налаштувань є роздільна здатність майбутнього зображення. У більшості випадках достатньо, щоб юридичних документ був роздільної здатність 300 dpi. Такий документ можна буде роздрукувати без втрати якості. Для застосування вказаної роздільної здатності до всіх зображень необхідно натиснути "Изменить" та вибрати "К этой странице и всех последующих". Звертаємо увагу, що при збільшенні роздільної здатності збільшується і час обробки зображення.

Наступним налаштуванням є "Удаление пятен". Для більш швидкої обробки варто вимкнути видалення плям. Це суттєво пришвидшує обробку та особливо не впливає на якість вихідного зображення.

Корисною є також функція випрямлення строк. За замовчуванням вказана функція відключена. Для її активації варто натиснути "Изменить" та вибрати режим "Автоматически". Програма спробує випрямити строки, якщо не рівні.

Після вказаних маніпуляцій ми отримаємо майже ідеальне зображення, яке не соромно подати до суду чи використовувати у своїй діяльності.