Основні недоліки опублікованих відкритих даних – невідповідні формати, відсутність опису структури та уніфікованого стандарту оформлення – експерти

WATCH IN ENGLISH

Київ, 3 липня 2016 року – На сьогодні кількість доступних відкритих даних відносно задовільна, проте із якістю є чимало проблем. Також є численні випадки явного ухилення від публікації тих чи інших даних з боку різних державних органів. Про це заявили користувачі відкритих даних під час дискусії в Українському кризовому медіа-центрі.

Основний показник якості даних – це машиночитаний формат, тобто, придатність даних до подальшої роботи, зазначив Андрій Газін, аналітик Texty.org.ua. «Якщо подивитися на те, що було на порталі кілька тижнів тому, ви бачите, що за кількістю домінують формати DOC, PDF, JPJ,PNG. Навіть більше половини опублікованих даних не можуть бути названі якісними, тому що з PDF і Wordавтоматичними засобами не можна працювати», – пояснив він. – Просто розпорядники даних не розрізняють текстові і структуровані дані, і публікують структуровані дані у форматі для текстових». На його думку, необхідно просто заборонити приймати файли у цьому форматі.

Типові приклади недоліків в опублікованих машиночитаних даних формату CSV* та XLS(X)Андрій Газін продемонстрував на прикладі реєстру виданих і призупинених ліцензій на торгівлю алкогольними напоями і тютюновими виробами Державної фіскальної служби України, з яким він працював минулого місяця. Це, зокрема, відсутність опису структури файлу, нетипове кодування, яке при цьому не зазначене в метаінформації, різне значення і порядок змінних, різне форматування, відсутність уніфікованого формату дати, адреси, форм написання форм господарювання, використання латинських символів замість українських тощо. Така різноманітність, на думку пана Газіна, зумовлена тим, що ці дані вводять вручну, кожен на власний розсуд. «Тут основна проблема – відсутність елементарних інструкцій щодо ведення цих баз даних», – підсумував аналітик. Все це у результаті суттєво ускладнює роботу для користувача даних.

Для усунення цих проблем, на думку Андрія Газіна, необхідно вводити валідатор, який би перевіряв валідність файлу, у тому числі кодування та наявність порожніх комірок, та впровадити стандарт оформлення таких документів хоча б у межах однієї установи. «Також було б непогано продумати, де можна автоматизувати процес введення даних, щоб замість десяти варіацій одного значення був випадаючий список, із якого реєстратор вибирає необхідне», – запропонував він.

Олексій Вискуб, заступник голови Державного агентства з питань електронного урядування України, погодився, що проблеми існують, але й зазначив, що налагодити за 9 місяців роботу системи практично з нуля  – завдання непросте. Труднощі пов’язані частково із застарілою системою ведення баз даних в установах та нерозумінням або спротивом чиновників. «80% наших зусиль фактично йдуть на питання, які пов’язані з питаннями трансформації свідомості і політичної волі. […] Близько 90% органів влади взагалі не розуміють, що таке відкриті дані. Питання навчання і підвищення кваліфікації чиновників – це першочергове завдання», – зазначив він. Для покращення ситуації у серпні для державних установ планують розпочати проект на зразок Open Data Leader Networks. «Ми будемо намагатися створювати лідерів відкритих даних в Україні. […] Набираючи людей у таку мережу, навчаючи їх і створюючи осередки лідерства, ми зможемо більш якісно просувати політику відкритих даних», – наголосив Олексій Вискуб.

Існуючі недоліки самого порталу планують ліквідувати у другій версії порталу. «Ми впровадимо інструменти, які мінімізують публікацію неякісних даних. […] Сподіваюся, вона почне роботу вже восени», – повідомив Олексій Вискуб. До кінця серпня планують також прийняти постанову, яка допоможе налагодити взаємодію між різними реєстрами і вирішить проблему дублювання даних у реєстрах різних установ. Крім того, спільно із громадською мережею ОПОРА зараз готують єдину платформу, на базі якої обласні органи місцевого самоврядування зможуть налагодити взаємодію між своїми реєстрами і єдиним порталом.

Пан Вискуб нагадав, що у 17 базових органах влади вже 2-й місяць триває аудит щодо того, якими наборами даних вони володіють. «Сподіваюся, до кінця жовтня цю роботу завершать і ми зможемо показати якісну аналітику і перспективу відкриття нової черги даних», – зазначив він.

Також проводять роботу із підвищення готовності громадян до роботи з відкритими даними. З цією ж метою Агентство ініціювало декілька конкурсів для проектів, їх проводять Інкубатор проектів на основі відкритих даних 1991 та E-GapChallenge. «Нещодавно у нас були креативні вікенди, на яких ми відібрали такі проекти. Це, наприклад, Open DataBot, який аналізує інформацію з 4-х реєстрів. Там в один клік із месенджера можна отримати якісні дані щодо будь-якого підприємства,  у скількох судових справах воно фігурує і так далі», – розповів заступник голови Держагентства.

Присутні на дискусії користувачі даних особливо наголосили на тому, що нерідко чиновники ухиляються від публікації тому даних. Це офіційно пояснюють відсутністю фінансування, спеціалістів, або ж відписують, що «відповідний наказ знаходиться у процесі погодження». Поширеною практикою є і невиправдане накладання грифу «для службового користування». Коментуючи ці факти, Олексій Вискуб зазначив, що зараз для боротьби з порушеннями «вже більше політичної волі». «Якщо якийсь орган не оприлюднюватиме дані, ми збираємося виносити питання на розгляд Кабміну. Сподіваємося, це стане значним поштовхом», – пообіцяв він.

Водночас, вже можна говорити про певний прогрес у цій сфері: у міжнародному рейтингу ООН щодо розвитку електронного врядування Україна за останні два роки піднялася із 87-ї позиції на 62-у. «Це дуже важливо, тому що із 2010 по 2013 ми впали вниз на 33 позиції», – нагадав Олексій Вискуб. За критеріями міжнародного рейтингу OpenData Barometer, Україна цього року досягла найбільшого прогресу у сфері бюджету та державних закупівель, найменшого – у сфері освіти та охорони здоров’я. Зараз закінчують роботу із приєднання України до Міжнародної Хартії відкритих даних. Очікують, що це приєднання відбудеться під час конференції у Мадриді.