Основные недостатки опубликованных открытых данных – несоответствующие форматы, отсутствие описания структуры и унифицированного стандарта оформления – эксперты

WATCH IN ENGLISH

Киев, 3 июля 2016 года – На сегодня количество доступных открытых данных относительно удовлетворительное, однако с качеством есть немало проблем. Также имеются многочисленные случаи явного уклонения от публикации тех или иных данных со стороны различных государственных органов. Об этом заявили пользователи открытых данных во время дискуссии в Украинском кризисном медиа-центре.

Основной показатель качества данных – это машиночитаемый формат, то есть, пригодность данных к дальнейшей работе, отметил Андрей Газин, аналитик Texty.org.ua. «Если посмотреть на то, что было на портале несколько недель назад, вы видите, что по количеству доминируют форматы DOC, PDF, JPJ, PNG. Более половины опубликованных данных нельзя назвать качественными, потому что с PDF и Word автоматическими средствами работать нельзя», – пояснил он. – Не всегда распорядители данных не различают текстовые и структурированные данные, и публикуют структурированные данные в формате текстовых». По его мнению, необходимо просто запретить принимать файлы в этом формате.

Типичные недостатки опубликованных машиночитаемых данных формата CSV * и XLS (X) Андрей Газин продемонстрировал на примере реестра выданных и приостановленных лицензий на торговлю алкогольными напитками и табачными изделиями Государственной фискальной службы Украины, с которым он работал в прошлом месяце. Это, в частности, отсутствие описания структуры файла, нетипичное кодирование, которое при этом не указано в метаинформации, различное значение и порядок переменных, разное форматирование, отсутствие унифицированного формата даты, адреса, написания форм хозяйствования, использование латинских символов вместо украинских и тому подобное. Такое разнообразие, по мнению эксперта, обусловлено ​​тем, что эти данные вводят вручную, каждый по своему усмотрению. «Здесь основная проблема – отсутствие элементарных инструкций по ведению этих баз данных», – подытожил аналитик. Все это в итоге существенно усложняет работу пользовательских данных.

Для устранения этих проблем, по мнению Андрея Газина, необходимо вводить валидатор, который бы проверял валидность файла, в том числе кодирование и наличие пустых ячеек, и внедрить стандарт оформления таких документов хотя бы в пределах одного учреждения. «Было бы неплохо продумать, где можно автоматизировать процесс ввода данных, чтобы вместо десяти вариаций одного значения был выпадающий список, с которого регистратор выбирает необходимое», – предложил он.

Алексей Вискуб, заместитель председателя Государственного агентства по вопросам электронного правительства Украины, согласился, что проблемы существуют, но и отметил, что наладить за 9 месяцев работу системы практически с нуля – задача непростая. Трудности связаны частично с устаревшей системой ведения баз данных в учреждениях и непониманием или сопротивлением чиновников. «80% наших усилий фактически идут на вопросы, связанные с трансформацией сознания и политической воли. […] Около 90% органов власти вообще не понимают, что такое открытые данные. Вопросы обучения и повышения квалификации чиновников – это первоочередная задача», – отметил он. Для улучшения ситуации в августе для государственных учреждений планируют начать проект на подобии Open Data Leader Networks. «Мы будем стараться создавать лидеров открытых данных в Украине. […] Набирая людей в такую ​​сеть, обучая их и создавая ячейки лидерства, мы сможем более качественно продвигать политику открытых данных», – отметил Алексей Вискуб.

Недостатки самого портала планируют устранить во второй версии портала. «Мы внедрим инструменты, которые минимизируют публикацию некачественных данных. […] Надеюсь, она начнет работу уже осенью», – сообщил Алексей Вискуб. До конца августа планируется также принять постановление, которое поможет наладить взаимодействие между различными реестрами и решит проблему дублирования данных в реестрах различных учреждений. Кроме того, совместно с общественной сетью ОПОРА сейчас готовят единую платформу, на базе которой областные органы местного самоуправления смогут наладить взаимодействие между своими реестрами и единым порталом.
Алексей Вискуб напомнил, что в 17 базовых органах власти уже 2-й месяц продолжается аудит относительно того, какими наборами данных они обладают. «Надеюсь, до конца октября эту работу закончат и мы сможем показать качественную аналитику и перспективу открытия новой очереди данных», – отметил он.

Также проводят работу по повышению готовности граждан к работе с открытыми данными. С этой же целью Агентство инициировало несколько конкурсов для проектов, их проводят Инкубатор проектов на основе открытых данных 1991 и E-Gap Challenge. «Недавно у нас были креативные уикенды, на которых мы отобрали такие проекты. Это, например, Open Data Bot, который анализирует информацию с 4-х реестров. Там в один клик с мессенджера можно получить качественные данные по любому предприятия, в скольких судебных делах оно фигурирует и так далее», – рассказал заместитель председателя Госагентства.

Присутствующие на дискуссии пользователи данных особенно подчеркнули, что нередко чиновники уклоняются от публикации данных. Это официально объясняют отсутствием финансирования, специалистов или же отписывают, что «соответствующий приказ находится в процессе согласования». Распространенной практикой является и неоправданное наложение грифа «для служебного пользования». Комментируя эти факты, Алексей Вискуб отметил, что сейчас для борьбы с нарушениями «уже больше политической воли». «Если какой-то орган будет уклоняться от обнародования данных, мы собираемся выносить вопрос на рассмотрение Кабмина. Надеемся, это станет значительным толчком», – пообещал он.

В то же время, уже можно говорить об определенном прогрессе в этой сфере: в международном рейтинге ООН по развитию электронного управления Украины за последние два года поднялась с 87-й позиции на шестьдесят вторую. «Это очень важно, потому что с 2010 по 2013 годы мы упали вниз на 33 позиции», – напомнил Алексей Вискуб. По критериям международного рейтинга Open Data Barometer, Украина достигла наибольшего прогресса в сфере бюджета и государственных закупок, наименьшего – в сфере образования и здравоохранения. Сейчас заканчивают работу по присоединению Украины к Международной Хартии открытых данных. Ожидается, что это присоединение состоится во время конференции в Мадриде.