Каким будет белорусский портал открытых данных
Уже 3 октября на Форуме по управлению интернетом Belarus IGF-2018 будет возможность из первых рук узнать все о степени готовности национального портала открытых данных. Пока известно, что заработать он должен уже в начале 2019 года. А пока можем лишь строить предположения о том, какие именно данные там будут собраны, кому они будут релевантны и насколько точны.
В том, что Беларусь очень поздно создает свой официальный портал открытых данных, можно найти свои преимущества. Во всем мире собран колоссальный опыт относительно сбора, обработки и использовании этой информации. Недавно Европейская комиссия даже выпустила объемный документ с рекомендациями для порталов открытых данных, который по сути является руководством по их созданию.
В то же время десятки городов в Европе, Азии, Америке многие годы создают потрясающие интерактивные карты с тысячами параметров — от степени загрязнения воздуха по районам до показателей раздельного сбора отходов. На основе открытых данных создаются прибыльные стартапы, полезные приложения и онлайн-сервисы для жителей мегаполисов, планы развития микрорайонов и целых регионов.
«До прошлого Форума по управлению интернетом в Беларуси не было ни одного прецедента, когда госсектор, бизнес, и НКО собрались бы вместе и поговорили о том, что все мы хотим видеть в качестве открытых данных, — комментирует Алина Родачинская из сообщества „Открытые данные. Беларусь“. Именно она будет модератором тематической секции на IGF. — Это было первое публичное событие по теме и оно прошло очень удачно, потому что у нас были представлены все стороны. В этом году мы ждем еще более тесного взаимодействия».
Менее половины национальных порталов знают, кто их пользователи
Такой вывод содержится в уже упомянутых выше рекомендациях Еврокомиссии. В Беларуси есть шанс не наступить на эти грабли и формировать датасеты (наборы данных для публикации) в привязке в тому, какая именно информация востребована.
«Это стало как раз одним из главных итогов дискуссии на прошлогоднем IGF — выяснить, какие данные интересны белорусским пользователям, бизнесу и академическому сообществу в первую очередь. Другими словами, наладить связь между поставщиком open data в лице государства и потребителями. Ведь сбор, унификация, проверка и анонимизация данных является очень затратным процессом, — продолжает Алина Родачинская. — Мы проводили это исследование с упором на бизнес-аудиторию, так как именно она является тем, что в разработке IT-продуктов называется „early adopters“. То есть люди, которые могут первыми начать пользоваться продуктом и имеют понимание, что им это нужно. Совместно с участниками панельной дискуссии мы разработали анкету, которую разослали по всем доступным нам каналам. Результаты передали разработчикам концепции портала и в Министерство информации».
Сейчас идет второй этап разработки портала, который включает не только создание сайта с каталогами и рубрикацией, но также выстраивание работы поставщиков информации. Ведь теперь они будут обязаны предоставлять информацию в формате, соответствующем требованиям государственного интернет-ресурса и подходящем под международное определение открытых данных — т.е. должны быть подробными, детализированными, машиночитаемыми, бесплатными и неограниченными для использования.
Также идет работа над соответствующим законодательством, так как в текущих нормативно-правовых актах просто не существует определения, что такое открытые данные. Открытым остается вопрос и с подготовкой сотрудников госорганов к наполнению портала, и с образовательными программами в области data science. В рамках дискуссии на IGF планируется предложить программы по обмену опытом с коллегами из стран-соседей.
«Мы очень надеемся, что от государства будет на это спрос, — делится Алина. — Хотелось бы, чтобы запуск портала проходил без негативного фидбека. Мы как сообщество очень хотели бы помочь в этом. Поэтому и пригласили принять участие в дискуссии в рамках IGF представителей минсвязи, бизнеса, который использует open data, а также главу представительства международной финансовой корпорации. Также приглашаем принять участие в секции всех желающих, кому интересна эта тема».
Бессчетные возможности подсчитанных данных
Когда в США появился в 2009 году портал открытых данных, в нем было всего 47 датасетов. Сейчас их более 200 000 и это число быстро растет. Главные драйверы роста — востребованность, точность и простота использования данных. По мере появления хорошо подготовленных «наборов» они питают общий объем информации как кислород, раздувающий пламя, взаимодействуя между собой и формируя новые датасеты. Более того, чем больше данных собирается из разных источников, тем они чище.
Не уходя далеко от темы пламени — потрясающий пример использования открытых данных появился у нью-йоркских пожарных. Разработанный для них инструмент Firecast непрерывно агрегирует более 7500 факторов риска возгораний из 17 различных источников. Итог — каждый день пожарный департамент города получает выписку из 15 наиболее уязвимых объектов в каждом из районов, а точность пожарных инспекций повысилась на 20%. Но главную цель разработчики видят в спасении сотен жизней простых горожан и пожарных в долгосрочной перспективе.
Есть бессчетное количество не таких сложных, но не менее интересных примеров: на портале открытых данных Амстердама, например, можно изучить полную географию бомбардировок города во время Второй мировой войны. Желающие купить или арендовать квартиру в Берлине могут оценить онлайн уровень шума не только любого здания в городе, но даже увидеть разницу в зависимости от фасада. Но готовы ли в Беларуси к такой открытости?
Мы предпочитаем не знать о загрязненности окружающей среды
К такому парадоксальному выводу пришли исследователи из белорусского стартапа, производящего дозиметры степени загрязненности воздуха. Правда, это касается в первую очередь тех, кто уже живет в не самых экологически благополучных районах.
Опасения относительно использования открытых данных в экологических вопросах высказывает и государство. В районы с плохой репутацией перестают селиться люди с хорошим достатком и район «проседает» еще больше. С одной стороны, у людей появляется выбор, с другой — как эта информация повлияет на людей, которые не имеют возможности переехать?
Опыт других стран говорит скорее в пользу open data. Открытые данные стоят в центре уникального проекта по развитию самого неблагополучного района Лондона. А портал города Цинциннати, который является одним из самых объемных и системных в мире и позволяет увидеть десятки факторов, влияющих на жизнь районов, включает даже данные о всех случаях передозировки героином. Да, тоже в привязке к карте города. К слову, эти данные использовали для улучшения работы станций скорой помощи.
«У всех нас будет много работы»
«В следующем году у нас точно будет портал открытых данных. И потом у всех, включая государство, бизнес, общество, журналистов, академического сообщества, будет много работы, — подводит итог Алина Родачинская. — Появление портала — не финальная, а скорее начальная точка. Плюс в том, что мы можем смотреть на мировой опыт, тенденции, такие документы как Хартия открытых данных, где собираются лучшие практики. Например, еще год назад Хартия провозглашала главным принципом open by default. То есть все, что не является государственной, персональной или коммерческой тайной, должно быть открыто. Но теперь уже Хартия говорит, что публикация должна быть on demand, то есть надо понимать потребности, чтобы открывать в первую очередь то, что нужно».
Организаторы Belarus IGF приглашают всех желающих принять участие в дискуссии, которая во многом определит уровень open data, образования и осведомленности общества в области данных, а также развитие интернета на ближайшие годы в целом. Участие в Форуме бесплатное, но требуется регистрация.