Как проверяются данные в «Голосе» и «Зубре» - отвечает глава разработчиков этих проектов
Менее недели назад было объявлено о запуске онлайн-платформы «Голос», посредством которой предлагается защищать голоса на выборах. Однако за это время у белорусов возникло несколько вопросов технического характера, на которые не смогло ответить даже интервью с «Честными людьми». Поэтому 42.TUT.BY адресовал их разработчику платформ «Голос» и «Зубр».
Онлайн-платформа «Голос» — это проект сообщества «Честные люди». Избирателям предлагается отправить фото своего бюллетеня в чат-боты в Viber и Telegram, причем сделать это можно будет не только с 4 по 9 августа, но и после выборов. Затем все бюллетени планируется обработать. Напомним, глава ЦИК Лидия Ермошина говорила, что публиковать фото бюллетеня до 20.00 9 августа — нельзя. Это расценивается как агитация, а агитация в день выборов запрещена. Сделать это позже закон не запрещает.
А функционал платформы «Зубр» планируется использовать для наблюдения на избирательных участках, фиксации явки и нарушений, размещения данных протоколов с участков, а также подсчета голосов, отданных за каждого кандидата.
Мы собрали некоторые из часто задаваемых в комментариях вопросов и адресовали их тимлиду команды разработчиков, работавших над обеими платформами. Наш собеседник попросил не указывать своего имени, но рассказал, что в IT он уже 17 лет — руководит департаментом в IT-компании, делает «много волонтерских и благотворительных проектов» и верит в то, что «инженерия может помогать миру расти и развиваться быстрее, а людям — быть более уверенными в прозрачности информации вокруг».
Он дал ответы в письменном виде. Так, на вопрос, как защищаются данные в платформе «Голос», и видят ли разработчики номера и имена тех, кто присылает бюллетени, тимлид пояснил, что на сегодня из всех персональных данных человека собирают только его телефон, который необходим «для сохранения уникальности голоса».
— Мы проверяем, что это номер из Беларуси и затем хэшируем (для технических специалистов: хэшируется SHA-3 с использованием соли). В результате мы получаем зашифрованный номер телефона, который далее используется только для проверки, что телефон с таким хэшем еще не оставлял свой голос.
Разработчики платформы не сохраняют телефон другим способом и не могут видеть, какие телефоны сохранены на платформе. Это одна из причин, почему можно не бояться какой-либо утечки данных. Даже заполучив в руки всю базу данных, из нее невозможно будет идентифицировать голосовавших людей. Поэтому ждать от нас после голосования обратного звонка с вопросом «точно ли вы уверены в своем выборе?» не стоит, — говорит собеседник. — Именно поэтому мы считаем эту платформой интересной и в своем роде уникальной — она позволяет дать голосующим людям уверенность в том, что никто кроме них самих не будет знать об их выборе
— Как проверяют, не шлет ли один человек фото с разных номеров?
— Это один из очень популярных вопросов, которые нам задают в соцсетях, и один из самых сложных технических вопросов, который мы решаем. На текущий момент мы строим полноценную систему защиты от подобного обмана через глубокий анализ отсылаемого изображения, сопоставление с особенностями телефона и многим другим факторам, которая будет готова как раз к моменту начала избирательной компании
— Как будут распознаваться фото бюллетеней? Какие технологии применяются?
— Над распознаванием фото работает команда специалистов по Computer Vision. К счастью, в Беларуси это направление очень развито, и найти сильных специалистов оказалось несложно. Кроме того, мы готовим систему ручного распознавания силами модераторов для случаев, с которыми не справился искусственный интеллект. Технологии — OCR, OpenCV, Machine Learning, нейронные сети.
Собеседник добавляет, что над «Голосом» работало более десятка разработчиков, причем их количество постоянно растет, так как проект тоже расширяется.
— И мы постоянно ищем новых специалистов, помогающих нам как с техническими вопросами, так и с вопросами продвижения продукта, волонтерской помощи и так далее. Для нас это исключительно волонтерский проект.
Команда — это белорусские программисты и другие специалисты, некоторые из них живут за границей. Понятно, что об оплате труда речи даже не заходило — люди рады, что есть возможность сделать что-то полезное для страны. В основном это опытные инженеры, работающие в серьезных компаниях. У многих опыт в проектах с повышенными требованиями к безопасности.
Находить специалистов оказалось неожиданно легко — люди приходят сами и предлагают свою помощь. Это очень вдохновляет. При этом у нас существуют очень строгие правила разграничения доступа. Всего несколько надежных разработчиков имеют доступ к базе данных и продакшн-аккаунту Amazon. Они находятся за пределами Беларуси
Также мы задали несколько вопросов относительно платформы «Зубр» — как будут подсчитывать явку: вручную или при помощи технологий? Как будут отсекать недобросовестных наблюдателей? И какие технологии используются в платформе?
— Явку будут присылать наблюдатели, которые станут подсчитывать ее вручную, а волонтеры будут ее обрабатывать, так как несколько наблюдателей могут прислать разные данные с участков, — поясняет тимлид. — Тут важна именно ручная работа для достоверности данных. Недобросовестные наблюдатели будут заблокированы в системе, если волонтеры увидят подозрительную активность с их стороны или частые случаи очевидно недостоверных данных.
На данный момент мы не станем озвучивать технологии, которые использованы в проекте, в целях безопасности самого проекта. Но после выборов есть мысль опубликовать исходный код проекта в публичный доступ, сделать его open source проектом (программное обеспечение с открытым исходным кодом — прим.TUT.BY).