Суббота, 27 апреля, 2024    
Главная > Без рубрики > Павел Малков: личные данные россиян при переписи украсть невозможно

Павел Малков: личные данные россиян при переписи украсть невозможно

Всероссийская перепись населения, которая станет первой цифровой, пройдет с 1 по 30 апреля 2021 года. О том, какие новые технологические решения задействует Росстат, насколько они будут безопасными и как повлияют на результат, а также сколько удалось сэкономить средств бюджета за счет их применения, рассказал в интервью РИА Новости глава Росстата Павел Малков. Беседовала Ирина Дерюгина.

В апреле 2021 года стартует Всероссийская перепись населения, отложенная в этом году из-за пандемии. Вы не раз говорили про применение планшетов в ходе опросов, а какой уровень защиты этой информации? Есть ли риски утечки данных?

– Самый, наверное, принципиально важный момент – Росстат не собирает персональные данные, даже если, например, человек зашел на портал Госуслуг (где можно заполнить переписной лист – ред.), идентифицировался, ввел свои имя, фамилию, отчество. Дальше человеку присваивается идентификатор, который используется, во-первых, чтобы не было дублирования информации, и, во-вторых, чтобы облегчить заполнение анкеты – загрузить те сведения, которые уже есть на портале, в нужные поля. После того как человек заполнил анкету, нажал кнопку «завершить», к нам она приходит уже без персональных данных. Фамилия, имя и отчество человека к нам не попадают. Самая лучшая мера защиты от утечки персональных данных – это не иметь их вовсе, у нас их и не будет.

Кроме того, мы будем публиковать все результаты переписи: микроданные, из которых можно самостоятельно собрать результаты, и максимальный спектр всех полученных результатов во всех необходимых форматах. И для экспертов, и для аналитиков, и для ученых, и для всех граждан, которые хотят удобно и быстро получить те или иные статистические данные. Все это будет на специально созданном портале.

Еще раз подчеркну, данные попадают к нам обезличенные, максимальное количество информации и так будет публиковаться, поэтому необходимость взлома наших баз данных стремится к нулю.

Как отразится применение новых технологий на результатах переписи?

– Первое – процесс существенно ускорится с точки зрения получения результатов. Перепись у нас завершится в июне следующего года, а в октябре уже будут опубликованы первые итоги. Потом, в течение года, мы их будем дополнять новыми данными, новой аналитикой и так далее.

Второе – существенно сократится количество ошибок. Раньше при подведении итогов переписи ошибки так или иначе все равно выявлялись, устранялись и корректировались, но это достаточно сложный и неочевидный процесс. Сейчас, когда все данные вносятся в электронном виде, все упрощается, плюс не появляются дополнительные ошибки, которые раньше возникали при распознавании текстов и машиночитаемых планов.

Новые технологии – это скорость, качественное сокращение ошибок и наконец-то, как и я говорил, публикация всех результатов в удобных форматах для разных категорий пользователей.

Будете прибегать к помощи искусственного интеллекта?

– Искусственный интеллект будет применяться при анализе тех данных, которые агрегируют операторы мобильной связи. В этот раз мы впервые будем экспериментировать с большими данными. Операторы мобильной связи владеют информацией о перемещениях своих абонентов. И на основе этих данных (сейчас как раз заключаем контракт и ведем соответствующие работы) получим сведения о количестве населения муниципальных районов и городских округов. Это позволит нам в том числе и уточнить результаты переписи.

Повлияла ли цифровизация на объем финансирования переписи?

– Повлияла. Во-первых, конечно, сместились акценты. Вся перепись целиком стоит 32 миллиарда рублей, из них примерно 60% – это оплата труда для наемного персонала. А примерно треть, 30%, – это информационные технологии во всех их аспектах, во всем применении. Раньше, соответственно, эта доля была существенно меньше. При этом общий бюджет переписи сократился. У нас уменьшилось число переписчиков, достаточно существенно, за счет переписи онлайн и за счет использования планшетов. У нас исчезла необходимость печатать и распознавать бумажные бланки, это отдельный большой объем работ, и так далее. Мы оцениваем стоимость переписи, в случае если бы она проводилась традиционным способом, примерно в 60 миллиардов рублей.

Какая часть населения, по вашим ожиданиям, будет проходить перепись онлайн?

– Это очень интересный вопрос, и мы на него никогда точных прогнозов не даем. Во-первых, потому что очень стремительно меняется ситуация в мире. Распространение коронавируса существенно изменило наши бытовые привычки. «Цифра» стала намного ближе, все привыкли пользоваться электронными сервисами, за время самоизоляции – сервисами для видеоконференций. И, наверное, в связи с этим большее количество людей готовы пройти перепись в формате онлайн. С другой стороны, есть категории граждан, которые к этому не готовы. И мы обязаны обеспечить традиционный подход.

Важно и другое, сколько участников переписи мы бы потеряли, если бы не предоставили им возможность принять участие в переписи онлайн. Сейчас достаточно большая категория людей уже просто не готова общаться с переписчиками, они привыкли получать все в электронном виде, они готовы участвовать в переписи, но не готовы ждать, что кто-то придет к ним домой. И благодаря возможностям интернета от этих людей мы информацию получим. Будет это 5%, 10% или 20% от всех участников – это в любом случае успех.

Здесь нет какого-то KPI, сколько бы ни было – это хорошо. Наша задача другая – сделать удобную анкету и обеспечить качественный доступ к ней. Это наши самые основные задачи с министерством цифрового развития.

Сможем ли мы в перспективе полностью отказаться от традиционной переписи и переписчиков?

– Переход в онлайн – скорее, нет. То есть отказаться от переписчиков и перевести в онлайн – наверное, нет, а вот полностью перевести перепись на альтернативные источники данных, я считаю, не просто возможно – это наша цель, это как раз проект для следующей переписи.

Электронные планшеты, которые будут использоваться для переписи, останутся в Росстате или будут переданы каким-то другим ведомствам для иных целей?

– Они, конечно же, не должны лечь мертвым грузом на склады. Всего 360 тысяч устройств, из них часть, около 40 тысяч, останется у нас для проведения других переписей и исследований, остальные должны перейти в другие министерства и ведомства под проекты в части «Цифровой экономики».

Сейчас прорабатывается вопрос со всеми потенциально заинтересованными сторонами. Сразу скажу, что заявок много, вопрос – где эффективнее применить. Конечно, нельзя просто взять планшет и начать на нем работать, нужно под него разработать специальные приложения. Если в здравоохранении, значит, оно должно работать на системе «Аврора», если образование – отвечать задачам системы образования. Это касается и нас. Нам для того, чтобы использовать планшеты в других переписях и обследованиях, тоже нужно разработать новое программное обеспечение.

Использование планшетов позволит вам ускорить обработку данных в повседневной работе?

– Наша задача – уйти постепенно от бумажных бланков и прийти к планшетам. Мы уже давно собираем цены только в электронном виде. Для любых обследований, которых у нас больше десятка, конечно, тоже лучше и удобнее использовать планшеты. И выгоды все те же самые: меньше ошибок, ускоряются расчеты и так далее.

Если представить классические весы с двумя чашами: на одной чаше у нас скорость, а на другой – качество. Каждый раз, когда мы просто ускоряемся, падает качество, если мы хотим более высокое качество, то надо замедлять расчеты. Можно ли все это ускорить – можно, но это принципиально новые подходы. Не только использование электронных планшетов, но и использование административных данных, больших данных и так далее. Тут как раз лежит ключ и к повышению скорости, и к повышению качества.

Какие показатели статистики в текущем году вас удивили?

– Статистика не терпит эмоций, поэтому мы не удивляемся, мы не обижаемся, мы не огорчаемся, мы просто фиксируем события в цифрах и даем какой-то анализ. Я бы здесь, наверное, больше говорил про людей, которые меня удивили, которые рассчитывали все показатели в такое сложное время, в такой непростой год. В условиях пандемии не было ни одного срыва по срокам публикации данных, и мы только наращивали темп и одновременно делали наши данные более понятными, учились их разъяснять, давали их в новых разрезах, в новых видах, графике и прочее.

Например, промышленное производство и инфляция выходили несмотря ни на что. Или рождаемость и смертность, еще два показателя, их в условиях самоизоляции, связанных ограничений на передвижение считали в предельном напряжении усилиями коллег в Росстате, Минздраве, ФНС и коллег из регионов. Такая была очень непростая задача.

Ну и наконец, раз уж мы говорим про COVID, статистика о смертности от самого коронавируса, ее разрабатывали буквально с нуля, по ходу дела разбирались с особенностями этой болезни, решали вместе с коллегами из других ведомств, как правильно объективно отражать эти все данные.

Нигде в мире мы больше так и не видели настолько подробной статистики по этой теме до сих пор. И тут, понятно, не было каких-либо международных стандартов, международного опыта других стран, на который можно было опереться. То есть мы пробивали этот путь сами, с нуля, в итоге получили самую подробную статистику по этой теме. Такой был сложный год, и я считаю, что он позволил нам стать сильнее.