Использование актуальных и качественных датасетов является залогом успешной разработки решений на основе искусственного интеллекта (ИИ). Датасеты представляют собой массивы данных, которые программисты применяют для обучения алгоритмов, позволяя им разрабатывать высокоточные и функциональные приложения.
В 2013 году Правительство Москвы создало портал открытых данных, который сейчас предоставляет доступ к более чем 1200 обезличенным наборам данных. Эти данные включают график отключения воды, адресный реестр объектов недвижимости, площадки для выгула собак, объекты культурного наследия и много другого. Такими данными пользуются как жители города для поиска информации, так и ИТ-специалисты для разработки сервисов и приложений.
Крупные российские картографические сервисы активно используют эти данные, добавляя важную информацию на свои карты. Например, перед Новым годом они могут добавить данные о местах продажи елок.
На основе датасетов, опубликованных на портале, созданы множество мобильных приложений и интернет-сервисов. Среди них проекты сторонних разработчиков и городские решения, такие как мобильное приложение «Госуслуги Москвы», платформа «Электронный дом» и портал «Наш город».
Для разработчиков, работающих над прорывными решениями с использованием ИИ, Москва предлагает 32 специализированных набора данных в рамках спецпроекта по внедрению цифровых технологий. Среди этих данных можно найти данные метеостанций, результаты голосований в проекте «Активный гражданин», сведения о водоснабжении, содержании дворовых территорий, спортивных мероприятиях и многое другое.
Кроме того, на сайте mosmed.ai публикуются обезличенные наборы данных для самотестирования сервисов компьютерного зрения в лучевой диагностике. В настоящее время доступны 68 таких датасетов по направлениям, таким как маммография, флюорография, компьютерная томография и другие. Это позволяет разработчикам создавать и тестировать свои решения в медицинской области, что является особенно актуальным для улучшения качества диагностики и лечения заболеваний.