Главное в чём Вы можете помочь проекту - это помочь с преобразованием существующих данных в плохих форматах в машиночитаемый вид.
На этой странице представлен список таких данных наиболее востребованных. Вы можете свободно дополнять этот в список те существующие данные которые вы считаете наиболее приоритетными. В отличии от раздела Желаемые данные здесь описывается только то что уже существует.
Можно преобразовать любой из этих массивов и помочь проекту.
Источник данных в плохом формате | Для чего могут быть использованы эти данные | Статус | Парсеры и данные |
Список зарегистрированных политических партий (Минюст) |
Для последующего анализа списков региональных отделений, числа членов, финансовых отчетов и так далее. | Не преобразован | ? |
Заверенные копии уставов политических партий http://cikrf.ru/news/relevant/2011/08/03/ustav.html список документов HTML и DOC форматах |
Для последующего анализа и сравнения программ политических партий | Не преобразован | ? |
Сведения о поступлении и расходовании средств политических партий http://cikrf.ru/politparty/finance/rashod.html Данные в форматах DOC и XLS |
Для сведения в общую базу данных о деятельности российских партий | Не преобразован | ? |
Сводные финансовые отчеты политических партий http://cikrf.ru/politparty/finance/svodn_otchet_11.html Данные в форматах PDF |
Для сведения в общую базу данных о деятельности российских партий |
Не преобразован |
? |
Результаты учета объема эфирного времени http://cikrf.ru/politparty/garant/res.html данные в форматах XLS и HTML |
Для сравнения эфирного времени партий | Не преобразован | ? |
Эти массивы уже были преобразованы волонтёрами.
Источник данных в плохом формате | Для чего могут быть использованы эти данные | Статус | Парсеры и данные |
База значений индикаторов Банка России на основе их регионального раздела |
Для визуализации индикаторов Центрального Банка | Преобразован |
Парсер от Ивана Бегтина |
Технические комитеты Ростехрегулирования http://www.gost.ru/wps/portal/pages.TechCom Список и множество HTML страниц |
Для мониторинга того чем занимаются комитеты, если у них сайты, какие из них были бы интересны гражданам и так далее | Преобразован |
Парсер от Александра Мыльцева |
Список получателей господдержки от Федерального агентства по печати и массовым коммуникациям |
Для анализа на что и каким организациям (СМИ) идут деньги по господдержке | Преобразован |
Парсер на Perl от Алексея Капранова http://github.com/kappa/opengovdata-parsers/tree/master//rosfapmc/ |
Сведения о веб-адресах кредитных организаций в Российской Федерации http://www.cbr.ru/credit/CO_SitesFull.asp Одна веб страница с таблицей |
Для определения официальности сайта банка, для анализа информации на сайтах банков | Преобразован |
Парсер на Python от Ивана Бегтина |
Депутаты Государственной Думы http://www.duma.gov.ru/index.jsp?t=deputat/1.html Много отдельных маленьких страничек |
Позволит делать гражданские проекты основанные на активности депутатов. Например, по мониторингу их выступлений, публикаций в блогах с фильтрацией по партии, фракции, комитету госдумы и так далее | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name |
Государственный реестр фильмов http://mkrf.ru/activity/register/search/ Форма поиска. Особенность в том что для некоторых фильмов выводит страницу с подтверждением на её просмотр |
Для анализа данных реестра на предмет наличия порнографии, оскорбительного содержания, анализа плодовитости авторов и компаний и многое другое | Преобразован |
Парсер на Python от Виктора Миреева http://github.com/AmbientLighter/mkrf
|
Сводная налоговая отчетность Сложные данные в виде множества XLS файлов. |
Для анализа того как и по каким темам приходят деньги от налогоплательщиков. | Преобразован |
Парсер от balmaster |
Российский сегмент мирового пространства идентификаторов объектов http://www.ctel.msk.ru/x500/OIDS/inform.htm |
Например, для наглядного соотнесения удостоверяющего центра и органа власти дабы показать в каких из них уже есть свои УЦ, а где нет. | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name |
База запусков космических аппаратов http://www.federalspace.ru/main.php?id=10&year=14 |
Позволит провести анализ запущенных аппаратов по изготовителям, заказчикам, странам, потенциальным местам падения, составить календарь истечения сроков эксплуатации и использоваться для более наглядного отображения. | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name |
Реестр эксплуатантов гражданской авиации http://www.favt.ru/airl/airl_r/index.php |
Для отображения организаций на карте, соотнесения с другими банками данных для анализа отрасли авиаперевозок, для анализа какие эксплуатанты к каким аэропортам относятся | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name |
Государственный реестр аэропортов гражданской авиации Одна HTML страница с несколькими простыми таблицами |
Позволяет отобразить официальный список существующих аэропортов на карте, а также расширять этот список адресами сайтов и реквизитами предприятий. | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name |
Перечень зарегистрированных политических партий (Избирком) http://www.cikrf.ru/newsite/politparty/reg_politparty.jsp Очень простой и небольшой список партий с регистрационными номерами в избиркоме |
Для сведения воедино всей информации о политических партиях из разных источников. | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name |
Станции службы крови (донорство) http://test.new06.yadonor.ru/ru/service/where/
|
Для наглядного отображения на картах в социально ориентированных проектах. | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name |
Перечень государственных эталонов России http://www.gost.ru/wps/portal/pages.root.Activity?WCM_GLOBAL_CONTEXT=/gost/GOSTRU/Activity/Metrology/StateMasterBase |
Для анализа деятельности Ростехрегулирования | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name
|
Выписка из реестра плана нумерации Россвязи http://www.rossvyaz.ru/activity/num_resurs/registerNum/ Несколько HTML страниц |
Для сервисов определения месторасположения телефонов по кодам ABC и DEF. Вспомогательный массив, позволяет, например, выявить геолокацию организаций если адреса нет и есть телефон | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name
Парсер на Ruby от Sergey Kojin |
Список членов Совета Федерации http://www.council.gov.ru/staff/members/persons/index.html Список и множество HTML страниц в общем формате |
Для сервисов и сайтов аналогичных OpenCongress.org, WatchDog.net и анализа данных о российских политиках | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name
|
Перечень аккредитованных испытательных лабораторий Россвязи http://www.rossvyaz.ru/activity/correlation/certification/registerLabs/ Список и множество HTML страниц |
Для анализа деятельности Россвязи | Преобразован |
Парсер на Python от Артемия Трегубенко arty.name |
Перечень гарантирующих поставщиков электрической энергии |
Для анализа деятельности ФСТ России и поставщиков электроэнергии | Преоборазован | Парсер на Python от Артемия Трегубенко arty.name electro_suppliers.zip |
Реестр недобросовестных поставщиков В виде списка на ASP.NET с постбэками на листание страниц |
Для анализа какие организации, по каким причинам и когда попадают в этот реестре | Преобразован |
Парсер на Python с использованием Scrapy от Виктора Миреева http://github.com/AmbientLighter/rpn-fas
Парсер на Perl от Алексея Капранова |