| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • Introducing Dokkio, a new service from the creators of PBworks. Find and manage the files you've stored in Dropbox, Google Drive, Gmail, Slack, and more. Try it for free today.

View
 

Как помочь проекту

Page history last edited by Ivan Begtin 7 years, 7 months ago

Главное в чём Вы можете помочь проекту - это помочь с преобразованием существующих данных в плохих форматах в машиночитаемый вид.

 

На этой странице представлен список таких данных наиболее востребованных. Вы можете свободно дополнять этот в список те существующие данные которые вы считаете наиболее приоритетными. В отличии от раздела Желаемые данные здесь описывается только то что уже существует.

 

 

Нужно преобразование

Можно преобразовать любой из этих массивов и помочь проекту.

 

Источник данных в плохом формате  Для чего могут быть использованы эти данные  Статус  Парсеры и данные

Список зарегистрированных политических партий (Минюст)

http://www.minjust.ru/nko/gosreg/partii/spisok

Набор HTML страниц со ссылками на документы

Для последующего анализа списков региональных отделений, числа членов, финансовых отчетов и так далее. Не преобразован ?

Заверенные копии уставов политических партий 

http://cikrf.ru/news/relevant/2011/08/03/ustav.html список документов HTML и DOC форматах

Для последующего анализа и сравнения программ политических партий Не преобразован ?

Сведения о поступлении и расходовании средств политических партий

http://cikrf.ru/politparty/finance/rashod.html

Данные в форматах DOC и XLS

Для сведения в общую базу данных о деятельности российских партий Не преобразован ?

Сводные финансовые отчеты политических партий

http://cikrf.ru/politparty/finance/svodn_otchet_11.html

Данные в форматах PDF

Для сведения в общую базу данных о деятельности российских партий

Не преобразован

?

Результаты учета объема эфирного времени

http://cikrf.ru/politparty/garant/res.html

данные в форматах XLS и HTML

Для сравнения эфирного времени партий Не преобразован

 

 

Уже преобразованы

Эти массивы уже были преобразованы волонтёрами.

 

Источник данных в плохом формате  Для чего могут быть использованы эти данные  Статус  Парсеры и данные

База значений индикаторов Банка России на основе их регионального раздела

http://cbr.ru/scripts/Root.asp?Prtid=WSR

Веб-сервис ориентированный на .NET технологии 

Для визуализации индикаторов Центрального Банка  Преобразован 

Парсер от Ивана Бегтина

https://github.com/ivbeg/cbr_opendata

Технические комитеты Ростехрегулирования

http://www.gost.ru/wps/portal/pages.TechCom

Список и множество HTML страниц

Для мониторинга того чем занимаются комитеты, если у них сайты, какие из них были бы интересны гражданам и так далее Преобразован

Парсер от Александра Мыльцева

http://github.com/avm/open_data_parsers 

Список получателей господдержки от Федерального агентства по печати и массовым коммуникациям

http://www.fapmc.ru/support/recipientsofstate/

Для анализа на что и каким организациям (СМИ) идут деньги по господдержке Преобразован

Парсер на Perl от Алексея Капранова

http://github.com/kappa/opengovdata-parsers/tree/master//rosfapmc/

Сведения о веб-адресах кредитных организаций в Российской Федерации

http://www.cbr.ru/credit/CO_SitesFull.asp

Одна веб страница с таблицей

Для определения официальности сайта банка, для анализа информации на сайтах банков Преобразован

Парсер на Python от Ивана Бегтина

cbr_banksites.zip

Депутаты Государственной Думы

http://www.duma.gov.ru/index.jsp?t=deputat/1.html

Много отдельных маленьких страничек

Позволит делать гражданские проекты основанные на активности депутатов. Например, по мониторингу их выступлений, публикаций в блогах с фильтрацией по партии, фракции, комитету госдумы и так далее Преобразован

Парсер на Python от Артемия Трегубенко arty.name

http://github.com/arty-name/Open-Data-Parsers

Государственный реестр фильмов

http://mkrf.ru/activity/register/search/

Форма поиска. Особенность в том что для некоторых фильмов выводит страницу с подтверждением на её просмотр

Для анализа данных реестра на предмет наличия порнографии, оскорбительного содержания, анализа плодовитости авторов и компаний и многое другое Преобразован

Парсер на Python от Виктора Миреева

http://github.com/AmbientLighter/mkrf

 

Парсер на языке Fantom от Akcelisto

https://code.google.com/p/parser-register-films/

Сводная налоговая отчетность
http://www.nalog.ru/document.php?id=27443&topic=stat_otch

Сложные данные в виде множества XLS файлов.

Для анализа того как и по каким темам приходят деньги от налогоплательщиков. Преобразован

Парсер от balmaster

http://github.com/balmaster/conv_svod_nalog

Российский сегмент мирового пространства идентификаторов объектов

http://www.ctel.msk.ru/x500/OIDS/inform.htm
Одна HTML страница с несколькими таблицами

Например, для наглядного соотнесения удостоверяющего центра и органа власти дабы показать в каких из них уже есть свои УЦ, а где нет. Преобразован

Парсер на Python от Артемия Трегубенко arty.name

russian_sign_id.zip

База запусков космических аппаратов

http://www.federalspace.ru/main.php?id=10&year=14
Набор HTML страниц по годам

Позволит провести анализ запущенных аппаратов по изготовителям, заказчикам, странам, потенциальным местам падения, составить календарь истечения сроков эксплуатации и использоваться для более наглядного отображения. Преобразован

Парсер на Python от Артемия Трегубенко arty.name

space_launches.zip

Реестр эксплуатантов гражданской авиации

http://www.favt.ru/airl/airl_r/index.php
Несколько HTML страничек с алфавитной разбивкой

Для отображения организаций на карте, соотнесения с другими банками данных для анализа отрасли авиаперевозок, для анализа какие эксплуатанты к каким аэропортам относятся Преобразован

Парсер на Python от Артемия Трегубенко arty.name

avia_users.zip

Государственный реестр аэропортов гражданской авиации

http://www.favt.ru/ap/ap_rga/

Одна HTML страница с несколькими простыми таблицами

Позволяет отобразить официальный список существующих аэропортов на карте, а также расширять этот список адресами сайтов и реквизитами предприятий. Преобразован

Парсер на Python от Артемия Трегубенко arty.name

rus_airports.zip

Перечень зарегистрированных политических партий (Избирком)

http://www.cikrf.ru/newsite/politparty/reg_politparty.jsp

Очень простой и небольшой список партий с регистрационными номерами в избиркоме

Для сведения воедино всей информации о политических партиях из разных источников. Преобразован

Парсер на Python от Артемия Трегубенко arty.name

polit_parties.zip

Станции службы крови (донорство)

http://test.new06.yadonor.ru/ru/service/where/

 

Для наглядного отображения на картах в социально ориентированных проектах.  Преобразован

Парсер на Python от Артемия Трегубенко arty.name
donor_blood_stations.zip

Перечень государственных эталонов России

http://www.gost.ru/wps/portal/pages.root.Activity?WCM_GLOBAL_CONTEXT=/gost/GOSTRU/Activity/Metrology/StateMasterBase
Таблица в HTML документе

Для анализа деятельности Ростехрегулирования Преобразован

Парсер на Python от Артемия Трегубенко arty.name

etalon_list.zip

 

Выписка из реестра плана нумерации Россвязи

http://www.rossvyaz.ru/activity/num_resurs/registerNum/

Несколько HTML страниц

Для сервисов определения месторасположения телефонов по кодам ABC и DEF. Вспомогательный массив, позволяет, например, выявить геолокацию организаций если адреса нет и есть телефон Преобразован 

Парсер на Python от Артемия Трегубенко arty.name

plan_numbers_arty.zip

 

Парсер на Ruby от Sergey Kojin

http://github.com/skojin/rossvyaz_register_parser

Список членов Совета Федерации 

http://www.council.gov.ru/staff/members/persons/index.html

Список и множество HTML страниц в общем формате

Для сервисов и сайтов аналогичных OpenCongress.org, WatchDog.net и анализа данных о российских политиках Преобразован
 

Парсер на Python от Артемия Трегубенко arty.name

council_members_arty.zip

 

 

Перечень аккредитованных испытательных лабораторий Россвязи

http://www.rossvyaz.ru/activity/correlation/certification/registerLabs/

Список и множество HTML страниц

Для анализа деятельности Россвязи Преобразован

Парсер на Python от Артемия Трегубенко arty.name

rossvyaz_cert_labs.zip

Перечень гарантирующих поставщиков электрической энергии

http://www.fstrf.ru/about/activity/gp/perechen

Для анализа деятельности ФСТ России и поставщиков электроэнергии Преоборазован Парсер на Python от Артемия Трегубенко arty.name
electro_suppliers.zip

Реестр недобросовестных поставщиков 

http://rnp.fas.gov.ru/

В виде списка на ASP.NET с постбэками на листание страниц

Для анализа какие организации, по каким причинам и когда попадают в этот реестре  Преобразован 

Парсер на Python с использованием Scrapy от Виктора Миреева

http://github.com/AmbientLighter/rpn-fas

 

Парсер на Perl от Алексея Капранова 

http://github.com/kappa/opengovdata-parsers

 

 

Comments (0)

You don't have permission to comment on this page.