| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

Как помочь проекту

Page history last edited by Ivan Begtin 11 years, 9 months ago

Главное в чём Вы можете помочь проекту - это помочь с преобразованием существующих данных в плохих форматах в машиночитаемый вид.

 

На этой странице представлен список таких данных наиболее востребованных. Вы можете свободно дополнять этот в список те существующие данные которые вы считаете наиболее приоритетными. В отличии от раздела Желаемые данные здесь описывается только то что уже существует.

 

 

Нужно преобразование

Можно преобразовать любой из этих массивов и помочь проекту.

 

Источник данных в плохом формате  Для чего могут быть использованы эти данные  Статус  Парсеры и данные

Список зарегистрированных политических партий (Минюст)

http://www.minjust.ru/nko/gosreg/partii/spisok

Набор HTML страниц со ссылками на документы

Для последующего анализа списков региональных отделений, числа членов, финансовых отчетов и так далее. Не преобразован ?

Заверенные копии уставов политических партий 

http://cikrf.ru/news/relevant/2011/08/03/ustav.html список документов HTML и DOC форматах

Для последующего анализа и сравнения программ политических партий Не преобразован ?

Сведения о поступлении и расходовании средств политических партий

http://cikrf.ru/politparty/finance/rashod.html

Данные в форматах DOC и XLS

Для сведения в общую базу данных о деятельности российских партий Не преобразован ?

Сводные финансовые отчеты политических партий

http://cikrf.ru/politparty/finance/svodn_otchet_11.html

Данные в форматах PDF

Для сведения в общую базу данных о деятельности российских партий

Не преобразован

?

Результаты учета объема эфирного времени

http://cikrf.ru/politparty/garant/res.html

данные в форматах XLS и HTML

Для сравнения эфирного времени партий Не преобразован

 

 

Уже преобразованы

Эти массивы уже были преобразованы волонтёрами.

 

Источник данных в плохом формате  Для чего могут быть использованы эти данные  Статус  Парсеры и данные

База значений индикаторов Банка России на основе их регионального раздела

http://cbr.ru/scripts/Root.asp?Prtid=WSR

Веб-сервис ориентированный на .NET технологии 

Для визуализации индикаторов Центрального Банка  Преобразован 

Парсер от Ивана Бегтина

https://github.com/ivbeg/cbr_opendata

Технические комитеты Ростехрегулирования

http://www.gost.ru/wps/portal/pages.TechCom

Список и множество HTML страниц

Для мониторинга того чем занимаются комитеты, если у них сайты, какие из них были бы интересны гражданам и так далее Преобразован

Парсер от Александра Мыльцева

http://github.com/avm/open_data_parsers 

Список получателей господдержки от Федерального агентства по печати и массовым коммуникациям

http://www.fapmc.ru/support/recipientsofstate/

Для анализа на что и каким организациям (СМИ) идут деньги по господдержке Преобразован

Парсер на Perl от Алексея Капранова

http://github.com/kappa/opengovdata-parsers/tree/master//rosfapmc/

Сведения о веб-адресах кредитных организаций в Российской Федерации

http://www.cbr.ru/credit/CO_SitesFull.asp

Одна веб страница с таблицей

Для определения официальности сайта банка, для анализа информации на сайтах банков Преобразован

Парсер на Python от Ивана Бегтина

cbr_banksites.zip

Депутаты Государственной Думы

http://www.duma.gov.ru/index.jsp?t=deputat/1.html

Много отдельных маленьких страничек

Позволит делать гражданские проекты основанные на активности депутатов. Например, по мониторингу их выступлений, публикаций в блогах с фильтрацией по партии, фракции, комитету госдумы и так далее Преобразован

Парсер на Python от Артемия Трегубенко arty.name

http://github.com/arty-name/Open-Data-Parsers

Государственный реестр фильмов

http://mkrf.ru/activity/register/search/

Форма поиска. Особенность в том что для некоторых фильмов выводит страницу с подтверждением на её просмотр

Для анализа данных реестра на предмет наличия порнографии, оскорбительного содержания, анализа плодовитости авторов и компаний и многое другое Преобразован

Парсер на Python от Виктора Миреева

http://github.com/AmbientLighter/mkrf

 

Парсер на языке Fantom от Akcelisto

https://code.google.com/p/parser-register-films/

Сводная налоговая отчетность
http://www.nalog.ru/document.php?id=27443&topic=stat_otch

Сложные данные в виде множества XLS файлов.

Для анализа того как и по каким темам приходят деньги от налогоплательщиков. Преобразован

Парсер от balmaster

http://github.com/balmaster/conv_svod_nalog

Российский сегмент мирового пространства идентификаторов объектов

http://www.ctel.msk.ru/x500/OIDS/inform.htm
Одна HTML страница с несколькими таблицами

Например, для наглядного соотнесения удостоверяющего центра и органа власти дабы показать в каких из них уже есть свои УЦ, а где нет. Преобразован

Парсер на Python от Артемия Трегубенко arty.name

russian_sign_id.zip

База запусков космических аппаратов

http://www.federalspace.ru/main.php?id=10&year=14
Набор HTML страниц по годам

Позволит провести анализ запущенных аппаратов по изготовителям, заказчикам, странам, потенциальным местам падения, составить календарь истечения сроков эксплуатации и использоваться для более наглядного отображения. Преобразован

Парсер на Python от Артемия Трегубенко arty.name

space_launches.zip

Реестр эксплуатантов гражданской авиации

http://www.favt.ru/airl/airl_r/index.php
Несколько HTML страничек с алфавитной разбивкой

Для отображения организаций на карте, соотнесения с другими банками данных для анализа отрасли авиаперевозок, для анализа какие эксплуатанты к каким аэропортам относятся Преобразован

Парсер на Python от Артемия Трегубенко arty.name

avia_users.zip

Государственный реестр аэропортов гражданской авиации

http://www.favt.ru/ap/ap_rga/

Одна HTML страница с несколькими простыми таблицами

Позволяет отобразить официальный список существующих аэропортов на карте, а также расширять этот список адресами сайтов и реквизитами предприятий. Преобразован

Парсер на Python от Артемия Трегубенко arty.name

rus_airports.zip

Перечень зарегистрированных политических партий (Избирком)

http://www.cikrf.ru/newsite/politparty/reg_politparty.jsp

Очень простой и небольшой список партий с регистрационными номерами в избиркоме

Для сведения воедино всей информации о политических партиях из разных источников. Преобразован

Парсер на Python от Артемия Трегубенко arty.name

polit_parties.zip

Станции службы крови (донорство)

http://test.new06.yadonor.ru/ru/service/where/

 

Для наглядного отображения на картах в социально ориентированных проектах.  Преобразован

Парсер на Python от Артемия Трегубенко arty.name
donor_blood_stations.zip

Перечень государственных эталонов России

http://www.gost.ru/wps/portal/pages.root.Activity?WCM_GLOBAL_CONTEXT=/gost/GOSTRU/Activity/Metrology/StateMasterBase
Таблица в HTML документе

Для анализа деятельности Ростехрегулирования Преобразован

Парсер на Python от Артемия Трегубенко arty.name

etalon_list.zip

 

Выписка из реестра плана нумерации Россвязи

http://www.rossvyaz.ru/activity/num_resurs/registerNum/

Несколько HTML страниц

Для сервисов определения месторасположения телефонов по кодам ABC и DEF. Вспомогательный массив, позволяет, например, выявить геолокацию организаций если адреса нет и есть телефон Преобразован 

Парсер на Python от Артемия Трегубенко arty.name

plan_numbers_arty.zip

 

Парсер на Ruby от Sergey Kojin

http://github.com/skojin/rossvyaz_register_parser

Список членов Совета Федерации 

http://www.council.gov.ru/staff/members/persons/index.html

Список и множество HTML страниц в общем формате

Для сервисов и сайтов аналогичных OpenCongress.org, WatchDog.net и анализа данных о российских политиках Преобразован
 

Парсер на Python от Артемия Трегубенко arty.name

council_members_arty.zip

 

 

Перечень аккредитованных испытательных лабораторий Россвязи

http://www.rossvyaz.ru/activity/correlation/certification/registerLabs/

Список и множество HTML страниц

Для анализа деятельности Россвязи Преобразован

Парсер на Python от Артемия Трегубенко arty.name

rossvyaz_cert_labs.zip

Перечень гарантирующих поставщиков электрической энергии

http://www.fstrf.ru/about/activity/gp/perechen

Для анализа деятельности ФСТ России и поставщиков электроэнергии Преоборазован Парсер на Python от Артемия Трегубенко arty.name
electro_suppliers.zip

Реестр недобросовестных поставщиков 

http://rnp.fas.gov.ru/

В виде списка на ASP.NET с постбэками на листание страниц

Для анализа какие организации, по каким причинам и когда попадают в этот реестре  Преобразован 

Парсер на Python с использованием Scrapy от Виктора Миреева

http://github.com/AmbientLighter/rpn-fas

 

Парсер на Perl от Алексея Капранова 

http://github.com/kappa/opengovdata-parsers

 

 

Comments (0)

You don't have permission to comment on this page.