Любому автору, чьи публикации индексируются в базе данных Scopus, присваивается уникальный идентификационный номер (ID) . Другими словами, Scopus создает профиль для каждого автора автоматически. Система идентификации авторов (Author ID) была создана компанией Elsevier для того, чтобы решить проблему привязки авторов к публикациям, возникающую из‐за путаниц с совпадением имен и фамилий.

Поэтому нет необходимости создавать свой профиль самостоятельно. Если у Вас есть хотя бы одна статья в журнале, индексируемом Scopus, то это уже сделано за Вас. И при желании Вы можете зайти в свой профиль, хотя бы для того, чтобы узнать номер своего ID и число индекса Хирша (h-индекс) в БД Scopus. Cделать это можно одним из предлагаемых способов:

Первый способ . Поиск по статье.

Шаг 1. Зайти на вкладку Document search . Выбрать поисковое поле Article title и ввести название статьи (примечание: если в названии статьи есть скобки, лучше заменить их на пробелы).

Шаг 2. Search .

Шаг 3. Выбрать нужную статью и перейти на страничку, содержащую полное ее описание: выходные данные, авторы, их аффилиация, реферат и т. п.

Шаг 4. Нажать на свою фамилию, что приведет Вас в личный профиль, где указывается: персональный номер ID , h-индекс , области исследований, количество цитирований со ссылками на документы, визуализация профиля, список публикаций, которые система автоматически идентифицировала под Вашей фамилией и инициалами и т. д.

Шаг 1. Зайти на вкладку Author search . Ввести в поисковые поля свою фамилию (Last name), инициалы (Initials) или имя (First name) и по желанию аффилиацию (affiliation).

Шаг 2. В случае, если Ваша фамилия распространенная и у Вас много однофамильцев, для более точного поиска можно указать область исследований (Subject Areas) (обратите внимание, что область исследований определяется теми журналами, в которых опубликованы ваши статьи).

Шаг 3. Запустить поиск, нажав кнопку Search .

Шаг 4. Если у Вас в базе данных Scopus проиндексирована только одна статья, то перейти сразу на авторский профиль с фамилии автора невозможно. В данном случае следует выбрать команду Show Profile Matches with One Document (Показать профили с одним документом), затем по гиперссылке 1 Document перейти в полную запись статьи и уже через свою фамилию перейти в личный профиль (аналогично шагу 4 в первом способе поиска).

Напоминаем, что не всегда автоматическое формирование авторского профиля происходит достаточно корректно, поэтому авторский профиль необходимо отредактировать. В случае существования несколько учетных записей с различным написанием Вашего имени, Вы можете объединить их в один профиль.

В мае 2012 года министр образования и науки Российской Федерации Дмитрий Ливанов озвучил намерение Минобрнауки (МОН РФ) провести всесторонний аудит сектора исследований и разработок, включая институты РАН, государственные научные организации и высшие учебные заведения. Это заявление можно назвать зарождением «Карты российской науки» . Этот проект был официально анонсирован в декабре 2012 года . Накануне МОН РФ был проведен конкурс на выполнение НИР по теме «Формирование системы оценки и мониторинга результатов научно-исследовательской деятельности организаций и ученых для регулярной оценки состояния сферы науки» . Начальная (максимальная цена) контракта - 100 млн. руб. Финансирование проекта обеспечивалось в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы» (Конкурс за 2012 год, Мероприятие 2.1, Очередь 11, Лот 1). Победу в конкурсе одержала частная консалтинговая компания «ПрайсвотерхаусКуперс Раша Б.В.» - PwC.

К концу 2013 года проект «Карта российской науки» получил платный доступ к двум основным базам - Российский индекс научного цитирования (РИНЦ) и Web of Science (WoS). Неполный доступ к базе WoS (её части, относящаяся к российским ученым) обошелся бюджету в 40 млн. руб. Была также добавлена (однако неполная) база по ведущим российским ученым относительно их монографий, а также информации об участии в НИОКР и грантах. Зеркала проекта также размещены по адресам www.scimap.alt-lan.com и www.картанауки.рф Предполагалось, что большинство российских грантодателей перейдут на использование «Карты российской науки» в качестве основного источника информации о публикациях авторов и коллективов-грантополучателей .

Добавляйтесь пальчиками!

К 2016 году в проект были добавлены массив данных по зарубежным патентам, выданным российским организациям; информация по патентам на изобретения, полезные модели и промышленные образцы ФГБУ «Федеральный институт промышленной собственности »; а также информация по монографиям, учебникам для вузов, учебным пособиям для вузов и сборникам научных трудов от ФГБУН «Российская книжная палата» . В итоге, в «Карте российской науки» представлены сведения за период с 2007 по 2016 годы, с последующей необходимой актуализацией самими исследователями посредством мануального ввода данных и запросов на изменение информации в техподдержку.

После подтверждения регистрации и верификации пользователя в разделе «Моя карточка» появится информация, которую вы можете редактировать и дополнять.
Если список публикаций сразу окажется неполным, то можно провести поиск по системе недостающих публикаций и, в случае их успешного нахождения, поставить отметку об авторстве.

Несмотря на то, что вплоть до конца 2016 года проект «Карта российской науки» фактически так и не вышел из стадии бета-тестирования, то есть функционировал с системными недоработками, чиновники Минобрнауки и Совета по грантам Президента Российской Федерации (для государственной поддержки молодых российских ученых и по государственной поддержке ведущих научных школ Российской Федерации) относились к этому очередному изделию отечественного карго-культа как к полноценной базе данных. Об этом свидетельствует объявление, размещенное на сайте ФГБНУ НИИ РИНКЦЭ :

Об участии в конкурсе на право получения грантов Президента РФ на 2017-2018 гг.
Для участия в конкурсе на право получения грантов Президента РФ на 2017-2018 гг. для государственной поддержки молодых ученых, который будет объявлен в конце августа 2016 года, потребуется указать:
<...>Индивидуальный номер ученого в Карте российской науки (для его получения необходимо зарегистрироваться на сайте https://mapofscience.ru).

Писец настиг внезапно, но виден был издалека!

31.01.2017 Совет по науке при Министерстве образования и науки РФ опубликовал на сайте заявление с первого в 2017 году заседания, в котором также приняла участие министр образования и науки Ольга Васильева. Согласно этому заявлению:

<...> При проведении конкурса организаторы получали связанные с проектами наукометрические параметры из так называемой «Карты российской науки». Совет считает, что за четыре года своего существования этот инструмент так и не достиг сколько-нибудь удовлетворительного качества. Значительная часть представляемых «Картой российской науки» сведений ошибочна и не может быть сколько-нибудь адекватно использована. Это создало значительные трудности при подведении итогов рассматриваемого конкурса.
Совет призывает МОН впредь не использовать «Карту российской науки» для каких-либо целей. Вместо этого Совет предлагает использовать перечень общепринятых баз данных по различным областям.

В начале февраля 2017 года без каких-либо официальных заявлений сайт и его зеркала пропали из сети Интернет и более недоступны. При этом дальнейшее использование купленных баз и внесенных самими пользователями данных остается неясным.

В качестве альтернативы «Карте российской науки» проректор Московского государственного университета им. М.В.Ломоносова, академик Алексей Хохлов, в интервью газете «Поиск» от 10.02.2017 , предложил применять систему ­“ИСТИНА” или , которая «используется в МГУ им. М.В.Ломоносова и сейчас в пилотном режиме внедряется в десяти институтах, подведомственных ФАНО» . Комментарии излишни…

Жалко ли «мартышкиного труда» тех преподавателей вузов и сотрудников НИИ, которые вбивали данные о себе в базу «карты» ? Нет, нисколько - чтобы осознать на своей шкуре всю гниль путиноидной системы, «вата-грантополучатели должны страдать!» И чем больше они настрадаются, тем радостнее будут восклицать при виде запихнутых в мусорные бачки коррупционеров-«запутинцев» !

21 мая 2012 года Министром образования и науки Российской Федерации назначается Дмитрий Ливанов. В своем первом публичном выступлении он озвучивает намерение Министерства образования и науки (МОН РФ) провести всесторонний аудит сектора исследований и разработок, включая институты РАН, государственные научные организации и высшие учебные заведения. Это заявление можно назвать зарождением «Карты российской науки».

К сожалению, за событиями вокруг реформы РАН этот проект как-то потерялся и не получил, на наш взгляд, должного внимания со стороны IT-сообщества. Мы предлагаем вам небольшую ретроспективу: путь проекта от концепции до реализации.

Бесцельный путь синеет предо мной,
Далекий путь, потоками изрытый,
А дальше - мрак; и в этом мраке скрытый,
Парит судеб Вершитель роковой.

Александр Блок, октябрь 1899

Часть 1: конкурс

Проект «Карта российской науки» (http://mapofscience.ru/) был официально анонсирован в декабре 2012 года. Накануне МОН РФ был проведен конкурс на выполнение НИР по теме «Формирование системы оценки и мониторинга результатов научно-исследовательской деятельности организаций и ученых для регулярной оценки состояния сферы науки». Начальная (максимальная цена) контракта - 100 млн руб. Финансирование проекта обеспечивалось в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы» (Конкурс за 2012 год, Мероприятие 2.1, Очередь 11, Лот 1).

В конкурсе приняли участие следующие организации:

  1. Институт системного анализа Российской академии наук;
  2. ПрайсвотерхаусКуперс Раша Б. В. (далее - PwC);
  3. Научно-исследовательский институт автоматической аппаратуры им. академика В. С. Семенихина;
  4. Московский государственный университет приборостроения и информатики;
  5. Московский государственный технический университет имени Н. Э. Баумана;
  6. Московский государственный университет имени М. В. Ломоносова;
  7. ИНЭК-Информационные Технологии.
Бауманку не допустили по формальной причине: устаревшая выписка из ЕРГЮЛ. Являлось это халатностью при подготовке документов, или сыграл какой-то другой фактор, - уже вряд ли удастся узнать.

Победу в конкурсе одержала частная консалтинговая компания «ПрайсвотерхаусКуперс Раша Б.В.», предложив стоимость контракта 90 млн руб. и срок его выполнения - 90 дней.

Необходимо отметить, что МГУ предложил разработать «Карту науки» примерно вдвое дешевле - за 50 млн руб., однако получил от конкурсной комиссии невысокие баллы за качество и квалификацию, заняв второе место. Выглядит это странно, если учесть, что в Университете существуют полезные наработки в этой области: недавно запущена информационно­-аналитическая система «Наука-­МГУ», с помощью которой осуществляется сбор и анализ публикационной активности сотрудников.

В официальной прессе решение по выбору PwC в качестве исполнителя объяснили желанием заказчика в лице МОН РФ провести «аудит российской науки» силами внешней организации, никак не связанной с научной средой.

PwC потратило 40 млн на покупку данных из базы Web of Science (далее - WoS) у Thomson Reuters и 15 млн - на развертывание технической инфраструктуры. Плюс к этому система требует, по оценкам исполнителей, 10-15 млн руб. в год на поддержку.

К сожалению, мы не смогли найти в публичном доступе государственный контракт с победителем конкурса, а также техническое задание. (Внимание, вопрос: это не противоречит конкурсному законодательству?) Очень хотелось бы посмотреть на тот объем работ, который был заявлен на бумаге. Хотя с формальной точки зрения это уже не столь важно, так как проект оформлен как НИР: его результатом может являться просто отчет, реализация хотя бы прототипа совсем необязательна.

Часть 2: что хотели сделать?

«Наша цель - определить поименно тех ученых и те малые научные коллективы (то есть лаборатории, научные группы), которые уже сегодня в России работают на высоком международном уровне. Мы будем делать этот проект с одной простой целью - понять, где сегодня Россия сохраняет конкурентоспособность, какие области науки сегодня для нас являются перспективными, где у нас есть шанс в будущем совершить рывок. И, что самое важно, поддержать - адресно - именно тех людей, тех ученых, те лаборатории, которые этой поддержки заслуживают»,- говорил Дмитрий Ливанов в своем интервью телеканалу «Просвещение».

В документе, подготовленном PwC , сам проект описывается следующим тезисом: «Карта российской науки» должна стать основой для принятия информированных управленческих решений в сфере научно-исследовательской деятельности ученых и организаций»; также поставлены конкретные цели:

  1. «инвентаризация» текущего состояния российской науки;
  2. быстрый доступ по требованию к актуальным и корректным показателям российской науки;
  3. аналитический инструментарий для принятия обоснованных управленческих решений;
  4. выявление наиболее авторитетных экспертов и научных коллективов для их адресной поддержки;
  5. сравнение уровня развития науки в России с другими странами и выявления точек роста;
  6. обеспечение прозрачности принимаемых управленческих решений.
В этом же документе заявлены три основных столпа проекта: охват данных , качество данных и фунционал .

Охват данных планировалось обеспечить через:

  • международные источники: публикации, доклады на международных конференциях, патенты, издания;
  • российские источники: публикации, патенты, гранты, НИОКР, издания;
  • показатели как фундаментальной, так и прикладной науки.
В итоге должна была получиться «уникальная по охвату база, обеспечивающая наиболее полное возможное покрытие результатов научно-исследовательской деятельности российских ученых».

Под качеством данных подразумевалось:

  • очистка исходных данных для исключения разнонаписаний имен собственных;
  • использование механизма корректировки данных самими учеными и организациями;
  • использование уникальных идентификаторов ученых и организаций.
В результате этого ожидалось достижение «беспрецедентного уровня точности данных, который поможет обеспечить видимость российской науки для международного сообщества».

И, наконец, фунционал включал:

  • инструментарий для сравнения и выявления точек роста в науке;
  • построение отчетов по заданным параметрам для ученых, организаций, научных направлений;
  • гибкий поиск и фильтрация данных;
  • выявление неформальных коллективов ученых.
Это «усовершенствованный набор аналитических инструментов и их гибкость, обеспечивающие решение управленческих задач».

А теперь непрофессионалам , наверное, станет не очень интересно, но так как Хабр - технологичный блог, мы посчитали необходимым показать план работ и архитектуру выстраиваемой системы. Всего три слайда.

Бочки и стрелочки


План работ


Архитектура!

Часть 3: что получилось?

Прежде всего, мы предлагаем читателям Хабра самим оценить, соответствует ли заявленный функционал тому, что было реализовано. «Карта российской науки» доступна по данной ссылке http://mapofscience.ru/ . Можно ли считать это образцом для подражания? Является ли этот проект уникальным не только в России, но и в мире? Попробуйте сами ответить на эти вопросы.

Не так давно главная страница «Карты» была обновлена. Был добавлен красный мигающий блок, говорящий нам: «Внимание! Система находится в опытной эксплуатации». Вероятно, это произошло из-за большого количества негативных отзывов о проекте. Если взглянуть на приложение к конкурсу , можно заметить, что deadline данного проекта - конец 2013 года. Таким образом, что-либо кардинально исправить в этой версии для «опытной эксплуатации» представляется уже маловероятным, и мы можем перейти к оценке всего проекта.

Целью проекта (если кто не запомнил) являлось «определить поименно тех ученых и те малые научные коллективы (то есть лаборатории, научные группы), которые уже сегодня в России работают на высоком международном уровне». На наш взгляд, сделать это с помощью предложенных инструментов невозможно.

Охват данных
Скорее не получилось, чем получилось. Две основные базы - Российский индекс научного цитирования (РИНЦ) и Web of Science (WoS) - представлены в диапазоне 2007–2012 гг., да еще и с оговоркой в отношении WoS. Данные попросту неактуальны (верхняя планка года) и некорректны (нижняя планка года) для заявленной основной цели. И это при том, что доступ к базе WoS (её части, относящаяся к российским ученым) обошелся государству в 40 млн руб (практически без права передачи данных в МОН).

По остальным заявленным в проекте источникам данным также наблюдается, мягко говоря, некоторая неполнота. После длительного поиска по ведущим российским ученым не удалось обнаружить их книг, монографий, а также информации об участии в НИОКР и грантах. Можно предположить, что эти данные либо просто не предоставлены в карту науки, либо их не смогли подготовить.

Качество данных
По нашему мнению, эта задача являлась ключевой в реализации «Карты российской науки», это была именно та технологическая часть , которая составляла основную сложность и должна была отнять основные силы и время. Проще говоря, задача всей «Карты» состояла в том чтобы свести, очистить и грамотно перелинковать данные. Или, как следует из стенограммы установочного заседания экспертных групп по вопросам реализации проекта «Карта российской науки», ключевым блоком работ являлась «вычистка и интеграция данных из различных источников». И, к сожалению, эта часть совсем не получилась. Данные вообще не были сведены: нам предлагается или РИНЦ, или WoS. По сути, нам представлен просто интерфейс к этим двум базам, с не очень внятным функционалом. Так получилось, что именно к качеству данных возникло большинство претензий у научного сообщества. Мы попробовали собрать их воедино (но наверняка что-нибудь да упустили, - нареканий очень много):
  1. использование классификатора (рубрикатора) научных направлений, не применимого к действующим направлениям в российской науке;
  2. произвольный отбор (группировка) научных учреждений по рубрикам;
  3. отсутствие контроля уровня случайных совпадений;
  4. несоответствие числовых показателей реальным значениям (по численности состава научных учреждений, по количеству публикаций в WoS и РИНЦ, по числу патентов, по индексу цитирования), ошибки при переносе операторами данных из одной базы в другую;
  5. некорректный отбор «ведущих» учреждений или исследователей (топ-5), построенный на использовании произвольных признаков, не имеющих друг с другом связи (либо данные по WoS, либо по РИНЦ, либо алфавитный порядок, либо рубрикатор, и т.д.);
  6. неверное (некорректное) написание Ф.И.О. исследователя как в русской, так и в английской системе написания;
  7. неверная (некорректная) аффилиация исследователя;
  8. отсутствие разделения однофамильцев и их корректного соотношения с научным направлением и научным учреждением;
  9. отсутствие сведений о подразделениях организаций (в том числе, о факультетах крупных университетов, таких, как МГУ и СПбГУ).
Функционал
С функционалом тоже не все хорошо. Например, вот как реализован механизм корректировки данных: «Исправление технических ошибок, замеченных пользователями, происходит через предоставление бумажной версии замечаний, заверенной печатью организации, в которой работает пользователь». Между тем, в вышеупомянутой стенограмме говорится: «Основной принцип реализации проекта - минимизация усилий со стороны ученых. Предполагается, что большая часть информации в личных кабинетах будет заполняться в автоматическом режиме».

До сих пор не найден ни один человек, который может внятно объяснить, какую информацию несет в себе так называемая «тепловая карта». Единственная, на наш взгляд, интересная фича - это ссылка «свернуть карту» справа внизу, ее функционал, по крайней мере, неординарен и содержит львиную долю самоиронии.

Мы попробовали зарегистрироваться в системе, чтобы посмотреть, как она выглядит изнутри. Нам посчастливилось завести аккаунт примерно за месяц до написания настоящего обзора, потому что в настоящее время регистрация новых пользователей по каким-то причинами уже не работает (похоже были утеряны все полимеры).

Для регистрации ученому необходимо предоставить Ф.И.О., год рождения и email, после чего пройти процедуру «верификации». Это можно сделать двумя способами: по почте или через так называемый SPIN-код.

Верификация по почте осуществляется через «ручной контур». Чтобы этого избежать, мы решили освоить инновационный SPIN-код. Скорее всего, не каждый читатель знаком с этим понятием (среди нас тоже нашлись такие), поэтому расшифруем.

SPIN-код - это персональный идентификационный код автора в SCIENCE INDEX, информационно-аналитической системе, построенной на основе данных Российского индекса научного цитирования (РИНЦ).

Мы отправили заявку на получение SPIN-кода, заполнив для этого на сайте РИНЦ огромную форму с несколькими десятками полей и классификаторов (всего за какие-то 20 минут), и успешно получили код через две недели ожидания. Радуясь своим достижениям, мы ввели SPIN-код в профиле ученого, после чего «Карта» нам сообщила, что эта информация требует проверки (not again!). С момента ввода прошло уже две недели, а аккаунт до сих пор не верифицирован.

Если у вас хватило терпения, то вы добрались до личного кабинета.

Личный кабинет


Редактировать в личном кабинете особо нечего, так как в нем присутствуют только те данные, которые вы ввели при регистрации. Авторы системы подразумевают, что все остальное ученый расскажет о себе сам, заполнив немалое количество полей. Заметим, что в западных системах (ResearchGate, Academia.edu, Google Scholar) пользователь после регистрации получает практически готовый профиль, который система подготовила для него, автоматически собрав данные из различных источников. Ему остается только подтвердить их и при необходимости дополнить.

Сомнительно, что ученые по доброй воле станут пользоваться системой, в которой только на регистрацию уходит более 4 недель. Очевидно одно - «минимизации усилий со стороны ученых» не получилось.

Официальная неудовлетворительная оценка проекта также соответствует нашим выводам. «Это макет, это даже не пилотный проект », - отметила замминистра образования и науки РФ Людмила Огородова (макет за 90 миллионов).

Часть 4: реакция научного сообщества

Это будет самая лаконичная часть нашего повествования. Реакция научного сообщества была резко отрицательной.

Часть 5: причины провала

Как следует из официальной позиции МОН РФ и многочисленных отзывов экспертного научного сообщества, «Карта науки» получилось неудовлетворительной. Соответствует ли она целям выполненного государственного контракта, мы рассуждать не станем ввиду недостаточности информации о нем. Важно другое - как можно было бы избежать подобной ситуации? На наш взгляд, ключевым моментом в данной истории является то, что все данные, на которых строилась эта публичная информационная система, не являются открытыми.

И здесь мы хотели бы затронуть очень актуальную проблему открытых данных в науке. Их попросту нет. А ведь были бы они открыты, возможно, и необходимости в подобном госзаказе не было. «Карту науки» смог бы реализовать любой профессиональный разработчик, интересующийся тематикой открытых данных и наукой. Более того, таких «карт» при соответствующем спросе со стороны государства и научного сообщества было бы несколько.

Посмотрим на список предполагаемых российских источников для «Карты науки»:

  1. статьи в российских и зарубежных журналах (НЭБ);
  2. российские и зарубежные патенты (ФИПС);
  3. гранты (ФГБНУ НИИ РИНКЦЭ, РФФИ, РГНФ);
  4. отчеты по НИР и НИОКР (ЦИТиС);
  5. диссертации и авторефераты (ЦИТиС);
  6. издания книг (Российская книжная палата);
  7. сведения о научных организациях и их подразделениях (в том числе о вузах и их факультетах).
Подавляющее большинство вышеперечисленных источников были сформированы за счет государственного бюджета и непонятно, почему эти данные не являются публичными.

Часть 6: как исправить ситуацию?


Пообещала, что «Карта» «будет основным, системным инструментом для принятия решений в разных областях».

Несколько дней назад «Карта российской науки» заработала в интернете, и ученые начали искать себя в этом «путеводителе» и находить удивительные вещи.

«Эта «Карта» — форменное безобразие. «Карта» выдает информацию, которая совершенно не соответствует действительности. Знаете, где у нас по «Карте» работают лучшие астрономы? В новосибирском Институте ядерной физики, который в жизни никакой астрономией не занимался.

А в Институте теоретической физики Ландау занимаются всем на свете — вплоть до биологии.

Та версия системы, которую так раскритиковали академики, является тестовой — об этом красным по белому написано на самом сайте «Карты российской науки». В настоящее время официальным разработчиком системы является компания PricewaterhouseCoopers, которая по заданию закупает данные для «Карты» в основном из двух источников — Thomson Reuters (база научных статей Web of Science) и Российского индекса научного цитирования. Эти две частные компании по оформленным договорам поставляют данные о российских ученых.

То, что пока сделано, — это первоначальная автоматическая обработка данных, попытка облегчить их дальнейшую ручную верификацию.

Претензии, которые предъявляют к системе, связаны со сложностями технического плана. «Много претензий высказывается людьми, которые не разобрались и считают, что в системе должны указываться все их публикации за весь период их жизни. Это совсем не так, сейчас речь идет о 2007-2012 годах. Кроме того, точность данных по 2007 году из-за технических ограничений WoS зачастую не позволяет правильно сопоставить авторов с организациями, в которых они работают», — рассказал «Газете.Ru» источник, близкий к Минобрнауки.

К тому же данные самих этих баз опираются на сведения, поступающие от научных журналов, в том числе российских, многие из которых далеко не всегда корректно оформляют публикации.

Пояснил источник и то, откуда берется фиановское «огородничество».

Дело в том, что Web of Science и РИНЦ присваивают тематику журналам, а не отдельным публикациям. Поэтому каждая публикация получает тематику, приписываемую отдельному журналу. В «Карте» тематики организациям приписываются по тематикам публикаций, поэтому достаточно одной работы ученого, опубликованной, скажем, в журнале с сельскохозяйственной тематикой, чтобы всему ФИАНу приписали соответствующую направленность.

Большая часть выделенных 90 млн руб. идет на закупку данных из WoS и РИНЦ, кроме того, данные представляют Российская книжная палата и ФИПС при . Тех, кто опасается, что данные «Карты» будут в ближайшем времени использоваться при оценке научных организаций, разработчики системы успокаивают: «Когда организации будут отчитываться, им надо будет представлять не данные «Карты науки», которая еще не готова, а данные непосредственно Web of Science и Scopus».

По словам источника, корректная работа «Карты» будет зависеть и от самих ученых, для которых предусмотрена опция, позволяющая им выправлять собственные профили в этой системе и сообщать о замеченных разночтениях или лакунах. «Успех этого процесса будет зависеть от того, какие стимулы будут у ученых для использования «Карты». Например, профили ученых в системе могут использоваться при подаче на гранты, чтобы упростить составление заявок», — рассказал источник.

Правда, подобные объяснения не очень устраивают обиженных ученых. «Так с людьми не надо обращаться. Почему мы должны разгребать их… не буду говорить что? Вы же видите, как работает ? Он потому и работает, что его создавали выдающиеся люди, решавшие труднейшую задачу. Это задача для математиков, прикладников, тех, кто анализирует базы данных, а не тех, кто собрались и решили кое-как все сделать», — считает Паршин.

21 мая 2012 года Министром образования и науки Российской Федерации назначается Дмитрий Ливанов. В своем первом публичном выступлении он озвучивает намерение Министерства образования и науки (МОН РФ) провести всесторонний аудит сектора исследований и разработок, включая институты РАН, государственные научные организации и высшие учебные заведения. Это заявление можно назвать зарождением «Карты российской науки».

К сожалению, за событиями вокруг реформы РАН этот проект как-то потерялся и не получил, на наш взгляд, должного внимания со стороны IT-сообщества. Мы предлагаем вам небольшую ретроспективу: путь проекта от концепции до реализации.

Бесцельный путь синеет предо мной,
Далекий путь, потоками изрытый,
А дальше - мрак; и в этом мраке скрытый,
Парит судеб Вершитель роковой.

Александр Блок, октябрь 1899

Часть 1: конкурс

Проект «Карта российской науки» (http://mapofscience.ru/) был официально анонсирован в декабре 2012 года. Накануне МОН РФ был проведен конкурс на выполнение НИР по теме «Формирование системы оценки и мониторинга результатов научно-исследовательской деятельности организаций и ученых для регулярной оценки состояния сферы науки». Начальная (максимальная цена) контракта - 100 млн руб. Финансирование проекта обеспечивалось в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы» (Конкурс за 2012 год, Мероприятие 2.1, Очередь 11, Лот 1).

В конкурсе приняли участие следующие организации:

  1. Институт системного анализа Российской академии наук;
  2. ПрайсвотерхаусКуперс Раша Б. В. (далее - PwC);
  3. Научно-исследовательский институт автоматической аппаратуры им. академика В. С. Семенихина;
  4. Московский государственный университет приборостроения и информатики;
  5. Московский государственный технический университет имени Н. Э. Баумана;
  6. Московский государственный университет имени М. В. Ломоносова;
  7. ИНЭК-Информационные Технологии.
Бауманку не допустили по формальной причине: устаревшая выписка из ЕРГЮЛ. Являлось это халатностью при подготовке документов, или сыграл какой-то другой фактор, - уже вряд ли удастся узнать.

Победу в конкурсе одержала частная консалтинговая компания «ПрайсвотерхаусКуперс Раша Б.В.», предложив стоимость контракта 90 млн руб. и срок его выполнения - 90 дней.

Необходимо отметить, что МГУ предложил разработать «Карту науки» примерно вдвое дешевле - за 50 млн руб., однако получил от конкурсной комиссии невысокие баллы за качество и квалификацию, заняв второе место. Выглядит это странно, если учесть, что в Университете существуют полезные наработки в этой области: недавно запущена информационно­-аналитическая система «Наука-­МГУ», с помощью которой осуществляется сбор и анализ публикационной активности сотрудников.

В официальной прессе решение по выбору PwC в качестве исполнителя объяснили желанием заказчика в лице МОН РФ провести «аудит российской науки» силами внешней организации, никак не связанной с научной средой.

PwC потратило 40 млн на покупку данных из базы Web of Science (далее - WoS) у Thomson Reuters и 15 млн - на развертывание технической инфраструктуры. Плюс к этому система требует, по оценкам исполнителей, 10-15 млн руб. в год на поддержку.

К сожалению, мы не смогли найти в публичном доступе государственный контракт с победителем конкурса, а также техническое задание. (Внимание, вопрос: это не противоречит конкурсному законодательству?) Очень хотелось бы посмотреть на тот объем работ, который был заявлен на бумаге. Хотя с формальной точки зрения это уже не столь важно, так как проект оформлен как НИР: его результатом может являться просто отчет, реализация хотя бы прототипа совсем необязательна.

Часть 2: что хотели сделать?

«Наша цель - определить поименно тех ученых и те малые научные коллективы (то есть лаборатории, научные группы), которые уже сегодня в России работают на высоком международном уровне. Мы будем делать этот проект с одной простой целью - понять, где сегодня Россия сохраняет конкурентоспособность, какие области науки сегодня для нас являются перспективными, где у нас есть шанс в будущем совершить рывок. И, что самое важно, поддержать - адресно - именно тех людей, тех ученых, те лаборатории, которые этой поддержки заслуживают»,- говорил Дмитрий Ливанов в своем интервью телеканалу «Просвещение».

В документе, подготовленном PwC , сам проект описывается следующим тезисом: «Карта российской науки» должна стать основой для принятия информированных управленческих решений в сфере научно-исследовательской деятельности ученых и организаций»; также поставлены конкретные цели:

  1. «инвентаризация» текущего состояния российской науки;
  2. быстрый доступ по требованию к актуальным и корректным показателям российской науки;
  3. аналитический инструментарий для принятия обоснованных управленческих решений;
  4. выявление наиболее авторитетных экспертов и научных коллективов для их адресной поддержки;
  5. сравнение уровня развития науки в России с другими странами и выявления точек роста;
  6. обеспечение прозрачности принимаемых управленческих решений.
В этом же документе заявлены три основных столпа проекта: охват данных , качество данных и фунционал .

Охват данных планировалось обеспечить через:

  • международные источники: публикации, доклады на международных конференциях, патенты, издания;
  • российские источники: публикации, патенты, гранты, НИОКР, издания;
  • показатели как фундаментальной, так и прикладной науки.
В итоге должна была получиться «уникальная по охвату база, обеспечивающая наиболее полное возможное покрытие результатов научно-исследовательской деятельности российских ученых».

Под качеством данных подразумевалось:

  • очистка исходных данных для исключения разнонаписаний имен собственных;
  • использование механизма корректировки данных самими учеными и организациями;
  • использование уникальных идентификаторов ученых и организаций.
В результате этого ожидалось достижение «беспрецедентного уровня точности данных, который поможет обеспечить видимость российской науки для международного сообщества».

И, наконец, фунционал включал:

  • инструментарий для сравнения и выявления точек роста в науке;
  • построение отчетов по заданным параметрам для ученых, организаций, научных направлений;
  • гибкий поиск и фильтрация данных;
  • выявление неформальных коллективов ученых.
Это «усовершенствованный набор аналитических инструментов и их гибкость, обеспечивающие решение управленческих задач».

А теперь непрофессионалам , наверное, станет не очень интересно, но так как Хабр - технологичный блог, мы посчитали необходимым показать план работ и архитектуру выстраиваемой системы. Всего три слайда.

Бочки и стрелочки


План работ


Архитектура!

Часть 3: что получилось?

Прежде всего, мы предлагаем читателям Хабра самим оценить, соответствует ли заявленный функционал тому, что было реализовано. «Карта российской науки» доступна по данной ссылке http://mapofscience.ru/ . Можно ли считать это образцом для подражания? Является ли этот проект уникальным не только в России, но и в мире? Попробуйте сами ответить на эти вопросы.

Не так давно главная страница «Карты» была обновлена. Был добавлен красный мигающий блок, говорящий нам: «Внимание! Система находится в опытной эксплуатации». Вероятно, это произошло из-за большого количества негативных отзывов о проекте. Если взглянуть на приложение к конкурсу , можно заметить, что deadline данного проекта - конец 2013 года. Таким образом, что-либо кардинально исправить в этой версии для «опытной эксплуатации» представляется уже маловероятным, и мы можем перейти к оценке всего проекта.

Целью проекта (если кто не запомнил) являлось «определить поименно тех ученых и те малые научные коллективы (то есть лаборатории, научные группы), которые уже сегодня в России работают на высоком международном уровне». На наш взгляд, сделать это с помощью предложенных инструментов невозможно.

Охват данных
Скорее не получилось, чем получилось. Две основные базы - Российский индекс научного цитирования (РИНЦ) и Web of Science (WoS) - представлены в диапазоне 2007–2012 гг., да еще и с оговоркой в отношении WoS. Данные попросту неактуальны (верхняя планка года) и некорректны (нижняя планка года) для заявленной основной цели. И это при том, что доступ к базе WoS (её части, относящаяся к российским ученым) обошелся государству в 40 млн руб (практически без права передачи данных в МОН).

По остальным заявленным в проекте источникам данным также наблюдается, мягко говоря, некоторая неполнота. После длительного поиска по ведущим российским ученым не удалось обнаружить их книг, монографий, а также информации об участии в НИОКР и грантах. Можно предположить, что эти данные либо просто не предоставлены в карту науки, либо их не смогли подготовить.

Качество данных
По нашему мнению, эта задача являлась ключевой в реализации «Карты российской науки», это была именно та технологическая часть , которая составляла основную сложность и должна была отнять основные силы и время. Проще говоря, задача всей «Карты» состояла в том чтобы свести, очистить и грамотно перелинковать данные. Или, как следует из стенограммы установочного заседания экспертных групп по вопросам реализации проекта «Карта российской науки», ключевым блоком работ являлась «вычистка и интеграция данных из различных источников». И, к сожалению, эта часть совсем не получилась. Данные вообще не были сведены: нам предлагается или РИНЦ, или WoS. По сути, нам представлен просто интерфейс к этим двум базам, с не очень внятным функционалом. Так получилось, что именно к качеству данных возникло большинство претензий у научного сообщества. Мы попробовали собрать их воедино (но наверняка что-нибудь да упустили, - нареканий очень много):
  1. использование классификатора (рубрикатора) научных направлений, не применимого к действующим направлениям в российской науке;
  2. произвольный отбор (группировка) научных учреждений по рубрикам;
  3. отсутствие контроля уровня случайных совпадений;
  4. несоответствие числовых показателей реальным значениям (по численности состава научных учреждений, по количеству публикаций в WoS и РИНЦ, по числу патентов, по индексу цитирования), ошибки при переносе операторами данных из одной базы в другую;
  5. некорректный отбор «ведущих» учреждений или исследователей (топ-5), построенный на использовании произвольных признаков, не имеющих друг с другом связи (либо данные по WoS, либо по РИНЦ, либо алфавитный порядок, либо рубрикатор, и т.д.);
  6. неверное (некорректное) написание Ф.И.О. исследователя как в русской, так и в английской системе написания;
  7. неверная (некорректная) аффилиация исследователя;
  8. отсутствие разделения однофамильцев и их корректного соотношения с научным направлением и научным учреждением;
  9. отсутствие сведений о подразделениях организаций (в том числе, о факультетах крупных университетов, таких, как МГУ и СПбГУ).
Функционал
С функционалом тоже не все хорошо. Например, вот как реализован механизм корректировки данных: «Исправление технических ошибок, замеченных пользователями, происходит через предоставление бумажной версии замечаний, заверенной печатью организации, в которой работает пользователь». Между тем, в вышеупомянутой стенограмме говорится: «Основной принцип реализации проекта - минимизация усилий со стороны ученых. Предполагается, что большая часть информации в личных кабинетах будет заполняться в автоматическом режиме».

До сих пор не найден ни один человек, который может внятно объяснить, какую информацию несет в себе так называемая «тепловая карта». Единственная, на наш взгляд, интересная фича - это ссылка «свернуть карту» справа внизу, ее функционал, по крайней мере, неординарен и содержит львиную долю самоиронии.

Мы попробовали зарегистрироваться в системе, чтобы посмотреть, как она выглядит изнутри. Нам посчастливилось завести аккаунт примерно за месяц до написания настоящего обзора, потому что в настоящее время регистрация новых пользователей по каким-то причинами уже не работает (похоже были утеряны все полимеры).

Для регистрации ученому необходимо предоставить Ф.И.О., год рождения и email, после чего пройти процедуру «верификации». Это можно сделать двумя способами: по почте или через так называемый SPIN-код.

Верификация по почте осуществляется через «ручной контур». Чтобы этого избежать, мы решили освоить инновационный SPIN-код. Скорее всего, не каждый читатель знаком с этим понятием (среди нас тоже нашлись такие), поэтому расшифруем.

SPIN-код - это персональный идентификационный код автора в SCIENCE INDEX, информационно-аналитической системе, построенной на основе данных Российского индекса научного цитирования (РИНЦ).

Мы отправили заявку на получение SPIN-кода, заполнив для этого на сайте РИНЦ огромную форму с несколькими десятками полей и классификаторов (всего за какие-то 20 минут), и успешно получили код через две недели ожидания. Радуясь своим достижениям, мы ввели SPIN-код в профиле ученого, после чего «Карта» нам сообщила, что эта информация требует проверки (not again!). С момента ввода прошло уже две недели, а аккаунт до сих пор не верифицирован.

Если у вас хватило терпения, то вы добрались до личного кабинета.

Личный кабинет


Редактировать в личном кабинете особо нечего, так как в нем присутствуют только те данные, которые вы ввели при регистрации. Авторы системы подразумевают, что все остальное ученый расскажет о себе сам, заполнив немалое количество полей. Заметим, что в западных системах (ResearchGate, Academia.edu, Google Scholar) пользователь после регистрации получает практически готовый профиль, который система подготовила для него, автоматически собрав данные из различных источников. Ему остается только подтвердить их и при необходимости дополнить.

Сомнительно, что ученые по доброй воле станут пользоваться системой, в которой только на регистрацию уходит более 4 недель. Очевидно одно - «минимизации усилий со стороны ученых» не получилось.

Официальная неудовлетворительная оценка проекта также соответствует нашим выводам. «Это макет, это даже не пилотный проект », - отметила замминистра образования и науки РФ Людмила Огородова (макет за 90 миллионов).

Часть 4: реакция научного сообщества

Это будет самая лаконичная часть нашего повествования. Реакция научного сообщества была резко отрицательной.

Часть 5: причины провала

Как следует из официальной позиции МОН РФ и многочисленных отзывов экспертного научного сообщества, «Карта науки» получилось неудовлетворительной. Соответствует ли она целям выполненного государственного контракта, мы рассуждать не станем ввиду недостаточности информации о нем. Важно другое - как можно было бы избежать подобной ситуации? На наш взгляд, ключевым моментом в данной истории является то, что все данные, на которых строилась эта публичная информационная система, не являются открытыми.

И здесь мы хотели бы затронуть очень актуальную проблему открытых данных в науке. Их попросту нет. А ведь были бы они открыты, возможно, и необходимости в подобном госзаказе не было. «Карту науки» смог бы реализовать любой профессиональный разработчик, интересующийся тематикой открытых данных и наукой. Более того, таких «карт» при соответствующем спросе со стороны государства и научного сообщества было бы несколько.

Посмотрим на список предполагаемых российских источников для «Карты науки»:

  1. статьи в российских и зарубежных журналах (НЭБ);
  2. российские и зарубежные патенты (ФИПС);
  3. гранты (ФГБНУ НИИ РИНКЦЭ, РФФИ, РГНФ);
  4. отчеты по НИР и НИОКР (ЦИТиС);
  5. диссертации и авторефераты (ЦИТиС);
  6. издания книг (Российская книжная палата);
  7. сведения о научных организациях и их подразделениях (в том числе о вузах и их факультетах).
Подавляющее большинство вышеперечисленных источников были сформированы за счет государственного бюджета и непонятно, почему эти данные не являются публичными.

Часть 6: как исправить ситуацию?



Close