Библиометрия, наукометрия и вебометрия - от числа строк в работах Аристотеля
Гордукалова Г.Ф.1
1 Санкт-Петербургский
государственный университет культуры и искусств
Истоки библиометрии связываются с количественным измерением авторского наследия мыслителей Древнего мира. Выделены ее типовые и специальные задачи, российский опыт 18 века, соотношения с наукометрией, вебометрией, алтметрикой и др. Cовременное содержание библиометрии определяется как количественное отображение изменяющихся связей между объектами в локализованном информационном поле по избранным индикаторам. Тенденции развития показаны на основе анализа журнала “Scientometrics”.
Ключевые слова:
тенденции, библиометрия, наукометрия, история, задачи, вебометрия, альтметрика, сетеметрия, Scientometrics
Приглашаем к сотрудничеству авторов научных статей
Публикация научных статей по экономике в журналах РИНЦ, ВАК (высокий импакт-фактор). Срок публикации - от 1 месяца.
creativeconomy.ru Москва + 7 495 648 6241
Библиометрия – количественное измерение параметров определенной части документального потока для выявления тенденций его развития или отраженного в нем знания об объекте.
Результаты исследований документального потока (ДП) полезны для издателей и библиографов; историков, исследователей и организаторов науки; инженеров по информации и аналитиков разной специализации; модераторов контента в информационных хранилищах и менеджеров по управлению знаниями.
Задачи библиометрии. Современное содержание библиометрии можно определить как количественное отображение изменяющихся связей между единицами информации об объекте в локализованном предметном и информационном поле по избранным индикаторам.
В ДП активно исследуются любые динамические характеристики; семантическая, издательская и авторская структуры потока; закономерности его развития – темпы роста годового потока, темпы старения в нем документов, закономерности рассеяния публикаций из периодических изданий, дублирования и фрагментарности документов в потоке.
Прикладное исследование позволяет выполнять следующие типовые задачи:
• оценивать темпы развития предметной области,
• выявлять ведущих специалистов, организации и страны с определенной оценкой их вклада в развитие отрасли знания, тематического направления,
• выделять зарождающиеся направления и аспекты изучения локальных объектов, а также прогнозировать отдельные параметры реального и цитируемого ДП.
Специалисты решают и более узкие прикладные задачи. Например, реконструкцию интеллектуальной истории научного коллектива, мониторинг слияний и поглощений на рынке научной периодики. Прослеживается динамика рейтингов отдельных организаций и периодических изданий, их видимость в сети и т.д.
Для изучения избирается любая тематически однородная часть мирового потока литературы, микропоток отдельных видов документов – статей, патентов, новостных или рекламных сообщений за определенный период времени, сайтов и т.д.
Выделенный микропоток документов может измеряться и анализироваться на разных уровнях:
• потокографический – изменение параметров структур реального или цитируемого потока, картографирование – отображение связей между документами или ссылками, выделенных по разным структурным признакам – тематике, вида документов, автора, времени опубликования и т. д.;
• документографический– библиографический анализ единичных документов для их идентификации, индексирования, отбора и оценки;
• текстографический – формализованный частотный анализ текстов документов, фрагментов, фактов из них с разными прикладными целями – на уровне ключевых слов и даже внетекстовой информации. Широко используется для разработки рубрикаторов и онтологий, мониторинга новостных потоков, выявления тенденций развития объекта.
Современная библиометрия строится на применении двух основных групп методов:
• библиографические методы – поиск, отбор и систематизация источников информации для точного формирования анализируемых массивов документов и ссылок;
• количественные методы – частотный анализ текстов, корреляционный, факторный, кластерный анализ, метод главных компонент и др.
Из сочетания формальных и содержательных методов формируются сложные аналитические технологии картографирования, контент-анализа, интент-анализа, информационного моделирования объектов, технологий оценки вклада ученых, организаций, журналов, стран и т.д.
Для обозначения прикладных исследований документального потока остается общепринятым термин «библиометрия» с параллельным использованием понятий наукометрия, информетрия, вебометрия и др. Чтобы разобраться в их хитросплетении, важно увидеть объект и историю его измерений.
Документальный поток как объект библиометрии. Со времен Древнего мира для обозначения множества книг использовались понятия «библиотека», «литература», позже – «книжный рынок». Интуитивное восприятие безбрежности «книжного моря» ощущается в Лаврентьевской летописи за 1037 год: книги – это «рекы, напояющие вселенную», «книгам бо есть несчетная глубина…».
Первый опыт введения понятия «книжный поток» в библиотечную лексику был предпринят Н. А. Рубакиным в обозрении «Книжный прилив и книжный отлив» (1909 г.). Благодаря длительным исследованиям сложилось представление о документальном потоке как о целостном, длительно существующем явлении:
Документальный поток (ДП)– это непрерывно развивающееся, целостное множество семантически связанных документов, являющееся уникальным средством хранения, накопления и передачи знания о внешнем мире. ДП – интеллектуальная память цивилизации, искусственно созданная система, которая приобрела в процессе развития собственные структуры (тематическую, издательскую, видовую, языковую, ценностные связи между документами и др.), собственные закономерности развития – темпы роста, старения, степень рассеяния, дублирования и др. Поток масштабен, почти неисчислим, пространственно распределен, охватывает источники информации всех времен и народов. Поэтому в основе библиометрии лежит главное правило: при любом измерении качество его результатов связано с четкими границами анализируемого потока.
Основные события в истории библиометрии. Термин «библиометрия» был введен в широкое использование английским ученым Аланом Притчардом в 1969 г. для обозначения любых количественных измерений «написанной информации»– вместо многозначного термина «статистическая библиография» [1].
Европейские специалисты связывают появление библиометрии с измерениями потока через книготорговые каталоги в Лейпциге в XVII в. Однако, первые количественные измерениямы находим в измеренииавторского наследия мыслителей Древней Греции и других центров цивилизации. Подсчитывались два основных показателя – количество книг автора и количество строк (иногда слов) в рукописях: Диоген Лаэртский сообщил, что труды Аристотеля составляют 400 книг из 445270 строк. В I веке грамматик Дадим написал 3500 работ, а Марцил – 14 книг, 150 переводных и 100 оригинальных свитков [2].
В России возможность получения нового знания на основе изучения и измерения потока литературы была предсказана уже первыми теоретиками библиографии. В.Г. Анастасевич (1811, 1820), B.C. Сопиков (1813), Г.Л.Х. Бакмейстер (1772) полагали, что изучение постоянно изменяющейся совокупности книг позволит судить о «недостатках» книжного рынка и «дальнейшем развитии науки». Первое количественное изучение потока в России было проведено членами Петербургской академии А.К. Шторхом и Ф.П. Аделунгом в 1807 г. на основе составленного ими указателя «Систематизированное обозрение литературы в России в течение пятилетия с 1801–1806 г.» (СПб, 1810). Первая часть указателя – «Российская литература» – принадлежит А. Шторху и содержит в себе роспись 1254 книг и 232 журнальных статей по разделам. Ф. Аделунгом составлена вторая часть – «Иностранная литература в России» (773 книги), которые были проанализированы статистически.
|
|
Андрей
Карлович Шторх (1766–1835) – экономист, историк и библиограф, академик (1804)
и вице-президент Петербургской академии наук (1830). В 1799
г. Был назначен учителем великих княжон, позднее преподавал курс
политической экономии великим князьям. Первая работа по статистике («Gemдlde
von St.-Petersburg», Riga, 1793) была переведена на французский, шведский и
английский языки. Автор широко признанного учебника по политической экономии.
|
Федор
Павлович Аделунг (1768–1843) – историк, лингвист, библиограф,
член-корреспондент Петербургской академии наук с 1809
г. Составил библиографические указатели санскритского языка, иностранных
карт России с 1306 по 1699 гг., сводный труд «Критико-литературное обозрение путешественников
по России до 1700 г. и их сочинений».
|
На основе количественного анализа А. Шторх и Ф. Аделунг показали «сколько сочинений напечатано в каждом роде» – по видам изданий, жанрам произведений, языкам издания, месту печатания, авторству, названию журналов, а также с каких языков сделаны переводы. Был измерен авторский коллектив: 366 писателей 19 сословий, из которых «10 князьев, 6 графов, 3 министра». Авторы рассматривались по ученому званию, сословию (10 студентов, 1 вольный крестьянин), полу и национальности – «5 женщин, из них одна немка». Впервые было показано распределение статей по названиям журналов и даже сделана попытка рекомендаций и «претензий».
Очевидно, что авторами выдвигались масштабные аналитические задачи с желанием регулярно проводить количественный анализ потока новой литературы, полагая «усмотреть из оного состояние каждой особенной науки», «сравнить один период с другими и через сравнение это видеть прирашение или ущерб».
В странах, где уже с конца XVII в. стал осуществляться учет печатной продукции по разным признакам, накапливалась и анализировалась книготорговая статистика, строились планы международного учета печатной продукции. Проводились единичные отраслевые исследования в области химии, сравнительной анатомии, геофизике и др. Методический прорыв был осуществлен в 1934 г., когда английский документалист С. Брэдфорд дал свою формулировку закономерности рассеяния публикаций в периодических изданиях [1], историк науки Д. Прайс в 1956 г. предложил экспоненциальную модель роста потока научных публикаций, Р. Бартон и Р. Кеблер в 1960 г. нашли измеритель скорости старения публикаций. С этого времени начинается новый этап развития библиометрии, в том числе и для потока цитированной литературы.
В России теоретико-методические основы количественного изучения документального потока заложили работы В.В. Налимова, А.И. Михайлова, А.И. Черного и Р.С. Гиляревского, Л.С. Козачкова, Д.Ю. Теплова и других специалистов (см. табл. 1). К началу 1980-х гг. первопроходцы осуществили новаторские и масштабные исследования в разных отраслях знания –в области химии (В.В. Налимов, Ю.В. Грановский); металлургии (Г.В. Гедримович); физики твердого тела, конденсаторостроения, высокомолекулярных соединений, литературоведения (О.М. Зусьман, Г.Ф. Гордукалова). Анализ потока цитированной литературы осваивали С.Г. Кара-Мурза, И.В.Маршакова и другие специалисты. Сейчас весьма активно ведутся исследования в библиометрических центрах Москвы, Санкт-Петербурга, Новосибирска, Тамбова, Казани.
Таблица 1
Ключевые работы в области количественного изучения документального потока за 1969–1988 гг.
Год издания
|
Библиографическое описание издания
|
Основное нововведение
|
1969
|
Налимов В. В., Мульченко З.
М. Наукометрия. Изучение развития науки как информационного процесса. М. : Наука,
1969. 192 с.
|
Впервые анализируется
информационная модель науки. Введено понятие «наукометрия», рассмотрены
основные закономерности развития информационных потоков, приведены результаты
многоаспектного анализа потока для конкретного научного направления.
|
1973
|
Воробьев Г. Г. Документ:
информационный анализ. М. : «Наука», 1973. 264 с.
|
Первая монография об анализе
документальной информации, использовано понятие «документальный шлейф»,
впервые в отечественной литературе рассмотрены информационные свойства документов
(Гл.2).
|
1976
|
Михайлов А. И., Черный А.
И., Гиляревский Р. С. Научные коммуникации и информатика. М. : Наука, 1976.
436 с.
|
Впервые обобщен опыт
зарубежных исследователей потока научной информации, описаны закономерности
развития потока, используемые математические модели.
|
1978
|
Козачков Л. С. Системы
потоков научной информации. Киев : Наук. думка, 1978. 199 с.
|
Впервые в тексте использован
термин «документальные потоки», обобщен методический опыт количественных
исследований, в том числе с использованием автоматизированной информационной
системы.
|
1980
|
Грановский Ю. В.
Наукометрический анализ информационных потоков в химии. М. : Наука, 1980. 141
с.
|
Впервые изложены результаты
многоаспектного анализа потока литературы в области химии, показана
возможность их содержательной интерпретации.
|
1983
|
Документальные потоки по
естествознанию и технике и проблемы библиографии : сб. науч. тр. / ЛГИК ;
науч. ред. Г. В. Гедримович. Л., 1983. 167 с.
|
Впервые понятие
«документальные потоки» внесено в название книги. Приведены результаты
многолетних исследований микропотоков документов разной тематики, предложена
методика анализа периодических изданий, ориентированная на оценку
межотраслевых связей.
|
1983
|
Хайтун С. Д. Наукометрия:
состояние и перспективы. М. : Наука, 1983.
|
Впервые детально описан
комплекс и возможности методов математической статистики для изучения
закономерностей развития потоков научной информации, показана роль
лингвистических методов, в том числе сленгового анализа.
|
1986
|
Мотылев В. М. Старение
научно-технической литературы. Л. : Наука, 1986. 160 с.
|
Впервые в стране исследуется
теоретические и методические проблемы изучения закономерности старения, раскрывается
его сущность, механизм, формы проявления.
|
1988
|
В. И. Информетрия // Итоги
науки и техники. М. : ВИНИТИ, 1988. Т. 10. 190 с.
|
Первый обзор количественных
исследований, ориентированных на использование методов математической
статистики при измерении потоков информации. Введение в обиход отечественной
науки термина «информетрия».
|
1988
|
Маршакова И. В. Система
цитирования научной литературы как средство слежения за развитием науки. М. :
Наука, 1988. 288 с.
|
Впервые и фундаментально
характеризуются в России возможности и индикаторы для анализа потока
цитируемой литературы. Детально описан опыт подготовки и анализа указателя
ссылок на научную литературу «Science Citation Index» – (SCI), выходящего в
США с 1963 г.
|
Соотношение терминов. Предложенное А. Притчардом в 1969 г. обозначение «библиометрия» быстро распространилось, но в этом же году вышла в свет монография В.В. Налимова, в название которой вошло понятие «наукометрия», а затем стало использовать во всем мире для обозначения метрических исследований в науковедении. Понятие «информетрия» привнесено в профессиональный словарь отечественных специалистов В.И. Горьковой, благодаря подготовленному обзору количественных исследований под названием «Информетрия» (М., 1988). В период 1960–1980 гг. многие отрасли знания обрели свой метрический раздел – эконометрия, биометрия, технометрия, социометрия.
Более тридцати лет велась научная дискуссия о соотношении понятий «библиометрия», «наукометрия», «информетрия», благодаря которой были сделаны следующие выводы:
• обобщающим является термин «библиометрия»;
• термин «наукометрия» обозначает прикладные исследования потока научной информации с учетом его специфики;
• «информетрия» понимается как теория измерения количественных (в том числе семантических) характеристик информации, но в методическом отношении, как правило, не выходит за границы библиометрических исследований.
Не оправдала себя и попытка разграничить эти термины по кругу используемых методов, закрепив за информетрией сложные методы статистической обработки данных. В содержании международного журнала “Scientometrics”, а также в российских электронных журналах “Informetrics.ru”, “Biometrica” (г.Томск) одновременно используются все три термина, что подтверждает их смысловое единство. Выбор термина остается за авторами исследования, он определяется их специальностью, уровнем подготовки к подобным работам, задачами исследования.
Возникновение в системе электронных коммуникаций родственных терминов сетеметрия, вебометрия, киберметрия в конце 1990-х гг.не осложняет ситуацию, поскольку во всех случаях применяются инструменты и методы библиометрии, но только по отношению к машиночитаемым документам.
Содержательно эти три терминапока четко не разграничиваются в использовании. В дальнейшем возможна некоторая их специализация: термин «сетеметрия» может закрепиться за любыми измерениями в сети, в том числе и для сугубо технических нужд провайдеров, работы серверов; «вебометрия» будет обозначать измерение и результаты многоаспектного анализа веб-ресурсов. «Киберметрия», а точнее – близкое ему новое понятие, сможет со временем претендовать на всесторонний, полностью автоматизированный анализ потоков машиночитаемой информации как в сети, так и в масштабных базах данных локального доступа. В любом случае библиометрическое измерение параметров электронной части документального потока будет осуществляться через выявление в нем информационных профилей и структур.
Современные направления развития библиометрии. В настоящее время в стране и за рубежом активно обсуждаются следующие проблемы развития количественных измерений потока информации:
• индикаторы и инструменты проведения вебометрических исследований;
• веб-цитирование как фактор видимости вузов;
• развитие биобиблиометрии, позволяющей акцентировать внимание на авторской структуре потока;
• новые методики оценки вклада в науку;
• сложные приемы динамического картирования реального потока по запросам;
• возможность корректного использования веб-статистики и многие другие.
Направления работы, а главное – используемые массивы и методы зарубежных исследователей выявлялись нами на основе анализа публикаций международного журнала Scientometrics за 2010-2011 гг. (Табл. 2). В трех первых томах журнала за 2014 г. авторами рассматриваются, преимущественно, разработка карт «инфраструктуры знаний», карты предвыборной компании, карт на основе одновременного использования данных наукометрии и вебометрии, сетевой анализ стержневых ссылок среди университетов и т.д.
Таблица 2
Основные направления зарубежных прикладных исследований документального потока в 2010–2011 гг.
Цель и направление исследования
|
Область знания, изучаемая структура потока или закономерность.
Используемые методы, статистические модели
|
Сравнительный
ретроспективный анализ тематических направлений
|
Библиометрический анализ
двух микропотоков за 30 лет.
|
Дополнительная и
альтернативная медицина, Китай
| |
Ретроспективный анализ базы
данных
|
Глубокая ретроспекция
анализа потока и визуализация основных направлений исследований
|
База данных Medline,
1965-2005
| |
Сравнительный ретроспективный
анализ тематических направлений
|
Библиометрический анализ
микропотока 1970-е-2010 гг. на примере семи видов рыб
|
Измерение семантической
целостности научных областях
|
Семантическая структура
научной литературы
|
Библиометрические,
классификационные методы
| |
Выявление точек роста и
распространения знаний
|
Географическая, языковая,
организационно-фирменная структуры
|
Эволюция создания и
распространения знаний, Тайвань
| |
Анализ новых фронтов
исследований
|
Тематическая структура
|
Проявление новых тенденций в
развитии знаний
| |
Исследование тематических
профилей
|
Тематическая структура
микропотоков
|
Инновационная тематика в
сравнении со стабилизированной
| |
Отслеживание исследований и
разработок
|
Организационно-фирменная
структура
|
Библиометрический анализ
патентов на лекарства в «Orаnge Book»
| |
Изучение корпоративного
роста
|
Анализ потока патентов,
построение семантических сетей патентов, Китай
|
Построение карты совместного
производства знания
|
Организационно-фирменная
структура потока совместных патентов, Китай
|
Изучение порядка авторства
|
Авторская структура
|
Соавторство в научных
публикациях
| |
Анализ авторского научного
наследия
|
Авторский микропоток
публикаций
|
«Библиометрическое
путешествие»
| |
Исследование публикационной
активности авторов
|
Закономерность связи двух индикаторов:
чем выше звание и должность авторов, тем выше их продуктивность
|
Анализа динамики
научно-исследовательского сотрудничества
|
Организационно-фирменная
структура, ее изменения для африканских региональных инновационных систем
|
Оценка публикационной активности
стран
|
Географическая структура
|
Научные публикации стран
Балтии
| |
Библиографические
исследования изданий на иврите
|
Языковая структура –
микропоток документов на одном языке
|
Библиометрический анализ
| |
Оценка продуктивности
научно-технических программ
|
Документальный шлейф
публикаций и ссылок по программам Евросоюза
|
Оценка качества научных
исследований
|
Индексы цитирования
|
Анализ тенденций развития
тематического направления
|
Основные публикации об
исследованиях графена
|
Библиометрический анализ
| |
Оценка развития базы данных
научных исследований за 10 лет
|
Анализ количественных
параметров базы данных по библиометрическим индикаторам
|
Сравнительный анализ
динамики роста диссертаций
|
Динамика роста диссертаций в
потоке
|
Восемь областей исследования
| |
Пересмотр закономерности
старения
|
Закономерность старения
|
Измерение научного влияния
на ссылки
|
Моделирование процесса
распространения ссылок для оценки ее жизненного цикла с прогнозом
|
Механизм и факторы
цитирования
| |
Сравнение рейтингов
университетов на основе ссылок
|
Влияние национального языка
на рейтинговые оценки
|
Изучение научного сообщества
|
Географическая структура
потока цитированной литературы (ПЦЛ), Бразилия
|
Индикаторы распознавания и
оценки
| |
Измерение региональных
научных сетей
|
Сравнение международных и
китайских библиографических источников данных
|
Оценка результатов
исследований ученого
|
Анализ ссылок и характера
цитирования
|
Выявление основных
документов по теме
|
Семантическая структура в
потоке цитированной литературы. Кластеризация ссылок
|
Выявление динамики ссылок на
работы женщин-ученых
|
Авторская структуры ПЦЛ
|
Анализ структуры
интеллектуальной организации науки
|
Организационно-фирменная
структура ПЦЛ
|
Конфигурация знаний между
структурными компонентами в сетях науки
| |
Эффективность ссылок
|
Измерение экономических
журналов
|
H-индекс
|
H-индекс одной публикации и
косвенный H-индекс исследователя
|
Поиск связей между
индикаторами
|
Закон Брэдфорда в ПЦЛ,
продуктивность и импакт-факторы научных журналов
|
Поиск связей между
индикаторами
|
Тип статьи, название, их
влияние на количество загрузок и ссылок
|
Поиск связей между
индикаторами
|
Корреляция между
библиометрическими показателями и экспертной оценкой
|
Поиск связей между
индикаторами
|
Динамика патентования и
анализ ссылок Компании из списка Fortune 500
|
Проблемы естественного
отбора научных работ
|
Факторы цитирования,
открытая экспертная оценка и динамика потока научных статей
|
Исследование имен хостов в
URL ссылки
|
Степенное распределение
|
Анализ сети ссылок
|
Ссылки из взаимосвязанных
журналов, их связи с другими дисциплинами
|
Оценка формирования сети
знаний
|
Онтология
|
Модель векторного
пространства
| |
Атлас науки
|
Средства визуализации,
уровень восприятия
|
*) На материале международных журналов Scientometrics и Journal of Informetrics (Нидерланды) за 2010–2011 гг. Не включались близкие по методике исследования микропотоков разных тематических областей – нанотехнологий, водных ресурсов, проблемы стволовыхклеток и др.
Отмечаются и другие факторы развития библиометрии– спрос на количественные исследования новостных потоков в сфере бизнеса, вебометрические измерения в социальных науках, разработка новых программных комплексов для семантической обработки текстов, попытки найти новые средства визуализации знания в инфографике [3–5].
О перспективах дальнейшей дифференциации библиометрии свидетельствует обсуждение предложенного в 2010 г. нового термина «альтметрика», обозначающего направление, альтернативное классическому индексу цитирования и импакт-фактора журналов. Оно ориентировано на комплексную оценку публикаций до их выхода в свет, предполагает обобщение показателей разного рода, включая формализованный анализ текстов рецензий и отзывов в форумах. В условиях создания масштабных полнотекстовых баз данных и электронных библиотек библиометрия на всех уровнях анализа документального потока становится необходимым инструментом. Решение глобальной проблемы семантического поиска приведет к существенным переменам в технологии прикладных библиометрических исследований.
[1] Модель Брэдфорда–Ципфа–Лотке используют сейчас для описания распределений объектов практически всех открытых систем, она применяется для построения карт науки, в алгоритмах поисковых систем при индексировании интернет-ресурсов.

Издание научных монографий от 15 т.р.!
Издайте свою монографию в хорошем качестве всего за 15 т.р.!
В базовую стоимость входит корректура текста, ISBN, DOI, УДК, ББК, обязательные экземпляры, загрузка в РИНЦ, 10 авторских экземпляров с доставкой по России.
creativeconomy.ru Москва + 7 495 648 6241
Борухович В.Г. В мире античных свитков. – Саратов: Изд-во Сарат. Ун-та, 1976. – С. 99, 159, 191. См. также: Рукописная книга в культуре народов Востока. – Кн.1–2. – Москва: Наука, 1987-1988.
Беленький А. Визуализация в инфометрии – красота, да и только [Электронный ресурс] // http://www.Informetrics.ru. – 2010. – № 1435. См. также: Беленький А. Визуализация в инфометрии – красота, да и только // КомпьютерПресс. – 2009. – № 4. – С. 12-16.
Гордукалова Г.Ф. Результаты анализа оценочных высказываний о состоянии и тенденциях развития науки в Санкт-Петербурге // Вестн. Санкт-Петербург. гос. ун-та культуры и искусств. – 2011. – № 2. – С. 99-106.
Schaer P. Applied Informetrics for Digital Libraries: An Overview of Foundations, Problems and Current Approaches // Historical Social Research. – 2013. – 38 (3). – P. 267–281.
Gordukalova, G.F. Bibliometrics, scientometrics and webometrics – from the number of rows in the works of Aristotle. Scholarly Communication Review , 40-46. doi: 10.18334/np42127 (in Russian)