Главная страница
Навигация по странице:

  • Закономерности роста и старения

  • БИ ОСНОВЫ ИНФОРМАТИКИ. БИ_курс лекций. Р. С. Гиляревский основы информатики курс лекций


    Скачать 1.65 Mb.
    НазваниеР. С. Гиляревский основы информатики курс лекций
    АнкорБИ ОСНОВЫ ИНФОРМАТИКИ
    Дата07.04.2021
    Размер1.65 Mb.
    Формат файлаpdf
    Имя файлаБИ_курс лекций.pdf
    ТипКурс лекций
    #192133
    страница8 из 26
    1   ...   4   5   6   7   8   9   10   11   ...   26
    Литература как источник информации
    Основные понятия, эволюция и типология
    Строго говоря, источником любой информации является чело- век или группа людей. Ответственность за достоверность тех или иных сведений могут брать на себя учреждения или организации, которые в этом случае также служат как бы источниками информации. Но в про- фессиональной информационной деятельности информация циркули- рует в виде документов, и именно они считаются источниками инфор- мации.
    Под документом понимается совокупность логически завер-
    шенных сведений и материального носителя, на котором они записа-
    ны, с непременным указанием кем, где и когда документ был создан.
    Понятие документа является альтернативным и обобщающим по от- ношению к понятию произведения письменности и печати, часто упот- ребляемому в гуманитарных науках.
    Произведением письменности считается результат целена-
    правленной познавательной деятельности (факты, идеи, образы),
    имеющий определенную логическую взаимосвязь частей, завершен-
    ность в целом и изложенный в письменном виде. Произведение печа-
    ти, кроме того, получает обязательную редакционную апробацию и
    имеет точный библиографический адрес, состоящий из стандартно-
    го набора выходных сведений (автор, заглавие, город, издательство и
    год публикации или название публикующего органа).
    Поскольку способы хранения и передачи информации играют большую роль в развитии коммуникации, да и цивилизации в целом, интересно проследить эволюцию этих способов.
    С развитием каждой цивилизации по мере усовершенствования ее языка и письменности вырабатывались и определенные типы доку- ментов, как по форме, так и по содержанию. Самые древние из до- шедших до нас документов – клинописные плитки Месопотамии – да-

    78 тируются четвертым тысячелетием до н. э. От шумерской культуры того времени и вавилоно-ассирийской, расцвет которой приходится на второе тысячелетие до н. э., сохранились сочинения в области астро- номии, географии, истории, права, торговли. Наряду с небольшими глиняными плитками высотой в 2,5 см изготовлялись плитки высотой до 40 см, содержащие до 400 строк в 4 колонки с двух сторон. Основ- ным недостатком этих глиняных книг, в течение тысячелетий обслу- живавших культурные и научные потребности человека, была их гро- моздкость и недостаточная емкость. Отдельные произведения занима- ли до 10 плиток. Собрания, насчитывавшие десятки тысяч плиток (а до нас дошли остатки подобных библиотек), требовали огромных поме- щений.
    Папирусный свиток – более компактная форма документа, по- зволявшая накапливать большие собрания произведений письменно- сти. Начиная с третьего тысячелетия до н. э. в Египте изготовлялись именно такие книги. Текст на папирусном свитке располагался пер- пендикулярно его длине колонками от 25 до 45 строк. Хрупкость и не- долговечность папируса обусловила незначительное число дошедших до нас образцов древнеегипетских документов (древнейший из них восходит к XVIII в. до н. э.). Это, главным образом, ритуальные "книги мертвых", извлекаемые археологами из пирамид и других захороне- ний.
    У греков и римлян на протяжении долгого времени сведения
    (особенно научного характера) распространялись устным путем. Из- вестно, что лишь после Аристотеля для этих целей стали широко при- меняться рукописи. До середины нашего века мы не располагали ни одним оригиналом времен античных классиков, часто столетия отде- ляют последнюю сохранившуюся копию от возможной даты написания текста. Исключение составляет лишь найденные во время второй ми- ровой войны кумранские рукописи ("рукописи Мертвого моря"), дати- руемые первым веком н. э. Сведения о греческих и римских папирусах почерпнуты из малоазиатских и позднеегипетских образцов. Средняя длина свитка не превышала 10 м, ширина – 30 см.
    Пергамент, изготовлявшийся из телячьих шкур, известен как материал для письма с III в. до н. э. Он позволял писать с двух сторон, был более долговечен, чем папирус, и обусловил переход к современ- ной блочной форме книги – кодексу. Кодексы из папируса изготовля-

    79 лись еще в первые века н. э., но к V в. были вытеснены пергаментным кодексом.
    Кодекс – более емкая форма книги, чем свиток, он удобнее для записи больших текстов и для наведения справок, Пергаментные ко- дексы вплоть до XII в. были единственной формой книги в Европе.
    Основным их недостатком, препятствовавшим широкому распростра- нению письменных документов, была дороговизна. Для одного экзем- пляра пергаментной книги требовались шкуры целого стада. На смену пергаменту пришла бумага, изобретенная в 105 г. в Китае. На Ближнем
    Востоке ее начали изготовлять с 751 г., а в XII в. через арабских завое- вателей Испании она проникла в Европу.
    Бумажная книга, значительно более дешевая, чем пергаментная, стала широко использоваться в научных и образовательных целях.
    Опыт нескольких тысячелетий развития письменных документов пока- зывает, что их форма менялась главным образом под влиянием по- требностей общества: документы становились все более емкими, удоб- ными для использования и дешевыми. Именно эта тенденция развития средств, служивших для закрепления информации, привела к появле- нию бумажного книжного блока, который до нашего времени оставал- ся основной материальной формой документа.
    В XV в. стала повсеместно ощущаться потребность в новом способе изготовления документов. Рукописная книга перестала удов- летворять культурные и научные запросы общества по двум причинам.
    Во-первых, она изготовлялась слишком долго и требовала значитель- ных затрат труда. Во-вторых, переписка текстов от руки не давала воз- можности получить большое число экземпляров идентичного содер- жания, так как копии одного и того же текста отличались друг от друга из-за искажений, вносимых переписчиками.
    Именно к этому времени относится историческое изобретение в
    1448 г. немецким ремесленником И. Гутенбергом книгопечатания под- вижными литерами. Технические средства, которые легли в основу книгопечатания, – граверная и литейная техника и винодельческий пресс, преобразованный Гутенбергом в печатный станок, – были из- вестны еще в античные времена. Однако лишь настоятельная потреб- ность общества в быстром и точном механическом воспроизведении текстов вызвала к жизни это изобретение, совершенству которого мы не перестаем удивляться и основными принципами которого продол- жаем пользоваться для размножения документов.

    80
    Мы знаем, что теперь появились технические средства, значи- тельно повысившие наши возможности хранения больших массивов информации с быстрым доступом к любой единице этой информации.
    Речь идет о компактных оптических дисках, используемых в качестве внешней памяти компьютера (CD-ROM – Compact Disc Read Only
    Memory). В этой области прогресс происходит так быстро, что риско- ванно приводить какие-либо точные данные. Но объем одного диска измеряется тысячами мегабайт, т. е. миллионами страниц текста, время записи и считывания одной страницы не превышает 1–2 сек., а в "биб- лиотеке" из 64 дисков поиск и выдача информации по запросу занима- ет 10–15 сек. Выведенные на экран тексты и изображения можно из- менять по мере необходимости. Эти новые средства начинают широко использоваться , и мы еще будем о них говорить.
    В широком смысле документами иногда считают не только над- писи, рукописи и печатные издания, но и произведения искусства, ну- мизматические памятники, музейные экспонаты минерального, бота- нического, зоологического или антропологического характера. П. Отле считал документом любой материальный объект, который фиксирует или подтверждает какие-либо знания и может быть включен в опреде- ленное собрание.
    Различные виды научных документов возникали в разное время и на протяжении последних столетий и даже десятилетий претерпева- ют значительную эволюцию. Книга существует уже несколько тысяче- летий, описание изобретений – 500 лет, научный журнал – немногим менее 350 лет, а журнальная статья в ее настоящем виде – 100–150 лет.
    Типология документов также существенно меняется. До последнего времени наиболее важным считалось деление научных документов на опубликованные и непубликуемые. Еще несколько десятилетий назад идеи и факты признавались введенными в оборот только после их опубликования, означавшего широкое распространение и официаль- ную регистрацию документов, в которых они содержались.
    Для информационной деятельности это разграничение менее существенно, так как, во-первых, в неопубликованных документах со- держится много ценной информации, опережающей сведения, появ- ляющиеся в публикациях, а, во-вторых, новые средства репродуциро- вания делают это разграничение очень условным. Такие научные до- кументы, считающиеся обычно непубликуемыми, как отчеты, диссер-

    81 тации, переводы, часто распространяются в сотнях и даже тысячах эк- земпляров.
    Информатика выдвинула на первый план деление документов на первичные и вторичные. Деление это также очень условно и приблизи- тельно, поскольку оно главным образом относится к самой информа- ции, а не к документам, в которых она содержится. Считается, что в первичных документах отражаются непосредственные результаты по- знания, а во вторичных – результаты аналитико-синтетической перера- ботки информации, содержащейся в первичных документах. Однако исторически сложившаяся система научных документов такова, что многие из них содержат одновременно и результаты научных исследо- ваний и переработку прежних сведений, содержавшихся в ранее опуб- ликованных документах. Примером могут служить и статьи в научных журналах, и монографии, и учебники, и особенно – справочная литера- тура.
    Тем не менее, деление это удобно, так как позволяет характери- зовать различные потоки документов в информационной деятельности.
    Мы придерживаемся его в информатике, считая первичными те доку-
    менты и издания, в которых преимущественно содержатся новые
    сведения или новое осмысление известных идей и фактов, а вторич-
    ными те документы и издания, в которых содержатся сведения о
    первичных документах. С учетом сделанных оговорок к первичным документам и изданиям можно отнести большинство книг (за исклю- чением справочников), журналы, газеты и сериальные издания, описа- ния изобретений, стандарты, отчеты, диссертации, переводы, а ко вто- ричным – справочники и энциклопедии, обзоры, реферативные журна- лы, библиотечные каталоги, библиографические указатели и картоте- ки.
    Основные виды первичных документов и изданий охарактери- зованы в книговедческих курсах, а вторичным будет посвящена в дан- ном курсе лекция об информационных изданиях и услугах. Здесь хоте- лось бы высказать некоторые соображения лишь о журналах, так как на их примере дальше будут анализироваться закономерности роста, старения и распределения научных публикаций. Журналом мы будем
    называть периодическое (сериальное) издание, регулярно публикуемое
    в течение одного года выпусками, одинаково оформленными и содер-
    жащими статьи или иные материалы научно-технического или обще-
    ственно-политического содержания, а также произведения художе-

    82
    ственной литературы. В журналах содержится новейшая информа- ция, освещаются последние достижения науки и техники. Журналы появились почти триста пятьдесят лет назад: точной датой этого собы- тия считается 5 января 1665 г., когда был опубликован первый номер французского еженедельника "Журнал ученых", который дал название этому виду периодических изданий.
    Основным назначением этого журнала, предопределившим ха- рактер научных журналов на 150 лет вперед, стало оповещение о но- вых книгах по всем отраслям науки, литературы и искусства, однако с особым вниманием к естественным наукам и технике. Для раскрытия содержания книг в то время широко пользовались прямыми заимство- ваниями и цитатами из текста. Вначале научная хроника играла в жур- нале второстепенную роль, постепенно все больше места в нем стали занимать сообщения об экспериментах в области естественных наук и вновь открытых явлениях природы. Оригинальные статьи в течение всего XVIII в. публиковались в журналах редко. Обычно они принад- лежали крупным ученым и имели традиционно-условную форму писем одного ученого к другому: так было принято сообщать о научных от- крытиях в предшествующие эпохи.
    Начиная с XIX в. журнал становится основным источником на- учной информации. В нашем столетии установилась исключительно важная практика упоминания в каждой журнальной статье всех науч- ных работ, которые использовались при ее написании. Статьи в науч- ных журналах являются в настоящее время основным источником на- учной информации, они прочно занимают первое место среди всех других документов. Обследование библиографических запросов не- скольких тысяч ученых и инженеров показало, что до 70 % всех ис- пользуемых ими источников составляют журнальные статьи.
    Однако рост числа журналов, их недостаточная профилирован- ность, быстрое старение опубликованных в них материалов привели к тому, что уже с 30-х годов журнал как источник информации стал под- вергаться критике ученых. Они выдвинули множество проектов заме- ны научных журналов другими средствами распространения знаний. В их основе лежит предложение вместо издания журналов депонировать разрозненные статьи в специальных отраслевых центрах и отражать их в реферативных журналах.
    Один из первых проектов такого рода был выдвинут отечествен- ными учеными, делегатами Международного геологического конгрес-

    83 са в 1933 г. В этом же году англичанин У. Дэвис сделал аналогичное предложение, которое легло в основу известного "плана Бернала", опубликованного в 1939 г. в книге Дж. Бернала "Социальная функция науки". Этот план был предметом обсуждения в 1948 г. на Конферен- ции по научной информации, созванной английским Королевским об- ществом, а в 1958 г. на Международной конференции по научной ин- формации в Вашингтоне. Дж. Бернал предложил отказаться и от самой статьи как формы сообщения результатов научного исследования, по- скольку она не обеспечивает их быстрого и адекватного отражения.
    Рациональные моменты в этих его идеях были воплощены при созда- нии системы депонирования неопубликованных научно-технических документов. Однако полностью план Бернала вряд ли когда-либо будет реализован, так как он не учитывает многих закономерностей системы научных публикаций.
    Закономерности роста и старения
    С развитием информатики наступил новый этап в изучении научных публикаций, поскольку основное внимание стали уделять закономерностям, характеризующим внутреннюю связь изданий с развитием науки, количест- венные зависимости между числом публикаций и показателями роста науки.
    Закономерности эти связаны со структурой и свойствами научной информа- ции, но проявляются несколько иначе и могут быть достаточно точно измере- ны.
    Выяснилось, что для числа авторов, публикующих определенное коли- чество работ в течение своей жизни, числа журналов, ежегодно публикующих определенное количество статей, числа публикаций, содержащих определен- ное количество ссылок на другие публикации, существует общая закономер- ность распределения. "Они следуют тому же типу распределения, который характеризует соотношение миллионеров и бедняков в условиях высокоразви- той капиталистической экономики: огромная доля богатств находится в руках узкого круга сверхбогачей, а небольшой остаток – в руках несметного множе- ства мелких производителей. Является ли точная форма распределения лога- рифмической, экспоненциальной, описывается ли она законом Ципфа или об- ратной квадратной функцией это предмет особого рассмотрения в каждом отдельном случае"
    1 1
    Прайс Д. Регулярные закономерности в организации науки // Органон. – 1965. –
    № 2. – С. 246–247.

    Авторы в определенном году 100 %
    25 %
    Текучие авторы»
    3 %
    11 %
    13 %
    6 %
    В следующий год
    Из предшествующего года
    Из предыдущих лет
    В последующие годы
    14 %
    19 %
    41 %
    46 %
    Никогда ранее
    Никогда снова
    20 %
    10 %
    Рис. 7. Постоянство авторства (по Д. Прайсу)

    85
    Это означает, что большинство авторов за всю жизнь публикует лишь одну или две статьи, тогда как небольшая группа авторов отлича- ется плодовитостью, публикуя по несколько десятков или даже сотен работ. По большей части прекращают выходить в свет периодические издания, успевшие выпустить несколько годовых комплектов, тогда как небольшое число давно выходящих изданий публикует львиную долю всех статей. Примерно половина опубликованной литературы обязана такому числу авторов или журналов, которое составляет квад- ратный корень общего их количества. "Короче, если, например, в мире выходит 30 тыс. журналов или в какой-либо стране имеется 1 млн на- учных работников, то лишь небольшое ядро в 175 журналов и 1 тыс. ученых ответственно за половину всей литературы по количеству и, вероятно, за 70–80 % по важности содержания"
    1
    Эти положения Д. Прайс иллюстрирует схемой, которую он на- звал "подходом страхового агента" к проблеме авторства научных ста- тей, На рис. 7 круг обозначает 100 % авторов в какой-либо области или стране, опубликовавших статьи в определенном году. Левая сторона схемы показывает распределение авторов этих статей по их публикуе- мости в предыдущие годы (год назад, два-три года назад и ранее не публиковавшихся). Правая сторона показывает то же распределение в последующие годы. Под кругом изображено движение "постоянных" авторов, т. е. публикующихся на протяжении ряда лет (и не учитывав- шихся в приведенном выше распределении). Обобщенный смысл этой схемы заключается в том, что для увеличения числа постоянных авто- ров на одну единицу необходимо появление примерно четырех новых авторов. Один из них заменяет постоянного автора, переставшего пуб- ликовать свои труды, два других выбывают по причине "детской смертности". Это те, кто приходят в систему научных публикаций и уходят из нее в течение одного года. И только четвертый остается на более или менее длительный срок печатающимся автором
    2
    Рост литературы выражается в непрерывном увеличении числа вновь появляющихся изданий и публикаций. Широко распространен- ное представление об экспоненциальном росте основных видов лите- ратуры справедливо лишь для ее суммарного количества, причем без
    1
    Там же. – С. 248.
    2
    Прайс Д., Гюрсей Г. Текучесть и постоянство в авторстве научных публика- ций // Международный форум по информации и документации. – 1976. – № 2. – С. 18–
    27.

    86 учета старения. Реальной моделью такого представления могут слу- жить крупные научные библиотеки, комплектующие литературу по широкому профилю и выполняющие функции архивного хранения ли- тературы. Но если нас интересует ежегодный прирост новой литерату- ры, то приходится быть более осторожными в оценках.
    Статистика мирового книжного рынка за последние полстолетия показывает, что число ежегодно выпускаемых на рынок книг увеличи- вается в арифметической прогрессии, а именно, на 15–20 тыс. назва- ний. В 1955 г. по данным ЮНЕСКО опубликовано 269 тыс. названий книг, в 1960 г. – 332 тыс., в 1970 г. –521 тыс., в 1980 г. – 715 тыс., в
    1990 г. –842 тыс., в 2000 г.– 1,25 млн. Справедливость требует заме- тить, что это далеко не все выходящие книги, а только те, которые по- ступают в продажу. Если бы было возможно учесть заказные, бесплат- ные, ведомственные, учебно-методические и другие издания ограни- ченного распространения, то приведенные цифры можно было бы уд- воить. Следует также иметь в виду, что научные книги (т. е. содержа- щие научную информацию в нашем понимании) составляют 20–25 % от общего их числа.
    Подсчет числа журналов значительно сложнее, так как они в от- личие от книг все время находятся в процессе изменений. Журналы возникают, прекращаются, сливаются, дробятся, меняют название, из- дателей, периодичность и т. д. По мнению специалистов, только по естественным, точным и прикладным наукам ежедневно три новых журнала возникает, а один перестает выходить.
    Наиболее достоверные сведения о числе выходящих журналов можно получить из "Международной библиографии периодических изданий", выходящей под именем Констанции Ульрик. В последнем издании этого справочника зарегистрировано 164400 названий журна- лов, из которых около 50 % падает на издания по общественным и гу- манитарным наукам, 40 % составляют журналы по точным, естествен- ным и прикладным наукам и лишь 10 % – литературно-художествен- ные и общественно-политические журналы. Некоторое представление о темпах роста числа журналов можно получить, сравнивая объемы различных изданий библиографии К. Ульрик: 13-е изд. (1969–70) –
    40 тыс. названий, 15-е изд. (1971–72) – 55 тыс., 17-е изд. (1973–74) –
    60 тыс., 19-е изд. (1980) – 62 тыс., 21-е изд. (1982) – 63 тыс., 24-е изд.
    (1988) – 100 тыс., 30-е изд. (1995) – 120 тыс., 39-е изд. (2001)– 164 тыс.

    87
    Старение публикаций заключается в том, что они с увеличени- ем своего "возраста" теряют ценность как источники информации и все меньше используются специалистами. Степень этого использова- ния можно устанавливать при помощи учета цитирования. В данном случае стареет не сама информация, а содержащие ее публикации, по- скольку (как мы выяснили) в свежих работах эта информация может быть "упакована" более плотно вместе с новой.
    Для измерения скорости старения публикаций американские ученые Р. Бартон и Р. Кеблер предложили в 1960 г. меру, названную "периодом полужизни" публикаций по аналогии с показателем скоро- сти распада радиоактивных веществ. Период полужизни публикаций –
    это время, в течение которого была опубликована половина всей ис-
    пользуемой в настоящее время литературы по какой – либо отрасли
    или предмету. Например, если этот период ранен 5, то это значит, что
    50
    % всех процитированных в текущем году по данному предмету ра- бот не старше пяти лет. Ниже приводятся данные разных авторов о периодах полужизни публикаций в различных отраслях науки:
    Биомедицина 3,0
    Металлургия 4,6
    Хим. технология 4,8
    Социология 5,0
    Машиностроение 5,2
    Физиология 7,2
    Химия 8,1
    Ботаника 10,0
    Математика 10,5
    Геология 11,8
    География 16,0
    Достоверность приведенных цифр зависит от величины выборки цитирования, от типа и характера публикаций, поэтому даже в преде- лах одной науки данные разных авторов могут существенно расхо- диться. Но дело не только в этом. В 70-е и 80-е годы проблема старе- ния литературы подверглась интенсивным исследованиям, в результате которых ее понимание стало сильно отличаться от концепции "периода полужизни". Начало этому пересмотру положил М. Лайн, который ввел в расчет характеристики старения литературы темпы ее экспонен- циального роста. Сущность того, что произошло в трактовке старения, как всегда ярко выразил Д. Прайс: "В течение нескольких лет после публикации спрашиваемость статьи или ее относительная цитируе- мость уменьшается крайне медленно (по параболе, если считать по логарифмам прошедших лет). Даже через столетие возможность цити- рования уменьшается только на порядок. Большинство ссылок падает на работы последних лет потому, что этих работ большинство, и очень

    88 сомнительно, чтобы это вызывалось эффектом немедленности, связан- ным с быстрым старением..."
    1
    Этой проблеме до сих пор и у нас и в ряде зарубежных стран посвящается много серьезных работ, которые убеждают в том, что час- тота использования определенной совокупности литературы одного года издания меняется очень медленно. Использование публикаций, определяемое по их цитированию или на основе запросов читателей, отражает не только старение литературы, но и ее рост.
    Для теоретиков информатики и историков науки важно учиты- вать старение литературы в чистом виде, для информаторов и библио- текарей период полужизни служит важным практическим показателем и продолжает широко использоваться. Следует также иметь в виду, что цитируются далеко не все научные публикации. Половина статей в оп- ределенной области в текущем году, как правило, не упоминается, а еще 40 % цитируется лишь один раз (обычно самим автором). Таким образом, активный исследовательский фронт, т. е. число работ, цити- руемых более одного раза в году, на порядок меньше корпуса опубли- кованной литературы.
    1   ...   4   5   6   7   8   9   10   11   ...   26


    написать администратору сайта