Основы научно-исследовательской..._Крючкова_ВВ_2018_212 с.. Учебное пособие для бакалавров направлений подготовки
Скачать 1.26 Mb.
|
Тема документа/информационного запроса - раздел науки или техники, об- ласть практической деятельности или проблема, которой посвящен документ/ ин- формационный запрос. Поисковые системы состоят из следующих основных компонентов: - spider (паук) - браузероподобная программа, которая скачивает веб-стра- ницы. Spider скачивает веб-страницы тем же способом, что и браузер пользова- теля. Отличие состоит в том, что браузер отображает информацию, содержащу- юся на странице (текстовую, графическую и т.д.), паук же не имеет никаких визу- альных компонент и работает с html-текстом страницы (вы можете сделать «про- смотр html-кода» в вашем браузере, чтобы увидеть «сырой» html-текст). - crawler (краулер, «путешествующий» паук) – программа, которая авто- матически проходит по всем ссылкам, найденным на странице. Crawler выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск но- вых документов, еще неизвестных поисковой системе. - Indexer (индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Indexer разбирает страницу на составные части и анализирует их. Выделяются и анализируются различные элементы страницы, такие как текст, 130 заголовки, структурные и стилевые особенности, специальные служебные html- теги и т.д. - data base (база данных) – хранилище скачанных и обработанных страниц. Database - это хранилище всех данных, которые поисковая система скачивает и анализирует. Иногда базу данных называют индексом поисковой системы. - search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных. Search Engine Results Engine занимается ран- жированием страниц. Она решает, какие страницы удовлетворяют запросу поль- зователя, и в каком порядке они должны быть отсортированы. Это происходит согласно алгоритмам ранжирования поисковой системы. Эта информация явля- ется наиболее ценной и интересной – именно с этим компонентом поисковой си- стемы взаимодействует оптимизатор, пытаясь улучшить позиции сайта в выдаче, поэтому в дальнейшем мы рассмотрим отдельные факторы, влияющие на ранжи- рование результатов. - web server (веб-сервер) – веб-сервер, который осуществляет взаимодей- ствие между пользователем и остальными компонентами поисковой системы. Как правило, на нем присутствует html-страница с полем ввода, в котором пользова- тель может задать интересующий его поисковый термин. Веб-сервер также отве- чает за выдачу результатов пользователю в виде html-страницы. Детальная реализация поисковых механизмов может отличаться друг от друга (например, связка Spider+Crawler+Indexer может быть выполнена в виде единой программы, которая скачивает известные веб-страницы, анализирует их и ищет по ссылкам новые ресурсы), однако всем поисковым системам присущи опи- санные общие черты. По характеру поискового массива и выдаваемой информации ИПС подраз- деляют на документальные и фактографические. Документальная ИПС предназначена для отыскания документов (статей, книг, отчетов, описаний к авторским свидетельствам и патентам), содержащих не- обходимую информацию. Поисковый массив такой ИПС состоит из поисковых образов документов (т.е. элементов, каждый из которых передает основное содер- жание документа) или из самих документов. В ответ на предъявляемый информа- ционный запрос ИПС выдает некоторое множество документов (или адреса их хранения), содержащих искомую информацию. Документом называют любой осмысленный текст, который обладает определенной логической завершенностью и содержит сведения о его источнике и/или создателе. Фактографическая ИПС обеспечивает выдачу непосредственно фактиче- ских сведений, затребованных потребителем в информационном запросе. Поиско- вый массив состоит из фактографических записей, т.е. из описаний фактов, извле- ченных из документов и представленных на некотором формальном языке. 131 Например, если бы Служба знакомств решила создать документальную ИПС, поисковый массив состоял бы непосредственно из писем ее клиентов типа: "Меня зовут Илья Муромец. Просидел я сиднем на печи 33 года, а теперь у царя в охранниках...". Для создания фактографической ИПС по письмам клиентов запол- нялись бы таблицы вида: "Фамилия - Муромец. Имя - Илья. Возраст - 33. Долж- ность - секьюрити". Соответственно и запросом в первом случае будет служить часть письма клиента с пожеланиями относительно его партнера: "Невесту хочу моложе меня, но премудрую и чтоб хозяйством домашним интересовалась", а во втором - составленная по ней таблица: "Возраст <33, интеллект - высокий, инте- ресы - домашнее хозяйство". По пространственному масштабу ИПС можно разделить на: − локальные, − глобальные, − региональные − специализированные. Локальные поисковые системы могут быть разработаны для быстрого по- иска страниц в масштабе отдельного сервера. Региональные ИПС описывают ин- формационные ресурсы определенного региона, например, русскоязычные стра- ницы в Интернете. Глобальные поисковые системы в отличие от локальных стре- мятся объять необъятное - по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет. В Интернете существуют следующие режимы работы: − on-line - режим работы, означающий непосредственное подключение к сети на все время запроса, поиска, обработки, получения и просмотра информа- ции. В таком режиме работают большинство служб Интернета, например, WWW. − off-line - режим работы, подразумевающий подключение к сети только на время отправки запроса или получения информации по запросу режим работы. В таком режиме работает, например, электронная почта. Базовые пользовательские технологии работы в Интернете Несколько лет назад передача данных с помощью компьютеров интересо- вала только специалистов и опытных пользователей. В настоящее время исполь- зование локальных и глобальных компьютерных сетей становится столь же ру- тинным и распространенным, как и ПК. В настоящее время использование компь- ютерных коммуникаций не требует специальных знаний. Многие деловые люди и организации обнаружили, что они должны использовать в своей деятельности компьютерные коммуникации (электронную почту, интерактивные информаци- онные службы и т.д.) не только для своих сотрудников, но и для широкого круга 132 потребителей своей продукции через электронные доски объявлений (BBS — Bulletin Board System), телеконференции интерактивных информационных служб или через узлы Всемирной Паутины Internet. Объем и способы информирования потребителей с помощью средств компьютерных коммуникаций коренным образом изменились за последние год — два. Если раньше эта информация в основном предназначалась для специ- алистов, то теперь она рассчитана на самую широкую аудиторию. 1. Электронная почта (E-mail). В настоящее время наиболее распространенными средствами обмена дан- ными с помощью ПК становится электронная почта. Она составляет значитель- ную часть коммуникационной среды и становится наиболее предпочтительным способом информационного обмена с помощью ПК. E-mail является синонимом электронной почты. Можно сказать , что почти любая форма обмена информацией с помощью компьютера является электронной почтой. В то время, как обычное письмо идет в течение нескольких дней или даже недель, сообщение электронной почты достигает адресата за часы или минуты. Электронная почта быстро доставляется и недорога в использовании. Обычно передать сообщение по электронной почте дешевле чем по обычной по- чте или по телефону. Возможно, наиболее значительным преимуществом элек- тронной почты является простота отправки и приема сообщений. Для того чтобы отправить сообщение по обычной почте, необходимо его написать, надписать ад- рес на конверте и, наконец, отнести письмо на почту или опустить в почтовый ящик. Намного проще подготовить сообщение и щелкнуть на кнопке Send (По- слать), чтобы компьютер отправил сообщение. Ответы на сообщения также не- сложно обрабатывать - программа электронной почты может автоматически до- ставлять, сортировать и выполнять другие действия с поступающими сообщени- ями. 2. Электронные доски объявлений (BBS ). В течение многих лет электронные доски объявлений (BBS) наряду с ком- мерческими информационными службами являются распространенными сред- ствами обмена информацией и ее совместного использования. Обычно BBS функ- ционируют на ПК, к ним можно подсоединиться с помощью модема. BBS обычно содержит файлы с информацией, представляющей интерес для определенных групп пользователей, а также средства, позволяющие пользовате- лям BBS обмениваться информацией по интересующим их вопросам. 133 Существует много коммерческих BBS. Например, компании, производящие аппаратуру и программное обеспечение, поддерживают BBS, позволяющие поль- зователям загружать файлы, включая драйверы устройств, или новые версии про- грамм. Через BBS осуществляется также техническое обслуживание: пользователи посылают на BBS вопросы, а персонал компании отвечает на них. Когда пользо- ватель следующий раз подключается к BBS, он получает ответ на свой вопрос. 3.Передача файловых архивов (FTP). Пространство всемирной паутины воистину безбрежно, и в нем можно найти самую разнообразную информацию. Как выяснилось, с помощью про- граммы-браузера можно перекачать любой файл, на который есть ссылка с Web- страницы, однако при этом чаще всего будет использоваться не совсем стандарт- ный протокол для передачи файлов - протокол HTTP. Более того, для копирования крупного файла может понадобиться слишком много времени, а если произойдет разрыв связи, процедуру перекачки придется начинать сначала. FTP (File Transfer Protocol, протокол передачи файлов) - раздел Интернет, являющийся хранилищем всевозможных файлов. И в то же время FTP (File Transfer Protocol, протокол передачи файлов) - протокол передачи данных, используемый в разделе FTP для пересылки файлов. Протокол FTP более удобен для передачи файлов, поскольку он может про- должать дозагрузку файлов после разрыва связи между компьютерами. 4.Телеконференции (USENET). USENET NEWS – это система телеконференций сообщества сетей Интер- нет. На Западе этот сервис принято называть новостями. Близким аналогом теле- конференций являются и так называемые "эхи" в сети FIDO. С точки зрения абонента телеконференции, USENET представляют из себя доску объявлений, в которой есть разделы, где можно найти статьи на любую тему - от политики до садоводства. Эта доска объявлений доступна через компьютер, подобно электронной почте. Не отходя от компьютера, можно читать или поме- щать статьи в ту или иную конференцию, найти полезный совет или вступать в дискуссии. Естественно, статьи занимают место на компьютерах, поэтому не хра- нятся вечно, а периодически уничтожаются, освобождая место для новых. Во всем мире лучшим сервисом для поиска информации в конференциях Usenet является сервер Google Groups (Google Inc.). Группы Google – это бесплатное интерактивное сообщество и служба групп обсуждений, которая предлагает самый обширный в Интернете архив сообщений сети Usenet (более миллиарда сообщений). 134 Среди русскоязычных выделяется сервер Всемирная система USENET и те- леконференции Relcom. Точно также как и в других поисковых службах, пользо- ватель набирает строку запроса, а сервер формирует список конференций, содер- жащих ключевые слова. Далее надо подписаться на отобранные конференции в программе работы с новостями. Также имеет место аналогичный российский сер- вер FidoNet Online: конференции Fido на WWW. 5. Прямое общение пользователей (IRC). Интернет позволяет своим пользователям не только посылать сообщения по электронной почте, но и общаться в реальном режиме времени, передавая текст, вводимый с клавиатуры, буквально через считанные секунды на общую доску. Этот сервис называется IRC (Internet Relay Chat) или Chat. IRC (Internet Relay Chat, беседа через Интернет) - беседа в реальном времени посредством ввода текста с клавиатуры. В отличие от групп новостей, поддерживающих открытое обсуждение опре- деленной темы, в системе IRC общение проходит в пределах одного канала. Не- которые каналы работают постоянно, а некоторые создаются временно. Пользо- ватель, подключившись к системе IRC, обычно выбирает для себя определенный канал, после чего подключается к нему, выбирая себе псевдоним. Подключив- шись к каналу, вы видите на экране сообщения, переданные на него другими участниками. Если вы введете с клавиатуры свое сообщение, оно практически не- медленно будет показано на канале под вашим псевдонимом. Канал - организация дискуссии на определенную тему через выбран- ную систему IRC. IRC-сервер - программа, обеспечивающая работоспособность системы IRC и хранящая информацию о каналах и подключенных пользователях. Несколько серверов, соединенных друг с другом, образуют систему IRC. Вы можете выбирать каналы в пределах одной системы IRC. Для работы с серверами IRC разработаны специальные программы-кли- енты. Наиболее популярным клиентом является программа mIRC. IRC-клиент - программа для подключения к IRC-серверу и ведения бе- седы.(например, клиента: mIRC). С развитием технических средств компьютерных сетей увеличивается ско- рость передачи данных. Это позволяет пользователям, подключенным к сети, не только обмениваться текстовыми сообщениями, но и передавать на значительное расстояние звук и видеоизображение. Одним из представителей программ, реали- зующих общение через сеть, является программа NetMeeting, входящая в состав комплекта Internet Explorer. 135 MS NetMeeting - программа, реализующая возможности прямой связи через Интернет. Следует отметить, что для реализации звуковой связи необходимо соответ- ствующее техническое оборудование: звуковая карта, микрофон и акустические системы. Для передачи видеоизображения нужно видеоплата и камера, или только камера, поддерживающая стандарт Video for Windows. Основными возможностями программы MS NetMeeting являются: Подключение к серверу каталогов (ILS-сервер), просмотр списка пользова- телей, зарегистрированных на сервере. При регистрации на любом из серверов ка- талогов вы указываете данные о себе, в частности, страну проживания и адрес электронной почты. После подключения к серверу можно вызвать любого зареги- стрированного пользователя и пригласить его на беседу. Вызов конкретного поль- зователя через сервер каталогов или локальную сеть по IP-адресу или присоеди- нение к текущему вызову. Участники вызова имеют равные права. Если вам изве- стен постоянный IP-адрес вашего коллеги (что бывает чрезвычайно редко), можно вызвать его напрямую, минуя сервер. Если личность, которую вы вызываете, уже участвует в беседе, вы можете присоединиться. Равные права участников означает автоматические завершение беседы, если остался только один участник. Органи- зация встречи в запланированное время (встречу контролирует ведущий, наделен- ный особыми полномочиями). Организатор встречи как бы уединяется в отдель- ную комнату для беседы и ждет присоединения к нему. Особые полномочия озна- чают, во-первых, возможность единоличного пребывания ведущего, а, во-вторых, автоматическое завершение встречи, как только он ее покинет. После организации вызова или встречи, участникам доступны различ- ные способы общения: − разговор (Chat) с участниками встречи посредством ввода текста с клавиатуры. − совместная работа с графикой на общей Доске. Здесь реализуется воз- можность совместного творчества с помощью простейшего графического редак- тора. − передача любого файла участнику встречи. − совместная работа с документом (приложением), запущенным на выпол- нение на локальном компьютере организатором встречи. Организатор может поз- волить участникам встречи только наблюдать за своими действиями при работе с запущенным приложением, или предоставить любому участнику право работать с этим приложением. − голосовая связь и видеосвязь во время бесед. После организации вызова или встречи вы можете вести разговор, подобный телефонному, отправлять свое 136 видеоизображение и видеть изображение, передаваемое собеседником. Если во встрече участвует несколько человек, звуковую и видеосвязь можно осуществить только с одним участником. Качество изображения и звука в большой степени за- висит от скорости соединения с Интернетом. 137 ЛЕКЦИЯ 9. ОСНОВЫ НАУЧНОЙ ЭТИКИ И ОРГАНИЗАЦИИ ТРУДА 1. Этические основы научной деятельности. 2. Основы организации научного труда. 3. Плагиат и антиплагиат. 1. ЭТИЧЕСКИЕ ОСНОВЫ НАУЧНОЙ ДЕЯТЕЛЬНОСТИ Высокая роль и растущее значение науки в жизни современного обще- ства, с одной стороны, а с другой - опасные негативные социальные следствия бездумности, а порой и откровенно преступного использования достижений науки повышают в наши дни требования к нравственным качествам уче- ных, к этической, если ставить вопрос шире, стороне научной деятельности. Исходя из этого научно-исследовательская работа требует от ее исполнителей соблюдение ряда принципов поведения в научном сообществе. Эти прин- ципы определяются совокупностью морально-этических ценностей, прису- щих данному виду творческой деятельности. Их содержание сложилось исто- рически и уточняется, усовершенствуется самим научным сообществом в соот- ветствии с условиями современности - в связи с возникновением в науке новых этических проблем под воздействием социальных трансформаций. Научная этика- это совокупность установленных и признанных науч- ным сообществом норм поведения, правил морали научных работников, заня- |